दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। कंपनी का दावा है कि 2048 जीपीयू का उपयोग करके अपने शक्तिशाली डीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया गया है, जो प्रतियोगियों को काफी कम कर रहा है। हालांकि, यह आंकड़ा केवल पूर्व-प्रशिक्षण जीपीयू लागतों को दर्शाता है, पर्याप्त अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे के खर्चों को छोड़ देता है।
छवि: ensigame.com
दीपसेक वी 3 अभिनव प्रौद्योगिकियों का लाभ उठाता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) बेहतर सटीकता और दक्षता के लिए; विशेषज्ञों का मिश्रण (एमओई) , 256 तंत्रिका नेटवर्क (प्रति टोकन सक्रिय आठ सक्रिय) का उपयोग करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) महत्वपूर्ण वाक्य तत्वों पर ध्यान केंद्रित करने के लिए। ये प्रगति मॉडल के प्रतिस्पर्धी प्रदर्शन में योगदान करती हैं।
छवि: ensigame.com
प्रारंभिक दावों के विपरीत, सेमियालिसिस ने डीपसेक के बड़े पैमाने पर बुनियादी ढांचे का खुलासा किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू, जिसमें H800, H100 और H20 यूनिट शामिल हैं, कई डेटा केंद्रों में फैले हुए हैं। कुल सर्वर निवेश का अनुमान $ 1.6 बिलियन है, जिसमें परिचालन लागत $ 944 मिलियन तक पहुंचती है। इसके बावजूद, एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक, अपनी स्वतंत्रता और आत्म-वित्त पोषण, चपलता और तेजी से नवाचार को बढ़ावा देती है।
छवि: ensigame.com
कंपनी की सफलता भी शीर्ष प्रतिभा को आकर्षित करने से उपजी है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की है। यह, इसकी दुबला संरचना के साथ मिलकर, एआई प्रगति के कुशल कार्यान्वयन के लिए अनुमति देता है। एआई विकास में कुल निवेश $ 500 मिलियन से अधिक है।
छवि: ensigame.com
जबकि दीपसेक की "बजट-अनुकूल" कथा यकीनन ओवरस्टेड है, इसकी प्रतिस्पर्धात्मक बढ़त निर्विवाद है, खासकर जब R1 के लिए DeePseek के $ 5 मिलियन बनाम चैटगिट 4o पर खर्च किए गए $ 100 मिलियन की तुलना में $ 100 मिलियन की तुलना में। यह मामला अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनियों के लिए स्थापित खिलाड़ियों को चुनौती देने की क्षमता पर प्रकाश डालता है, हालांकि पर्याप्त निवेश एक महत्वपूर्ण कारक है।