Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das Unternehmen behauptet, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit 2048 GPUs ausgebildet zu haben und die Wettbewerber deutlich zu unterbinden. Diese Abbildung spiegelt jedoch nur die GPU-Kosten vor dem Training wider und lässt wesentliche Forschung, Verfeinerung, Datenverarbeitung und Infrastrukturaufwendungen weg.
Bild: Ensigame.com
Deepseek V3 nutzt innovative Technologien: Multi-Token Prediction (MTP) für eine verbesserte Genauigkeit und Effizienz; Mischung von Experten (MOE) unter Verwendung von 256 neuronalen Netzwerken (acht aktiviert pro Token); und Multi-Head Latent Achtung (MLA) sich auf wichtige Satzelemente zu konzentrieren. Diese Fortschritte tragen zur Wettbewerbsleistung des Modells bei.
Bild: Ensigame.com
Im Gegensatz zu anfänglichen Behauptungen ergab die semianalyse die massive Infrastruktur von Deepseek: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich H800-, H100- und H20 -Einheiten, verteilten sich auf mehrere Rechenzentren. Die gesamte Serverinvestition wird auf 1,6 Milliarden US -Dollar geschätzt, wobei die Betriebskosten 944 Millionen US -Dollar betragen. Trotzdem behält Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, ihre Unabhängigkeit und Selbstfinanzierung, Förderung von Agilität und schnelle Innovation bei.
Bild: Ensigame.com
Der Erfolg des Unternehmens beruht auch darauf, Top -Talente anzuziehen, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen. Dies ermöglicht eine effiziente Implementierung von KI -Fortschritten. Die Gesamtinvestition in die AI -Entwicklung liegt über 500 Millionen US -Dollar.
Bild: Ensigame.com
Während Deepseeks "budgetfreundliche" Erzählung wohl überbewertet ist, ist seine wettbewerbsfähige Kante unbestreitbar, insbesondere im Vergleich zu den gemeldeten 100 Millionen US-Dollar, die für die Ausbildung von Chatgpt4O ausgegeben wurden, gegenüber Deepseeks 5 Millionen US-Dollar für R1. Der Fall unterstreicht das Potenzial für gut finanzierte, unabhängige KI-Unternehmen, etablierte Spieler in Frage zu stellen, obwohl eine erhebliche Investition ein entscheidender Faktor bleibt.