Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La società afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli $ 6 milioni utilizzando 2048 GPU, concorrenti significativamente sottosquadri. Tuttavia, questa cifra riflette solo i costi della GPU pre-allenamento, omettendo sostanziali ricerche, raffinamento, elaborazione dei dati e spese di infrastruttura.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una migliore precisione ed efficienza; Mixture di esperti (MOE) , utilizzando 256 reti neurali (otto attivate per token); e Attenzione latente multi-testa (MLA) per concentrarsi su elementi di frase cruciali. Questi progressi contribuiscono alle prestazioni competitive del modello.
Immagine: Ensigame.com
Contrariamente alle affermazioni iniziali, la seminalisi ha rivelato la massiccia infrastruttura di DeepSeek: circa 50.000 GPU di Nvidia Hopper, tra cui unità H800, H100 e H20, diffuse su più data center. L'investimento totale del server è stimato a $ 1,6 miliardi, con costi operativi che raggiungono $ 944 milioni. Nonostante ciò, Deepseek, una consociata di High-Flyer, un hedge fund cinese, mantiene la sua indipendenza e l'autofinanziamento, promuovendo l'agilità e la rapida innovazione.
Immagine: Ensigame.com
Il successo dell'azienda deriva anche dall'attirare i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno. Questo, unito alla sua struttura magra, consente un'implementazione efficiente dei progressi dell'IA. L'investimento totale nello sviluppo dell'IA supera $ 500 milioni.
Immagine: Ensigame.com
Mentre la narrazione "economica" di Deepseek è probabilmente sopravvalutata, il suo vantaggio competitivo è innegabile, in particolare se confrontato con i $ 100 milioni spesi per la formazione di Chatgpt4o, rispetto a $ 5 milioni di Deepseek per R1. Il caso evidenzia il potenziale per società di intelligenza artificiale ben finanziate e indipendenti di sfidare gli attori consolidati, sebbene investimenti sostanziali rimangono un fattore cruciale.