Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La société prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars en utilisant 2048 GPU, sous-coignant considérablement les concurrents. Cependant, ce chiffre ne reflète que les coûts de GPU avant la formation, en omettant des dépenses de recherche, de raffinement, de traitement des données et des infrastructures substantielles.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes: Prédiction multi-token (MTP) pour une précision et une efficacité améliorées; Mélange d'experts (MOE) , en utilisant 256 réseaux neuronaux (huit activés par jeton); et Attention latente multi-tête (MLA) pour se concentrer sur les éléments de phrase cruciaux. Ces progrès contribuent aux performances concurrentielles du modèle.
Image: esigame.com
Contrairement aux allégations initiales, la semianalyse a révélé une infrastructure massive de Deepseek: environ 50 000 GPU Nvidia Hopper, y compris les unités H800, H100 et H20, réparties sur plusieurs centres de données. L'investissement total du serveur est estimé à 1,6 milliard de dollars, les coûts opérationnels atteignant 944 millions de dollars. Malgré cela, Deepseek, une filiale de High Flyer, un fonds spéculatif chinois, maintient son indépendance et son autofinancement, favorisant l'agilité et l'innovation rapide.
Image: esigame.com
Le succès de l'entreprise découle également de l'attraction de talents, certains chercheurs gagnant plus de 1,3 million de dollars par an. Ceci, couplé à sa structure Lean, permet une mise en œuvre efficace des progrès de l'IA. L'investissement total dans le développement de l'IA dépasse 500 millions de dollars.
Image: esigame.com
Alors que le récit "adapté au budget" de Deepseek est sans doute surestimé, son avantage concurrentiel est indéniable, en particulier par rapport aux 100 millions de dollars dépensés pour la formation de Chatgpt4O, contre 5 millions de dollars de Deepseek pour R1. L'affaire met en évidence le potentiel de sociétés d'IA indépendantes bien financées pour défier les acteurs établis, bien que l'investissement substantiel reste un facteur crucial.