O modelo de IA surpreendentemente barato de Deepseek desafia os gigantes da indústria. A empresa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões usando 2048 GPUs, subcotando significativamente os concorrentes. No entanto, esse número apenas reflete os custos de GPU pré-treinamento, omitindo pesquisas substanciais, refinamento, processamento de dados e despesas de infraestrutura.
Imagem: Ensigame.com
A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) Para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais (oito ativadas por token); e atenção latente de várias cabeças (MLA) para se concentrar nos elementos cruciais da frase. Esses avanços contribuem para o desempenho competitivo do modelo.
Imagem: Ensigame.com
Ao contrário das reivindicações iniciais, a semiânica revelou a enorme infraestrutura da Deepseek: aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo unidades H800, H100 e H20, espalhadas por vários data centers. O investimento total do servidor é estimado em US $ 1,6 bilhão, com custos operacionais atingindo US $ 944 milhões. Apesar disso, a Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, mantém sua independência e auto-financiamento, promovendo agilidade e inovação rápida.
Imagem: Ensigame.com
O sucesso da empresa também decorre de atrair os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente. Isso, juntamente com sua estrutura enxuta, permite a implementação eficiente dos avanços da IA. O investimento total no desenvolvimento da IA excede US $ 500 milhões.
Imagem: Ensigame.com
Embora a narrativa "orçamentária" de Deepseek seja indiscutivelmente exagerada, sua vantagem competitiva é inegável, principalmente quando comparada aos US $ 100 milhões gastos no treinamento do ChatGPT4O, contra US $ 5 milhões de Deepseek por R1. O caso destaca o potencial de empresas de IA independentes e bem financiadas para desafiar os participantes estabelecidos, embora o investimento substancial continue sendo um fator crucial.