首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

by Penelope Feb 26,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。该公司声称使用2048 GPU培训了其功能强大的DeepSeek V3神经网络,仅需600万美元,大大削弱了竞争对手。但是,该数字仅反映了培训前的GPU成本,省略了大量研究,改进,数据处理和基础设施费用。

DeepSeek Test图像:ensigame.com

DeepSeek V3利用创新技术:多型预测(MTP),以提高准确性和效率; 专家(MOE)的混合物,利用256个神经网络(八个激活的令牌); 多头潜在注意力(MLA)专注于关键的句子元素。这些进步有助于模型的竞争性能。

DeepSeek V3图像:ensigame.com

与最初的主张相反,半分析揭示了DeepSeek的大规模基础设施:大约50,000个NVIDIA HOPPER GPU,包括H800,H100和H20单位,分布在多个数据中心。服务器总投资估计为16亿美元,运营成本达到9.44亿美元。尽管如此,中国对冲基金的高飞行员的子公司DeepSeek仍保持其独立性和自给自足,促进敏捷性和快速创新。

DeepSeek图像:ensigame.com

该公司的成功也源于吸引顶尖人才,一些研究人员每年收入超过130万美元。这与其精益结构相结合,可以有效地实施AI的进步。 AI开发的总投资超过5亿美元。

DeepSeek图像:ensigame.com

尽管DeepSeek的“预算友好”叙述可以说是夸大其词的,但它的竞争优势是不可否认的,尤其是与据报道在培训Chatgpt4o上花费的1亿美元相比,与DeepSeek的R1相比。该案件强调了资金充足,独立的AI公司挑战已建立参与者的潜力,尽管大量投资仍然是关键因素。