首頁 新聞 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

by Penelope Feb 26,2025

DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。該公司聲稱使用2048 GPU培訓了其功能強大的DeepSeek V3神經網絡,僅需600萬美元,大大削弱了競爭對手。但是,該數字僅反映了培訓前的GPU成本,省略了大量研究,改進,數據處理和基礎設施費用。

DeepSeek Test圖像:ensigame.com

DeepSeek V3利用創新技術:多型預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡(八個激活的令牌); 多頭潛在注意力(MLA)專注於關鍵的句子元素。這些進步有助於模型的競爭性能。

DeepSeek V3圖像:ensigame.com

與最初的主張相反,半分析揭示了DeepSeek的大規模基礎設施:大約50,000個NVIDIA HOPPER GPU,包括H800,H100和H20單位,分布在多個數據中心。服務器總投資估計為16億美元,運營成本達到9.44億美元。盡管如此,中國對衝基金的高飛行員的子公司DeepSeek仍保持其獨立性和自給自足,促進敏捷性和快速創新。

DeepSeek圖像:ensigame.com

該公司的成功也源於吸引頂尖人才,一些研究人員每年收入超過130萬美元。這與其精益結構相結合,可以有效地實施AI的進步。 AI開發的總投資超過5億美元。

DeepSeek圖像:ensigame.com

盡管DeepSeek的“預算友好”敘述可以說是誇大其詞的,但它的競爭優勢是不可否認的,尤其是與據報道在培訓Chatgpt4o上花費的1億美元相比,與DeepSeek的R1相比。該案件強調了資金充足,獨立的AI公司挑戰已建立參與者的潛力,盡管大量投資仍然是關鍵因素。