Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя 2048 графических процессоров, что значительно подрывает конкурентов. Тем не менее, эта цифра отражает только предварительные затраты на GPU, пропуская существенные исследования, уточнение, обработку данных и расходы на инфраструктуру.
Изображение: Ensigame.com
DeepSeek V3 использует инновационные технологии: Multi-Token Prediction (MTP) для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей (восемь активированных на токен); и Многополосное скрытое внимание (MLA) , чтобы сосредоточиться на важных элементах предложения. Эти достижения способствуют конкурентной производительности модели.
Изображение: Ensigame.com
В отличие от первоначальных претензий, полуанализ выявил массивную инфраструктуру Deepseek: приблизительно 50 000 графических процессоров Nvidia, включая H800, H100 и H20, распространяются по нескольким центрам обработки данных. Общие инвестиции в сервер оцениваются в 1,6 млрд. Долл. США, при этом эксплуатационные расходы достигают 944 млн. Долл. США. Несмотря на это, Deepseek, дочерняя компания High-Flyer, китайского хедж-фонда, поддерживает свою независимость и самофинансирование, способствуя гибкости и быстрым инновациям.
Изображение: Ensigame.com
Успех компании также связан с привлечением лучших талантов, причем некоторые исследователи зарабатывают более 1,3 миллиона долларов в год. Это, в сочетании с его бережливой структурой, позволяет эффективно внедрить достижения искусственного интеллекта. Общая инвестиция в развитие искусственного интеллекта превышает 500 миллионов долларов.
Изображение: Ensigame.com
В то время как «Бюджетный» рассказ Deepseek, возможно, преувеличен, его конкурентное преимущество неоспоримо, особенно по сравнению с сообщенными 100 миллионами долларов, потраченных на обучение CHATGPT4O, по сравнению с 5 миллионами долларов на R1. Дело подчеркивает потенциал для хорошо финансируемых, независимых компаний искусственного интеллекта, чтобы оспорить устоявшихся игроков, хотя существенные инвестиции остаются важным фактором.