Настоящая стоимость DeepSeek, китайского чат-бота, который обрушил фондовый рынок США, оказалась совсем не такой
Утверждения разработчиков китайской нейросети DeepSeek, что ее создание заняло всего два месяца и обошлось в 6 миллионов долларов, значительно обрушили акции всех крупных западных технологических компаний. Но эта стоимость «китайского убийцы ChatGPT» оказалась значительно заниженной.

Китайский чат-бот DeepSeek, который перевернул мир искусственного интеллекта, стал предметом детального анализа в новом докладе независимой исследовательской компании SemiAnalysis.
В отчете оспариваются утверждения разработчиков DeepSeek о стоимости создания и обучения их модели V3, а также рассчитываются реальные затраты на разработку подобного ИИ на основе как официальных данных от китайской компании, так и общедоступной информации об актуальных ценах эксплуатации аналогичных ИИ-моделей западных компаний, пишет научный портал Interesting Engineering.
«DeepSeek представила свою ИИ-модель V3 на бесплатной основе и с открытым исходным кодом, заявив, что на ее создание и обучение ушло всего два месяца и менее чем $6 млн. Но эта цифра в основном учитывает только затраты на подготовку GPU (графических процессоров), но не берет во внимание инвестиции в исследования и разработки, создание и поддержку остальной инфраструктуры и другие критические затраты.
Фактические затраты DeepSeek значительно больше. По нашим данным, общие капитальные затраты китайской компании на серверы достигают впечатляющих $1,3 миллиарда. Большая часть этих средств направлена на эксплуатацию и обслуживание широких GPU-кластеров, которые являются основой вычислительной мощности нейросети», — отмечается в докладе SemiAnalysis.
Это дороже, чем стоимость создания и обучения ChatGPT, которая составляет около $1 миллиарда. Главное отличие от китайской DeepSeek в том, что ChatGPT для эксплуатации и обслуживания собственных серверов использует дата-центры и другую инфраструктуру компаний Microsoft, Oracle и SoftBank (но преимущественно Microsoft), тогда как китайская компания строит и обеспечивает свою собственную инфраструктуру, дополнительно сталкиваясь с последствиями технологических санкций Запада против Китая.
DeepSeek, согласно отчету SemiAnalysis, имеет доступ примерно к 50 тысячам графических процессоров поколения Hopper от компании Nvidia, среди которых есть мощные процессоры версий H100 и H800, а также H20 — специальной версии от Nvidia для китайского рынка, разработанной в ответ на ограничения со стороны США на технологический экспорт.
Для сравнения, ChatGPT-4 (который был выпущен в 2023 году) использовал от 20 до 25 тысяч еще менее совершенных процессоров A100 (также Nvidia), но теперь компания OpenAI приближается к показателю в 100 тысяч процессоров Nvidia GB200 (лучшие из всех вышеупомянутых).
При этом, как отмечает SemiAnalysis, китайский DeepSeek, несмотря на большую стоимость содержания инфраструктуры, демонстрирует сопоставимую с последними версиями ChatGPT точность ответов и способности к размышлениям. А владение собственными серверами может дать DeepSeek преимущество в стабильности работы ее модели и большую гибкость в сокращении затрат в будущем.
Комментарии
Галя, чым каня карміць будзем?