DeepSeek представляет свою флагманскую модель искусственного интеллекта через год после первого прорыва

DeepSeek выпустила превью новой флагманской модели искусственного интеллекта спустя год после потрясений в Кремниевой долине. Компания назвала модель самой мощной платформой с открытым исходным кодом как вызов конкурентам — от OpenAI до Anthropic, сообщает Bloomberg.

Китайский стартап представил серии V4 Flash и V4 Pro, подчеркнув их первоклассную производительность в тестах программирования и значительные улучшения в способности рассуждать и выполнять задачи, связанные с агентами. К ним относятся улучшения и оптимизация архитектуры, сообщил стартап Hugging Face.

DeepSeek выделила технику под названием «Архитектура гибридного внимания», которая, по ее словам, улучшает способность платформы ИИ запоминать запросы в долгих разговорах. Он также расширил контекстное окно до 1 миллиона токенов, что позволяет отправлять целые коды или длинные документы как одну подсказку.

V4 появился более чем через год после того, как стартап в Ханчжоу спровоцировал распродажу акций на 1 триллион долларов. долларов с выпуском R1, модели с открытым исходным кодом, которая имитирует процесс человеческого мышления. R1 конкурировал по производительности с современными системами искусственного интеллекта от таких компаний, как OpenAI, но, как утверждается, был создан за небольшую цену.

Акции китайских производителей чипов выросли в пятницу, поскольку инвесторы делают ставку на то, что новая модель поддержит спрос на отечественные чипы. В сообщении на WeChat компания DeepSeek указала, что возможности обслуживания серии V4 Pro крайне ограничены из-за нехватки вычислительных ресурсов. Однако стартап ожидает, что цены на модель значительно снизятся после запуска во второй половине этого года вычислительных кластеров на базе чипов Ascend 950 от Huawei Technologies. DeepSeek в настоящее время ведет переговоры с Tencent Holdings и Alibaba Group Holding о первом раунде финансирования.

Новая серия — это большой шаг вперед с точки зрения масштаба и эффективности, которые определили рост DeepSeek и оказали огромное конкурентное давление на конкурентов. После R1 технологические компании и инвесторы начали переосмысливать целесообразность вложения миллиардов долларов в разработку ИИ. С тех пор эти расходы восстановились: американские технологические гиганты прогнозируют, что в 2026 году они инвестируют около 650 миллиардов долларов в инфраструктуру искусственного интеллекта и центры обработки данных.

Система DeepSeek с 1 триллионом параметров использует метод Mixture-of-Experts, избирательно запуская лишь небольшое подмножество экспертных подсетей и активируя не более 37 миллиардов параметров для каждой задачи, чтобы стоимость вывода была значительно ниже, чем у аналогичных современных моделей.

Архитектура и технологии ставят DeepSeek в прямую конкуренцию новейшим моделям конкурентов из Кремниевой долины — OpenAI, Google и Anthropic. В пятницу стартап похвастался более высокой производительностью, чем такие модели, как OpenAI GPT-5.2, в тестах производительности, но признал, что V4 отстает от современных моделей примерно на 3-6 месяцев.

Однако в DeepSeek подчеркнули, что стремятся не только к максимальной производительности, но и к фундаментальному снижению затрат. Версия V4 предназначена для развертывания в менее затратной инфраструктуре.

Каждая новость – это актив, следите за Investor.bg и в Витрина новостей Google.