DeepSeek работает вместе с китайским университетом для улучшения моделей ИИ

DeepSeek работает вместе с китайским университетом для улучшения моделей ИИ

Китайский стартап DeepSeek работает совместно с Университетом Цинхуа, чтобы сократить обучение, которое необходимы его моделям искусственного интеллекта (ИИ), пытаясь сократить эксплуатационные расходы, сообщает Bloomberg.

DeepSeek, которая встряхнула рынки с своей дешевой моделью в январе, сотрудничала с учеными из Пекинского института в документе, в котором подробно описывается новый подход к обучению, чтобы сделать модели искусственного интеллекта более эффективными.

По словам ученых, новый метод направлен на то, чтобы помочь моделям ИИ более эффективно придерживаться предпочтений потребителей, предлагая вознаграждения за более точные и понятные ответы. Обучение эффективно для более быстрого решения задач AI в узких приложениях и областях.

Тем не менее, расширение метода для более общих приложений является проблемой — и это проблема, которую команда Depepeek пытается решить с помощью чего -то, называемого самоопределяющей настройкой критики. Стратегия превышает существующие методы и модели, в результате чего результат показывает лучшую производительность с меньшими вычислительными ресурсами, добавленными в документ.

DeepSeek называет эти новые модели DeepSeek-GRM и выпустит их на основе открытого исходного кода. Другие разработчики искусственного интеллекта, в том числе китайский технологический гигант Alibaba Group Holding Ltd. и базирующиеся в Сан -Франциско Open, они также стремятся улучшить возможности рассуждений и выращивания, в то время как модель ИИ выполняет реальные задачи.

Калифорнийская Meta Platforms Inc. Он запустил свои последние модели искусственного интеллекта, Llama 4 на выходных, и описал их как первую, кто использовал смесь архитектуры экспертов (MOE). Модели DeepSeek в значительной степени полагаются на MOE для более эффективного использования ресурсов, и Meta сравнивает свое новое издание с китайским стартапом.

DeepSeek не указывает, когда он планирует выпустить свою следующую ведущую модель.

Любая новость — это актив, следите за Investor.bg и в Google News ShowcaseС

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии