Китайская технологическая компания DeepSeek официально представила свою новейшую большую языковую модель DeepSeek-V4. Как сообщает ТАСС со ссылкой на публикацию разработчика в социальной сети WeChat, новинка уже доступна в открытом доступе.
В компании заявляют, что DeepSeek-V4 «лидирует среди китайских разработчиков программного обеспечения по объему знаний об окружающем мире и производительности вывода».
Модель представлена в двух конфигурациях: версия pro насчитывает 1,6 трлн параметров, облегченная версия flash — 284 млрд. В основе системы лежит архитектура MoE (Mixture-of-Experts), которая позволяет активировать лишь часть нейросети для выполнения конкретных задач, что существенно повышает эффективность вычислений. Кроме того, DeepSeek-V4 поддерживает контекстное окно объемом 1 млн токенов.
В январе 2025 года компания представила модель, сопоставимую по качеству с передовыми американскими аналогами, но при значительно меньших затратах на разработку. Успех DeepSeek происходит на фоне бурного роста ИИ-сектора в КНР, где число пользователей подобных технологий в 2025 году достигло 602 млн человек, увеличившись за год более чем на 140%.
Ранее «Телеспутник» сообщал, что OpenAI, Google и Anthropic объединили усилия против «дистилляции» технологий в Китае. Три конкурирующие американские компании, работающие в сфере искусственного интеллекта, начали координировать действия, чтобы противостоять китайским разработчикам, которые, по их оценке, используют наработки моделей из США.




_673b40074a29a.jpg)

