img
img11 апреля 2025 в 17:30

Революция в сжатии нейросетей: российские ученые представили новый метод HIGGS

Российские ученые из «Яндекса» вместе с коллегами из ведущих мировых университетов (НИУ ВШЭ, MIT, KAUST и ISTA) разработали новый метод сжатия больших языковых моделей (LLM), который позволяет уменьшить их размер без потери качества. Разработка под названием HIGGS позволит запускать мощные нейросети на обычных смартфонах и ноутбуках, открывая доступ к передовым технологиям широкому кругу пользователей, включая небольшие компании и независимых разработчиков.

Российские ученые из «Яндекса» вместе с коллегами из ведущих мировых университетов (НИУ ВШЭ, MIT, KAUST и ISTA) разработали новый метод сжатия больших языковых моделей (LLM), который позволяет уменьшить их размер без потери качества. Разработка под названием HIGGS позволит запускать мощные нейросети на обычных смартфонах и ноутбуках, открывая доступ к передовым технологиям широкому кругу пользователей, включая небольшие компании и независимых разработчиков.

Теперь сжатые версии опенсорсных моделей, таких как DeepSeek-R1 и Llama 4 Maverick, которые ранее требовали мощных серверов, можно тестировать и внедрять на мобильных устройствах. Метод HIGGS позволяет сжимать нейросети без использования дополнительных данных и сложной оптимизации параметров, улучшая баланс между качеством, размером и вычислительными требованиями, пишет Sostav.

Эксперименты показали, что HIGGS значительно превосходит другие методы квантизации, такие как NF4 и HQQ, при работе с популярными моделями Llama 3 и Qwen2.5. Разработчики уже сделали HIGGS доступным на Hugging Face и GitHub.

Напомним, ранее «Яндекс» внедрил в чат с Алисой мощную языковую модель нового поколения — YandexGPT 5 Pro. YandexGPT 5 Pro отвечает на запросы на уровне лучших мировых аналогов, а в некоторых типах задач превосходит их результаты. Представителям бизнеса она доступна на платформе Yandex Cloud.

Читайте также

Похожие материалы

Оператор электронного правительства Ленобласти импортозамещает систему виртуализации

31.07.2025

Расширение параметра КИИ на SIM-карты позволит повысить объём доверенной ЭКБ

24.09.2025

«Затишье перед бурей»: известные хакерские группировки могут готовить новые атаки на российские компании

08.08.2025

России не нужен ещё один Twitter

29.11.2024

ФАС привлекает операторов связи к делам о спам-звонках от бизнеса

19.11.2024

Популярные статьи

Подписка на рассылку

Подпишитесь на рассылку, чтобы одним из первых быть в курсе новых событий

Выбор редакции