img
img15 мая 2026 в 15:37

Отечественные ученые научили нейросети корректной работе с данными на русском языке

Исследователи НИУ ВШЭ представили метод адаптации языковых моделей для работы с российской научной терминологией, повысив скорость их работы в 2,7 раза.

Исследователи НИУ ВШЭ представили метод адаптации языковых моделей для работы с российской научной терминологией, повысив скорость их работы в 2,7 раза.

Отечественные исследователи разработали инновационный подход к обучению больших языковых моделей, который позволяет им эффективнее работать с российской научной терминологией. Внедрение методики позволило оптимизировать вычислительные ресурсы: адаптированная система функционирует в 2,7 раза быстрее и потребляет на 73% меньше оперативной памяти по сравнению с базовыми моделями.

Ведущий эксперт Центра стратегической аналитики и больших данных Института статистических исследований и экономики знаний Анастасия Малашина рассказала, что универсальные алгоритмы зачастую обладают поверхностными знаниями. По её словам, целью разработки было создание модели, способной «мыслить в категориях предметной области», понимать сложные взаимосвязи между понятиями и корректно интерпретировать запросы российских инженеров и ученых.

Необходимость создания специализированного инструмента обусловлена стремительным ростом объемов научной документации, патентов и отчетов. Большинство существующих нейросетей обучаются преимущественно на англоязычных массивах данных, что не позволяет им учитывать специфику научной лексики на русском языке. Для решения этой проблемы специалисты Института статистических исследований и экономики знаний НИУ ВШЭ использовали корпус данных iFORA-QA, сформированный более чем 150 экспертами на основе аналитических материалов в сфере технологий и инноваций. В ближайших планах разработчиков — интеграция дополнительных инструментов, которые минимизируют риск «галлюцинирования» нейросети и позволят ей корректно обрабатывать неоднозначную или неполную информацию. Как сообщили разработчики информационному агентству ТАСС,  конечной целью проекта является создание системы интеллектуальных агентов, способных автономно выявлять скрытые закономерности в научно-технических данных, превращая искусственный интеллект в полноценного партнёра исследователя.

Ранее сообщалось, что применение ИИ в российской науке пока неоднородно. Наиболее активно инструменты искусственного интеллекта применяют представители естественных и медицинских дисциплин, а также молодые исследователи, которые выполняют прикладные задачи. 

Читайте также

Похожие материалы

Страны БРИКС запустили межгосударственный маркетплейс

14.01.2025

В Piter-IX прокомментировали информацию о повышении цен

02.04.2026

«Незаходящая звезда»: учёные в России продолжают закупать и работать со Starlink

16.02.2026

Олег Грищенко («Ростелесеть») о меняющемся нормативном ландшафте и проблемах операторов

21.05.2025

Плати и смотри: в России задумались о динамическом приоритете на мобильных сетях

22.10.2025

Популярные статьи

Подписка на рассылку

Подпишитесь на рассылку, чтобы одним из первых быть в курсе новых событий

Выбор редакции