15 мая 2026 в 15:37

Отечественные ученые научили нейросети корректной работе с данными на русском языке

Исследователи НИУ ВШЭ представили метод адаптации языковых моделей для работы с российской научной терминологией, повысив скорость их работы в 2,7 раза.

Полина Макаренко

Главный редактор

Полина Макаренко

Главный редактор

Отечественные исследователи разработали инновационный подход к обучению больших языковых моделей, который позволяет им эффективнее работать с российской научной терминологией. Внедрение методики позволило оптимизировать вычислительные ресурсы: адаптированная система функционирует в 2,7 раза быстрее и потребляет на 73% меньше оперативной памяти по сравнению с базовыми моделями.

Ведущий эксперт Центра стратегической аналитики и больших данных Института статистических исследований и экономики знаний Анастасия Малашина рассказала, что универсальные алгоритмы зачастую обладают поверхностными знаниями. По её словам, целью разработки было создание модели, способной «мыслить в категориях предметной области», понимать сложные взаимосвязи между понятиями и корректно интерпретировать запросы российских инженеров и ученых.

Необходимость создания специализированного инструмента обусловлена стремительным ростом объемов научной документации, патентов и отчетов. Большинство существующих нейросетей обучаются преимущественно на англоязычных массивах данных, что не позволяет им учитывать специфику научной лексики на русском языке. Для решения этой проблемы специалисты Института статистических исследований и экономики знаний НИУ ВШЭ использовали корпус данных iFORA-QA, сформированный более чем 150 экспертами на основе аналитических материалов в сфере технологий и инноваций. В ближайших планах разработчиков — интеграция дополнительных инструментов, которые минимизируют риск «галлюцинирования» нейросети и позволят ей корректно обрабатывать неоднозначную или неполную информацию. Как сообщили разработчики информационному агентству ТАСС, конечной целью проекта является создание системы интеллектуальных агентов, способных автономно выявлять скрытые закономерности в научно-технических данных, превращая искусственный интеллект в полноценного партнёра исследователя.

Ранее сообщалось, что применение ИИ в российской науке пока неоднородно. Наиболее активно инструменты искусственного интеллекта применяют представители естественных и медицинских дисциплин, а также молодые исследователи, которые выполняют прикладные задачи.

Понравилась статья?

Чтобы оставить комментарий необходимо авторизоваться.

Отечественные ученые научили нейросети корректной работе с данными на русском языке

Читайте также

Провайдер «Дом.ру» ввел доплату за большой объем трафика

Евгений Мордкович о «реинкарнации» советского характериографа Л2-56

Похожие материалы

Евгений Мордкович о «реинкарнации» советского характериографа Л2-56

«Ростелесеть»: 80% операторов кабельного ТВ находятся в зоне риска

Как телевизионные спутники работали на фоне вспышек на Солнце в августе

Оператор электронного правительства Ленобласти импортозамещает систему виртуализации

Провайдер «Дом.ру» ввел доплату за большой объем трафика

Популярные статьи

Эксперт: борьба с Telegram превратилась в бесконечную технологическую гонку с ущербом для легитимных сервисов

В России планируют создать группировку радиолокационных спутников-кубсатов

Наталья Касперская: блокировки VPN создают критические риски для разработки ПО

Подписка на рассылку

Выбор редакции

«Ростелесеть»: 80% операторов кабельного ТВ находятся в зоне риска

«Телеспутник» соберет ключевые телеком-ассоциации для обсуждения реформы связи

В GS Group заявили о необходимости ужесточить ответственность за псевдолокализацию

Искусственный интеллект и авторское право: от прецедентов — к практике

Гендиректор «РТК-ЦОД» оценил идею создания плавучих дата-центров в России

Отраслевой передел: эксперты опасаются национализации и ухода малых операторов

Магия живого театра: дан старт новому этапу проекта «Золотой фонд театральных постановок России»

В Роскачестве поделились подробностями исследования онлайн-кинотеатров

Эксперт: «Ожидания пользователей растут быстрее возможностей ИИ-моделей»

Private Cloud ренессанс II: консолидация, российский ИИ и ставка на безопасность вместо гонки объёмов