img19 августа 2024 в 12:59

YandexGPT будет обучаться распознаванию текста на изображениях и в аудио- и видеофайлах

Нейросеть YandexGPT будет обучаться распознаванию текста на изображениях и в аудио- и видеофайлах. Об этом стало известно из опубликованного на сайте компании «Яндекс» описания вакансии AI-тренера. В требованиях к кандидатам указано, что они должны владеть английским языком и обладать профессиональными навыками перевода, необходимыми для обучения больших языковых моделей.

Нейросеть YandexGPT будет обучаться распознаванию текста на изображениях и в аудио- и видеофайлах. Об этом стало известно из опубликованного на сайте компании «Яндекс» описания вакансии AI-тренера. В требованиях к кандидатам указано, что они должны владеть английским языком и обладать профессиональными навыками перевода, необходимыми для обучения больших языковых моделей.

Источники «Ведомостей» сообщают, что планируется нанять около десяти таких специалистов. Предполагается, что тренеры будут заниматься обучением генеративной модели, создавая свои собственные эталонные примеры, оценивать качество переводов и подготавливать нейросеть к распознаванию и переводу текста с различных медиаформатов, включая изображения и видео.

Стоит отметить, что ранее, в начале 2023 года, «Яндекс» также проводил набор сотрудников под специальностью «AI-тренер» для обучения моделей YandexGPT. Тогда компания искала специалистов гуманитарного направления, которые могли бы работать с русскоязычными текстами, например, профессиональных редакторов, журналистов, филологов и педагогов. Как уточнил представитель компании, на этот раз речь идет о специалистах, которые смогут обучить нейросеть узким тематическим областям — от физики до юриспруденции, что позволит детализировать и углубить знания модели.

В мае 2023 года «Яндекс» представил свою собственную нейросеть YandexGPT, в которую был интегрирован виртуальный ассистент «Алиса». Летний релиз прошлого года был ознаменован важным шагом: нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы, после чего ее функции были добавлены в приложение для генерации изображений «Шедеврум». В сентябре была анонсирована обновленная версия YandexGPT-2, обладающая способностью давать быстрые ответы на запросы в «Поиске». Позднее пользователи получили доступ к функции кратких пересказов русскоязычных видеороликов длительностью до четырех часов. В марте 2024 года компания выпустила третье поколение нейросетей YandexGPT, включая модель для бизнеса, а в июне YandexGPT была интегрирована в переводчик.

В сфере машинного обучения важнейшими критериями являются чистота и качество данных. Многие компании, занимающиеся машинным переводом, регулярно нанимают специалистов с узкими специализациями для улучшения своих алгоритмов. Для обучения современных моделей необходимы два типа экспертов: во-первых, нейролингвисты, которые понимают, как работают нейросети, и помогают создавать современные алгоритмы машинного перевода. Во-вторых, это специалисты, владеющие несколькими языками, которые необходимы для создания пар между различными языками.

Ранее мы писали о том, что диффузионная нейронная сеть Yandex AI Rendering Technology (YandexART) научилась восстанавливать и повышать качество архивных видеозаписей и кинохроник.

Подписка на рассылку

Подпишитесь на рассылку, чтобы одним из первых быть в курсе новых событий