img25 января 2023 в 17:11

Документы с дореволюционной орфографией смогут расшифровать нейросети

«Яндекс» научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Об этом рассказали представители компании.

«Яндекс» научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Об этом рассказали представители компании.

Чтобы попробовать данную технологию в действии, нужно войти в сервис «Поиск по архивам», который откроет всем желающим доступ к более чем 2,5 млн страниц исторических документов с текстовой расшифровкой, пишет TelecomDaily.

Новый алгоритм построен на основе системы оптического распознавания символов. Он может учитывать особенности почерка, узнать утратившие актуальность буквы, а также способен понимать особую структуру архивных документов.

Руководитель «Поиска Яндекса» Елена Бубнова сообщила, что их сервис может за несколько секунд расшифровать одну страницу архивного рукописного текста, когда профессионалу для этой задачи нужно потратить примерно полчаса.

Искать можно по материалам XVIII — начала XX веков. Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса».

Ранее Волож заявил об уходе из «Яндекса».

Подписка на рассылку

Подпишитесь на рассылку, чтобы одним из первых быть в курсе новых событий