Первой широко применять компьютерную эмуляцию стала киноиндустрия. Сегодня режиссеры могут заменять актеров цифровыми двойниками, а также проводить различные манипуляции с их внешностью, чтобы, например, омолодить Роберта Де Ниро в фильме «Ирландец» или Джеффа Бриджеса в «Троне». Когда в период съемок в «Форсаже 7» погиб актер Пол Уокер, его внешность смогли перенести на дублеров с помощью технологии CGI (computer-generated imagery).
Впрочем, интерес к подобным новшествам проявляли не только киношники. История с использованием виртуальных персонажей, внешность и характер которых полностью созданы с помощью компьютерных технологий, не могла оставить равнодушными профессионалов шоу-бизнеса и телевидения. Первые еще 15–20 лет назад смогли создать финансово успешных виртуальных артистов, достаточно вспомнить Gorillaz (входит в Книгу рекордов Гиннесса как «Самая успешная виртуальная группа», — прим. ред.) или японскую певицу Хацунэ Мику (диски с ее песнями завоевывали первые позиции в чартах, — прим. ред.). В свою очередь, телевизионные продюсеры буквально несколько лет назад начали использовать виртуальных ведущих, которые способны работать 24 часа в сутки, никогда не устают и не требуют зарплаты, хотя, конечно, их «услуги» не совсем бесплатные.
Наверное, никого не удивит, что в области телевидения пионерами по внедрению технологии виртуальных ведущих стали китайцы. Первый в мире опыт по запуску цифрового ведущего был реализован информационным агентством «Синьхуа» и китайской интернет-компанией Sogou в 2018 году. В качестве прототипа цифрового ведущего выступил известный в стране телеведущий Цю Хао. Использование искусственного интеллекта (ИИ) позволило проанализировать мимику реального человека, его голос, манеру говорить и характерные жесты. На выходе получился вполне реалистично выглядящий в кадре молодой мужчина, который, если не придираться к деталям, читает новости, как живой человек. Разработчики подчеркивают, что оцифрованный Цю Хао может работать 24 часа в сутки, 7 дней в неделю, снижая затраты на производство новостей и повышая эффективность, а также снижая нагрузку на сотрудников агентства.
Через год эксперимент повторили на российской почве: Sogou специально для агентства ТАСС создала первого русскоязычного виртуального ведущего, который, как и в случае Цю Хао, был скопирован с реального прототипа. За основу разработчики взяли внешность и особенности речи главного специалиста управления международных связей ТАСС Елизаветы Зеленской. Результат не поражал реалистичностью, но выглядел вполне достойно. Позже стало очевидно, что проект преследовал скорее маркетинговые цели, чем практические. За последний год об использовании русскоязычного цифрового ведущего ничего не было слышно. Вероятно, его продолжают использовать на различных презентациях в качестве демонстрации достижений технологий в области телевидения.
Цифровой ведущий, разработанный для «Синьхуа», был создан для схожих целей — прорекламировать технологию и конкретного разработчика. Хотя в начале 2019 года информагентство сообщило, что его новые роботизированные сотрудники с момента запуска в ноябре 2018 года сделали около 3,4 тыс. репортажей общей продолжительностью более 10 тыс. минут.
Тем временем Sogou продолжила свои эксперименты и в мае этого года представила виртуального ведущего, созданного в формате 3D. Картинка стала более детализированной, ведущий обзавелся собственной трехмерной студией, а также научился более свободно жестикулировать и двигаться в кадре. «Синьхуа» применило его для освещения ежегодных заседаний законодательных органов Китая.
Интересна совместная разработка агентства Reuters и британской компании Synthesia — полностью автоматизированная система для создания футбольных репортажей. Она позволяет генерировать видеопередачи с виртуальным ведущим на основе текстовой информации, видео с футбольных матчей и фотографий.
При создании ведущего использовалась технология наподобие deepfake (синтез изображения с помощью искусственного интеллекта, — прим. ред.) — в студии записывалось видео с реальным ведущим, который зачитывал на камеру названия всех футбольных клубов Английской премьер-лиги, каждого игрока и почти все возможные действия, которые могут произойти в игре. В итоге Reuters получило возможность генерировать синтезированные с помощью ИИ видеоотчеты о матчах.
В системе используется алгоритм для объединения фотографий матчей в режиме реального времени и репортажей с поминутной подачей данных о том, что произошло в игре. Это позволяет автоматически генерировать сценарий для отчета о спортивном событии, комбинируя слова, описывающие событие, с соответствующей картинкой, объясняет руководитель отдела основных новостных продуктов агентства Reuters Ник Коэн (Nick Cohen). По его словам, эти репортажи едва ли можно отличить от реальных, и те, кто уже видел первые результаты работы системы, были очень впечатлены.
Возможность внедрения подобной системы означает две важные вещи — освещение в автоматическом режиме могут получить любые, даже незначительные события. Например, можно сформировать видеорепортажи всех футбольных матчей, проходящих в конкретной стране, на континенте или во всем мире. А в перспективе для каждого зрителя могут формироваться адресные новостные репортажи, учитывающие персональные запросы. Виртуальный диктор может рассказать о любом событии, которое интересно конкретному пользователю, вместо освещения самых горячих новостей, отобранных редакторами.
Среди опрошенных «Телеспутником» телеканалов об интересе к технологии виртуальных ведущих сообщили РБК и «Ключ». У РБК есть планы по внедрению цифрового ведущего, но нужно дождаться, когда технология дозреет, признается управляющий директор Илья Доронов. «У виртуальных ведущих определенно есть будущее, как минимум, в пространстве социальных сетей и блогинга они точно будут популярны. Сегмент видео в интернете ежегодно растет, в то время как производить такой контент сейчас довольно затратно. Виртуальные ведущие могут упростить производство», — отмечает он.
На телеканале «Ключ» также не исключают возможности использовать такой формат, так как он позволяет выпускать в эфир ведущего вне зависимости от погоды и настроения, говорит главный редактор, заместитель генерального директора Дмитрий Сафронов. По его мнению, виртуальный ведущий не заменит человека на ТВ, так как для его подготовки нужны другие люди, тоже мастера своего дела. Но с развитием технологии искусственного интеллекта стоимость производства программ с участием виртуальных ведущих должна будет снизиться, и в этом случае многие телеканалы смогут их использовать. «Очевидное применение в первую очередь будет в новостях из-за их разнообразия и большого количества событий в стране и мире, так как телеканал должен и будет рассматривать новый функционал с точки зрения коммерческой эффективности и возврата инвестиций. Минусами подхода на данный момент являются большая длительность подготовки сюжетов и соответствие виртуала человеческому облику и стилю общению, не говоря уже о стоимости. А вот плюсом может быть новый формат и подача материала», — комментирует Дмитрий Сафронов .
Главный редактор телеканала «Санкт-Петербург» Расим Полоскин настроен более скептически. «Результаты пока не очень убеждают. Тех дикторов, что я видел, извиняет только то, что они виртуальные. Так что нашим ведущим пока не о чем беспокоиться. На мой взгляд, у этой технологии какое-то мрачненькое будущее, из фантастических фильмов 80-х годов прошлого века. Вытеснят ли они [живых дикторов], сложно сказать. Не возьмусь предсказать, какой будет аудитория, какие форматы ей будут интересны к тому моменту, когда технология разовьется настолько, что виртуальных ведущих от живых будет не отличить. Но, опять же, телевидение любит технологии, оно ими живет — и всему новому всегда найдется применение», — заключает он.