Безупречно выверенная, акустически правильная среда в значительной степени улучшает возможности по предоставлению информационного контента зрителю. Создание точечного восприятия позволяет фокусировать внимание, при этом особую роль начинает играть звуковое сопровождение. Человеческий мозг способен легко локализовать звуки в синтезированном 3D-пространстве, что часто используется режиссерами медиа для создания нескольких независимых локаций. Процесс анализа позиционированных аудиоисточников включает в себя оценку ширины стереобазы, тембра и теплоты звука. Также важно сохранять слоговую разборчивость и прозрачность. Как результат, информация поступает к зрителю в форме профессионально сфокусированного аудиопотока, при этом выставленные акценты не теряются, а подчеркиваются. Локализация дает огромные преимущества в информационном вещании. Излагаемые факты должны иметь четкую структуру, поддаваться разделению на отдельные части, быть прозрачными в части понимания целевой аудиторией. Использование правильно выверенных звуков для поддержки графического контента — главный принцип создания высокотехнологичного информационного пространства, ведь ключевая роль телевидения — это обеспечение сжатости излагаемого материала в совокупности с детализированностью фактов. В этих условиях создание иммерсивной аудиосреды играет особую роль. Работа звукорежиссера в аудиовизуальных искусствах должна поддерживать и усиливать работу режиссера монтажа и сценариста, поскольку связь звука с графикой и изображением играет важнейшую роль в восприятии структуры происходящего на экране, ведь в случае несоответствия восприятия аудио и видео у зрителя возникает диссонанс, который может серьезно подорвать усилия всей команды.
Создание иммерсивного звука
Телекомпании активно развиваются в интернете, соответственно видеоконтент в формате 360 градусов начинает играть значительную роль в информационном пространстве. Ряд крупных мировых медиа, таких как ABC News, BT Sport, Sky News, запустили проекты по интеграции видео 360 градусов в телевизионное производство, при этом интеграция технологических решений для обработки аудиопотоков несет ряд вызовов для звукорежиссеров, поскольку при создании аудиопространства с использованием технологий погружения необходимы особые навыки работы с амбисоник-микрофонами (записывают звук не только в горизонтальной плоскости, но и над и под слушателем, — прим. ред.). Технология «амбисоник» развивает идею передачи стереофонических сигналов с помощью совмещенных микрофонов. Ряд производителей аудиооборудования разработали готовые технологические решения для создания звукового 3D-пространства. Среди них можно выделить Core Sound TetraMic, Sennheiser Ambeo, Soundfield MKV и MH Acoustics Eigenmike.
Выбор оборудования
Одним из факторов выбора амбисоник-микрофона является критерий точности локализации звуков в пространстве. В самой базовой конфигурации данный тип оборудования имеет четыре расположенных в форме тетраэдра капсюля. В систему, называемую higher order, добавляются несколько дополнительных капсюлей. Они помогают улучшить детализацию звуковой картины. Несмотря на то, что амбисоник-микрофон воспринимает звуковые волны со всех направлений, важно позиционировать трансдьюсер (устройство, преобразующее акустические колебания в электрический сигнал, — прим. ред.) лицевой стороной к основному источнику звука. Эту работу упрощает буквенное обозначение форматов. Так, на этапе предварительной записи звукорежиссер использует А-формат (выход с микрофонных капсюлей), а на этапе мониторинга звука и пост-продакшена с использованием цифровой звуковой рабочей станции необходима перекодировка в B-формат.
Согласование уровней исходных аудиосигналов является ключевым фактором успеха при первичной записи. Звукорежиссеру необходимо использовать генератор тона для подачи тестового сигнала на четыре независимых канала цифрового рекордера. Максимальный уровень записи при этом должен иметь запас 12—18 дБ, исходя из возможного динамического диапазона сигнала. Технология амбисоник позволяет передавать реалистичность и естественность контента. Именно поэтому изменение индивидуального уровня сигнала какого-либо из каналов недопустимо в процессе прямой записи. Нормализация уровней звукорежиссером нарушит баланс и усложнит дальнейшие этапы работы по созданию иммерсивного контента.
Вторым важнейшим критерием выбора микрофона является качество передачи тембров. Несмотря на технологичность и инновационность подходов, использующихся при работе с иммерсивным звуком, более критичный фактор — корректное позиционирование микрофона. Запись в различных концертных залах осуществляется с учетом акустических особенностей помещений. Процессы поглощения и отражения волн сильно зависят от размеров концертного зала. Этот фактор дает ощущение дистанции, направления звука и объема. Подсознание зрителя акустически и психофизически дорисовывает картину происходящего. Звуковые волны воспринимаются каждым микрофонным капсюлем независимо, что дает зрителю ощущение пространства.
Перспектива при записи музыки в условиях виртуальной реальности — это выбор звукорежиссера. На этом этапе важно учитывать положение видеокамеры и режиссерскую идею происходящего на сцене. Перспектива звуковой картины имеет принципиальные различия с точки прослушивания дирижера, зрителей первого ряда и балкона. Характер звучания, проработка тембров также будут различными. Продуманные заранее варианты расположения амбисоник-микрофона позволяют произвести запись нескольких творческих дублей и выбрать лучший. Дополнительной техникой является добавление традиционных мономикрофонов при записи солоинструментов в оркестре. Трансдьюсеры, расположенные на расстоянии 30—50 см от инструментов, помогают подчеркнуть нюансы исполнения и разнообразить звуковую картину. При работе над перспективой звука важнейшим аспектом является работа системы звукоусиления.
Расположение акустических систем напрямую влияет на окрашенность отражений в концертном зале. Изменения усиливаются в процессе увеличения звукового давления. Тембры инструментов теряют естественность, перспектива становится смазанной. Звукорежиссеру необходимо принимать решение об изменении дистанции между источниками звука на сцене и амбисоник-микрофоном.
Единственной дилеммой при позиционировании оборудования остается его заметность. Проблема заключается в том, что наилучшая точка для записи звука может оказаться перед камерой. Также важно не забывать про штатив — в этом случае микрофон неизбежно окажется в кадре. С другой стороны, при расположении амбисоник-микрофона за камерой неизбежно экранирование сигналов камерой, штативом и оператором. Таким образом, подвешивание микрофона над сценой часто является единственным решением, позволяющим сохранить художественность изображения и богатство тембров музыкальных инструментов.
Мониторинг сигналов
Простое панорамирование в стерео не позволяет оценить качество иммерсивного звука в полной мере. А-формат, использующийся при записи, — это только четыре индивидуальных канала. Для оценки акустической картины записи звукорежиссеру необходимо осуществлять мониторинг 3D-версии аудиопродукта. Для этого необходимо конвертирование из А-формата в B-формат в режиме реального времени, поэтому технология прямой амбисоник-записи предполагает обязательное использование декодера для перевода первичных аудиопотоков в ряд других форматов. Функция декодирования важна также на последующих этапах телевизионного производства. Эта технология характеризуется гибкостью при работе с исходными данными, то есть в случае необходимости финальные аудиопотоки могут быть получены в моно, стерео, многоканальном формате.
Проблемы иммерсивного звука
Существует несколько препятствий, задерживающих распространение иммерсивных технологий в телевизионной индустрии. Технические возможности по приему подобного контента сильно ограничены на стороне потребителя. Нерушимость физических законов распространения звука нельзя сбрасывать со счетов. Повсеместная цифровизация телевидения значительно улучшила качество принимаемого сигнала. Тем не менее размещение акустических систем в помещениях, плохо подготовленных к прослушиванию сложного, творчески подготовленного контента, ведет к смешанным результатам в вопросах восприятия информации зрителем. Потребитель воспринимает финальный медиапродукт в форме, сильно зависящей от внешних факторов, поскольку акустические условия часто не соответствуют самым базовым стандартам.
В условиях реального производства запись высококачественного иммерсивного контента упирается в нехватку времени на создание реалистичного аудиопространства.
Обработка звуковых потоков на стороне потребителя также оказывает влияние на качество звучания. Различные устройства декодирования звука создают отличающиеся по глубине и насыщенности структуры. Более того, не все акустические системы способны воспроизводить декодированный контент с одинаково высоким качеством.
Также важны проблемы локализации источников звука при создании виртуальной среды. Человеческое ухо уникальным образом способно к позиционированию звуков в 3D-пространстве. Восприятие аудиосигналов человеком основано на процессе сравнения и сопоставления большого количества параметров, таких как уровни громкости, длительность, динамический диапазон и т. д. Слушатель также анализирует тембр, частоты и окраску звука, ширину аудиопотока, слоговую разборчивость и прозрачность звучания. В условиях реального производства запись высококачественного иммерсивного контента упирается в нехватку времени на создание реалистичного аудиопространства. Данная проблема особенно актуальна для телевидения, поскольку ограниченность времени на работу с контентом имеет под собой ряд экономических и творческих причин. Последствия недостаточной продуманности звуковой картины очевидны. Подсознательное сравнение визуального и аудиального каналов приводит к возникновению диссонанса, что сильно снижает информативность графики. В результате внимание зрителя переключается с процесса погружения и восприятия информационных потоков на процесс оценивания качества.
Заключение
Тренды развития технологий существенно влияют на восприятие медиапродукции зрителем. Создание иллюзии присутствия, когда пользователь проходит через созданную атмосферу виртуального сценария и переживает цепь заранее запрограммированных событий, — это сложный, многоступенчатый технологический процесс. Запись качественного иммерсивного звука невозможна без учета акустических условий помещения, выбора оборудования, оценки дистанции и перспективы в звуковой картине. Существующие технические трудности носят временный характер. Процесс постоянного совершенствования систем кодирования/декодирования, программного обеспечения и методов передачи сигнала приближает нас к полноценный эре VR-технологий в медиаиндустрии.