среда, 25 февраля 2015 г.

Я услышал будущее потокового аудио — Meridian MQA. Часть 1.

Джон Аткинсон (John Atkinson) поделился своими впечатлениями от презентации новой технологии MQA.

В самом авторитетном аудио журнале «Stereophile» редактор Джон Аткинсон (John Atkinson) поделился своими впечатлениями от презентации новой технологии MQA, состоявшейся в Нью-Йорке в офисе Meridian на Манхэттене. Вот что он написал в статье под заголовком «I’ve Heard the Future of Streaming: Meridian’s MQA» - «Я услышал будущее потокового аудио - Meridian MQA» (By John Atkinson • Posted: Dec 21, 2014).

За почти 40 летнюю историю моих посещений различных пресс-мероприятий, я чрезвычайно редко возвращался домой с таким чувством, что присутствовал при рождении новой эпохи в аудио. Однажды, в марте 1979 г. я посетил Исследовательский Центр Philips Research Center в Эйндховене, в Голландии и впервые услышал звучание прототипа того, что позже было названо компакт-диском. Потом, летом 1982 года, я был в гостях у Ron Genereux и Bob Berkovitz в лаборатории компании Acoustics Research, недалеко от Бостона и услышал один из первых примеров применения DSP-процессоров для коррекции акустических проблем помещений. И, наконец, в начале декабря 2014, в офисе Meridian в Нью-Йорке, я услышал рассказ  Боб Стюарта о MQA технологии, за которым последовала демонстрация, которая меня буквально потрясла.

Через пару цифровых активных колонок Meridian, на которые подавались аудио данные с ноутбука, Боб Стюарт воспроизводил 24-битовые файлы с частотами дискретизации до 192 кГц, но скорость передачи данных была при этом не намного больше, чем у CD — около 1,5 Мбит/с! Но поразительно было не столько это, сколько осязаемость слышимого звука, прозрачность в передаче оригинального музыкального события, которую я почти никогда ранее не слышал, и это может подтвердить Jason Victor Serinus (см. его впечатления ниже).

Благодаря такой низкой скорости передачи данных, MQA позволит передавать подлинное аудио высокого разрешения (high-resolution) по тем же самым каналам Интернет, по которым любители музыки в настоящее время слушают в лучшем случае звук CD-качества от сервисов Tidal или Qobuz.

Так, что же скрывается за всеми этими чудесами?

MQA

MQA - это результат многолетних исследований Боба Стюарта и его соратника, известного английского инженера Питера Крейвена (Peter Craven). (Для получения дополнительной информации по MQA, кликните здесь.) Эти исследования включали возвращение к первоосновам, изучение современных достижений в области психологии восприятия звука, а также фундаментальные исследования природы музыки. (Боб представил доклад на эту тему на научной конференции Общества Audio Engineering Society в Лос-Анджелесе в октябре прошлого года: "A Hierarchical Approach to Archiving and Distribution" - «Иерархический подход к архивированию и распределению» (его можно скачать здесь (за 20 у.е. –прим.перев.). Там гораздо более подробно изложены теоретические и философские основы MQA, а в этой статье у меня нет для них достаточно места.)

Боб любезно согласился поделиться со мной презентацией в Powerpoint, и я воспроизвожу тут некоторые слайды, чтобы суметь разъяснить вам, что же такое MQA. Все следующее изложение — это моя личная интерпретация презентации Боба; и если в ней есть ошибки, то они лишь мои собственные.
Meridian MQA-Stereophile
Рис.1 Спектр пиковых значений аудиосигнала при исполнении струнного квартета Равеля, дискретизированного с разрешением 192 кГц, 24-бит PCM. На такой диаграмме - скорость передачи данных эквивалентна заштрихованной области.

Рис.1 - это вариация того, что называется «Диаграммой Шеннона», которая показывает «объем информационного пространства», требуемый для кодирования звукового сигнала, где по вертикали отображается уровень сигнала в дБ, а по горизонтали - его частота в килогерцах. Пиковые уровни записи струнного квартета показаны в зависимости от частоты (красная кривая), а синяя линия показывает уровень фонового шума в записи. (Боб говорит, что, независимо от типа музыки, для информационного пространства характерна эта базовая треугольная форма, а музыка и музыкальные инструменты постепено эволюционировали, чтобы соответствовать кривой чувствительности нашего слуха) Серая заштрихованная  область слева на графике, расположенная над зеленой линией, показывает, какую часть этого информационного пространства удается сохранить при записи в PCM с разрешением 16-бит/48кГц. Ниже зеленой линии показано, насколько больше информации можно сохранить при записи в PCM с разрешением 24-бит.

Если частоту дискретизации удвоить – до 96кГц, то теперь в записи может быть сохранена область с розовой штриховкой; а если частоту удвоить еще раз – до 192кГц, то сохраняется полное «информационное пространство».

Если взглянуть внимательно на красную и синюю кривые, становятся очевидными четыре вещи: 
  1. Что требуется иметь частоту дискретизации  >96кГц для того, чтобы закодировать всю музыкальную информацию в этой записи.
  2. Что информация, присутствующая на частотах свыше приблизительно 55кГц — это шум.
  3. Что в пределах основного диапазона (<24кГц), уровень шума превышает нижний предел 16-битового квантования.
  4. Что музыкальная информация занимает только часть «информационного пространства», обычно это область треугольной формы с самым большим динамическим диапазоном на низких частотах и с наименьшим — на ультразвуковых частотах. Это связано с природой музыки, которая фундаментально подобна самой себе по отношению к ее спектральному содержанию («fundamentally self-similar nature of music with respect to its spectral content»).
Последнее утверждение связано с наблюдаемым фактом - при каждом удвоении частоты дискретизации PCM, хотя и имеется небольшое улучшение в качестве звука, скорость потока данных и объем необходимой памяти для файлов также удваивается. Стерео сигнал 16/48k имеет скорость 1.54Mbps; 24/96k сигнал -  4.6Mbps; и 24/192k - 9.2Mbps. Линейное PCM кодирование считает каждую координату «информационного пространства» одинаково важной, отсюда проистекает неэффективность кодирования и передачи сигналов музыкальных данных в формате PCM.

Затем Боб Стюарт представил в своем докладе концепцию «Аудио оригами» ("Audio Origami") - сложения ультразвуковых компонент музыки обратно в основной диапазон, так чтобы сократить полосу частот для данных. 
Meridian MQA-Stereophile
Рис.2 MQA использует статистику музыкальной информации, чтобы закодировать  данные из 4Fs-октавы в небольшую область «информационного пространства», лежащую ниже 4Fs частоты Найквиста.

Первый шаг показан вверху. Музыкальная информация на частоте свыше 48кГц имеет очень малый динамический диапазон, поэтому, несмотря на то, что требуемая частота дискретизации  составляет 192 кГц, область, которую она занимает в  информационном пространстве (диаграмма "C") мала. Алгоритм MQA инкапсулирует (encapsulates) эти данные в малой прямоугольной области около  –130dBFS между 24 кГц и 48 кГц, в такой области, где для всех реальных записей иначе окажутся только случайные числа, т.е. шум. В результате получается файл с частотой дискретизации  96 кГц, который содержит внутри себя музыкальные данные  с частотой дискретизации  192 кГц. 
Meridian MQA-Stereophile
Рис.3 Тот же самый процесс инкапсуляции можно сделать и для 2Fs-октавных данных.

Но нет причин останавливаться на этом шаге. На Fig.3 показано как MQA инкапсулирует музыкальную информацию между 24 кГц и 48 кГц с частотой дискретизации 96 кГц ("B") в основное информационное пространство "A". Хотя динамический диапазон музыкальной информации в этой октаве больше, чем на частотах свыше 48 кГц, здесь инкапсуляция использует кодирование без потерь (lossless), получая еще одну прямоугольную область, которую можно «зарыть» ниже уровня шума в записях  в основном диапазоне ниже 24кГц. 
Meridian MQA-Stereophile
 Рис.4  24-битовый файл MQA с частотой дискретизации 48кГц содержит всю информацию, необходимую для восстановления  музыкального сигнала с частотой дискретизации 192кГц.

На Рис.4 показан конечный результат такого складывания и упаковывания: 24-битовый файл MQA с частотой дискретизации 48 кГц содержит всю информацию, соответствующую исходной записи музыкального сигнала с частотой дискретизации 192 кГц. Однако вы не получаете это бесплатно: данные, расположенные выше основного диапазона Fs, упаковываются существенно ниже уровня шума в записи, с использованием субтрактивного дизеринга (subtractive dither – подмешивания с вычитанием), в области информационного пространства, которая все равно была бы занята случайными сигналами, и это не имеет заметных на слух последствий. Когда этот файл воспроизводится с помощью MQA декодера, он «раскладывает» его обратно, чтобы получить исходное разрешение и диапазон частот, необходимые для воспроизведения музыки без потерь.

Комментариев нет:

Отправить комментарий