пятница, 14 декабря 2012 г.

Правда о форматах сжатия аудиоданных с потерей качества....

Байки относительно того, что тот или иной формат обеспечивает качество компакт-диска, оказались настолько действенными, что создатели современных кодеров эксплуатируют их без зазрения совести, заставляя пользователей верить в откровенную ложь. Прежде всего, стоит определиться, что именно является «качеством компакт-диска». Фактически подобное описание можно применить лишь к PCM (Pulse Code Modulation, импульсно-кодовая модуляция, самый распространенный метод кодирования несжатого аудиосигнала) файлам формата 44,1 кГц, 16 бит, стерео. Тем не менее, разработчики используют это понятие для обозначения чего угодно.

История заблуждения уходит корнями в ранние 90-е, когда институт Фраунгофера, представив общественности MP3, использовал термин «CD-качество» для описания возможностей нового формата. Ведь до появления MP3 обладатели персональных компьютеров могли пользоваться лишь убогим ADPCM (Adaptive Differential Pulse Code Modulation, адаптивная дифференциальная импульсно-кодовая модуляция), имеющим степень сжатия примерно 1:2 (1:4), а при увеличении степени компрессии напрочь убивающим даже намек на качество. Возвращаясь к институту Фраунгофера, заметим, что именно там родилось словосочетание «CD quality» по отношению к файлам, кодированным в формат MP3, 128 кбит/с, 44 кГц, 16 бит, стерео, положив тем самым начало одному из наиболее распространенных заблуждений в истории сжатия звука. Разработчиков можно было понять: в то время компьютерные колонки по качеству воспроизведения музыки могли соревноваться разве что с телефонными трубками, поэтому разница между Audio CD и MP3 при прослушивании музыки на компьютере была минимальной. Тем не менее, через некоторое время энтузиасты, пробовавшие записывать еще диковинные музыкальные файлы на дорогущие диски CD-R и прослушивавшие их на качественной аппаратуре, стали осознавать, что их попросту «надули».

К концу девяностых годов качество компьютерных колонок и звуковых карт сильно возросло, к тому же все чаще стали использоваться серьезные колонки, подключенные к ПК через усилитель. Понятно, что в этом случае не замечать огрехи цифровой компрессии становилось трудно.

Разработчики новых форматов, сравнивая звучание своих файлов с MP3, все больше занижали битрейт, при котором достигалось абстрактное CD-качество, чтобы показать таким образом эффективность своих кодеков. А простой пользователь, которому почему-то не приходило в голову проверить спорные утверждения, продолжал слушать… Планка быстро снизилась со 128 кбит/с до 96, 64, а затем и вовсе до 48 кбит/с…

Некоторые эксперты используют термин «прозрачность» (от англ. transparency) для обозначения сигнала, неотличимого на слух от оригинала в слепом тестировании. Так вот, если говорить о прозрачности музыки с использованием современных кодеков, то при проведении тестов становится ясно, что ни на 128, ни тем более на 64 кбит/с она (прозрачность) в подавляющем большинстве случаев не достигается; можно лишь говорить о приемлемом качестве, на котором уровень сторонних шумов и артефактов обычно не слишком велик, чтобы вызывать раздражение.

Битрейт, при котором достигается достаточно высокий уровень прозрачности (то есть вероятность появления артефактов крайне мала, а сигнал в большинстве случаев неотличим от оригинала на слух), обычно составляет 180–220 кбит/с для современных кодировщиков, работающих в режиме VBR. К сожалению, нельзя утверждать, что сейчас есть losless-кодеки, способные создавать файлы, «прозрачные» для любого человека. Ведь если одни не слышат разницы между оригиналом и WMA с битрейтом 96 кбит/с, другие способны в тесте отличить исходный файл от кодированного при помощи Musepack --braindead. Можно говорить о 50%, 80% или даже 99% людей, но никак не обо «всех». Подобное пока возможно лишь при losless-сжатии.

Что дальше?

Пока войны lossy-форматов продолжаются, многие компании всерьез занялись поддержкой алгоритмов, позволяющих производить сжатие без потерь. На данный момент существует огромное количество loseless-форматов, позволяющих хранить любимые композиции, не боясь лишиться хотя бы бита данных. Назовем самые известные из них: FLAC (Free Loseless Audio Codec), Monkeys Audio, Wavpack, LA (Loseless Audio).

Недавно собственный формат (WMA9 loseless) начала продвигать Microsoft, а FLAC стал частью проекта Xiph.org. В новой версии спецификации стандарта MPEG-4 тоже появится поддержка сжатия без потерь.


Что же заставляет крупные компании обращать внимание на loseless-сжатие?

Прежде всего, сжатие без потерь обеспечивает создание идеальных копий произведений, уменьшая размер файлов примерно вдвое. Объемы носителей растут, а новые винчестеры позволяют не так трепетно относиться к размеру файлов. На практике loseless-сжатие - единственное решение для тех, кто разочаровался в возможностях lossy-компрессии, или в случаях, когда даже незначительное снижение качества звука нежелательно или недопустимо. А с переходом на скоростные каналы связи (к сожалению, пока недоступные многим россиянам) привлекательность использования сжатия без потерь только возрастает. Ведь пользователям FLAC или LA не нужно беспокоиться о том, что формат, в котором они хранят архивные копии любимых дисков, устареет или выйдет из моды: в любой момент они могут не только конвертировать всю фонотеку в другой loseless-формат, не потеряв ни бита, но и сжать, используя любой из доступных кодеков.

Комментариев нет:

Отправить комментарий