вторник, 20 ноября 2012 г.

Правда о форматах сжатия аудиоданных с потерей качества....

Байки относительно того, что тот или иной формат обеспечивает качество компакт-диска, оказались настолько действенными, что создатели современных кодеров эксплуатируют их без зазрения совести, заставляя пользователей верить в откровенную ложь. Прежде всего, стоит определиться, что именно является «качеством компакт-диска». Фактически подобное описание можно применить лишь к PCM (Pulse Code Modulation, импульсно-кодовая модуляция, самый распространенный метод кодирования несжатого аудиосигнала) файлам формата 44,1 кГц, 16 бит, стерео. Тем не менее, разработчики используют это понятие для обозначения чего угодно.

История заблуждения уходит корнями в ранние 90-е, когда институт Фраунгофера, представив общественности MP3, использовал термин «CD-качество» для описания возможностей нового формата. Ведь до появления MP3 обладатели персональных компьютеров могли пользоваться лишь убогим ADPCM (Adaptive Differential Pulse Code Modulation, адаптивная дифференциальная импульсно-кодовая модуляция), имеющим степень сжатия примерно 1:2 (1:4), а при увеличении степени компрессии напрочь убивающим даже намек на качество. Возвращаясь к институту Фраунгофера, заметим, что именно там родилось словосочетание «CD quality» по отношению к файлам, кодированным в формат MP3, 128 кбит/с, 44 кГц, 16 бит, стерео, положив тем самым начало одному из наиболее распространенных заблуждений в истории сжатия звука. Разработчиков можно было понять: в то время компьютерные колонки по качеству воспроизведения музыки могли соревноваться разве что с телефонными трубками, поэтому разница между Audio CD и MP3 при прослушивании музыки на компьютере была минимальной. Тем не менее, через некоторое время энтузиасты, пробовавшие записывать еще диковинные музыкальные файлы на дорогущие диски CD-R и прослушивавшие их на качественной аппаратуре, стали осознавать, что их попросту «надули».

К концу девяностых годов качество компьютерных колонок и звуковых карт сильно возросло, к тому же все чаще стали использоваться серьезные колонки, подключенные к ПК через усилитель. Понятно, что в этом случае не замечать огрехи цифровой компрессии становилось трудно.

Разработчики новых форматов, сравнивая звучание своих файлов с MP3, все больше занижали битрейт, при котором достигалось абстрактное CD-качество, чтобы показать таким образом эффективность своих кодеков. А простой пользователь, которому почему-то не приходило в голову проверить спорные утверждения, продолжал слушать… Планка быстро снизилась со 128 кбит/с до 96, 64, а затем и вовсе до 48 кбит/с…

Некоторые эксперты используют термин «прозрачность» (от англ. transparency) для обозначения сигнала, неотличимого на слух от оригинала в слепом тестировании. Так вот, если говорить о прозрачности музыки с использованием современных кодеков, то при проведении тестов становится ясно, что ни на 128, ни тем более на 64 кбит/с она (прозрачность) в подавляющем большинстве случаев не достигается; можно лишь говорить о приемлемом качестве, на котором уровень сторонних шумов и артефактов обычно не слишком велик, чтобы вызывать раздражение.

Битрейт, при котором достигается достаточно высокий уровень прозрачности (то есть вероятность появления артефактов крайне мала, а сигнал в большинстве случаев неотличим от оригинала на слух), обычно составляет 180–220 кбит/с для современных кодировщиков, работающих в режиме VBR. К сожалению, нельзя утверждать, что сейчас есть losless-кодеки, способные создавать файлы, «прозрачные» для любого человека. Ведь если одни не слышат разницы между оригиналом и WMA с битрейтом 96 кбит/с, другие способны в тесте отличить исходный файл от кодированного при помощи Musepack --braindead. Можно говорить о 50%, 80% или даже 99% людей, но никак не обо «всех». Подобное пока возможно лишь при losless-сжатии.

Что дальше?

Пока войны lossy-форматов продолжаются, многие компании всерьез занялись поддержкой алгоритмов, позволяющих производить сжатие без потерь. На данный момент существует огромное количество loseless-форматов, позволяющих хранить любимые композиции, не боясь лишиться хотя бы бита данных. Назовем самые известные из них: FLAC (Free Loseless Audio Codec), Monkeys Audio, Wavpack, LA (Loseless Audio).

Недавно собственный формат (WMA9 loseless) начала продвигать Microsoft, а FLAC стал частью проекта Xiph.org. В новой версии спецификации стандарта MPEG-4 тоже появится поддержка сжатия без потерь.


Что же заставляет крупные компании обращать внимание на loseless-сжатие?

Прежде всего, сжатие без потерь обеспечивает создание идеальных копий произведений, уменьшая размер файлов примерно вдвое. Объемы носителей растут, а новые винчестеры позволяют не так трепетно относиться к размеру файлов. На практике loseless-сжатие - единственное решение для тех, кто разочаровался в возможностях lossy-компрессии, или в случаях, когда даже незначительное снижение качества звука нежелательно или недопустимо. А с переходом на скоростные каналы связи (к сожалению, пока недоступные многим россиянам) привлекательность использования сжатия без потерь только возрастает. Ведь пользователям FLAC или LA не нужно беспокоиться о том, что формат, в котором они хранят архивные копии любимых дисков, устареет или выйдет из моды: в любой момент они могут не только конвертировать всю фонотеку в другой loseless-формат, не потеряв ни бита, но и сжать, используя любой из доступных кодеков.

Сетевой проигрыватель Pioneer N-30-K.

Pioneer Corporation, основанa в 1938г. в Токио. История возникновения компании очень необычная. Сначала это была простая мастерская по ремонту радио и громкоговорителей. А теперь это ведущий мировой лидер по производству электроники!

Корпорация Pioneer уже давно заработала репутацию производителя самых революционных технических новинок. Именно этой компании принадлежит честь изобретения интерактивного кабельного телевидения, лазерного CD плеера, первой полной акустической системы для автомобиля и многого другого. Кроме того, компания производит превосходные, AV ресиверы, Blu-Ray проигрыватели, и тысячи других продуктов. Особенно преуспела Pioneer в производстве компонентов для современного домашнего кинотеатра: специалисты компании разработали множество мелочей, которые сделают Ваш домашний кинотеатр самым современным и самым мощным. Важно, что Pioneer ценит выше всего качество своей продукции: техника данного брэнда отрабатывает по всем параметрам на 100%.

Изумительный звук (в акустике), суперкомфортная установка и эксплуатация, а, главное, эргономичность – абсолютная безопасность для человека и его окружения – все это является фирменным отличием продукции, произведенной Pioneer. Важно и то, что работа большинства моделей Pioneer автоматизирована настолько, насколько это возможно. Вам не придется ломать голову над тем, как настроить систему и добиться оптимальных результатов. Все за Вас сделает “умная” техника от Pioneer. Продукция каждой компании имеет уникальные свойства, которые Вы никогда не найдете у других производителей. Для Pioneer это ориентация на потребителя, его интересы и потребности, а также безусловно максимальное качество продукции. Важно, чтобы Вы хорошо ориентировались в этих тонкостях.

В наше время большую часть, если не всю свою музыку мы храним на жестком диске или портативном устройстве (таком, как iPod или iPhone). И мы можем слушать Интернет радио, а не только FM станции. Сетевые аудиоплееры Pioneer, подключаемые к АВ ресиверу или внешнему ЦАП-у, позволяют наслаждаться самым разным цифровым аудио, которое есть сегодня в нашем распоряжении - где бы оно не было сохранено. Они предлагают широкую поддержку музыкальных файлов, разных характеристик улучшения звука и опцию беспроводного подключения к домашней сети. Hi-bit обработка и изолированный цифроаналоговый блок питания обеспечивают кристально чистое звучание. 


Один из самых доступных на рынке сетевых плееров, с очень гуманной ценой (15990 руб.) и отличным функционалом, Pioneer N-30-K.

К отличительным чертам можно отнести:
  • Совместимость с AirPlay
  • USB вход на передней панели для подключения Вашего iPod/iPhone/iPad
  • возможность работы с приложениями управления Pioneer : приложением дистанционного управления для iPod touch, iPhone и Android
  • возможность работы с Bluetooth
  • возможность работы с беспроводной локальной сетью
  • Воспроизведение HD аудио (до 192 кГц/24-бит)
  • Синхронизатор высокой точности



























































Сетевой аудиоплеер Onkyo T-4070.

Сначала в японской Осаке, а потом по всему миру, с 1946 года и по наше время руководство Onkyo неукоснительно следовало принципу приоритета качества звучания. И ее продукция всегда стояла несколько особняком по сравнению с массовыми электронными марками. Чтобы ни было, какие бы поветрия не волновали умы человечества, а в Onkyo всегда ставили дискретную элементную базу с качественными комплектующими в своих ресиверах и усилителях. И это только один из показательных фактов добросовестного отношения к делу на фоне всеобщей экономии, унификации и маркетинговых мифов.

В настоящее время Onkyo разрабатывает три основных направления. Первое – это различные схемы усиления, а также воспроизведения аудио и видео. О них мы поговорим ниже чуть подробнее. Второе – OEM-производство динамиков - для автомобилей, телевизоров, видеоигр, музыкальных инструментов и радиовещания - здесь в клиентах у Onkyo почти вся Япония, включая даже телевизоры Sony и Panasonic. В свое время, в 50-х технология беспрессового изготовления диффузоров вывела Onkyo в число ведущих японских производителей акустических систем. И третье направление - самое перспективное и многообещающее - сетевая коммуникация Компания грамотно ведет свой курс, чутко прислушиваясь к современным тенденциям (и во многом формируя их самостоятельно) при одновременной заботе о своих клиентах - не обманывая на качестве комплектующих и предлагая сбалансированные решения. Доказательством этому служит признательность и преданность фанатов Onkyo по всему миру - иначе бы о 60-летии компании мы сейчас говорили в прошедшем времени.


Выпустив сетевой тюнер T-4070, Onkyo сделала решительный шаг в мир бесчисленных музыкальных открытий, связанных с бурной эволюцией медиа носителей. Сегодня она достигла «облачных» сфер, в которых отныне хранятся все файлы. Синхронизируйте Onkyo T-4070 с вашей домашней сетью, чтобы получить доступ к заказным потоковым сервисам и персонализованным радиостанциям, таким как AUPEO!, Napster, vTuner и Last.fm. Интеллектуальный и интуитивно понятный диск-жокей - DJ – это всего лишь одна из функций, которую для вас исполнит Onkyo T-4070. Используйте порт USB для прямого цифрового подключения iPod/iPhone и флеш накопителей; а сеть Ethernet – для проигрывания аудио библиотек с вашего PC через тюнер, усилитель и колонки, или же настройтесь на станцию в любом из диапазонов: AM/FM/DAB/DAB+.

Универсальность T-4070 прекрасно сочетается с высоким качеством исполнения. Схема Onkyo DIDRC подавляет даже малейшие шумы для ничем не искаженного воспроизведения. Раздельные микросхемы ЦАП Wolfson 192 кГц/24-бит для L/R каналов обеспечивают высокую точность преобразования. Можно выбрать позолоченные разъемы RCA, AES/EBU, или коаксиальный выход. Подобные детали показывают серьезность подхода Onkyo к обеспечению подлинно аудиофильского уровня звучания. 

Особенности Onkyo T-4070
  • Схема подавления динамических интермодуляционных искажений DIDRC (Dynamic Intermodulation Distortion Reduction Circuitry)
  • Интернет-радио и потоковая музыка через Ethernet (vTuner, Last.fm, Napster, Spotify, AUPEO!)
  • Подключение к домашним сетям с сертификацией DLNA Version 1.5
  • Воспроизведение аудио файлов по локальной сети (MP3, WMA, WMA Lossless, FLAC, WAV, Ogg Vorbis, AAC)
  • Прямое цифровое подключение iPod/iPhone и флеш-памяти на разъем USB на передней панели
  • Алгоритм восстановления сжатых музыкальных файлов Advanced Music Optimizer
  • Раздельные микросхемы ЦАП Wolfson 192 кГц/24-бит (WM8742 x 2) для L/R каналов
  • Антивибрационное шасси толщиной 1.6 мм
  • FM/AM/DAB+ тюнер, память на 40 FM/AM станций, 40 DAB/DAB+ станций, RDS (RT/PTY/TP)
  • 3 цифровых аудио выхода (Amphenol AES/EBU, оптический и коаксиальный)
  • Позолоченные медные фрезерованные разъемы RCA, AES/EBU и коаксиальный
  • 3-режимный диммер дисплея (Normal/Dim/Dimmer)
  • Потребление: 28 Вт, размеры: 435 x 100 x 306.7 мм, вес: 5.8 кг

Музыкальный сервер Naim NS03.

Модная тема сетевого хранения и стриминга мультимедийныхданных не обошла стороной и легендарные аудиобренды, которыезачастую предлагают оригинальные комплексные решения.В британском ателье Naim для развития этого направленияорганизовано отдельное подразделение NaimNet.


Музыкальный сервер Naim NS03 - функционально наиболее насыщенный компонент NaimNet. Поскольку он включает в себя устройство  чтения компактдисков, можно использовать его как высококлассный CD-проигрыватель, либо копировать содержимое компактов на внутренний винчестер с одновременной каталогизацией контента.Накопителей у него два - первый содержит актуальную версию музыкальной библиотеки, а второй служит для резервирования данных. Чтобы снизить загрузку системы, процесс резервного копирования происходит по расписанию, задаваемому владельцем. Для управления сервером на лицевой панели имеется цветной сенсорныйэкран высокого разрешения. Кроме того, базовые операции выполняются также с помощью обычного пульта ДУ. Однако для аппарата подобного класса наиболее важно управление по сети. И здесь Naim NS03 допускает самые разнообразные варианты - от доступа по IP с обычного браузера или специального клиентского приложения NaimNet Desktop Client до использования iPhone или iPad в роли продвинутого пульта.

Темные шероховатые стенки массивного металлического корпуса скрывают продуманную до мелочей конструкцию. Такого рода устройства находятся на стыке компьютерной и аудиотехники, что заметно при изучении внутреннего обустройства Naim NS03. Системная плата с процессором и памятью, жесткие диски, импульсный блок питания цифровых модулей сервера и привод CD соседствуют с аналоговой частью, построенной на чипах Burr-Brown PCM1791. Ее энергоснабжение изолировано от остальных подсистем и организовано посредством классического блока питания на базе тороидального трансформатора. Особое внимание уделено вопросам охлаждения и виброизоляции, в результате чего издаваемый компонентом шум сведен к минимуму и практически не слышен, хотя сам металлический корпус в процессе работы ощутимо нагревается, что необходимо учитывать при инсталляции.

Главная задача Naim NS03 - созданиеи хранение музыкальной библиотеки, составленной из коллекции компакт дисков, а также воспроизведение и раздача сетевым клиентам входящих в нее файлов. И с этой миссией сервер справляется блестяще. Копирование CD на внутренний диск занимает менее 10минут. С одной стороны, не слишком быстро, зато выполняется указанная процедура с применением фирменного алгоритма считывания и проверки информации, минимизирующего ошибки чтения, что существенно влияет на качество звучания. Если копируется официальное издание, то из Интернета в музыкальную библиотеку переносятся необходимые сопроводительные сведения об альбоме, включая графический образ обложки. После завершения копирования записи сразу готовы к прослушиванию. Как источник аналогового сигнала в стерео системе, Naim NS03 сохранил все лучшие черты проигрывателей компакт-дисков Naim. Живые и очень выразительные аудио образы и масштабная сцена сочетаются с избирательным вниманием к мелким деталям,что лишает звук хирургической стерильности. Если вы предпочитаете слушать музыку, а не оценивать характеристики саунда, то продукция Naim, скорее всего,придется вам по вкусу. Причем материал воспроизводится одинаково хорошо как непосредственно с CD, так и из музыкальной библиотеки на внутреннем винчестере сервера, что лишний раз подчеркивает образцовое качество копирования.

Умеет Naim NS03 работать и с музыкальными фонограммами высокого разрешения, вплоть до параметров 32 бит/192 кГц. Подобные файлы можно разместить на внешних накопителях, как сетевых, так и оснащенных интерфейсом USB, - во внутреннюю библиотеку текущая версия прошивки такой материал не импортирует. Впрочем, имеется способ интегрировать подобный контент в музыкальную библиотеку сервера и другим способом: прямо из системного меню аппарата можно воспользоваться услугами музыкального онлайн-магазина Naim Label, предлагающего легальные записи в формате FLAC с параметрами 24 бит/96 кГц.

Технические характеристики:

Частотная характеристика, Гц – нет данных
Воспроизведение – WAV, AIFF, FLAC, ALAC, OGG Vorbis, AAC, WMA, MP3
Частота дискретизации, кГц – 32; 44,1; 48; 88,2; 96; 192
Кодирование, бит – 16; 24; 32 fixed; 32 float
Отношение сигнал/шум, дБ – нет данных
Гармонические искажения,% – нет данных
Обмен данными – Ethernet, USB 2.0 (5)
Накопители – внутренние, 1 Тбайт (2)
Аудиовходы – нет
Аудиовыходы – стереопары RCA (4), DIN, цифровой коаксиальный, цифровой оптический
Видеовыходы – композитный, S-Video, VGA
Дополнительно – сенсорный экран 4,3 дюйма, привод CD
Габариты, см – 43,2 x 8,7 x 31,4 | Масса, кг – 10,8

Музыкальные Серверы: какими они бывают...

Это первая заметка в серии статей о музыкальных серверах hi-end класса. Удобство музыкальных серверов вне всякого сомнения. Об этом свидетельствует несомненный успех  iPod. Портативный музыкальный сервер, который мало весит и имеет массу музыкальных файлов, удобных для  индивидуального использования (в наушниках), или в домашней музыкальной системе (через кредл). Поскольку много пользователей iPod и музыкальных слушателей отмечают удобство во всем, что улучшает качество жизни. Если продукт кажется хорошим, это - только увеличивает ценность для тех, кто это замечает и использует. В течение многих десятилетий большинство меломанов сопротивлялось удобству в пользу качества звука. Например, ходьба к виниловому проигрывателю, чтобы переместить иглу или поменять диск была предпочтительным методом для многих меломанов. А  музыкальный сервер? Гигантское НЕТ в мире аудио hi-end много лет. К счастью, меломаны больше не будут делать выбор между качеством и удобством. Теперь они могут иметь музыкальный сервер класса hi-end.
Эта статья обсуждает две категории музыкальных серверов hi-end, промышленно изготовленных и изготовленных на базе ПК. Готовые системы, часто называемые решениями под ключ, являются действительно удобными и  законченными решениями, в отличии от компьютерного воплощения. Они могут часто размещаться в стойку с существующими компонентами, ими удобно пользоваться, следуя руководству на экранах, они уже имеют свой собственный софт и интерфейс, не требуют дополнительных знаний от пользователя, адаптированы к современному звуку и просто великолепно звучат. Многие из этих аудио серверов используют те же самые соединительные провода, что и обычные  CD-плеера. Некоторые изготовители даже загружают музыку на музыкальный сервер прежде, чем это будет сделано пользователем. Музыкальные сервера - безусловно самый легкий способ объединить музыкальный сервер в систему hi-end, но они ограничивают варианты расширения или модернизации. 
Системы на базе ПК требуют много компьютерных знаний, чтобы его использовать по назначению, но предлагают почти неограниченную гибкость и способность к росту по более дешевой цене. Большинство компьютерных  систем похожи на стандартные компьютеры с интерфесом, способным интегрировать данное устройство в аудиосистему hi-end. У тех, которые хотят лучшую эстетику, есть выбор использовать корпуса, специально предназначенные для мультимедийных решений, который гармонирует с существующими аудио компонентами, или они могут использовать хорошо выглядящий Mac Mini. Вы даже можете убрать его из основной комнаты и разместить его в любой другой, соединив его с аудиосистемой посредством Wi-fi. У Вас есть свободная комната в подвале или туалете? Поместите свой музыкальный сервер там и используйте беспроводное устройство, чтобы транспортировать музыку к Вашей главной системе. Главные недостатки, которые много меломанов имеют с системой на базе ПК, состоят в том, что они должны понять, как их музыкальный сервер работает, чтобы использовать ее, и они должны провести время, "управляя" сервером. Т.е. систему нужно настроить. И нужно не забывать, что это програмно-ориентированный подход, и нужно уделять время подбору и настройке програмного продукта. В противоположность готовой системе, где все продумано производителем, и потребителю не нужно ломать голову.
Что же предпочесть? Как выбрать?  Здесь мы обсудим  эти варианты и поможем  Вам определиться с решением,  какой музыкальный сервер является правильным для Вас.
 Большинство меломанов хочет хранить больше музыки и превосходно ее воспроизводить, иметь хороший внешний вид и удобное управление. Самый легкий способ достигнуть этого с готовым музыкальным сервером, который вписывается в существующую систему так хорошо, что вы перестаете его замечать. Есть две категории готовых музыкальных серверов. Это замена существующего источника или дополняющий вашу систему. 
Музыкальный сервер замены - тот, который заменяет существующий CD-плеер полностью, т.е. имеет на борту CD привод, и может выполнять роль проигрывателя. Пример музыкального сервера замены - серия MS у McIntosh, MS300 & MS750. Эти компоненты - в основном CD-плееры McIntosh с дополнительной возможностью хранить музыку на жестком диске и имеющие экранное меню. 
Дополнительные музыкальные серверы (сетевые проигрыватели) – это именно то,  что подразумевает само название, т.е. музыкальный сервер, дополняющий основную систему. Они - интегрируются в существующую систему hi-end, оставляя текущий CD плеер на своем  месте. Дополнительные музыкальные серверы производят Sooloos, Qsonix,  ReQuest и многие другие производители. Эти музыкальные серверы имеют больше общего с компьютерами, чем CD-плеерами. У них часто есть мониторы с сенсорным экраном, встроенный    RAID-массив, и (ограниченная) способность добавлять дисковое пространство. Является ли это заменой или дополнительным музыкальным сервером, главный коммерческий аргумент по готовым системам – простота и функциональность. Продолжение следует....

Подключение звуковой карты к внешнему DAC. Продолжение.

Продолжим. Поговорим о шине "Toslink". Многие аудиомонахи говорят, что, дескать "джиттер" у него "большой". Это не так! Дело в том, что качество передачи по этой шине прямо зависит от того, какого типа оптические кабели, приемники и передатчики вы применяете.

Стекловолоконные кабели,. это уже - полдела. Теперь о приемниках с передатчиками. На рынке присутствуют, в основном, изделия фирмы Sharp, реже встречается продукция фирмы Toshiba. В TA-E2000ESD применены приемники TORX 173 и передатчики TOTX 173 от Toshiba, для которых наихудшие результаты измерения по частотной девиации сигнала составляют около 20 пикосекунд, такие же величины характерны и для моделей 176 и 194, обладающих одними и теми же электрическими и оптическими параметрами, но поставляющимися в разных форм-факторах крепежа. Для удешевленной пары TORX/TOTX 178 на основе стеклопластика максимальная девиация может доходить до 40 псек., по данным из независимых источников. Для изделий же фирмы Sharp характерны величины вплоть до 70 псек., т.е. значительно хуже, но также нет оснований сомневаться в том, что подобная величина много меньше характерной для недорогих "сидюков" с коаксиальными интерфейсами и аудиофильского хлама. О Sound Blaster Live!, кстати, доподлинно известно, что его цифровой аудиоинтерфейс характеризуется "джиттером" на уровне 240 псек., что сравнимо с таким "сидюком", как Arkam Alpha 5.

Теперь остановимся на шине  AC-Link. В отличие от шин S/PDIF и AES/EBU для передачи данных в AC-Link в одном кадре выделяются по 12 так называемых "временных слотов" для входящих и выходящих данных. Первый и второй "слоты" используются для передачи регистров и команд, 3 и 4 - для левого и правого каналов, 5 - для модема, 6, 7, и 8 - для цетрального, левого и правого тыловых каналов, 9 - для сабвуфера, 10 и 11 - для "альтернативных" левого и правого каналов (режим "двойное стерео"), 12 - для модема. Звукоданные по этой шине передаются строго с частотой дискретизации 48 кГц, в формате с длинной слова 16 или 18 бит. С точки зрения конструкции ЦАП и АЦП не оригинальны, и базируются на "проверенных" решениях, примененных в ЦАП TDA 1305 и SAA 7360 фирмы Philips. Сие означает, что АЦП работает по принципу дельта - сигма модуляции с однобитовым представлением данных со 128-кратной субдискретизацией и шумоформированием 3 порядка и оперирует на частоте 24,576 МГц, т.е. 512-кратной частоте дискретизации исходного сигнала. В переводе на простой человеческий язык это значит примерно 14 битовую точность и динамический диапазон порядка 75 дБ при 18 битовом формате представления звукоданных. Владельцы DCC - магнитофонов и Dolby Digital ресиверов фирмы Philips могут легко представить себе качество оцифровки.

Ну и наконец о USB.  USB (сокращение от Universal Side Bus, с англ. - универсальная последовательная шина) - интерфейс передачи данных между цифровыми устройствами. Версия этого стандарта USB 1.1 обеспечивает скорость 12 Мбит/c, а распространенная сегодня версия USB 2.0, - 480 Мбит/c. Стандартные разъемы USB есть практически на каждом ноутбуке и ПК, а его уменьшенные вариации (называемые mini-USB и micro-USB) используются в портативной технике (мобильных телефонах, КПК, MP3-плеерах, цифровых фотокамерах и т. д.). USB стал действительно универсальным стандартом и соответствующими разъемами оснащено уже множество цифровых устройств. К компьютеру по USB можно подключать мышки, клавиатуры, принтеры, сканеры и множество других устройств. В том числе сейчас и внешние ЦАП.

ЦАП (цифро-аналоговый преобразователь) - гаджет экзотический и многие о них даже не слышали. Главная задача ЦАП - улучшить качество звучания цифровых источников. В первую очередь - компьютера. Как правило, применяется подключение по USB, а установка драйверов не требуется. По сути ЦАП используется как внешняя звуковая карта. Причем заметно более качественная, чем обычные карточки. Но это не предел возможностей ЦАПов. Наверняка у многих найдется дома хотя бы одно устройство, к которому можно подключить преобразователь помимо компьютера. Итак, к ЦАПам можно подключать: игровые консоли, сетевые музыкальные проигрыватели и серверы, медиаплееры, CD-, DVD- и Blu-ray-плееры и др. Есть и экзотические варианты, готовые работать напрямую с iPhone (Peachtree iDac) или по Wi-Fi (Arcam rDac Wireless).

Входы и выходы

У любого ЦАПа есть набор входов и выходов, которые используются для подключения других музыкальных компонентов. Понятно, что чем шире ассортимент, тем проще будет с подключением разных источников. Советую оценить, сколько источников вы хотите подключить к ЦАПу. Возможно, вам не понадобится преобразователь с большим количеством разъемов и это позволит немного сэкономить. Только помните, что в будущем, количество источников может увеличиться.

Набор входов индивидуален у каждой модели, хотя можно определить своего рода джентльменский набор: коаксиальный вход (разъем RCA), оптический вход, разъем USB (тип В). Первый и второй пригодятся для подключения Hi-Fi и бытовой техники. Разъем USB пригодится для подключения ноутбуков и настольных ПК. У серьезных и дорогих моделей набор входов, как правило, расширенный. У них может быть, несколько коаксиальных и оптических входов (а также вход AES), чтобы у пользователя была возможность подключить одновременно несколько источников.

Набор выходов скромнее и может ограничиваться одним стандартным небалансным стереовыходом (2 разъема RCA) для подключения к усилителю. Также у некоторых моделей к обычному добавляется балансный стереовыход, который теоретически обеспечивает лучшее качество передачи сигнала при подключении к усилителю с соответствующим входом. Встречаются у ЦАПов и цифровые выходы, которые можно использовать для вывода сигнала на другие источники (к примеру, на другой - более качественный ЦАП).

В это трудно поверить, но при подключении одного источника к разным входам ЦАПа можно получить разный результат. К примеру, подключил источник по USB - хорошо играет, подключил по коаксиалу - играет еще лучше! Такой сюрприз объясняется как особенностями конкретного ЦАПа, используемыми кабелями, особенностями самих цифровых интерфейсов и др.

Подключение звуковой карты к внешнему DAC. Теория.

В журналах по аудиотехнике было много разглагольствований о том, что за цифровые фильтры, ЦАП и внутренние шины применяются во всяческих сидюках, транспортах и  ЦАП - конвертерах. Уделялось внимание также входным приемникам-конвертерам, преобразующим данные, пришедшие по шине S/PDIF в формат внутренней шины прибора, однако все наши доводы не шли дальше сравнений типа "AES20/21 (UltraAnalog) - хорошо, CS 8411/8412 (Crystal Semicon.) или YM3623 (Yamaha) - плохо". Поговорим сегодня подробно о шине S/PDIF.

Итак, наша шина, описываеваемая стандартами IEC958 1989-03 (часть I)и EIAJ CP-340 1987-9, появилась в 1983, примерно через год после выпуска первых "сидюков", когда стало ясно, что появление бытовых цифровых магнитофонов не за горами. Оба стандарта подразумевают формат передачи с длиной слова в 32 бит, плюс 4 бит синхронизации, плюс 1 бит полей Рида-Соломона, плюс 1 бит субкода, плюс 1 бит четности с 5 по 31 бит, плюс один бит статуса канала за один кадр передачи. Звукоданные могут передаватся в формате 16, 20 и 24 бит, а частота дискретизации не оговорена.

В отличие от оного формат передачи AES/EBU подразумевает передачу звукоданных для каждого канала полукадрами по 32 бит, что образует в сумме один кадр с тем же 4 битным блоком синхронизации, разряды же состояния канала каждого из 192 полукадров в сумме образуют блок из 24х8 бит. Звукоданные передаются в формате 18 или 24 бит, в первом случае возможна передача 6 бит служебной информации в каждом кадре. Блоки синхронизации в обеих форматах несут информацию о длине слова звукоданных, внесенных предискажениях, характере - моно/стерео и временном коде, плюс регистры полей Рида - Соломона. В 1989 г. два вышеупомянутых стандарта оговорили передачу сведений о коде записи по каталогу и информации о запрещении-разрешении копирования по стандарту SCMS.

Электрические же характеристики сигналов, несущих звукоданные в этих двух форматах, различны:



AES/EBUS/PDIF (IEC-958)
КабельСимметричный 110 Ом, в оплеткеассиметричный 75 Ом
Штеккер3-pin XLRRCA (или байонетный BNC)
Уровень сигнала3..10 вольт0.5..1 вольт
Максимальная длина шины12 метров2 метра
Частотные характеристики шины S/PDIF:
2.8224 Mбит/сек. - 44,1 кГц
3.072 Mбит/сек - 48 кГц
2.048 Mбит/сек - 32 кГц

Как было указано, у стандарта IEC958 1989-03 присутствует вторая часть. Она подразумевает деление S/PDIF на два формата передачи данных профессиональный и потребительский. Первый позволяет передавать данные по шине S/PDIF в раскадровке, аналогичной AES/EBU.

В 1986 г. фирма Toshiba предложила способ передачи данных в S/PDIF-формате по оптическому кабелю на расстояние в 1,5 метра (пластик), либо 3 метра (стекловолокно). Эта шина, получившая название "Toslink", описывается стандартом EIAJ CP-1201. О нем мы скоро поговорим.

 Наконец, в 1998 г. появился простой стандарт IEC60958, подразумевающий пересылку по шине как обычных звукоданных, так и сжатых в форматах АС-3, MPEG Audio, либо DTS согласно стандарту IEC61937, появившемуся в 1994 г.

Несмотря на все многообразие форматов пересылки данных этим делом издревле занимаются передатчики и приемники, которые и определяют качество того сигнала, что доставляет звукоданные на внутреннюю шину ваших шикарных ЦАП с прецизионными цифровыми фильтрами и резистивными матрицами лазерного травления с допуском 0,25 мкм на ней. Их, эти передатчики-приемники, можно условно разделить на три типа.
  • Тип первый - это передатчики и приемники со встроенным ОЗУ для промежуточного хранения как самих звукоданных, так и служебных регистров. Наиболее надежен и хорош. К нему относятся большинство таких приборов фирмы Sony, передатчики СS 8401 и CS 8403 плюс приемники CS 8411 и 8413 фирмы Crystal Semicon. и AES-20 UltraAnalog, представляющий из себя, по сути, "плохой" CS 8411, произведенный с максимальными качественными допусками. Практически они могут принимать и отправлять звукоданные в широком спектре форматов их представления - с частотой дискретизации от единиц до 48-96 кГц и от 4 бит до 24 длины слова. А кроме того они могут компенсировать временные искажения сигнала при помощи выборки из ОЗУ, однако и они не справятся с явными помехами и шумами. 
  • Вторым номером у нас идут приемники и передатчики упрощенного типа, в которых отсутствует ОЗУ, но есть маленький кэш для регистров. К ним относятся приемники CS 8412/8414, AES-21 и YM 3623, и передатчики CS 8402/8404. Здесь хорошие трансформаторные входы-выходы переходят из разряда "рекомендуемое" в "обязательное". К этому же типу относятся и встроенные в DSP-чипы передатчики, что применяются в большинстве звуковых карт. Так, в ZA-2 применен приемник CS 8412 и передатчик, встроенный в процессор CS 4922 и полностью аналогичный отдельно взятому СS 8402. Таков и передатчик, встроенный в AU8830 Vortex 2, а приемник к нему нужен отдельно.
  • На третье у нас комбинированные модели. К таковым относятся, во-первых, приемопередатчики фирм Philips, Toshiba и ряда других, применяющиеся в бытовых DAT-магнитофонах, минидисковых деках и всяческих декодерах Dolby Stereo Digital. Для комбинированных моделей характерна упрощенческая архитектура, подразумевающая пересылку данных на внутреннюю шину в каком-то одном формате, чаще всего - 16 бит/48 кГц, данные, поступившие извне в ином формате, конвертируются на входе или выходе в указанный. Предпосылки для появления таких изделий появились в 1986 г., когда были выпущены первые бытовые DAT-магнитофоны, вообще неспособные выполнять запись на частоте дискретизации 44,1 кГц в целях защиты авторских прав (стандарт SCMS еще не был принят). Потом ими начинили декодеры Dolby Digital и минидисковые деки. Такого рода штука применена и в исходном Sound Blaster Live!, и поэтому сия карта решительно не годится для звукозаписи. После того, как вы получили данные с внешнего "сидюка", переведенные на частоту 48 кГц, вам придется долго и муторно конвертировать их обратно на 44,1 кГц перед записью на CD-R, что жутко неудобно. Однако даже в этом случае со стабилизацией электрических параметров входного и выходного цифровых аудиосигналов все более-менее в порядке, а потому вы можете смело использовать карту как для игр, так и для сочинения песенок в стиле "тыц" для дальнейшей раздачи минидисков друзьям. Другой важной чертой Sound Blaster Live! является применение внутренней шины I2S - подобно большинству бытовых цифровых аудиоустройств, в то время, как большинство других производителей опирается на шину AC-Link.  
Более того, на самой плате имеется вход формата I2S  прямо как в каком-нибудь процессоре от Sonic Frontiers или Camelot. Уже имеются источники с выводом звукоданных в формате I2S, например MPEG-2 декодер Creative's CT7160, который может работать в паре с Live! по этой шине. Такое замечательное нововведение резко контрастирует с куцыми возможностями карты в работе с цифровым аудио. В сентябре 1999 г. Creative Labs выпустила карту Sound Blaster Live! Platinum, вокруг которой ходили упорные слухи, что в ней будет полностью переработанный цифровой аудиоинтерфейс. Бормотали, что с помощью новой карты можно будет писать и воспроизводить звукоданные в форматах от 16 бит/32 кГц до 24 бит/96 кГц в их "естественном" виде. Но слухи не оправдались…

суббота, 17 ноября 2012 г.

Hi-Fi звук на базе ПК. Часть 2.

В начале своей публикации я упоминал, что прослушивание формата MP3 и CD-Audio дисков на Hi-Fi устройствах является нецелесообразным. Предпочтение стоит отдать так называемым lossless форматам.

Как сообщает «Википедия», сжатие без потерь (англ. lossless) - метод сжатия информации, при использовании которого закодированные данные могут быть восстановлены с точностью до бита. Для каждого из типов цифровой информации, как правило, существуют свои алгоритмы сжатия без потерь. Подробнее в отдельной статье.

К lossless аудиоформатам относят Monkey Audio и Flac. Их принцип несколько схож с обыкновенным архивированием в WinRAR или WinZIP. Алгоритмы указанных форматов специально адаптированы для упаковки WAV-файлов. Именно упаковки, а не для сжатия или переконвертации. Разумеется, степень сжатия здесь невысокая. Обычный оцифрованный диск займет около 700 Мб в «сыром» WAV и примерно 450 во Flac или APE. Воспроизводить такие форматы могут очень многие медиаплееры после установки дополнительного ПО. Скачать его можно с сайтов
www.monkeysaudio.com и www.flac.sourceforge.net. Кроме того, среди компьютерных меломанов популярен проигрыватель foobar, обладающий очень простым интерфейсом и «родной» поддержкой Flac/APE. Найти оный можно по адресу www.foobar2000.org. Все упомянутое в этом абзаце ПО – бесплатное.

Коллекцию аудиозаписей в хорошем качестве придется «добывать» самостоятельно. Предстоит собрать воедино все доступные качественные диски и самостоятельно оцифровать их программой EAC, а затем упаковать. Владельцы безлимитных каналов доступа в Интернет могут воспользоваться eMule’ами и Torrent’ами.


Акустика!
 
Итак, с компьютерной частью в той или иной степенью мы разобрались. Далее обратим внимание на проблему выбора непосредственно колонок. Вернее, оптимального ценового диапазона. Здесь должно быть понятно, что покупать к ПК напольники за многие тысячи долларов (Hi-End) незачем. Равно как и двухсотдолларовые колонки к звуковой карте за те же деньги. На наш взгляд к лидеру полупрофессиональных звуковых карт (E-MU 1212m) едва ли есть смысл покупать АС (акустическую систему) заметно дороже $1000 без использования внешнего ЦАПа (цифро-аналогового преобразователя). Качественный внешний ЦАП, подключенный к хорошей звуковой карте «по цифре», сможет раскрыть потенциал очень дорогих акустических систем. Однако ценовой диапазон такого решения с учетом стоимости соответствующего усилителя и аксессуаров легко может перешагнуть за $10’000...

Таким образом, ограничимся диапазоном стоимости акустической системы от $150 – для «игровых» карт до $1500 – для полупрофессиональных. Стоимость усилителя обычно определяется как равная или чуть меньшая по отношению к колонкам.


Конкретные модели акустических систем и усилителя следует выбирать исключительно путем самостоятельного прослушивания в Hi-Fi салонах. Выбор по отзывам других людей, а также по рейтингам тестов – крайне нежелателен. В ценовом диапазоне «среднего» Hi-Fi (около $1000) и уж тем более в бюджетном нет идеально звучащих компонентов. Другими словами каждая акустическая система, каждый усилитель будет иметь свои недостатки и преимущества в рамках определенной ценовой категории. Какие именно недостатки окажутся для тебя наименее критичными, а какие достоинства наиболее первостепенными, решать только тебе самому.

Кабели

Еще один вопрос, который нельзя не затронуть, это кабели. Кабель, соединяющий источник звука с усилителем, называется межкомпонетным (interconnect). Его часто называют «межблочником».

Кабели, соединяющие усилитель с колонками, называют акустическими. Ценовая категория здесь простирается от нескольких центов до тысяч долларов за метр.

Вопрос влияния кабелей на звук оставим за рамками данной статьи. Эта тема весьма рьяно обсуждается на форумах. Дкмаю, потенциальный покупатель перед покупкой должен самостоятельно определиться, слышит ли он разницу в звучании тракта при замене одного кабеля на другой или нет.

ВЫВОДЫ!
 
Таким образом, звук начального и среднего Hi-Fi на ПК вполне возможен. В бюджетном секторе он даже оказывается несколько более экономичным, нежели «стационарный» подход.

Однако ПК, оставаясь устройством с высокой степенью интеграции и универсальности, вряд ли применим для топового уровня Hi-Fi и уж тем более Hi-End. Впрочем, применение высококачественного внешнего ЦАПа с цифровым подключением к профессиональной звуковой карте (например, Linx Two стоимостью в $800) позволяет оспаривать последнее утверждение.Об этом поговорим в отдельных статьях.

Hi-Fi звук на базе ПК. Часть 1.

В рамках данной статьи мы рассмотрим вариант сборки аудиотракта с источником в виде ПК в ценовой категории от $300 за компонент. Думаю - это самый востребованный сегмент. Начало большого пути в дебри. Сама аббревиатура Hi-Fi означает High Fidelity, что в переводе с английского означает «высокая точность».
 
В классическом варианте в качестве источника звука в высококачественном тракте используется виниловый проигрыватель или же стационарный CD-плеер. Здесь мы попробуем разобраться, в какой степени их способен заменить обычный ПК.

Здесь сразу отметим – слушать MP3 на колонках и усилителе немалой стоимости смысла нет. Проигрывать CD-аудио диски на обычном компьютерном приводе также не следует. Наиболее подходящий вариант с моей точки зрения – это сжатый звук без потери качества (Lossless). Теперь обо всем по порядку.


Начнем с проблем, с которыми меломан обязательно столкнется при создании высококачественного звукового тракта на базе ПК. В первую очередь стоит позаботиться о максимальном снижении шумности работы ПК. Варианты тут различные – от замены кулеров на более качественные и эффективные до сборки отдельного маломощного и практически бесшумного мультимедийного центра исключительно для «музыкальных» нужд. Вопросам бесшумного охлаждения, а также различным аспектам подборки оптимальной конфигурации домашнего компьютера посветим отдельные статьи.


Далее следует обратить внимание на качество блока питания. Даже самая лучшая в мире звуковая карта не сможет раскрыть свой потенциал, если она питается  от низкокачественного БП. В целом, именно импульсные помехи по питанию, которые типичны для ПК, и побуждают скептиков отрицательно относиться к компьютеру, как источнику высококачественного звука. Посему качеству питания следует уделить первостепенное внимание.


В погоне за качественным звучанием музыки весьма популярной ошибкой является покупка типично «геймерской» звуковой карты, например, такой, как Creative Audigy 2/4. Основным недостатком таких устройств является частота центрального аудиопроцессора (ЦАП) 48 кГц, в то время как стандарт CD-аудио устанавливает частоту 44.1 кГц. Таким образом, если звуковой сигнал прослушивается через ЦАП, работающий на частоте 48 кГц, происходит передискретизация. Именно она и вносит в звучание искажения. Кроме того, типичные «геймерские» звуковые карты с поддержкой ЕАХ и т.п. комплектуются аналоговой частью из далеко не самых лучших деталей (в основном операционных усилителей).
Поскольку в самом ПК именно звуковая карта наиболее важна с точки зрения меломана, то на выборе оной мы и остановимся подробнее.

  • Creative Audigy 2 (6.1) существенно отличается от своего младшего собрата. Здесь была введена поддержка EAX3 (а впоследствии и EAX4), заявлена поддержка режимов воспроизведения 192kHz/24bit. В силу применения в аналоговой части компонентов сравнительно высокого качества звучание Creative Audigy 2 можно охарактеризовать как приемлемое.
  • Creative Audigy 2 ZS представляет собой обновленную версию Audigy2. Появилась поддержка EAX4 (также была введена и в Audigy2). Качество звучания улучшилось. Из приятных мелочей стоит отметить появление консоли управления, эквалайзера и THX-калибровки. THX-калибровка позволяет указать расстояние и угол поворота каждой колонки относительно рабочего места.
  •  Creative Audigy 4 Pro является улучшенной модификацией Audigy 2ZS. Игровые возможности – те же. Благодаря применению элементов, которые используются в профессиональной линейке звуковых карт от Creative, было достигнуто не сильно значительное улучшение звучания.
  • Creative X-Fi Elite Pro позиционируется как топовая звуковая карта в линейке. На борту также установлены 64 Мб памяти. Игровые возможности не отличаются от X-Fi Fatality. В плане качества звучания отметим, что это бесспорно лидер среди карт Creative. Однако несколько завышенная цена не позволяет нам однозначно рекомендовать приобрести именно этот вариант.
  • Terratec Aureon Space 7.1 (M-Audio Revolution 7.1) является одной из самых дешевых звуковых карт на чипе VIA ENVY24-HT. Качество звучания хорошее. Стоит отметить один не очень серьезный недостаток – это скудные возможности драйверов. 
  • Audiotrak ProDigy 7.1 похожа на две предыдущие звуковые карты. Если быть совсем точным, эти карты являются практически близнецами. Но стоит отметить, что качество воспроизведения музыки на ProDigy все же выше, чем на Space/Revolution. Разница не велика, но слышна.
  • M-Audio Revolution 5.1 является обновленной версией старой Revolution 7.1. При производстве это карты были использованы более качественные элементы и более новый ЦАП. Естественно, что качество звучания возросло. На данных момент это, наверное, самая качественная в плане воспроизведения музыки звуковая карта, выполненная на чипе Envy24-HT. Также стоит отметить, что в этом устройстве были убраны два никому не нужных дополнительных канала и вместо них появился специальный выход для наушников.  
 Следующие звуковые карты к рассмотрению, так называемые профи. Они ориентированы в первую очередь для студийной работы: записи звукового материала, работы в редакторах, воспроизведения сведенного материала на высококачественных мониторах, – поэтому не стоит удивляться отсутствию каких-либо элементарных функций, которые есть даже на встроенном звуке. Однако в силу высокого качества звучания полупроф-карточки все чаще можно встретить в домашнем ПК. Но здесь имеются ограничения: звуковые карты данной категории смогут раскрыть все свои достоинства только на очень качественной аппаратуре. Давай рассмотрим наиболее популярные на нашем рынке полупрофессиональные карты.

  • E-MU 0404 является самой младшей звуковой картой в профессиональной звуковой линейке производства Creative. Она оснащена неплохой элементной базой. Звучание можно оценить как очень хорошее.
  • E-MU 1820 является расширенной версией 0404 с дополнительным коммутационным блоком управления. Качество звучание идентично предыдущему устройству.
  • E-MU 1212m имеет практически лучшее звучание в категории полупрофессиональных решений, благодаря чему эта звуковая карта приобрела заслуженную любовь как у профессионалов, так и просто у любителей качественного звука.  
  •  ESI Juli@ – это профессиональная звуковая карта уровня Home Studio. Построена она на базе чипа ENVY24. Карта предназначена в первую очередь для записи звука, но также очень хорошо подходит и для воспроизведения оного. Имеет балансные TRS и небалансные RCA разъемы (одновременное использование и тех, и других – невозможно). Качество звучания очень хорошее. Если сравнить с решениями от Creative, то это устройство по воспроизведению звука находится где-то на уровне E-MU 0404. ESI Juli@ имеет очень удобную и понятную панель управления.
 Подводя итог по полупрофессиональным картам, хотелось бы подчеркнуть, что здесь были описаны далеко не все модели данного сегмента, а только те, которые наиболее распространены на рынке. Их отличительная особенность – очень качественное звучание за сравнительно невысокую (по отношению к стационарным проигрывателям компакт-дисков класса Hi-Fi) стоимость.

Продвинутый аудио-плейер для платформы Windows

Рекомендую Вам попробовать Foobar2000 Media Player. Этот плейер разработан Peter Pawlowski, который ранее участвовал в создании Winamp.

Foobar2000 представляет собой довольно мощный аудио плеер, который по своим возможностям может сравниться, даже, с такими программами, как WinAmp или AIMP. Этот программный продукт способен воспроизводить, практически, все известные на сегодняшний день форматы аудио, позволяет подключать множество дополнительных модулей обработки звука и обладает весьма широкой функциональностью.

Основные возможности программы Foobar2000

Самым необычным, что сразу же бросается в глаза, является то, что программа может использоваться в двух основных вариантах: стационарная установка и портативная версия. С портативной версией, наверное, все понятно. Она просто не требует установки и может запускаться с любого съемного носителя, что весьма удобно для использования ее на сторонних компьютерах. В свою очередь, стационарная установка может производиться в стандартной версии и версии, которая включает в себя множество дополнительных плагинов. Дистрибутив стандартной версии имеет размер чуть более 3 МБ, а версия с дополнительными модулями занимает около 16,5 МБ. Скачать можно  с сайта www.foobar2000.org.

Среди самых основных особенностей программы стоит отметить то, что она абсолютно не требовательна к системным ресурсам и не нагружает систему. Естественно, это огромный плюс, поскольку, можно, к примеру, играть на компьютере в игры, а попутно, в фоновом режиме, слушать музыку.

Поддерживаемые форматы аудио представлены довольно разнообразно. Сюда относятся MP3, MP4, AAC, CD Audio, WMA, Vorbis, FLAC, WavPack, WAV, AIFF, Musepack, Speex, AU, SND. Совершенно без усилий, при условии установки дополнительных средств, расширяющих возможности приложения, можно работать с архивами, производить рипинг любых аудио дисков, а также полностью перенастраивать назначения горячих клавиш для удобства управления проигрывателем.

И, естественно, плеер поддерживает работу с совершенно различными плейлистами. Кстати, в отличие от старого формата, в нем реализован новый формат плейлистов M3U8. Также, программа позволяет использовать и некоторые расширенные возможности, а именно, плавное проигрывание, полную поддержка Unicode, легко настраиваемый интерфейс, поддержку тэгов APEv2, поддержку функции ReplayGain. Плюс ко всему, приложение имеет открытую архитектуру с возможностью расширения функционала сторонними разработчиками, а также позволяет производить доступную прямо из меню справки онлайн диагностику. Кроме того, в этом релизе была добавлена возможность работы с тэгами для аудио файлов формата WAV (даже с 16-битной структурой).

В общем и целом, плеер довольно прост в использовании и управлении, тем более, что имеет весьма широкие возможности, распространяется совершенно бесплатно, а главное, не требует использования мощных компьютеров, что, конечно же, делает честь этому программному продукту.

Сжатие звуковых файлов без потерь. ALAC и другие форматы.

Кодек сжатия аудиоданных без потерь ALAC (Apple Lossless Audio Codec), другое название ALE (Apple Lossless Encoder) разработан компанией Apple. Формат был представлен в 2004 году.
По эффективности сжатия ALAC находится на обычном для Lossless-кодеков уровне 40-60%. Файлы этого формата упакованы в стандартный MP4-контейнер и имеют расширение .m4a. Эти файлы, в основном, предназначены для MP3-плееров iPod от Apple, причем, их умеют проигрывать не все плееры.

Формат не поддерживает DRM, однако защита содержимого файлов от несанкционированного использования реализована на уровне контейнера.

 Для кодирования файлов в формат ALAC предлагаю использовать вам утилиту dBpoweramp

 Meridian Lossless Packing - MLP то же самое, Dolby TrueHD, DVD-Audio, HD DVD, Blu-ray. В DVD Video отсутствует! DVD-Audio в структуре диска содержит директорию AUDIO_TS, в которой содержится мультимедиа-контейнер DVD Audio Object Files (расширение .aob), где и содержится MLP-поток (.mlp)

 DTS (DTS Surround Sound) - формат звука, созданный Digital Theater System, конкурирующий со схожим Dolby Digital. Формат DTS использует меньший уровень сжатия, чем Dolby, так что теоретически он звучит лучше. Формат DTS Stereo практически идентичен Dolby Surround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. DTS в домашних театрах допускает полный битрейт (1509,75 кбит/с). Здесь нужно быть внимательным, кодек DTS сжимает звук без потерь только в настроках DTS-HD Master Audio или по старому DTS++! Все остальные форматы с красивыми названиями DTS-HD High Resolution Audio, DTS Digital Surround 96/24 (DTS 96/24) НЕ являются беспотерьными, а значит априори качество звука теряется на стадии кодирования!

 RealAudio Lossless - впервые представленный в составе пакета RealAudio 10 проприетарный кодек для сжатия звука без потери качества. Среди плюсов данного кодека - поддержка потокового вещания, очень быстрое декодирование. К минусам относят закрытость кода и отсутствие многоканальности. Доступен для Microsoft Windows, Macintosh и GNU/Linux.
Используемые расширения файлов - .ra, .ral.

 ТАК (нем. Tom’s verlustfreier Audio Kompressor) - аудио-кодек и формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования. Распространяется бесплатно вместе c набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. В поддержке на уровне железа замечен пока не был, но кодек активно развивается. Настройки по умолчанию являются разумным компромисом: takc -e. Используемые расширения файлов - .tk, .tak.

 True Audio (TTA) - свободный аудио-кодек, осуществляющий сжатие обеспечивает сжатие мультиканальных 8-, 16- и 24-битных аудиофайлов без потерь, способен работать в режиме реального времени. Бесплатный и открытый исходный код и документация, есть аппаратная поддержка медиа-боксами. По настройкам сказать ничего не могу, не использовал.
Используемые расширения файлов - .ta, .tta.

 Lossless Audio (LA) - беспотерьный аудио-кодек от Майкла Бевина. По степени сжатия превосходит все существующие лосслесс кодеки (только кодеки, некоторые аудио-архиваторы жмут лучше). Скорость кодирования/декодирования низкая. Аппаратная поддержка - никакая как в принципе и программная. Используемые расширения файлов - .la.

 OptimFROG имеет один из лучших показателей сжатия аудио. Реализован на платформах Windows, Linux, Mac, использует технологию аудио сжатия: концепцию декорелляции стерео (совместно с оптимальным предсказателем). Благодаря этому нововведению, эта технология позволила достичь значительного улучшения (~1.5%) сжатия по сравнению с существующими показателями аудио кодеров без потерь. Но несмотря на все "фичи", распространения не получил. Используемые расширения файлов - .ofr, .ofs.

Сжатие звуковых файлов без потерь. WavPack и Monkey’s Audio.

Бесплатно распространяемый кодек для сжатия аудиоинформации без потерь WavPack был разработан Дэвидом Бриантом (David Bryant) в 1998 году. Файлы, обработанные этим кодеком, имеют расширение .wv, эффективность сжатия колеблется от 30 до 70%. WavPack поддерживает множество форматов аудио, в том числе – многоканальный звук.
   Особенность формата заключается в том, что кодек имеет гибридный режим работы. В таком режиме вместо одного файла, содержащего информацию о музыкальной композиции в цифровом виде, создаются два файла – один – файл, содержащий композицию, сжатую с потерями качества (этот файл имеет расширение .wv), а второй – так называемый коррекционный файл (с расширением .wvc). Используя первый файл, музыку можно прослушать, однако, с потерями в качестве, а используя оба файла – восстановить музыкальный файл в исходном виде, то есть – без потери качества. Таким образом, можно использовать один и тот же кодек и для хранения звука в сжатом с потерями виде, и для хранения аудиоматериала исходного качества.
 
WavPack отличает достаточно высокая скорость кодирования файлов, существует множество программных проигрывателей этого формата, однако, что касается портативных проигрывателей, там он пока представлен довольно слабо. В частности, из достаточно известных и распространенных плееров, поддерживающих его, можно назвать устройства (плееры Apple, iRiver), которые можно прошить уже не раз упоминаемой RockBox.

 Для кодирования WavPack-файлов скачайте WavPack Win32 – утилиту командной строки для кодирования с сайта http://wavpack.com/downloads.html/. Скачиваемый архив имеет небольшой размер – 327 Кб. Для удобства работы можете сразу же скачать архив Frontend-программы с сайта http://members.home.nl/w.speek/wavpack.htm/ - он занимает всего 24 Кб.

 Распакуйте оба архива в одну папку и запустите файл WavPack frontend.exe.

 Формат Monkey’s Audio еще называют форматом APE – по расширению файла, которое он использует Этот формат сжимает данные без потери качества. Среди его особенностей производители отмечают эффективность (которая сопоставима с другими кодеками сжатия без потерь), скорость работы, достаточно широкую программную поддержку (например, его поддерживает программный проигрыватель WinAmp), простоту использования, бесплатность, поддержку тегов, доступность исходных кодов.

Официальная версия кодека выпущена для платформы Windows, однако существуют ее порты на другие платформы. Подробности о формате можно узнать на
http://www.monkeysaudio.com/.  Для кодирования Monkey’s Audio создана специальная программа, которую можно бесплатно скачать на http://www.monkeysaudio.com/download.html/. Работа с программой предельно проста. Надо добавить файлы в ее окно, воспользовавшись кнопками Add Files (Добавить файлы) или Add Folder (Добавить папку), после чего настроить параметры кодека – с помощью кнопки настройки (вторая слева на панели инструментов). По умолчанию это – Normal (Нормальный), для лучшего уровня сжатия можно установить параметр Insane (Наилучший), для повышения скорости работы кодера за счет уровня сжатия можно установить параметр Fast (Быстрый). После этого достаточно нажать на кнопку Compress (Сжать) – и программа начнет работу. Если кликнуть по черному треугольнику рядом с кнопкой Compress – откроется список действий, среди которых можно отметить параметр Decompress (Разжать) – кодек декодирует APE-файл в WAV-файл, и Convert (Конвертировать) – используйте этот режим работы если вы хотите, например, "пережать" Monkey’s Audio файлы, сжатые в режиме Fast, в режиме Insane.  Среди другого ПО для кодирования Monkey’s Audio можно отметить ImTOO Audio Encoder. Среди доступных в этой программе настроек кодека можно отметить лишь уровень сжатия, количество каналов файла и наличие APE-тегов.

Сжатие звуковых файлов без потерь. FLAC.

Кодеки, сжимающие звук без потерь, стали пользоваться популярностью в мире портативного аудио сравнительно недавно. Дело в том, что этим кодекам не под силу такие огромные степени сжатия, которыми могут похвастаться кодеки, сжимающие звук с потерями качества. Большие объемы памяти стали широко доступны пользователям современных плееров лишь последние года три-четыре – и с приходом больших объемов памяти в плееры, сжатие музыки без потерь стало популярным. Конечно, те, кто хотел слушать музыку без потерь качества, делали это всегда (например, с помощью Audio CD-проигрывателей), а в наше время все желающие (естественно, при наличии поддержки соответствующих кодеков их плеерами) могут попробовать Lossless-кодеки в действии.

Главное отличие кодеков, сжимающих аудиоданные без потери качества от кодеков, сжимающих с потерями, заключается в том, что кодеки без потери качества не удаляют из аудиопотока информацию, которая при сжатии с потерями может считаться избыточной. Главная задача Lossless-кодека заключается в том, чтобы как можно сильнее сжать исходную звуковую информацию, не потеряв при этом ни единого бита информации.

Ситуация с поддержкой Lossless-кодеков в настоящее время такова, что наиболее широко распространена поддержка кодека ALAC, который имеет непосредственное отношение к фирме Apple и ее плеерам. Остальные же кодеки поддерживаются пока немногими плеерами, иногда для того, чтобы плеер поддерживал кодек, требуется перепрошивка плеера, причем, пожалуй, наиболее известная прошивка для плееров, поддерживающая Lossless-кодеки, RockBox – это альтернативная, а никак не официальная прошивка.

В ходе работы с Lossless-кодеками вам могут встретиться так называемые Cue-файлы или индексные карты файлов. Cue-файлы распространяются, например, вместе с FLAC или APE-файлами, реже – с MP3 и WAV-файлами, которые представляют собой один большой (порядка 300 Мб) файл, в котором хранится целый альбом. Cue-файл – содержит в себе информацию о разбиении большого файла на треки и о названиях этих треков. С отдельными файлами работать удобнее, однако, даже если к вам в руки попадет, скажем, большой FLAC-файл с CUE-файлом, на основе информации, содержащейся в CUE-файле, исходный файл можно разделить на отдельные треки.
 
Начнем описание форматов сжатия данных без потерь с популярного формата FLAC.
 
FLAC (Free Lossless Audio Codec) – это формат сжатия аудиоданных без потерь, который разработала Xiph.Org Foundation. Это абсолютно бесплатный формат, которым могут пользоваться все желающие. Что немаловажно для большинства любителей музыки. Многие начали переводить домашние музыкальные коллекции в этот формат, для хранения на своих музыкальных серверах. об этом мы еще поговорим, позже....

Работа FLAC и других кодеков, сохраняющих аудиоданные без потерь, напоминает работу обычных архиваторов. Однако, за счет специальных алгоритмов эффективность таких кодеков при сжатии аудиоинформации гораздо выше, чем у обычных архиваторов. Формат FLAC разрабатывался как поточный – информация во FLAC-файле разбита на фреймы (кадры), каждый из которых может быть раскодирован отдельно от других фреймов.

Как правило, FLAC способен сжать исходный файл, например, Audio CD-качества на 40-50%. В итоге битрейт полученной записи оказывается равным порядка 800 Кбит/c. В формате FLAC предусмотрена возможность сохранения CD-дисков таким образом, что при необходимости можно полностью воссоздать исходный диск – это очень удобно для тех, кто хочет создать цифровые копии своих CD с возможностью последующего восстановления.

Скорость кодирования и декодирования FLAC-файлов неодинакова. Скорость кодирования зависит от уровня сжатия и от скорости системы – на высоких уровнях сжатия она может быть достаточно медленной. Однако раскодирование ведется очень быстро – с ним без труда могут справиться современные портативные плееры и медиапроигрыватели.

За счет возможности бесплатного свободного использования, с FLAC можно работать на базе практически любой современной ОС, все больше портативных плееров поддерживают этот формат.

Кодирование в формат FLAC

Скачать утилиту для кодирования FLAC-файлов можно на http://flac.sourceforge.net/download.html/. Она включает в себя сам кодек и так называемый Frontend – программную оболочку для кодека. Размер дистрибутива занимает порядка 2,5-3 Мб. Работа с кодеком проста: вы добавляете интересующие вас файлы в окно программы с помощью кнопки Add Files (Добавить файлы), настраиваете опции кодирования и нажимаете кнопку Encode (Кодировать) – программа создает FLAC-файл.

Музыкальные файлы.

Направление развития звукозаписывающей индустрии ясно – на смену распространению музыки на физических носителях приходит загрузка ее из Интернета.

Однако, музыка, выложенная в Интернете, представлена в основном в форматах со сжатием – MP3, WMA и некоторых других. Сколь бы ни был высоким битрейт, все равно настоящие аудиофилы не будут довольными. Однако, существуют технологии, которые позволяют распространять музыку через Интернет без потери качества.

Простейший способ передавать музыку через Интернет с высоким качеством – скопировать информацию, записанную на CD «один-в-один». Если все биты при копировании сохраняются, то загруженная из глобальной компьютерной сети музыка будет воспроизведена без искажений.

Проблема заключается в том, что формат записи на аудио CD не тождественен принятому формату записи для компьютерных дисков. И файловая система на диске как таковая отсутствует. Так что сначала нужно сделать из диска файл или несколько файлов, которые уже можно будет выставить на сервер для скачивания.

Простейший способ заключается в создании так называемых рипов. На компьютере считывается информация с аудио CD и на основании нее формируются так называемые волновые файлы (с расширением *.wav). Как правило, на каждый трек диска делают отдельный WAV-файл. Потом эти файлы могут быть выставлены для скачивания. Преимущество такого подхода заключается в том, что формат WAV-файлов стандартизован и их можно воспроизвести практически на любом компьютере без установки дополнительного программного обеспечения. К тому же, файлы можно воспроизводить с жесткого диска компьютера.

Более сложный вариант подразумевает создание так называемого образа диска - файла, в котором записана информация о расположении битов на диске. Скачав образ диска, можно с помощью одной из программ записи на CD-R получить его полную копию. В итоге получится аудио CD, который можно воспроизводить как на компьютере, так и на любой аппаратуре, способной воспроизводить CD-R. То есть, практически на любой современной аудиоаппаратуре. Но на компьютере непосредственно с образа CD, хранящегося на жестком диске, без использования специального программного обеспечения воспроизвести музыку нельзя.

Формат для образов дисков обычно привязан к программе, с помощью которой потом можно записать диск. Самым популярным форматом для образов является *.nrg, используемый программой для записи дисков Nero.

Оба варианта подразумевают передачу музыки без какого-либо сжатия. Даже при современных широкополосных каналах связи процесс загрузки WAV-файлов или образов дисков происходит слишком медленно. Другой проблемой является отсутствия защиты от нелегального копирования файлов. Поэтому продажа музыки таким способом легальными продавцами, за редким исключением, не практикуется. Хотя распространение музыки в виде образов дисков широко используется пиратами.

Кроме этого, изготовление рипов или образов с дисков привязывает качество передаваемой музыки к качеству записи на CD. Однако, сам по себе формат CD является уже устаревшим. Нужны форматы, позволяющие распространять музыку с большей разрядностью кодирования и большей частотой дискретизации.

 Сжатие без потерь

Способы сжатия музыкальных записей можно условно разделить на две категории. При сжатии с потерями (например, в формате MP3) из сигнала удаляются мелкие детали, потерю которых большинство слушателей не заметят. Сжатие без потерь можно сравнить с работой программы-архиватора. Файл, сжатый без потерь, при распаковке восстанавливается полностью. Только, в отличие от универсальных архиваторов, используются алгоритмы, учитывающие особенности музыкальных записей. Форматы сжатия без потерь иногда называются lossless-форматами (lossless – по-английски «без потерь»).

По размеру файл, полученный сжатием без потерь, больше файла, сжатого с потерями, но значительно меньше исходной записи. Кроме этого, в некоторые форматы сжатия без потерь добавлена функциональность, защищающая их от пиратского копирования. Размер файла зависит от свойств музыкального произведения. В среднем файл lossless-формата в 1,5 - 3 раза меньше WAV-файла с той же записью.

В настоящее время наиболее распространены следующие lossless-форматы:

  • FLAC - формат для обмена музыкой, поддерживается практически на всех компьютерных платформах. Разрядность 16 бит, частота дискретизации – до 96 кГц. Не имеет средств защиты от копирования. Поддерживается не только компьютерами, но и некоторыми моделями аудиоаппаратуры.
  • Apple Lossless – фирменный стандарт Apple. В нем заложена возможность защиты от пиратского копирования, но пока на практике она не используется. Основное преимущество – совместимость с программным и аппаратным обеспечением, а также сервисами Apple.
  • APE – один из самых популярных lossless-форматов для обмена музыкальными записями через Интернет. В коммерческих целях не используется. Поддержка реализована пока только в компьютерных программах.
  • Lossless WMA – вариант формата WMA без сжатия. Главное преимущество формата – за ним стоит Microsoft. В этом формате уже сейчас легально продается музыка через Интернет. Поддерживается широким кругом производителей аппаратуры. Ну и, наконец, можно записывать 5.1-канальную музыку с разрядностью до 24 бит и частотой дискретизации до 96 кГц.
  • Monkey’s Audio – Lossless-формат, используемый только на компьютерах. По утверждению разработчиков, позволяет получать более компактные файлы по сравнению с другими lossless-форматами. Однако, небольшой выигрыш в размере файла вряд ли может быть серьезным аргументом, если учесть, что за это придется заплатить проблемами, обусловленными малой распространенностью формата.
  • WavPack – формат, имеющие варианты как сжатия с потерями, так и lossless. Отличительная особенность – возможность записи звука с разрядностью до 32 бит. Кроме этого, можно записывать пространственное звучание 5.1. Поддержка lossless-варианта WavPack реализована в новых версиях архиватора WinZip. Пока используется только на компьютерах.
Во времена, когда скорость доступа в Интернет была низкой, формат MP3 и ему подобные, совершили настоящую революцию, изменившую музыкальную индустрию. Сейчас же, с повышением скорости доступа, наступает время lossless-форматов. И если раньше музыкальные записи, загруженные из Интернета, не могли соперничать с CD по качеству звука, то сейчас они иногда даже превосходят его по качеству.

Восприятие и сжатие звука.

Статья Дмитрий Шмунк (dmitrijs@qdesign.com)
  
Простые методы сжатия

Традиционные методы сжатия без потерь (Huffman, LZW, итд.) обычно плохо применимы для сжатия аудио информации (по тем же причинам что и при сжатии визуальной информации).
Ниже перечислены некоторые методы сжатия с потерями:
  • Сжатие тишины(пауз) - определяет периоды "тишины", работает аналогично run-length кодированию.
  • ADPCM - Adaptive Differential Pulse Code Modulation (в русскоязычной литературе применяется термин адаптивная дельта-импульсно-кодовая модуляция (АДИКМ).
    Например, стандарт CCITT G.721 -- от 16 до 32 Kbits/sec:
    Кодирование разницы между двумя или более последовательными отсчетами; затем разница квантуется --> при квантовании часть информации теряется. Квантование адаптивно (меняет параметры в зависимости от сигнала), в результате меньшее количество бит необходимо для достижения лучшего SNR. Необходимо предсказывать как звук изменится --> сложно
  • Apple разработал собстенную систему названную ACE/MACE. Сжатие с потерями, пытается предсказать, каково будет значение следующего отсчета. Сжатие порядка 2:1.
  • Linear Predictive Coding (LPC) - пытается описать сигнал с помощью "речевой модели" и передает параметры модели --> звучит как компьютерно синтезированная речь, 2.4 kbits/sec.
  • Code Excited Linear Predictor (CELP) - тоже самое что и LPC, однако дополнительно передает ошибку квантования (используя предопределенный набор "кодовых слов") --> телефонное качество при 4.8 kbits/sec.

Методы сжатия, основанные на психоакустике

Представители: MPEG layers 2, MPEG layer 3 (MP3), AAC (Advanced audio coding), TwinVQ, Ogg Vorbis, и др.
Алгоритм кодека использующего психоакустику обычно состоит из следующих шагов:
  • Обсчет психоакустической модели (маскирования).
  • Разделение сигнала на частотные подполосы (FFT, DCT/MDCT, FilterBanks, и т.д.).
  • Квантование сигнала в подполосах в соответствии с результатами психоакустической модели. Возможно использование одного квантового уровня. сразу для нескольких входных значений (векторное квантование - Vector Quantization) - TwinVQ.

Некоторые факты о восприятии звука

  • Частотный спектр воспринимаемый человеком (примерно) от 20 Hz до 20 kHz, наибольшая чувствительность в диапазоне от 2 до 4 KHz.
  • Динамический диапазон (от самых тихих воспринимаемых звуков до самых громких) около 96 dB (более чем 1 к 30000 по линейной шкале).
  • Общеизвестно, что человек в состоянии различить изменение частоты на 0.3% на частоте порядка 1kHz.
  • Если два сигнала различаются менее чем на 1дб по амплитуде - они трудноразличимы. Разрешение по амплитуде зависит от частоты и наибольшая чувствительность наблюдается в диапазоне от 2 до 4 KHz.
  • Пространственное разрешение (способность к локализации источника звука) - до 1 градуса.
  • Звуки различной частоты распространяются в воздухе с разной скоростью. В результате высокочастотная часть спектра от источника находящегося на удалении от слушателя несколько запаздывает.
  • Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms.
  • Некоторые исследования показывают, что человек в состоянии ощущать частоты выше 20kHz. С возрастом частотный диапазон сужается.
Речь
  • Частотный спектр, несущий информацию в человеческой речи: от 500 Hz до 2 kHz
    Низкие частоты - басы и гласные
    Высокие частоты - согласные
  • Лучшее сжатие речи достигается с использованием параметрических кодеров (LPC, CELP, и пр.), пытающихся представить речь как набор параметров некоторой речевой модели. Кодеки общего назначения (MPEG и др.), как правило, дают худшее сжатие.

Устройство уха

В общем случае ухо - нелинейная система и не может быть точно описано с помощью только линейных элементов (таких как фильтры и линии задержки). Как побочный результат нелинейности может проявляться, например, следующий эффект: при подаче двух тонов с частотой 1000 и 1200Hz может также быть слышен третий тон с частотой 800Hz. Однако в интересующем нас диапазоне амплитуд нелинейность достаточно слаба и ей обычно пренебрегают.

Строение

Ухо состоит из трех частей: ушной раковины (также называемой внешним ухом), среднего уха и внутреннего уха - улитки. Проходя через различные части уха звук претерпевает изменения.
  • Одна из функций внешнего уха (ушной раковины) - улучшение локализации источника звука в пространстве. Благодаря ее несимметричной форме АЧХ сигналов приходящих из разных точек пространства изменяется по разному. Ушная раковина может влиять лишь на сигналы с длинной волны, сопоставимой с размерами уха (>3kHz). Внешний ушной канал резонирует на частоте около 2kHz , что дает повышенную чувствительность в данном диапазоне.
  • Среднее ухо выполняет роль гидравлического усилителя. Так как в улитке находится жидкость а снаружи - воздух, то необходимо согласование сопротивления среды. Среднее ухо также защищает от низкочастотных звуков чрезмерной амплитуды.
  • Внутреннее ухо - улитка. В развернутом виде будет представлять из себя трубочку, с постепенно уменьшающимся к одному из концов диаметром. Улитка выполняет роль частотного анализатора. Внутри улитки находятся до 4000 нервных окончаний. Различные области улитки входят в резонанс при подаче сигнала определенной частоты.
Восприятие в зависимости от частоты
  • Так как нейрон может возбуждаться не чаще чем 500 раз в секунду, то для получения информации о более высоких частотах слуховой аппарат человека прибегает к некоторым "ухищрениям":
    На частотах до 500 Hz --> колебания непосредственно переходят в нервные импульсы.
    Примерно до 1.5кГц проблема решается подключением одновременно до 3 нейронов к одному нервному окончанию. Нейроны в данном случае возбуждаются последовательно, один за другим и, соответственно, помогают улучшить частотное разрешение в 3 раза.
    На более высоких частотах регистрируется лишь амплитуда сигнала.
  • Таким образом бинауральный слух, играющий большую роль в локализации источника звука, лучше всего развит на частотах меньших 1.5кГц. Выше этой частоты источником информации о местоположении служит лишь разница амплитуд сигнала для левого и правого уха. Это делает возможным применение при кодировании режимов Joint Stereo - запоминается либо информация для суммы правого и левого каналов и их разница, со значительно меньшей точностью (Mid/Side coding), либо вообще запоминается лишь амплитуда сигнала (Intensity coding).
Психоакустика
Критические полосы (Critical Bands)
  • Человеческая система восприятия звука имеет ограниченное, зависящее от частоты разрешение. Равномерное, с точки зрения восприятия человеком измерение частоты может быть выражено в единицах ширины Критических Полос.
    Их ширина менее 100 Hz для нижних слышимых частот, и более 4 kHz для наиболее высоких. Весь частотный диапазон может быть разделен на 25 критических полос.
  • Новый отсчет частоты был назван барк (bark, after Barkhausen):
    1 Барк = ширина одной критической полосы
    Для частот < 500 Hz, может быть рассчитан по формуле:   частота / 100  Барк,
    Для частот > 500 Hz:   9 + 4log2(частота / 1000)  Барк.
Чувствительность человеческого уха в зависимости от частоты
  • Эксперимент: Слушатель в тихой комнате. Повышаем громкость тона частотой 1 kHz до уровня когда он становится слышимым. Изменяя частоту тона получим:
Частотное(параллельное) маскирование
Вопрос: Взаимодействуют ли звуковые рецепторы друг с другом ?
  • Эксперимент: Воспроизводим тон частотой 1 kHz (маскирующий сигнал), с фиксированной громкостью (60 dB). Воспроизводим тестовый (маскируемый) тон с различной громкостью (скажем с частотой 1.1 kHz), и повышаем его уровень до тех пор пока он не становится слышимым.
  • Изменяем частоту тестового тона и рисуем границу слышимости:
  • Повторяем эксперимент для различных частот маскирующего сигнала:
  • Частотное маскирование с частотной шкалой выраженной в Барках:
Временное(последовательное) маскирование
Если мы слышим громкий звук, который внезапно прекращается, требуется некоторое время чтобы услышать более тихий тон.
Эксперимент: Воспроизводим 1 kHz маскирующий тон на уровне 60 dB, и тестовый тон с частотой 1.1 kHz на уровне 40 dB. Тестовый тон не слышен (он замаскирован).
Отключаем маскирующий тон, затем, после небольшой задержки отключаем тестовый тон.
Уменьшаем время задержки до тех пор пока тестовый тон еще слышен (например 5 ms).
Повторяем используя различную громкость тестового тона и получаем:

 
Общий эффект от частотного и временного маскирования:


Транзиентные сигналы

Представленная выше теория маскирования верна в случае рассмотрения квазистационарных, медленно меняющихся по амплитуде и частотным характеристикам сигналов. В случае же рассмотрения сигналов с резко меняющимися параметрами (транзиентные сигналы) она неприменима.
Ухо в данном случае невозможно описать с помощью линейной системы. Теоретически обоснованных подходов для описания восприятия в данном случае автору не известно. Можно описать лишь несколько хорошо известных эффектов проявляющихся при кодировании данных сигналов:
  • Пре-эхо (pre-echo, ringing). Возникает перед резкими увеличениями амплитуды сигнала (атаками). При кодировании с недостаточным временным разрешением (и выделением недостаточного количества бит при квантовании) часть сигнала предшествующая атаке существенно искажается шумом квантования. Так как существует эффект пре-маскирования, то некоторое искажение допустимо, однако оно должно быть достаточно коротким по времени. Некоторые исследования показывают, что время пре-маскирования уменьшается с увеличением частоты сигнала.
  • Речевой сигнал. Голосовые участки речевого сигнала являются по своей природе часто идущими атаками с быстрым затуханием (pitched signals):
  • Стандартная психоакустическая модель маскирования сигналов в данном случае выдает завышенные пороги слышимости (из-за недостаточного временного разрешения) и, как результат, становится слышимым шум квантования.