WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Тестирование кодеков WMA 8.0, OGG Vorbis & MPEG-1 Layer III:
( Windows Media Audio 8.0 final (.WMA), MPEG-1 Layer III (.MP3, Lame Encoder) и Ogg Vorbis (.OGG) )

Автор: Александр Радзишевский (Alex Y. Radzishevsky)
Copyright (C) 2000, Alex Y. Radzishevsky
дата создания документа: 6 Apr.2001

Все права в отношении данного документа принадлежат автору. Воспроизведение данного текста или его части разрешается только с письменного разрешения автора.

 

Введение 

В связи с выходом в свет финальной версии кодека от Microsoft Windows Media Audio/Video v8.0, опубликованием новой беты кодера по алгоритму Ogg Vorbis, а также выпуском новой бета версии популярного кодера MP3 Lame Encoder, стала необходимость оценить проделанную разработчиками работу и решить чем пользоваться дальше нам, конечным пользователям. Появилась ли наконец альтернатива MPEG-1 Layer III или нам так и придется пользоваться этим кодеком еще и еще?

Итак, тестируемые кодеки: WMA 8.0, MPEG-1 Layer III, Ogg Vorbis.

Использованные кодеры: OggEnc v0.7 от 26.Feb.2001 (Ogg Vorbis), WM8EUtil от 23.Mar.2001 (Windows Media Audio), Lame Encoder MMX v3.88 beta 1 от 26.Mar.2001 (MPEG-1 Layer III).

Метод тестирования: кодирование оригинального .WAV-фрагмента каждым из кодеков, обратное декодирование в .WAV и сравнение результирующих АЧХ оригинального и полученного .WAV-файлов. Так как Ogg Vorbis кодирует только на VBR и не позволяет явным образом указать битрейт, подбор параметров кодирования для всех кодеков осуществлялся таким образом, чтобы сжатые файлы были приблизительно одного размера.

Основной фрагмент, взятый для тестирования: MAIN.WAV, 10,600,008 байт, PCM WAV 44.1 KHz, 16 bit, stereo; имеет продолжительность 1 минуту, очень насыщенный спектр на всех частотах (Jean Michel Jarre, Oxygene VII). Композиция с таким "экстремальным" спектром выбрана специально, дабы усилить и продемонстрировать все огрехи кодеков.

Примечания:

сокращения: CBR - Consatnt Bitrate (постоянная скорость бит-потока), VBR - Variable Bitrate (переменная скорость бит-потока). В дальнейшем, для укорочения написания, Windows Media Audio 8.0 будет обозначать просто WMA, MPEG-1 Layer III - MP3, Ogg Vorbis - OGG.

параметры кодирования: Lame Enc:  -b [bitrate] -m j -h -k (без фильтрации, joint stereo, оптимизация по качеству); WMA - предустановленные параметры для соответствующих битрейтов; OGG - как параметр указывался только необходимый битрейт (VBR).

Предварительные тесты 

Поехали. Заходя на сайт Microsoft каждый может увидеть призывные рекламные лозунги о "CD-качестве" кодирования WMA 8.0 при потоке 64 Kbps и "около CD-качестве" на 48 Kbps. Там же каждый желающий может скачать несколько файлов, демонстрирующих качество кодирования (для сравнения там выложены как оригинальные .WAV-файлы, так и закодированные 64 Kbps .WMA-файлы). Желая проверить честность таких заявлений, я решил скачать одну из выложенных там композиций и прослушать/протестировать качество ее звучания в сжатом виде. Для этого я скачал композицию "Livin' on borrowed time", самостоятельно закодировал ее в WMA 64 Kbps и прослушал. Что ж, конечно, в моих студийных наушниках отчетливо была слышна разница между звучанием оригинального файла и закодированного WMA, однако я действительно с уверенностью могу заявить, что на средней аппаратуре типа компьютерных колонок или в дешевых наушниках никто этой разницы не заметит. Следует учитывать, что такой низкий битрейт очень восприимчив к спектральной насыщенности кодируемого звука, таким образом качество при 64 Kbps будет сильно варьировать для разного рода композиций, однако непривередливому слушателю современной танцевальной музыки и обладателю аппаратуры среднего и низкого качества, WMA при 64 Kbps подойдет вполне.

Затем я решил сжать вышеуказанную композицию (также при 64 Kbps) и старой версией WMA v7.0, чтобы увидеть что изменилось в звучании при переходе с WMA 7.0 на WMA 8.0. И тут я был удивлен и поражен. Смотрите сами:

в увеличенном масштабе:

Итак, как видите, у WMA 8.0 начиная с границы 16 Khz начинается резкий спад, чего не наблюдается у WMA 7.0. Даже при не очень внимательном прослушивании чувствуется, что WMA 8.0 звучит явно глуше, чем WMA 7.0, и при этом никаких преимуществ 8.0 перед 7.0 не наблюдается... Вот это да...

Ладно. Тогда я взял другой файл, который был также выложен Microsoft на ее же сайте. В нем содержалась очень чистая запись звучания колокольчиков. Файл был также закодирован мною WMA 7.0 и 8.0 при потоке 64 Kbps. Вот что получилось.

в полосе частот 1 - 7,5 Khz:

в полосе частот 10 - 20 Khz:

Опираясь на графики, можно с уверенностью сказать, что в WMA 8.0 переработана модель кодирования звука, так как графики достаточно сильно отличаются друг от друга. Однако видно также, что в отличие от WMA 7.0, версия 8.0 действительно почти обрезает сигнал в районе 16-17 Khz. Возможно, это правильное решение при таком низком битрейте, как 64 Kbps.

Что же касается звучания, то здесь было отчетливо слышно, что WMA 8.0 произвел более качественное кодирование: в файле WMA 7.0 было слышно явное позвякивание, которое исчезло в WMA 8.0. В целом, звучание WMA 8.0 было действительно трудноотличимо от оригинала (объяснение этому, опять же, невысокая насыщенность спектра использованного звукового фрагмента).

Таким образом, мы выяснили, что в WMA 8.0 с целью удаления артефактов кодирования сжимаемая информация подвергается частичной (не полной) фильтрации частот выше 16-17, что в достаточной мере влияет на качество звучания, а также отличает версию 8.0 от 7.0 в лучшую сторону.

Основное тестирование 

Перейдем к основному тестированию и сравнению кодеков WMA, Ogg Vorbis и MP3. Сначала протестируем возможности этих кодеков на низших битрейтах. Начнем с 32 Kbps. К сожалению, не смотря на обещания, разработчики Ogg Vorbis до сих пор не встроили в свой кодер возможность кодирования на битрейтах ниже VBR 128 Kbps, по этой причине кодер участвовать в первых трех тестах не будет. Протестируем и сравним только MP3 и WMA.

Прошу учесть, что в этом и последующих тестах в качестве кодируемого звукового фрагмента использовалась композиция с очень насыщенным спектром (см. Введение), что можно назвать тестированием кодеков в "экстремальном" режиме, поскольку такое тестирование (теоретически) должно выявить наибольшее количество помех и артефактов кодирования.

Тест 1. 32 Kbps

Результирующая АЧХ для правого канала:

В увеличенном масштабе:

...Фанфары, литавры, занавес... Здесь все ясно. Комментарии излишни. MP3 поганит звук во всей полосе частот, в то время как WMA ведет себя достаточно стабильно в полосе до 8 - 10 Khz. MP3 просто обрезает сигнал на 5,5 Khz, а WMA старается как может в полосе вплоть до 20 Khz. Это по графику. Субъективно разница слышна, как говорится, невооруженным ухом. Качество MP3 уступает WMA минимум в три раза. Конечно, артефакты и всякий мусор кодирования имеет место быть в дичайшем количестве, однако в целом картина звучания для 32 Kbps приемлема и может удовлетворять многим запросам. Здесь WMA вне конкуренции.

Тест 2. 64 Kbps

Результирующая АЧХ для правого канала:

В увеличенном масштабе:

Аналогичная ситуация. Более подробное тестирование просто не требуется. Безусловно, оценка совпадения статичных графиков АЧХ не является объективным показателем, однако в данном случае делая скидку на любые погрешности можно с уверенностью заявить: MP3 проигрывает WMA по всем параметрам. Конечно, ни о каком "CD-качестве" на 64 Kbps у WMA (как писала Microsoft) не может быть и речи (по крайней мере при кодировании звука с таким насыщенным спектром, как у тестовой композиции) - композиция, на которой проводится тестирование, просто захлебывается в артефактах и бульканье, кроме того, стерео картина была просто изломана и искорежена кодером, однако MP3 на этом битрейте звучит сильно хуже WMA. Хотя, надо сказать, у MP3 на 64 Kbps наблюдается меньше артефактов, что вполне объяснимо - WMA пытается уместить всю полосу частот, а MP3 просто режет сигнал на 10 Khz, однако звучание MP3 все же сильно хуже WMA (что подтверждается графиком АЧХ). Также надо отметить, что WMA на таком битрейте явно вполне хватит для изготовления превью музыки (а для попсы так вообще).

Тест 3. 96 Kbps

Двинулись дальше. 96 Kbps - уже довольно большой бит-поток. Здесь конкурируют множество не рассматриваемых в данном тестировании кодеров (TwinVQ, Liquid Audio AAC и другие). Посмотрим, что же покажут MP3 и WMA.

Результирующая АЧХ для правого канала:

В увеличенном масштабе:

Здесь все становится значительно интересней. Во-первых, по графику уже сложно определить, кто лучше (в полосе до 16 Khz). Кажется, что более точно оригинальную АЧХ огибает именно MP3. Во-вторых, субъективное ощущение звучания подсказывает мне, что с WMA что-то не так. То, что работало на низших битрейтах перестало работать здесь и только портит. Это выражается не сильно, но при очень внимательном прослушивании, остается ощущение того, что WMA как-то позвякивает, или, точнее сказать, звучит звонче MP3. Но... Есть еще и аспект слышимости полосы от 15 до 20 Khz - здесь MP3 явно проигрывает. Это заметно как на слух, так и очевидно из графиков (на слух появляется ощущение рваных всплесков частот у MP3). Короче, в целом, WMA по совокупности оценок все же побеждает. Но победа уже не такая оглушительная, хотя и заметная. Кстати, в одном из прошлых тестирований WMA я предположил, что ощущение "что-то не так" при прослушивании WMA возникает в результате использования разработчиками оригинального и хитрого алгоритма кодирования, который, похоже, чуток размазывает звук. Уверен, это более четко проявится позже, в дальнейших тестах.

Тест 3. 128 Kbps

А вот тут начинается, пожалуй, самое интересное. Сейчас нам предстоит выяснить, кто же наиболее точен в передаче звука на 128 Kbps - самом популярном битрейте в Интернете и домашних музыкальных коллекциях. Здесь-то и вступает в игру новая бета кодека Ogg Vorbis. Что ж, перейдем к делу.

Результирующая АЧХ для правого канала в полосе частот 0 - 5000 Hz:

в полосе частот 5 - 15 Khz:

в полосе частот 15 - 22 Khz:

Теперь будем разбираться. Сначала о графиках. В полосе частот до ~15 Khz наиболее точно график АЧХ оригинального сигнала повторяют MP3 и OGG. Только OGG что-то начиная с 10 Khz вдруг съезжает с точного пути и начинает прыгать невпопад. WMA вообще ведет себя странно, его график на всех частотах не точен и кодер явно как-то по-хитрому реагирует на всплески частот. И это происходит уже начиная с 5 Khz. Если быть более точным, то график WMA не сильно далек от оригинала, однако если рассмотреть его в деталях, то видно, что WMA не отрабатывает тонкие детали оригинальной АЧХ. Это как нельзя лучше доказывает мое давнее предположение - WMA жульничает, размазывая сигнал как во времени, так и частотно (уж не знаю как это у него получается - нарочно или нечаянно). MP3, похоже, ведет себя наиболее предсказуемо и не совершает никаких неожиданных действий. В целом, именно график MP3 удовлетворяет меня более всех остальных.

Теперь о звучании. Я очень внимательно прослушал отрывок по нескольку раз вдаваясь в каждую мелочь и могу почти с полной уверенностью заявить, что звучание OGG и MP3 я предпочитаю звучанию WMA. При всем при том, что особенно придраться не к чему и никаких грубых артефактов я не обнаружил, WMA делает звук каким-то звонким, что немного раздражает. OGG и MP3 я вообще слабо отличаю друг от друга, хотя OGG кажется чуть более качественным. И еще раз обращу ваше внимание на то, что WMA действительно смазывает звучание - это очень хорошо слышно в одном моменте, где происходит перелив высоких частот (в районе 13-19 Khz).

Тест 4. 160 Kbps

Этот битрейт по современным представлениям должен вполне удовлетворять по качеству звучания любого слушателя (при осуществлении грамотного кодирования, конечно).

Результирующая АЧХ для правого канала в полосе частот 50 - 5000 Hz:

в полосе частот 5 - 15 Khz:

в полосе частот 15 - 22 Khz:

Здесь совсем все сложно. При самом внимательно рассмотрении графиков в разных масштабах я вообще затрудняюсь сделать какие-то выводы по поводу точности их совпадения с оригинальным. Похоже, что WMA все же по-прежнему подпорчивает сигнал. Здесь уже можно говорить только на уровне "мне кажется" и "я думаю". Причем о качестве звучания я тоже не берусь судить строго. Я по-прежнему склоняюсь на сторону OGG и MP3, хотя придраться к WMA уже не могу - совсем не к чему. Звон, вроде бы, пропал, осталось только что-то просто шумящее "наверху", кажется, что это не кажется ;-), но может быть это уже просто психологический настрой. Попытка вычесть один сигнал из другого (чтобы узнать какая часть сигнала "ушла" при кодировании) не увенчалась успехом - из-за неточного совпадения начала оригинального и декодированных сигналов разность не дает желаемого результата. На таком битрейте, вероятно, каждый должен решать для себя сам, чем пользоваться, а чем нет.

Тест 5. 192 Kbps

Ну, и финальный битрейт, выше которого, думаю, нет смысла подниматься.

Результирующая АЧХ для правого канала в полосе частот 50 - 5000 Hz:

в полосе частот 5 - 15 Khz:

в полосе частот 15 - 22 Khz:

Здесь, уж просите, будут сухие графики - никаких комментариев я дать просто не могу, поскольку не знаю что сказать У меня сильное подозрение, что OGG здесь ведет себя лучше всех. Все.

Тест 6. Описательный

Не удовлетворившись результатами графиков я решил осуществить синтетическое тестирование кодека WMA на 128 Kbps. Для это были созданы несколько файлов, содержащих строго определенный набор частот установленных амплитуд. Таким образом я хотел проверить свою теорию о размазывании сигнала во времени и по частоте. К сожалению, никаких подобных эффектов выявить не удалось - восстановленный сигнал всякий раз вообще не отличался от оригинала. Однако, думаю, этому есть объяснение. Дело в том, что никакой синтетический тест не может повторить реальные "жизненные" ситуации. Так, кодирование синтезированного звука, содержащего 10, 100, 1000 частотных составляющих не может сравниться по сложности обработки с кодированием реального звукового сигнала, имеющего насыщенный спектр. По этой причине провал моей попытки осуществить синтетический тест не означает, что кодек не имеет огрех. Кроме того, синтезированные мною сигналы не были с лишком уж сложными, что также повлияло на результат.

Выводы 

Основные мои рассуждения были приведены выше при описании тестов. Все они сводятся к одному: при кодировании на нижних битрейтах (32, 64 и 96 Kbps) становится очевидным выигрыш WMA. Особенно это проявляется на 32 и 64 Kbps. Здесь WMA ведет себя значительно лучше MP3. Совершенно определенно можно сказать, что WMA 64 Kbps действительно вполне достаточно для передачи звука для "ознакомления" (превью) либо для использования в побочных целях (комментарии к видео, дубляж и просто голос). Также, такого битрейта может с головой хватить тем слушателям, которые предпочитают поп- и другую современную музыку, не отличающуюся высокой насыщенностью спектра и прослушивающим закодированный звук на аппаратуре среднего уровня. И помимо прочего, битрейт 64 может быть очень полезен тем, кто пользуется портативными MP3/WMA-плеерами, поскольку при ходьбе по улице огрехи звучания 64 Kbps окажутся для слушателя незначительными по сравнению с посторонними шумами.

На 96 Kbps, кажется, WMA тоже остается лучше MP3. Как было указано выше, MP3 странно побулькивает в средней полосе частот при полном отсутствии передачи частот выше 15 Khz. WMA тоже далек от идеала - позвякивание где-то "наверху" раздражает, но в целом WMA побеждает MP3.

Если же рассматривать "массовый" битрейт 128 Kbps, то здесь уже сложно точно оценить какой кодек лучше. Скорее всего, каждый пользователь выберет его для себя сам, а приведенные графики будут служить только как "информация к размышлению". Однозначно можно сказать, что никакой революции WMA на 128 Kbps не совершил, качество кодирования в целом очень хорошее и добавить нечего. Хотя я больше склонен к тому, что Ogg Vorbis и MP3 более точно передают сигнал, нежели WMA.

На битрейтах 160 и 192 картина не ясна совсем. Никаких преимуществ ни у одного из кодеков я не увидел и не услышал.

Итак. По универсальности никакой кодек не может пока сравниться с MP3, так как этот кодек поддерживается на всех платформах и является самым распространенным. Качество MP3 на битрейтах начиная со 128 Kbps не уступает, в целом, никому. Ogg Vorbis, не смотря на всю свою продвинутость, ничем не удивил. Да, кодек хороший и качественный, чуть качественнее MP3, но бросаться теперь кодировать только им просто глупо, учитывая, что его распространенность сегодня очень невысока. WMA действительно порадовал на 32 -  64 Kbps, что несомненно делает его очень интересным во множестве случаев. На битрейтах 128 и выше WMA ведет себя приблизительно как и остальные кодеки, так что если кому-то просто хочется перейти на WMA, я не стану его отговаривать. Все те огрехи WMA, о которых я писал, выявляются только в хороших наушниках и при неплохой аппаратуре.

Относительные оценки по 5-балльной шкале (отдельно для каждого битрейта).

Битрейт / кодек 32 Kbps 64 Kbps 96 Kbps 128 Kbps 160 Kbps 192 Kbps
WMA 5 5 5 4 5 5?
MP3 3 3 4 4+ 5 5?
OGG - - - 5 5 5?

Похоже, что по совокупности оценок в тестировании победил WMA, с чем я всех и поздравляю.

Если у вас есть замечания, предложения или дополнения, присылайте их на e-mail.