Чем больше новшеств и технологий появляется в современной компьютерной индустрии, тем больше пользы это приносит пользователю – это правило подтверждается множеством примеров. В частности, процесс постоянного совершенствования и усложнения технологий компьютерного звука заставляет пользователя постоянно развиваться, «догонять передовую компьютерную мысль», становиться все более грамотным и компетентным. Но, с другой стороны, все более и более изощренным становится и бизнес в этой области, который впитывает в себя как губка все новое и передовое.
Музыку из Интернета не «качает» сегодня только ленивый. Повсеместное распространение технологий «сжатия аудио с потерями» – «lossy-coding» (технологии MPEG, WMA, Ogg Vorbis, VQF и многие другие) привело к тому, что достать музыку, некогда с таким трудом добываемую на аудио кассетах или CD, стало легко и просто - это можно сделать в Интернете даже не вставая с кресла. Такое положение вещей открыло новые возможности не только для пользователей, но и для тех, кто любит делать деньги на нечестном бизнесе.
В этой статье речь пойдет о том, как нелегальный компьютерный бизнес использует современное ПО и компьютерные технологии в области звука. Мы поговорим об аудио CD, «нарезанных» из .MP3-файлов, а, главное, о том, как практически отличить оригинальный CD от фальшивого.
Что нужно, чтобы наладить производство аудио компакт дисков? Завод по изготовлению «болванок», машины для тиражирования CD и своя звукозаписывающая студия? Нет, сегодня это уже не так. «Болванки» можно купить в магазине за углом, писать диски можно «потихоньку» на домашнем компьютере в недорогом приводе CD-R, а музыку можно выкачивать из Интернета, например, в формате .MP3 (MPEG-1 Layer III). Все просто, и, самое главное, - дешево. Этим и пользуется нечистоплотный бизнес. «Бизнесмены» ставят подобное производство (с небольшими модификациями) на поток, и продают результаты этого производства в магазинах, выдавая «паленые» компакт диски за оригинальные. Что в этом плохого, кроме некрасивого отношения к своим покупателям? Дело в том, что звучание подобных компакт-дисков если не катастрофически, то очень заметно отличается от звучания оригинальных композиций, из которых были сделаны использованные для записи CD .MP3-файлы (то же самое относится и к файлам в других lossy-форматах). Это обусловлено самой природой lossy-кодирования. Компрессоры (подобные компрессорам .MP3 и другим), основанные на идее кодирования с потерями качества (lossy-coding), преследуют две цели: закодировать аудио так, чтобы сжатые данные занимали как можно меньший объем памяти и звучали при этом как можно более близко к оригиналу. Способы, которыми достигаются эти две цели, могут быть различными, однако, все они в результате приводят к тому, что закодированные данные при воспроизведении (декодировании) уже не являются оригинальным сигналом, а лишь похоже звучат. Такая деградация оригинального качества звука связана с тем, что в процессе кодирования данные сильно "упрощаются": из них выбрасываются ненужные слабослышимые или замаскированные детали, а также используются другие методы «облегчения» данных (подобная техника упрощения аудио данных известна под понятием «психоакустическая модель»). Процесс декодирования уже не способен восстановить утраченные во время компрессии данные (нюансы звучания, отфильтрованные частоты и проч.). Поэтому, покупая сегодня аудио CD можно столкнуться с тем, что «компакт» окажется подделкой и будет являть собой СD, созданный из декодированных .MP3-файлов. А это означает, что качество звучания такого CD будет заведомо хуже оригинала.
Перейдем к делу. Предположим, вы приобрели аудио CD. Не спешите выбрасывать чек, – может быть вам еще придется вернуть этот диск назад в магазин. Давайте разберемся, что вас может насторожить в покупке. Таких моментов есть несколько. Первый, и наиболее очевидный, – это вид самого компакт диска. Фирменный диск всегда качественно упакован, чаще имеет голографическую маркировку, штрих-код и т.д., что явно отличает его от китайской штамповки. Второй момент – это, конечно, звучание CD: если оно сопровождается странными помехами («бульканьем», позвякиванием, резкими перепадами уровня сигнала на различных частотах) – это уже плохой признак, так как все упомянутые помехи, являются типичными «артефактами» кодирования в .MP3. Третий момент, на который тоже следует обращать внимание, – это неравная громкость звучания треков. Это может оказаться признаком того, что диск был записан с использованием не выровненных по уровню громкости .MP3-файлов.
Давайте попробуем разобраться, каким образом можно отличить оригинальный CD от диска, записанного с использованием .MP3-файлов.
Таких способов есть несколько. Однако ради справедливости здесь отметим, что ни один из указанных ниже способов не гарантирует, к сожалению, стопроцентной уверенности в напрашивающихся выводах. Это связано с тем, что все способы, которые мы рассмотрим, опираются на известные особенности кодирования в MP3 (или подобного, основанного на использовании психоакустики). Поэтому, грамотный и хитроумный специалист может при желании «замести следы». Но, все же, шанс обнаружить подделку при внимательном и правильном изучении диска достаточно велик. Кроме того, все рассматриваемые способы требуют некоторого понимания процесса компрессии аудио в .MP3. Всю необходимую информацию по этому поводу мы рассмотрим ниже по ходу изложения материала статьи.
Первое. В первую очередь необходимо вооружиться какой-нибудь программой, позволяющей копировать аудио данные с CD на винчестер в .WAV-файлы. Эта программа необходима для извлечения аудио данных для предстоящей проверки диска на «честность».
В качестве справки: информация на аудио CD хранится в некодированном цифровом виде, но не в файлах, а в специальном формате CDDA. Чтобы иметь возможность работать с этой информацией, необходимо предварительно скопировать ее в файлы: каждый аудио трек с диска копируется в отдельный файл. Стандартным файловым контейнером для хранения информации с параметрами, как на аудио CD, – 44.1 КГц / 16 бит / стерео - является .WAV-файл.
Программ для копирования данных с аудио CD существует множество, например, WinDAC, Feurio, CD Copy, CDex. Автор статьи уже давно остановил свой выбор на программе Exact Audio Copy. Воспользовавшись выбранной программой нужно скопировать все треки (либо только те, которые вы бы хотели исследовать) с CD в файлы на винчестер.
Второе. Необходимо установить какой-нибудь редактор цифрового аудио. Для этой цели, пожалуй, лучше всего подойдет редактор Cool Edit Pro компании Syntrillium. Редактор понадобится нам для детального изучения исследуемых данных. Откровенно говоря, Cool Edit сам умеет копировать информацию с аудио CD, однако, все же, лучше воспользоваться специально предназначенной для этой процедуры программой.
Третье. Приступаем к исследованию.
Способ 1. Предпосылкой к рождению этого способа является одна специфическая особенность кодирования аудио в .MP3. Кодирование данных в .MP3 происходит не целиком, а частями - аудио данные разбиваются на, так называемые «фреймы», длительностью 50 мс, и каждый фрейм анализируется и сжимается кодером отдельно. Тонкости этого процесса здесь описывать не будем. Главным является то, что самый первый фрейм в созданном в результате кодирования файле .MP3 оказывается пустым (или, точнее, почти пустым). А, значит, при обратном декодировании .MP3 в .WAV-файл, полученный аудио поток будет содержать «полную тишину» (сигнал с нулевой амплитудой) протяженностью около 25-40 мс (в зависимости от кодера, использованного для компрессии). Таким образом, аудио трек на неоригинальном аудио CD (в случае, если его передний край не подрезали специально перед созданием CD) характеризуется наличием короткого участка «полной тишины». Чтобы проверить, не имеем ли мы дело как раз с таким треком, нужно загрузить .WAV-файл в редактор (мы условились, что пользуемся редактором Cool Edit Pro), подобрать масштаб по амплитудной и временнОй шкале, и в случае «успеха» мы увидим картину, похожую на представленную ниже (см. рис. 1, показан только левый канал трека).
рис. 1
Масштаб временной шкалы следует подбирать так, чтобы на все видимое рабочее поле отображалось примерно 60-100 мс от начала файла. Масштаб амплитудной шкалы следует выбирать покрупнее, так как нужно быть уверенным наверняка в том, что интересующий нас участок аудио действительно несет нулевую амплитуду, а не просто очень низкий по уровню не нулевой сигнал.
Надо отметить, что полная тишина в начале трека еще не означает, что трек «фальшивый». Не исключено, что при подготовке диска к записи оригинальный сигнал действительно был нарочно приглушен по краям. Поэтому, чтобы сделать верные выводы относительно всего CD, нужно внимательно изучить не один и не два трека, а желательно все. В случае наличия тишины в начале каждого трека на диске, можно с определенной долей вероятности утверждать, что данный диск неоригинальный.
Способ 2. Рассмотрим способ, основанный на других специфических нюансах lossy-кодирования в .MP3. Как было упомянуто выше, lossy-кодирование основано на «упрощении сигнала», которое сильно способствует повышению коэффициента сжатия (иными словами, упрощенный сигнал сжимается намного сильнее, чем оригинальный). В MPEG-1 Layer III (а также во многих других кодеках) под упрощением сигнала подразумевается применение к сжимаемым данным также уже упомянутой выше психоакустической модели. В процессе такой обработки из сигнала отфильтровываются, например, неслышимые и замаскированные частоты, а также резкие кратковременные всплески, нераспознаваемые или малозаметные для человеческого слуха. Подобная фильтрация тем агрессивнее, чем более низкий битрейт используется для компрессии данных.
Врезка. В качестве справки: при сжатии в .MP3 пользователь указывает желаемый битрейт (или границы изменения битрейта) для сжатого выходного потока (битрейт – количество бит, используемых для хранения одной секунды аудио). Чем ниже битрейт, тем меньше бит позволяется кодеру отводить для хранения информации об одной секунде аудио и, таким образом, тем хуже качество получаемого сжатого потока аудио. Наиболее распространенное среднее значение битрейта колеблется в пределах от 128 до 192 Kbps («килобит в секунду»).
Чтобы «справиться» с компрессией данных на достаточно низких битрейтах (таких, как 96, 112 и 128 Kbps), некоторые кодеры .MP3 перед применением психоакустики отфильтровывают из оригинальных данных все частотные составляющие, расположенные выше определенного предела (для 128 Kbps граничная частота обычно составляет 16 КГц). Это означает, что при декомпрессии аудио этих частот также не будет. А, это в свою очередь означает, что если исследуемый диск «нарезан» из низкобитрейтных .MP3 файлов, то нехитрый спектральный анализ покажет полное или частичное отсутствие частот выше определенной границы.
Для того чтобы проверить нашу гипотезу, загрузим один из треков в редактор и посмотрим на этот трек в режиме сонограммы (в редакторе Cool Edit Pro режим просмотра сонограммы включается в меню View -> Spectral View). Пример того, как выглядит сонограмма .WAV-файла, декодированного из .MP3 128 Kbps, можно увидеть на рис. 2 (показан только левый канал).
рис. 2
Как видите, частот выше 16 КГц просто нет. Более того, видна совершенно четкая граница фильтрации.
Надо отметить, что этот метод проверки CD более точен. Однако и в этом случае нужно учитывать, что, во-первых, не все кодеры и не во всех режимах осуществляют такую жесткую фильтрацию - грамотно сжатый .MP3 даже на низком битрейте более или менее правильно отражает спектральную картину оригинального сигнала во всей полосе частот. Поэтому, даже если диск не оригинальный, подобной картины можно и не увидеть. Во-вторых, следует обратить внимание на то, что проблема имеет и обратную сторону. В ваших руках может оказаться оригинальный диск, который по результатам подобной проверки вы можете принять за фальшивый. Такое может случиться, если вы не учтете тот факт, что не все оригинальные диски содержат аудио материалы прекрасного качества. Некоторые диски могут быть записаны со старых носителей (старые магнитные ленты, виниловые пластинки), где частотный диапазон ограничен либо качеством самого носителя, либо невысоким качеством использованной при записи аппаратуры.
Способ 3. Как мы уже сказали выше, помимо возможной фильтрации верхних частот при кодировании в .MP3 происходит сильное «упрощение сигнала». Кодер анализирует аудио информацию и, опираясь на указанный пользователем битрейт, «решает» какие тонкости звучания можно выбросить. Чем ниже битрейт, тем сильнее будут упрощены оригинальные аудио данные. Такая обработка сигнала не проходит бесследно: сжатый сигнал начинает звучать менее естественно, а к звучанию добавляются так называемые «артефакты кодирования» («бульканье», позвякивание, заметные скачки уровня сигнала на различных частотах). В двух словах объяснить возникновение подобных искажений несложно: выходной поток кодера ограничен по размеру указанным битрейтом; кодер, «пытаясь» уложиться в заданный размер и, в то же самое время, не сильно испортить сигнал, «старается» сохранить как можно больше нюансов оригинального звучания. Однако ввиду конечности скорости реакции кодера и вследствие невозможности «запихнуть» в выходной поток все подобные нюансы, кодер вынужден резко переключаться между ними, изменять параметры фильтрации и проч., что в результате приводит к заметным искажениям в звучании. Естественно, эти искажения тем ощутимее, чем ниже битрейт.
Возвращаясь к практической части разговора надо отметить, что описанные искажения и дефекты кодирования в той или иной степени можно распознать на сонограмме. Если анализируемый аудио материал действительно является декодированным из .MP3, то такие артефакты будут различимы на сонограмме (в зависимости от битрейта исходного .MP3 они будут различимы больше или меньше).
Итак, для определения уровня искаженности сигнала берем фрагмент одного из треков протяженностью 1 – 1,5 секунды с наиболее насыщенным звучанием, причем, масштаб временной шкалы следует подобрать так, чтобы выбранный фрагмент занимал все рабочее поле; при необходимости масштаб можно еще более укрупнить. На рис. 3 в качестве примера приведена сонограмма фрагмента .MP3-файла (128 Kbps).
рис. 3
А теперь, для сравнения, посмотрите на сонограмму оригинального сигнала, показанную на рис. 4.
рис. 4
Как видите, сонограмма оригинального сигнала выглядит гладко, однородно, без резких скачков и рваных краев. Первая же сонограмма (рис. 3) выглядит наоборот, очень прерывистой, зернистой, неоднородной. Это и есть результат попыток кодера максимально «отработать» всю полосу частот, сохранив все тонкости звучания. Конечно, когда вы попытаетесь воспользоваться приведенным способом для определения подлинности купленного диска, в вашем распоряжении не будет оригинала, и сравнить сонограммы вы не сможете. Однако представленная на рис. 3 сонограмма типична для низкобитрейтного .MP3-файла и может послужить вам примером того, как выглядит неоригинальный сигнал. Видимая невооруженным глазом неоднородность, крупнозернистость и прерывистость спектра является наглядным примером наиболее характерных артефактов кодирования. Заметим, что такая наглядность снижается с увеличением битрейта .MP3-файла. В качестве еще одного примера посмотрим на сонограмму того же сигнала, однако закодированного на битрейте 160 Kbps (см. рис. 5).
рис. 5
На таком битрейте неоднородность сигнала хотя и стала менее заметной, однако все равно различима.
К сожалению, и этот способ определения оригинальности CD не гарантирует абсолютную достоверность. Он лишь дает наиболее уверенные результаты, чем предыдущие способы, но тоже не претендует на объективность по нескольким причинам. Во-первых, не всегда исследуемый сигнал имеет фрагменты с таким «наглядным» насыщенным спектром. Во-вторых, при подготовке диска к записи, профессионал может попытаться скрыть следы .MP3-кодирования. Кроме уже описанного обрезания тишины в начале файла, он может попытаться скрыть артефакты кодирования путем пропускания декодированного сигнала через специальные программы, облагораживающие звучание и реконструирующие частотные составляющие. После такой серьезной начальной обработки сигнала, можно и не заметить явно выраженных искажений сигнала. Однако все же этот способ анализа CD может оказаться решающим в определении происхождения купленного диска.
Способ 4. Последний способ, который может сыграть одну из решающих ролей в установлении истины, прост и красив. Способ основан на следующей идее. Обычно, основная аудио информация расположена не стерео панораме приблизительно в центре. То есть по субъективным ощущениям слушателя, источником звука является некий мнимый источник, находящийся посредине между двумя физическими. Артефакты кодирования же являются, как мы говорили, результатом невозможности точно отработать все тонкости звучания. Поскольку таких тонкостей может оказаться достаточно много, то безо всякой зависимости от стерео картины, дефекты кодирования могут быть разбросаны по стерео панораме достаточно хаотично.
Таким образом, вычитание сигнала одного канала из сигнала другого канала, по сути, «выбросит» все основное звучание, оставив только то, что находилось по бокам. Артефакты кодирования при этом станут намного заметнее, поскольку они окажутся выделенными на общем фоне. А, значит, такая нехитрая операция, как вычитание каналов даст возможность на слух достаточно уверенно определить все дефекты кодирования, если таковые имели место.
Теперь о том, как вычесть каналы. Загрузите один из .WAV-файлов (треков) в редактор и произведите вычитание правого канала из левого (в Cool Edit Pro: выделите правый канал, скопируйте его в буфер, теперь выделите левый канал, воспользуйтесь меню Edit -> Mix Paste, включите Invert и Overlap, примените). Теперь, исключительно для удобства прослушивания, скопируйте полученный результат из левого канала в правый. В случае если в вашем распоряжении оказался, все-таки, фальшивый трек, декодированный из .MP3, результатом проделанной процедуры будет сигнал, содержащий «все ужасы» кодирования в .MP3: все шумы, искажения и скрежет, «захлебывание» ударных, высокочастотный шум, – все это с большой долей вероятности окажется в полученном результирующем сигнале. Чтобы ясно представить себе, чего ожидать от такого звучания, вы можете сами создать свой .MP3 и сравнить звучание разности каналов оригинального сигнала со звучанием разности каналов .MP3.
Вывод. Личная практика автора по применению приведенных способов анализа показывает, что ни один из четырех представленных на ваш суд способов не является панацеей. Однако если большая часть результатов применения приведенных выше методов склоняет вас думать о подлоге, то, скорее всего, так оно и есть.
Данная статья кроме своей практической направленности преследовала своей целью расширить кругозор пользователей в области компьютерного звука. Автор будет признателен читателям за отзывы по данной статье, а также за новые идеи расширения методологии определения оригинальности аудио CD.