Музыка и Электроника, 2004, № 3, с.12-13, рубрика «Музыкальный софт»
МУЗЫКАЛЬНАЯ БИБЛИОТЕКА НА ДОМАШНЕМ КОМПЬЮТЕРЕ
Михаил Красильников
Современные мультимедийные технологии делают возможным хранение на домашнем компьютере огромных музыкальных коллекций. В статье рассказывается, каким образом это удобнее всего организовать.
Сжатие аудио
Наиболее простым способом представления аудио информации для компьютера является формат PCM. Файлы PCM чаще всего называют WAV-файлами и широко используют для хранения коротких звуковых фрагментов. Например, системные звуки Windows хранятся в формате WAV. Также PCM используется для хранения музыки на аудио компакт-дисках. PCM-информация хранится в несжатом виде, каждая единица данных (sample) представляет собой просто точку на осциллограмме звукового потока. Основными параметрами WAV-файла (да и цифрового звука вообще) являются частота дискретизации и разрядность. Частота дискретизации – это количество единиц (квантов) информации в секунду, закодированных в потоке. Она определяет спектр частот, который может быть сохранен в звуковом файле. Разрядность – это количество значений, которые может принимать каждый квант. Для обоих параметров работает очень простое правило: чем больше – тем лучше. Для стандарта Audio CD были приняты значения частоты и разрядности, равные соответственно 44100 KHz / 16 Bit. Первое число определяет, что спектр хранимых частот ограничен пределами 0 – 22050 КГц. (Человеческое ухо не слышит более высоких звуков). Второе число определяет, что каждый квант потока может принимать 2^16 = 65536 различных значений. Этого в большинстве случаев вполне достаточно, чтобы слушатель не смог отличить цифровой звук от живого. Главной проблемой стандарта PCM является то, что файлы имеют большой размер. 74 минуты музыки занимают порядка 800Мб. Это слишком много, чтобы хранить коллекцию музыкальных записей на жестком диске домашнего компьютера.
Для решения этой проблемы было придумано несколько методов сжатия звукового потока. Как было выяснено, человеческое ухо воспринимает далеко не всю звуковую информацию, которую может хранить формат PCM, и большинство методов сжатия аудио используют это правило, которое имеет название «сжатие с потерями». К примеру, вы не расслышите шелест опадающих листьев на фоне рева турбин реактивного самолета, поэтому можно хранить только звук турбин (средне-высокие частоты), а тихий шелест удалить (средние частоты).
MPEG (http://www.mpeg.org)
MPEG – это организация, которая с начала 90-х годов занимается проблемами представления мультимедийной информации (аудио и видео) в цифровом виде. Наиболее известные из решений MPEG – это серия стандартов MPEG-1 (Video-CD) и MPEG-2 (DVD). Знаменитый формат MP3 – это один из стандартов серии MPEG-1. Его полное название – MPEG-1 Layer 3. Основным параметром потока MP3 является так называемый битрейт (bitrate), который определяет количество информации, описывающее каждый временной промежуток звуковых данных. Легко вычислить битрейт для стерео файла PCM с параметрами 44100 / 16. Он будет равен 44,100 * 16 * 2 = 1,411,200 бит в секунду.
(На два нужно умножать, потому что стереозвук идет по двум каналам). Для того, чтобы было удобно представлять такие величины, используют понятия килобит (тысяча бит) и мегабит (миллион бит), соответственно, в секунду. Полученное нами значение примерно равно 1,4 мегабит в секунду (Мбит / Mbit).
Перед разработчиками стандарта MPEG-1 Layer 3 была поставлена задача достичь качества звучания аудио компакт-диска при битрейте 128 килобит в секунду (kbps), что соответствует степени сжатия более чем в 11 раз, и это им, с некоторыми оговорками, удалось. Дело в том, что алгоритму сжатия с потерями вместе с «мусором», при низких битрейтах, приходится удалять и полезную информацию, а это ведет к возникновению искажений при воспроизведении готового файла. Такие искажения принято называть артефактами. Для MP3 артефакты обычно представляют характерный звон на высоких частотах при битрейтах ниже 160 Кбит, поэтому для хранения качественного аудиоматериала надо использовать более высокие битрейты, например 192Кбит/с.
Стандарт MP3 является открытым. Это значит, что написать программу для сжатия аудио в этот формат имеет право каждый разработчик. Поэтому появилось великое множество программ для сжатия в MP3. Наиболее удачной из них является почтенного возраста проект Lame (http://mp3dev.net).
Однако в вопросах распространения программного обеспечения, которое использует технологию сжатия и декомпрессии MP3, наблюдается некоторая юридическая путаница. С одной стороны, некоторая часть алгоритмов MP3 запатентована и разработчики обязаны покупать лицензию. С другой – никто не воспрепятствует, скажем, использованию бесплатного компрессора winLame и бесплатного проигрывателя WinAMP.
Кодирование
с переменным битрейтом (VBR)
Нетрудно себе представить, что некоторые участки исходного аудио-материала могут быть сложнее других, обладать более насыщенной амплитудно-частотной характеристикой (АЧХ) для компрессора. Разумнее было бы расходовать на описание этих участков больше данных для повышения качества полученного файла. Такой метод кодирования называется VBR (Variable BitRate) Encoding. От пользователя обычно требуется указание минимального и максимального значения bitrate или его среднего значения (Average BitRate), ABR.
Xiph (http://www.xiph.org)
Xiph – это коллектив разработчиков программного обеспечения, которые поставили перед собой задачу создать альтернативу стандартам MPEG, не обремененную «юридической неопределенностью». Все продукты организации Xiph являются полностью бесплатными как для конечных пользователей, так и для прочих разработчиков. Основным звуковым кодеком Xiph (программой для преобразования звука в сжатый формат и обратно) является Ogg Vorbis, видео – Ogg Theora. Vorbis использует более продвинутые алгоритмы сжатия, чем MP3, звуковые файлы Ogg при одинаковом битрейте звучат качественнее файлов MP3. Для примера можно сказать, что Ogg ABR 128 kbps соответствует качеству MP3 ABR 192 kbps. Кроме того, для сжатия одинакового количества материала компрессору Vorbis требуется примерно в 8 раз меньше времени, чем компрессору MP3 (сравниваются последние версии кодеков Vorbis и Lame, работающие при максимальных настройках качества), что особенно важно для обладателей маломощных компьютеров.
Но есть и обратная сторона медали. Дело в том, что рынок заполонили устройства (CD-плееры, музыкальные центры, автомагнитоллы и т.п.), которые могут проигрывать диски с MP3 файлами, MP3, но не Ogg. Так что если вы планируете использовать такие устройства, то у вас могут возникнуть проблемы. Если же вы собираетесь слушать музыку только на компьютере, то ваш выбор – Ogg.
Главным параметром для файла Ogg является качество (quality), которое по сути является синонимом значения ABR. Качество 0 (ноль) соответствует ABR 64 kbps, 4 – ABR 128 kbps, максимальное, 10 – ABR 500 kbps.
Windows Media (WMA, WMV)
Корпорация Microsoft тоже создала свои собственные форматы представления мультимедийной информации для использования в операционных системах семейства Windows: Windows Media Audio (WMA) и Windows Media Video (WMV). До появления кодека Ogg Vorbis формат WMA был более предпочтительным для хранения музыки, так как файлы WMA обладали лучшим качеством звучания, чем MP3. На сегодняшний день, как нетрудно догадаться, их качество оценивается как «лучше, чем MP3, но хуже Ogg». Переносимость файлов формата WMA оценивается также.
Так как кроме Windows есть и другие операционные системы (ОС), формат Windows Media не столь распространен среди меломанов, а программы-проигрыватели файлов Ogg и MP3 существуют для большинства ОС. Некоторым преимуществом формата WMA является то, что при использовании современных версий Windows (XP) не требуется установки дополнительного программного обеспечения для копирования музыкальных компакт-дисков в этот формат. Всю работу берет на себя Windows Media Player, что представляется исключительно удобным для начинающих пользователей.
Инструкция по эксплуатации
Рассмотрим теперь процесс копирования музыкального компакт-диска в формат Ogg Vorbis при работе в операционной системе семейства Windows. Вообще говоря, необходимо иметь специальную компьютерную программу (приложение), выполняющую копирование звуковых дорожек с музыкального компакт-диска, и еще одну – для сжатия звука в соответствующий формат. Такой подход позволяет контролировать оба процесса, но требует усилий для настройки программ. Для копирования звука с диска мы используем популярную программу Nero Burning Rom, которая у вас, скорее всего, установлена, если вы являетесь обладателем пишущего CD-привода. В главном меню необходимо выбрать пункт Recorder → Save Track… или Extras → Save Tracks… в зависимости от используемой версии программы. Затем установить параметры, аналогичные указанным на иллюстрации 1, нажать на кнопку GO и дождаться завершения операции копирования. Теперь содержимое компакт-диска находится на вашем жестком диске (в нашем случае в папке C:\AudioCD).
Вторым шагом будет конвертация WAV файлов в формат Ogg Vorbis. Для этого вам потребуется (как один из вариантов) программа OggDrop, которая является бесплатной. Ее можно скачать по адресу http://homepage.ntlworld.com/jfe1205/ OggVorbis/. По умолчанию установлены параметры сжатия Q4, что соответствует среднему битрейту 128 kbps. Это нам и нужно. Достаточно просто перетащить группу WAV-файлов в окно OggDrop (см. иллюстрацию 2), и процесс сжатия начнется. Готовые Ogg файлы будут находиться в той же папке, что и исходные WAV-ы.
Файлы Ogg (и, естественно, MP3) могут хранить в себе название композиции, имя автора и другую информацию. Эти данные называются тегом (tag) и используются для логической организации музыкальной коллекции. Полученные нами Ogg файлы информационных тегов не содержат, и было бы неплохо их задать. Для этого загрузим наши файлы в проигрыватель WinAMP (которым, кстати, я рекомендую пользоваться для последующего прослушивания). В окне Winamp Playlist, в меню, открываемом правой кнопкой мыши, выбираем пункт File Info (3), заполняем в открывшемся окне пустые поля (4) и жмем кнопку Update. Кроме совета задавать теги, еще рекомендую хранить файлы в отдельной папке (например C:\Music), рассортированные по подпапкам следующим образом: в каталоге Music хранятся подпапки – названия исполнителей. В каждой такой подпапке создаются отдельные подкаталоги для каждого альбома. Таким образом, путь к любому файлу будет примерно таким: «C:\Music\ SomeArtist \SomeAlbum\ SomeSong.Ogg». Это значительно упрощает поиск нужной композиции.
Удачного прослушивания!
Статью с иллюстрациями см. в бумажной версии журнала