Цифровые аудиоформаты: феномен MP3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 27 апреля, печатный экземпляр отправим 1 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №31 (165) август 2017 г.

Дата публикации: 07.08.2017

Статья просмотрена: 966 раз

Библиографическое описание:

Карпачева, В. Е. Цифровые аудиоформаты: феномен MP3 / В. Е. Карпачева. — Текст : непосредственный // Молодой ученый. — 2017. — № 31 (165). — С. 1-5. — URL: https://moluch.ru/archive/165/45326/ (дата обращения: 19.04.2024).



Музыкальный формат MP3 (MPEG-1 Layer 3) — один из самых распространенных цифровых аудиоформатов в мире. Он поддерживается всеми портативными и стационарными аудиоустройствами. В мае 2017 года разработчики формата объявили о его «смерти». 23 апреля 2017 года была прекращена коммерческая лицензионная программа компании Technicolor и Fraunhofer IIS: истек срок действия последнего патента, включенного в программу, вследствие чего стандарт формата стал общественным достоянием. Можно ли говорить о том, что дни самого популярного формата сочтены?

Разработка MP3 началась в конце 1980-х годов в Институте интегральных схем общества Фраунгофера (Fraunhofer IIS). В 1987 году Университет Эрлангена-Нюрнберга и Fraunhofer IIS объединились для работы над проектом EU147 EUREKA, посвященным цифровому аудиовещанию — Digital Audio Broadcasting (DAB). Первым результатом работы альянса стал LC-ATC кодек, который позволял в режиме реального времени кодировать стереомузыку. Следующим шагом стала разработка алгоритма оптимального кодирования в частотной области — OCF (optimum coding in the frequency domain), который уже носил некоторые отличительные черты будущего MP3-кодека. Впервые появилась возможность кодировать музыку в хорошем качестве со скоростью 64 кбит/с для монофонического сигнала. OCF стал началом пути стандартизации MPEG (Moving Picture Expert) — организации, ответственной за разработку и внедрение международных стандартов сжатия и передачи цифрового видео- и аудиоконтента. В 1989 году MPEG получила 14 предложений по внедрению стандарта кодированию звука, поэтому участникам было предложено объединить их разработки. Это привело к появлению четырех потенциальных кандидатов, среди которых были MUSICAM из Института радиовещательной технологии IRT и Philips и ASPEC (Adaptive Spectral Perceptual Entropy Coding), являющийся результатом дальнейших усовершенствований OCF Fraunhofer IIS в дополнение к вкладам Университета Ганновера в сотрудничестве с AT&T и Thomson. После тщательного тестирования MPEG предложил объединить MUSICAM и ASPEC в создании семейства из трех методов кодирования: уровень 1 — вариант MUSICAM низкой сложности; уровень 2 — кодек MUSICAM; уровень 3 (позже называемый MP3) — основанный на ASPEC. Техническая разработка стандарта MPEG-1 была завершена в декабре 1991 года. В 1994 году Fraunhofer IIS представил первый в мире MP3-кодировщик L3enc, а в 1995 исследователи Fraunhofer единогласно согласились на «.mp3» в качестве расширения файла для 3 уровня MPEG [1].

Благодаря алгоритму сжатия, который используется в аудиоформате MP3, размер данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения звука, существенно уменьшается до 10–12 раз от оригинального в зависимости от битрейта записи. Битрейтом называют скорость кодирования/раскодирования цифрового аудиопотока; качество звука улучшается с увеличением битрейта. Формату MP3 свойственны следующие величины битрейта: 32 кбит/с (очень низкое качество, приемлемо только для речи), 96 кбит/с, 128 кбит/с (среднее качество), 160 кбит/с, 192 кбит/с, 256 кбит/с, 320 кбит/с (максимально наилучшее качество). Принцип сжатия алгоритма следующий: во время процесса компрессии аудиокодеки анализируют сигналы, фокусируясь на слышимых фрагментах, которые сохраняются для дальнейшего воспроизведения или трансмиссии. Тем самым отбрасываются звуки, выходящие за диапазон восприятия человеческого уха (от 20 до 20 000 Гц). Поэтому MP3 называют форматом с потерями (lossy).

Выделяют три режима кодирования МР3-файлов: постоянный битрейт (CBR), переменный битрейт (VBR) и средний битрейт (ABR). CBR является режимом кодирования по умолчанию. В этом режиме битрейт постоянен для всего файла. Это означает, что каждая часть МР3-файла использует одинаковое количество бит. Вне зависимости от сложности музыкального отрывка, кодировщик использует один и тот же битрейт, поэтому качество итогового файла переменно. Сложные части будут имеют более низкое качество, чем самые простые. Основное преимущество данного режима заключается в том, что размер окончательных файлов не изменяется и может быть точно предугадан. При кодировании в режиме VBR пользователь выбирает желаемое качество по шкале от 9 (наименьшее качество наивысшее искажение) до 0 (наивысшее качество/низкое искажение). Затем кодек пытается поддерживать заданное качество во всем файле, выбирая оптимальное количество бит для каждой части аудиозаписи. Главное преимущество заключается в возможности указать уровень качества, который необходимо достичь, но существенным недостатком является непредсказуемость конечного размера файла. В режиме ABR пользователь задает битрейт, и программа-кодировщик пытается постоянно поддерживать средний битрейт при использовании более высоких битрейтов для частей музыки, которым требуется больше бит. Результат обладает высоким качеством, чем при кодировании в режиме CBR, в то время как средний размер файла останется предсказуемым. Популярными программами-кодеками MP3 являются mp3PRO и Lame. Каждый MP3-файл состоит из фрагментов, которые называются фреймами, которые зависимы друг от друга и состоят из двух частей: заголовка и аудиоданных, полученных в результате сжатия.

Какие форматы могут в будущем служить заменой MP3? Почти каждый современный смартфон поддерживает аудиоформат AAC (Advanced Audio Coding), вошедший в стандарты MPEG-2 и MPEG-4. В его разработке так же принимал участие Fraunhofer IIS. Он используется такими сервисами как iTunes, YouTube, в игровых приставках PlayStation 3, Nintendo Wii и в цифровом радиовещании DAB+/DRM. AAC обладает перед MP3 преимуществами, отраженными в таблице 1. При конвертации аудиозаписи с форматом WAV (Waveform Audio File Format — формат без сжатия) размером 63 Мб в МР3 и ААС с помощью Freemake Audio Converter получаются результаты, которые также приведены в таблице.

Таблица 1

Сравнение звуковых форматов МР3 иААС

Характеристика

МР3

ААС

Расширения

.mp3

.m4a,.m4b,.m4p,.m4v,.m4r,.3gp,.mp4,.aac

Оригинальное название

MPEG — 1 Audio Layer 3

Advanced Audio Coding

Год релиза

1994

1997

Стандарт

ISO/IEC 11172–3, ISO/IEC 13818–3

ISO/IEC 13818–7, ISO/IEC 14496–3

Количество каналов звука

2

до 48

Квантование

16 бит — 24 бит

16 бит -24 бит

Скорость потока данных с диска

до 320 кбит/с

до 512 кбит/с

Частоты дискретизации звука

от 16 Гц до 48 Гц

от 8 Гц до 96 Гц

Совместимость с устройствами

iPhone, iPad, iPod, Microsoft's Zune, Sony PS3/PSP, другие смартфоны.

Все портативные и стационарные аудиоустройства

Алгоритм

Сжатие с потерями (lossy)

Сжатие с потерями (lossy)

Результаты конвертации

МР3

ААС

Размер файла с битрейтом 96 кбит/с

4.24 Мб

4.29 Мб

Размер файла с битрейтом 128 кбит/с

5.65 Мб

5.71 Мб

Размер файла с битрейтом 192 кбит/с

8.48 Мб

6.76 Мб

Размер файла с битрейтом 256 кбит/с

11.3 Мб

6.76 Мб

Таким образом, формат AAC обеспечивает более высокое качество звука при том же битрейте, что у МР3. Кроме того, он гораздо лучше обрабатывает частоты выше 16 Гц, имеет более эффективный и простой банк фильтров (вместо гибридного кодирования MP3, AAC использует чистый MDCT). Однако, AAC еще не достиг популярности МР3, но вполне вероятно, что его поддержка в скором времени распространится на больший спектр устройств.

Форматы без сжатия WAV, AIFF (Audio Interchange File Format), а также сжатия без потерь (lossless) не могут служить альтернативой МР3 в силу размера аудиофайлов. Записи форматов FLAC (Free Lossless Audio Codec), APE (Monkey’s Audio), WMA (Windows Media Lossless), ALAC (Apple Lossless Audio Codec) обладают высоким качеством и как следствие, большим размером файлов. Форматы без сжатия находят применение в профессиональных аудио- и видеоприложениях, где звук перед обработкой должен сохранять оригинальное качество. Lossless кодеки имеют не очень высокий уровень сжатия (от 40 до 60 %) и подходят для прослушивания музыки на высококачественной аппаратуре. Пример различия размеров аудиофайла, представленного в разных форматах, представлен на рисунке 1.

Сравнение сжатия аудиоданных

Рис. 1. Размеры аудиофайла, представленного в разных форматах

Технологии аудиокодирования, такие как MP3 и AAC, основаны на психоакустике, что позволяет им снизить скорость передачи музыкальных данных без слышимой потери качества. Это возможно, потому что человеческое ухо не является идеальным приемником. Однако исследование под названием «Воздействие MP3-компрессии на воспринимаемые звуки музыкальных инструментов», проведенное Audio Engineering Society, показало, что сжатие музыки усиливает негативную эмоциональную окраску музыки, придавая ей отрицательные характеристики (стеснительность, страх, печаль), ослабляя позитивные (счастье, спокойствие). Также анализ компрессированных и несжатых музыкальных образцов определил, что изменение качества звучания неодинаково отражается на различных инструментах: наибольшее негативное влияние оказывается на звучание трубы, в то время как звук рожка является наиболее устойчивым к изменениям. По мнению ученых, результаты исследования обусловлены фоновым шумом, неизбежно появляющимся при компрессии аудиофайла [2].

Рис. 2. Влияние формата MP3 на тембральные и эмоциональные характеристики мелодии

Эра MP3 началась с появлением на свет первого MP3-плеера под названием WinPlay3 в сентябре 1995 года В зависимости от объема памяти устройства, современный MP3-плеер может хранить от 2 000 до 200 000 минут музыки, что составляет примерно 130 дней непрерывного прослушивания. Несмотря на то, что современные MP3-плееры поддерживают не только MP3, но и AAC, Apple Lossless (iPod), WAV, AA и другие аудиоформаты, эра MP3-плееров уходит в прошлое. Ярким показателем данной тенденции является отрицательная динамика продаж iPod.

C:\Users\user\AppData\Local\Microsoft\Windows\INetCache\Content.Word\statistic_id276307_apple_-ipod-sales-worldwide-2006-2014.png

Рис. 3. Динамика продаж iPod с 2006 по 2014 год

С 2014 года компания Apple перестала публиковать статистику продаж iPod, а в июле 2017 года на официальном сайте производителя осталась лишь одна модель из линейки музыкальных плееров, доступных к приобретению. Опрос, проведенный сайтом 9to5toys.com показал, что 80 % пользователей равнодушны к прекращению продаж iPod [3]. Современными альтернативами MP3-проигрывателю служат смартфоны и «умные» часы, обладающие необходимым функционалом и достаточным объемом памяти для полноценного прослушивания музыки и хранения обширной музыкальной библиотеки пользователя.

В настоящее время отсутствие лицензионных сборов способствует распространению формата. Многие поставщики программного обеспечения проявили интерес к поддержке MP3. Ярким примером тому служит Chromium — веб-браузер с открытым кодом, служащий основой всемирно известным Google Chrome, Opera, Vivaldi и другим браузерам. До сих пор Chromium и косвенно Chrome поддерживали различные аудиоформаты, такие как OGG, FLAC, Opus, WAV, PCM и другие. Браузеры, такие как Chrome и Firefox, поддерживали MP3 только после того, как Google и Firefox платили лицензионные сборы за использование этой технологии. Добавление MP3 в Chromium будет распространять поддержку MP3 в браузерах, которые не имеют финансовой поддержки Google, Mozilla, Microsoft и других корпораций, и поможет этим небольшим поставщикам браузеров поддерживать самый распространенный в настоящее время аудиоформат по умолчанию без каких-либо затрат.

В то же время, новейшие медиа сервисы такие как потоковое вещание, радио- и телевещание используют современные ISO-MPEG кодеки, например, семейства AAC или MPEG-H. Данные технологии предоставляют больше возможностей и более высокое качество звука с гораздо более низким битрейтом по сравнению с МР3. Некоторые обозреватели считают, что MP3 может ждать судьба формата графических изображений GIF. Патент на GIF истек более 10 лет назад, но несмотря на это, он до сих пор остается популярным форматом анимационных изображений. Каждый день пользователи социальных сетей обмениваются «гифками»; по сей день GIF используется при создании рекламных баннеров на веб-страницах, даже проводятся специализированные гиф-арт выставки, посвященные GIF-анимации.

MP3 — феномен, в корне изменивший потребление музыки. Прекращение лицензионной программы совсем не означает, что формат в скором времени себя изживет. В то время как аудиотехнологии стремительно развиваются, музыкальные и развлекательные онлайн-сервисы, радиостанции и телевизионные компании предпочитают современные кодеки, обеспечивающие высокое качество звучания при небольшой степени сжатия, стандарт MP3 все еще остается популярным среди рядовых меломанов, поэтому будущее МР3 зависит лишь от пользователей.

Литература:

  1. URL: https://www.mp3-history.com/en/development.html (дата обращения: 10.07.2017)
  2. URL: http://www.aes.org/tmpFiles/elib/20170801/18523.pdf (дата обращения: 14.07.2017)
  3. URL: https://9to5mac.com/2017/07/27/what-do-you-think-of-apples-decision-to-discontinue-the-ipod-nano-shuffle-poll (дата обращения: 30.07.2017)
Основные термины (генерируются автоматически): AAC, IIS, MPEG, IEC, ISO, MUSICAM, WAV, ASPEC, CBR, GIF.


Похожие статьи

Задать вопрос