Первая страница
Наша команда
Контакты
О нас

    Главная страница


Кодирование и декодирование аудио с помощью foobar2000




страница1/3
Дата29.06.2017
Размер0.72 Mb.
ТипРеферат
  1   2   3


ГОСУДАРСТВЕННЫЙ КОМИТЕТ СВЯЗИ ИНФОРМАТИЗАЦИИ И ТЕЛЕКОММОНИКАЦИОННЫХ ТЕХНОЛОГИЙ РЕСПУБЛИКИ УЗБЕКИСТАН
ТАШКЕНТСКИЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

«К защите»

Заведующий кафедрой «КГ и Д»

доц. Нуралиев Ф.М.

«____» ____________ 2013 г.

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА


ТЕМА: Кодирование и декодирование аудио с помощью foobar2000

Выпускница ______________ Болтабоева Г.

(подпись) (Фамилия)

Руководитель ______________ Садыкова Н.

(подпись) (Фамилия)

Рецензент ______________ Тўхтаназаров М.

(подпись) (Фамилия)

Консультант по БЖД _____________ Қодиров Ф.

(подпись) (Фамилия)

Ташкент 2013 г.

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СВЯЗИ ИНФОРМАТИЗАЦИИ И ТЕЛЕКОММОНИКАЦИОННЫХ ТЕХНОЛОГИЙ РЕСПУБЛИКИ УЗБЕКИСТАН

ТАШКЕНТСКИЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ


Факультет Телевизионных технологий, кафедра «Компьютерная графика и дизайн»

Направление (специальность) 5525700-«Технология звука записи»


УТВЕРЖДАЮ

Зав кафедрой Нуралиев Ф.М.

«____» _______________ 2013 г.
ЗАДАНИЕ
на выпускную квалификационную работу

Болтабоева Гулмира Одилжоновна

(фамилия, имя, отчество)


1. Тема работы: Кодирование и декодирование аудио с помощью foobar2000

2. Утверждена приказом по университету от «4».02,2013 П№109

3. Срок сдачи законченной работы: 28.05.2013 г.

4. Исходные данные к работе: Программа foobar2000, Операционная система Windows 7

5. Содержание расчётно – пояснительной записи (перечень подлежащих разработке вопросов): Введение, 1.Анализ принципы кодирование и декодирование звука, 2. Анализ применение foobar2000 в практике, 4.Безопасность жизнедеятельности, 3. Конвертация. Кодирование и декодирование с помощью foobar2000.

6. Перечень графического материала: __презентация

7. Дата выдачи задания: 05.02.2013 г.

Руководитель: Садыкова Н. _________________

Ф.И.О. (подпись)

Задание приняла _Болтабаева Г. _________________

(подпись)

8. Консультант по отдельным разделам выпускной работы




Раздел

Ф.И.О

Руководителя



Подпись дата

Задание выдал

Задание получил

1. Введение

Садыкова Н.

05.02.13

05.02.13

2. Анализ принципы кодирование и декодирование звука

Садыкова Н.

21.02.13

21.02.13

3. Анализ применение foobar2000 в практике

Садыкова Н.

15.03.13

15.03.13

4. Конвертация. Кодирование и декодирование с помощью foobar2000

Садыкова Н.

06.04.13

06.04.13

5. БЖД

Қодиров Ф.

11.05.13.

11.05.13.

6. Заключение

Садыкова Н.

21.05.13

21.05.13

9. График выполнения работы






Наименование раздела работы

Срок

выполнения



Отметка руководителя выполнении

1.

Введение

05.03.13-20.02.13




2.


Анализ принципы кодирование и декодирование звука

21.02.13-15.03.13




3.


Анализ применение foobar2000 в практике

15.03.13-05.04.13




4.


Конвертация. Кодирование и декодирование с помощью foobar2000

06.04.13-10.05.13




5.


БЖД

11.05.13-18.05.13




6.


Заключение

21.05.13-27.05.13



Выпускница __________________ «____» _______________2013 г.

(подпись)

Руководитель__________________ «____» _______________2013 г.

(подпись)

В данной выпускной квалификационной работе было изучено программа foobar2000 которая работает над аудио информациями и ее возможности и интерфейс. Кроме того было рассмотрено процессы кодирование и декодирование с помощью этой программы.


Битирув малакавий ишида аудио маълумотларга ишлов берувчи foobar2000 дастур ҳақида, унинг интерфейси, имкониятларини ўрганиб чиқилди. Ҳамда шу дастур ёрдамида кодлаш ва декодлашни амалга ошириш кўриб чиқилди.
During the research work interface of the program Foobar 2000 which works on audio information and its all functions were observed. Also, with the help of this program it was observed to code and decode processes.

СОДЕРЖАНИЕ



ВВЕДЕНИЕ ………………………………………………………………………

6

ГЛАВА 1. ПРИНЦИПЫ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ЗВУКА




1.1. Кодирование звуковой информации ……………………………………….

7

1.2. Кодирование оцифрованного звука перед его записью на носитель ……

8

1.2.1. Сжатие звука без потерь и с потерями …………………………….

9

1.3. Декодирование звуковой информации …………………………………….

14

1.3.1. Декодирование звука с учётом ReplayGain ………………………...

16

1.4. Аналого-цифровой преобразователь ………………………………………

18

1.5. Цифро-аналоговый преобразователь ………………………………………

25

Выводы по первой главе …………………………………………………..

30

ГЛАВА 2. АНАЛИЗ ПРИМЕНЕНИЕ FOOBAR2000 В ПРАКТИКЕ




2.1. Описание интерфейса пользователя ………………………………………

31

2.2. Преимущества и недостатки программный аудио – проигрывателя foobar2000 ………………………………………………………………………..

36


Выводы по второй главе ………………………………………………......

38

ГЛАВА 3. КОНВЕРТАЦИЯ. КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ С ПОМОЩЬЮ FOOBAR2000




3.1. Принцип работы аудио проигрывателя foobar2000 ………………………

39

3.2. Принципы настройки конвертера foobar2000 ……………………………..

42

3.3. Кодирование в AAC ………………………………………………………...

53

3.4. Декодирование аудио с помощью foobar2000 …………………………….

56

Выводы по третьей главе ………………………………………………….

60

ГЛАВА 4. БЕЗОПАСНОСТЬ ЖИЗНЕДЕЯТЕЛЬНОСТИ




4.1. Влияние метеорологических условий производственной среды на организм человека ……………………………………………………………….

61


4.2. Пожарная безопасность …………………………………………………….

69

ЗАКЛЮЧЕНИЕ .…………………………………………………………………

78

ЛИТЕРАТУРА …………………………………………………………………...

79


ВВЕДЕНИЕ
Для дальнейшего развития телерадиовещания приняты ряд постановлений кабинетом министров, Олий Мажлисом и Президентом нашей страны. Мероприятия по исполнению Постановления Президента Республики Узбекистан №ПП-1088 «О мерах по дальнейшему повышению эффективности использования высокотехнологичного телерадиооборудова-ния в системе Национальной телерадиокомпании Узбекистана» от 1 апреля 2009 года. Которым предусмотрены меры по организации производства качественной телерадиопродукции на основе современных медиатехнологий и улучшению системы подготовки и переподготовки телевизионных инженерно-технических кадров, с 2009/2010 учебного года в Ташкентском университете информационных технологий будет открыт факультет «Телевизионные технологии» для подготовки телеоператоров, инженеров по спецосвещению, видеомонтажу, компьютерной графике и звукозаписи.

Целью данной выпускной квалификационной работе являются Кодирование и декодирование с помощью foobar2000.

В этом теме изучается анализ принципы кодирование и декодирование звука, анализ применение foobar2000 в практике, кодирование и декодирование с помощью foobar2000.

Поскольку вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование[1].

Выпускная квалификационная работа состоит из 4 разделов, введения, заключения, 38 – рисунков. Список литературы содержит 17 наименований.

ГЛАВА 1. АНАЛИЗ ПРИНЦИПЫ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА


    1. Кодирование звуковой информации

Звук – волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука - количество уровней)

Аналоговый и дискретный способ кодирования

Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые - зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее[2].

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.



Рис. 1. Аналоговое и дискретное кодирование

Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного – изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного – аудио компакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон.

Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.



Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.


    1. Кодирование оцифрованного звука перед его записью на носитель

Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.



  • Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел - значений амплитуды. В этом случае существуют два способа хранения информации.

    • Первый - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)

    • Второй - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

  • Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.

    • Кодирование данных без потерь (lossless coding) - способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо[3].




      1. Сжатие звука без потерь и с потерями

Звук является простой волной, а оцифрованный звук — цифровое представление этой волны. Это достигается запоминанием уровня аналогового сигнала множество раз в течение одной секунды. Например, в обыкновенном CD сигнал запоминается 44100 раз за секунду. Так как CD работает со стерео, мы запоминаем сигнал для левой и правой колонки параллельно. Для каждого замера используются 16-битовые числа. Поэтому нетрудно посчитать, что одна секунда звучания занимает 2*2*44100=176400 байт.



Сжатие звука без потерь — совокупность преобразований, позволяющая эффективно сжимать звуковые данные с возможностью их полного восстановления. Как и любое сжатие без потерь, сжатие звуковых данных эксплуатирует какую-либо особенность данных. В данном случае это:

  • Невысокая производная: другими словами, значения соседних сэмплов мало отличаются.

  • Невысокая вторая производная: значения соседних трёх сэмплов близки к линейной функции.

  • Близость левого и правого каналов: уровни сигнала в левой и в правой колонке, как правило, близки.

Преобразование координат (L, R) → (X, Y)

Первым шагом в сжатии будет представление каналов аудио L и R более эффективным образом, представив их некими числами X, Y согласно следующему алгоритму:

X=(L R)/2

Y=L – R


Для дробных чисел это преобразование не теряет информации и является эквивалентным оригинальному. Для целых же (L R)/2 теряет 0,5 при конверсии в integer, когда L и R имеют разную чётность, но, проверив чётность L – R, легко восполняем эти 0,5.

Кодирование. Алгоритм Райса

Идея сжатия аудио заключается в представлении чисел, соответствующих потоку минимально возможным образом, убрав предварительно любую корреляцию данных. После этого можно записывать поток закодированных данных на диск. Одним из самых эффективных способов является кодирование Райса.

Меньшие числа предпочтительней тем, что их представление в бинарном представлении короче. Например, необходимо закодировать следующий ряд:

Базис по основанию 10: 10, 14, 15, 46

Или тот же ряд в бинарном виде

Базис по основанию 2: 1010, 1110, 1111, 101110

Теперь если требуется представить этот в виде строки, где для каждого числа зарезервировано 32 бита (диапазон всех возможных значений), то это будет неэффективно, поскольку понадобится 128 бит. Однако существует более эффективный метод. Наилучшим решением было бы просто записать бинарные числа 1010, 1110, 1111, 101110 без запятых, получив ряд вида 101011101111101110. Проблема в том, что после нет возможности узнать границы каждого числа. В качестве решения подобной задачи, как правило, используется алгоритм Райса.

Кодирование Райса — это способ представить маленькие числа одной строкой, сохраняя способность их различать.

Кодирование данных с потерями (lossy coding). Здесь цель - добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности - сжатием с потерями.

Сжатие звука с потерями

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:



  • частотное (одновременное) маскирование

  • временное (неодновременное) маскирование

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного.

Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно.

Структура кодера сжатия аудиоданных с потерями.

Рис 2. Обобщенная структура кодера звукового сигнала с компрессией цифровых аудиоданных




  • Исходный цифровой звуковой сиг­нал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.

  • Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так назы­ваемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени.

  • После сег­ментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП[4].

Субъективная оценка качества

Для сжатых аудиоданных существует субъективная оценка качества, оцениваемая как процент людей, почувствовавших разницу с оригиналом.

Соответствие битрейта кодека MP3 в режиме стерео и процента людей заметивших разницу с оригиналом

Рис. 3. Субъективная оценка качества


Следует учесть тот факт, что качество получившегося материала зависит от характера сжимаемых данных, от жанра, наличия фона, помех. После сжатия, например MP3, на средних битрейтах, слушатели отмечают оловянность перкуссионных. А на голосе сжатие (даже сильное) отражается мало.
1.3. ДЕКОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
Структурная схема декодера приведена на рис. 1.3. Входные данные поступают на блок распаковки потока данных (РпПД), в кото­ром по синхрословам выделяются отдельные кадры, поступающие затем на блок декодирования и деквантования (КодГ-1  и КвГ-1).

Рис 4. Структурная схема декодера звука MPEG – 2


Данные, содержащиеся в кадре, декодируются в соответст­вии с порядком их следования и таблицами кодов, которые содер­жатся в программе работы декодера. Декодированные данные о распределении битов и о масштабных множителях используются для декодирования и деквантования звуковых данных.

После деквантования на уровнях Layer I и Layer II отсчеты сигналов под­диапазонов умножаются на соответствующие масштабные множи­тели. На уровне Layer III выполняется обратное МДКП.

После декодирования и деквантования отсчеты сигналов всех поддиапазонов объединяются в выходной цифровой звуковой сиг­нал, или несколько сигналов, если звук многоканальный.

Аппаратные и программные реализации декодера значитель­но проще, чем реализации кодера, так как в декодере не требуется психоакустическая модель.

Так декодирование стереофонического звука, сжатого с применением уровня Layer III, производится в ре­альном времени программными средствами на обычном ПК, в то время как для выполнения соответствующего кодирования необхо­димо сначала записать звуковой сигнал в несжатом виде в файл, а затем осуществить сжатие, что занимает существенно большее время, чем воспроизведение.

В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежние. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения).

К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП[5].

Параметры, влияющие на качество звука при его прохождении по полному циклу

Основными параметрами, влияющими на качество звука при этом являются:


  • Разрядность АЦП и ЦАП.

  • Частота дискретизации АЦП и ЦАП.

  • Джиттер АЦП и ЦАП

  • Передискретизация

Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

  • Отношение сигнал/шум

  • Коэффициент нелинейных искажений

  • Интермодуляционные искажения

  • Неравномерность амплитудно-частотной характеристики

  • Динамический диапазон


1.3.1. Декодирование звука с учётом ReplayGain
Технологию ReplayGain (выравнивание громкости звуковых файлов) придумали ещё в 2001 году, и с тех пор стало можно слушать музыку в режиме shuffle, не насилуя постоянно регулятор громкости.  Особенно это актуально для радиостанции, где резким перепадом можно доставить дискомфорт большому количеству ушей.

Технологию эту почти поддерживают почти все проигрыватели, и всё бы хорошо, но вот с юниксовыми утилитами, как выяснилось, есть проблемы. В частности, проблемы у них возникают с вытаскиванием информации из файлов в формате MP3. Это не удивительно: есть примерно десяток вариантов записи тэгов в эти файлы, попробуй разберись.

У нас на tmradio раньше использовался ices, в который я лично добавлял поддержку ReplayGain.  Но он давно не поддерживается и вместо него рекомендуют использовать ezstream, к которому подключаются внешние декодеры, с которыми он общается через потоки ввода-вывода.  Это действительно логично и удобно, только вот декодер осталось выбрать, а их тоже довольно много:

LAME. Единственный вариант для кодирования потока в MP3, причём умеет и декодировать файлы, поэтому кажется самым логичным вариантом.  Не поддерживает ReplayGain при декодировании, хотя умеет его считать.

SOX. Умеет почти всё, что можно придумать, но для работы с тэгами MP3 файлов использует библиотеку libmp3tag (из набора mad), которая поддерживает только самые базовые тэги: artist, title, genre, year итд. Зато спокойно справляется со всеми остальными форматами.

madplay. Его рекомендуют где-то в документации к ezstream. Он поддерживает ReplayGain, но в какой-то своей собственной интерпретации, снижая громкость на фиксированные 6dB.  Объяснение этому даётся, но довольно мутное, зато результат вполне чёткий: MP3 файлы звучат сильно тише других.

mpg321. Не поддерживает ReplayGain.

mpg123. Поддерживает ReplayGain, причём и RVA, и REPLAYGAIN_XXX.

В итоге мы используем mpg123 для декодирования MP3 файлов и sox для всех остальных.  Настройка кодеков в ezstream выглядит так:



MP3

.mp3

mpg123 --rva-radio --stereo --rate 44100 --stdout "@T@"

lame --preset cbr 128 -r -s 44.1 --bitwidth 16 - -





VORBIS

.ogg

sox --replay-gain track "@T@" -r 44100 -c 2 -t raw -e signed-integer -

oggenc -r -B 16 -C 2 -R 44100 --raw-endianness 0 -q 1.5 -t "@M@" -



Таблично-волновой синтез

Метод таблично-волнового (Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов (хотя не только для них)[6].

В технике такие образцы называют семплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.
1.4. Аналого-цифровой преобразователь
Аналого-цифровой преобразователь (АЦП, англ. Analog-to-digital converter, ADC) — устройство, преобразующее входной аналоговый сигнал в дискретный код (цифровой сигнал). Обратное преобразование осуществляется при помощи ЦАП (цифро-аналогового преобразователя, DAC).

Рис. 5. Четырёхканальный аналого-цифровой преобразователь


Как правило, АЦП — электронное устройство, преобразующее напряжение в двоичный цифровой код. Тем не менее, некоторые неэлектронные устройства с цифровым выходом, следует также относить к АЦП, например, некоторые типы преобразователей угол-код. Простейшим одноразрядным двоичным АЦП является компаратор.

Итальянский математик Фибоначчи сформулировал задачу наименьшего числа гирь целочисленного веса для взвешивания грузов наибольшего диапазона на рычажных весах, которая стала известна под названием задача о гирях (задача Баше — Менделеева). Фибоначчи пришёл к выводу, что, при взвешивании с разрешением класть гири только на одну чашу весов, наименьшее число гирь получается при выборе весов гирь из ряда 1, 2, 4, 8, 16,… (степени 2), что соответствует весам разрядов в двоичной системе счисления, при взвешивании с разрешением класть гири на обе чаши весов, наименьшее число гирь получается при выборе весов гирь из ряда 1, 3, 9, 27, 81,… (степени 3, последовательность A000244 в OEIS) что соответствует весам разрядов в троичных системах счисления.

Разрешение

Разрешение АЦП — минимальное изменение величины аналогового сигнала, которое может быть преобразовано данным АЦП — связано с его разрядностью. В случае единичного измерения без учёта шумов разрешение напрямую определяется разрядностью АЦП.

Разрядность АЦП характеризует количество дискретных значений, которые преобразователь может выдать на выходе. В двоичных АЦП измеряется в битах, в троичных АЦП измеряется в тритах. Например, двоичный 8-ми разрядный АЦП, способен выдать 256 дискретных значений (0…255), поскольку 28 = 256, троичный 8-ми разрядный АЦП, способен выдать 6561 дискретное значение, поскольку 38 = 6561.

Разрешение по напряжению равно разности напряжений, соответствующих максимальному и минимальному выходному коду, делённой на количество выходных дискретных значений.

На практике разрешение АЦП ограничено отношением сигнал/шум входного сигнала. При большой интенсивности шумов на входе АЦП различение соседних уровней входного сигнала становится невозможным, то есть ухудшается разрешение. При этом реально достижимое разрешение описывается эффективной разрядностью (effective number of bits, ENOB), которая меньше, чем реальная разрядность АЦП. При преобразовании сильно зашумлённого сигнала младшие разряды выходного кода практически бесполезны, так как содержат шум. Для достижения заявленной разрядности отношение С/Ш входного сигнала должно быть примерно 6 дБ на каждый бит разрядности (6 дБ соответствует четырёхкратному изменению уровня сигнала).

Типы преобразования

По способу применяемых алгоритмов АЦП делят на:


  • Последовательные прямого перебора

  • Последовательного приближения

  • Последовательные с сигма-дельта-модуляцией

  • Параллельные одноступенчатые

  • Параллельные двух- и более ступенчатые (конвейерные)

Передаточная характеристика АЦП — зависимость числового эквивалента выходного двоичного кода от величины входного аналогового сигнала. Говорят о линейных и нелинейных АЦП. Такое деление условное. Обе передаточные характеристики — ступенчатые. Но для «линейных» АЦП всегда возможно провести такую прямую линию, чтобы все точки передаточной характеристики, соответствующие входным значениям delta*2^k (где delta — шаг дискретизации, k лежит в диапазоне 0..N, где N — разрядность АЦП) были от неё равноудалены.

Имеется несколько источников погрешности АЦП. Ошибки квантования и (считая, что АЦП должен быть линейным) нелинейности присущи любому аналого-цифровому преобразованию. Кроме того, существуют так называемые апертурные ошибки, которые являются следствием джиттера (англ. jitter) тактового генератора, они проявляются при преобразовании сигнала в целом (а не одного отсчёта).

Эти ошибки измеряются в единицах, называемых МЗР — младший значащий разряд. В приведённом выше примере 8-битного двоичного АЦП ошибка в 1 МЗР составляет 1/256 от полного диапазона сигнала, то есть 0,4 %, в 5-тритном троичном АЦП ошибка в 1 МЗР составляет 1/243 от полного диапазона сигнала, то есть 0,412 %, в 8-тритном троичном АЦП ошибка в 1 МЗР составляет 1/6561, то есть 0,015 %.

Ошибки квантования

Ошибки квантования являются следствием ограниченного разрешения АЦП. Этот недостаток не может быть устранён ни при каком типе аналого-цифрового преобразования. Абсолютная величина ошибки квантования при каждом отсчёте находится в пределах от нуля до половины МЗР.

Как правило, амплитуда входного сигнала много больше, чем МЗР. В этом случае ошибка квантования не коррелированна с сигналом и имеет равномерное распределение. Её среднеквадратическое значение совпадает с среднеквадратичным отклонением распределения, которое равно LSB. В случае 8-битного АЦП это составит 0,113 % от полного диапазона сигнала.

Частота дискретизации

Аналоговый сигнал является непрерывной функцией времени, в АЦП он преобразуется в последовательность цифровых значений. Следовательно, необходимо определить частоту выборки цифровых значений из аналогового сигнала. Частота, с которой производятся цифровые значения, получила название частота дискретизации АЦП.

Непрерывно меняющийся сигнал с ограниченной спектральной полосой подвергается оцифровке (то есть значения сигнала измеряются через интервал времени T — период дискретизации) и исходный сигнал может быть точно восстановлен из дискретных во времени значений путём интерполяции. Точность восстановления ограничена ошибкой квантования. Однако в соответствии с теоремой Котельникова — Шеннона точное восстановление возможно только если частота дискретизации выше, чем удвоенная максимальная частота в спектре сигнала.

Поскольку реальные АЦП не могут произвести аналого-цифровое преобразование мгновенно, входное аналоговое значение должно удерживаться постоянным по крайней мере от начала до конца процесса преобразования (этот интервал времени называют время преобразования). Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения (УВХ). УВХ, как правило, хранит входное напряжение на конденсаторе, который соединён со входом через аналоговый ключ: при замыкании ключа происходит выборка входного сигнала (конденсатор заряжается до входного напряжения), при размыкании — хранение. Многие АЦП, выполненные в виде интегральных микросхем содержат встроенное УВХ.

Передискретизация

Как правило, сигналы оцифровываются с минимально необходимой частотой дискретизации из соображений экономии, при этом шум квантования является белым, то есть его спектральная плотность мощности равномерно распределена во всей полосе. Если же оцифровать сигнал с частотой дискретизации, гораздо большей, чем по теореме Котельникова — Шеннона, а затем подвергнуть цифровой фильтрации для подавления спектра вне частотной полосы исходного сигнала, то отношение сигнал/шум, будет лучше, чем при использовании всей полосы. Таким образом можно достичь эффективного разрешения большего, чем разрядность АЦП.

Передискретизация также может быть использована для смягчения требований к крутизне перехода от полосы пропускания к полосе подавления антиалиасингового фильтра. Для этого сигнал оцифровывают, например, на вдвое большей частоте, затем производят цифровую фильтрацию, подавляя частотные компоненты вне полосы исходного сигнала, и, наконец, понижают частоту дискретизации путём децимации.

Типы АЦП


Ниже перечислены основные способы построения электронных АЦП:

  • АЦП прямого преобразования:

    • Параллельные АЦП прямого преобразования, полностью параллельные АЦП, содержат по одному компаратору на каждый дискретный уровень входного сигнала. В любой момент времени только компараторы, соответствующие уровням ниже уровня входного сигнала, выдают на своём выходе сигнал превышения. Сигналы со всех компараторов поступают либо прямо в параллельный регистр, тогда обработка кода осуществляется программно, либо на аппаратный логический шифратор, аппаратно генерирующий нужный цифровой код в зависимости от кода на входе шифратора. Данные с шифратора фиксируются в параллельном регистре. Частота дискретизации параллельных АЦП, в общем случае, зависит от аппаратных характеристик аналоговых и логических элементов, а также от требуемой частоты выборки значений.

  • АЦП прямого преобразования:

    • Параллельные АЦП прямого преобразования — самые быстрые, но обычно имеют разрешение не более 8 бит, так как влекут за собой большие аппаратные затраты (2n – 1 = 28 – 1 = 255 компараторов). АЦП этого типа имеют очень большой размер кристалла микросхемы, высокую входную ёмкость, и могут выдавать кратковременные ошибки на выходе. Часто используются для видео или других высокочастотных сигналов, а также широко применяются в промышленности для отслеживания быстро изменяющихся процессов в реальном времени.

  • Конвейерная работа АЦП, применяется в параллельно-последовательных АЦП прямого преобразования, в отличие от обычного режима работы параллельно-последовательных АЦП прямого преобразования, в котором данные передаются после полного преобразования, при конвейерной работе данные частичных преобразований передаются по мере готовности до окончания полного преобразования.

  • АЦП последовательного приближения или АЦП с поразрядным уравновешиванием содержит компаратор, вспомогательный ЦАП и регистр последовательного приближения. АЦП преобразует аналоговый сигнал в цифровой за N шагов, где N — разрядность АЦП. На каждом шаге определяется по одному биту искомого цифрового значения, начиная от СЗР и заканчивая МЗР. Последовательность действий по определению очередного бита заключается в следующем.

  • АЦП дифференциального кодирования (англ. delta-encoded ADC) содержат реверсивный счётчик, код с которого поступает на вспомогательный ЦАП. Входной сигнал и сигнал со вспомогательного ЦАП сравниваются на компараторе. Благодаря отрицательной обратной связи с компаратора на счётчик код на счётчике постоянно меняется так, чтобы сигнал со вспомогательного ЦАП как можно меньше отличался от входного сигнала.

  • АЦП сравнения с пилообразным сигналом (некоторые АЦП этого типа называют Интегрирующие АЦП, также к ним относятся АЦП последовательного счета) содержат генератор пилообразного напряжения (в АЦП последовательного счета генератор ступенчатого напряжения, состоящий из счетчика и ЦАП), компаратор и счётчик времени.

  • АЦП с уравновешиванием заряда (к ним относятся АЦП с двухстадийным интегрированием, АЦП с многостадийным интегрированием и некоторые другие) содержат генератор стабильного тока, компаратор, интегратор тока, тактовый генератор и счётчик импульсов. Преобразование происходит в два этапа (двухстадийное интегрирование). На первом этапе значение входного напряжения преобразуется в ток (пропорциональный входному напряжению), который подаётся на интегратор тока, заряд которого изначально равен нулю. Это является следствием двухстадийности процесса: погрешности, введённые на первом и втором этапах, взаимно вычитаются. Не предъявляются жёсткие требования даже к долговременной стабильности тактового генератора и напряжению смещения компаратора: эти параметры должны быть стабильны лишь кратковременно, то есть в течение каждого преобразования (не более 2TN). Типичная разрядность АЦП этого типа составляет от 10 до 18 двоичных разрядов. Дополнительным достоинством является возможность построения преобразователей, нечувствительных к периодическим помехам (например, помеха от сетевого питания) благодаря точному интегрированию входного сигнала за фиксированный временной интервал. Недостатком данного типа АЦП является низкая скорость преобразования. АЦП с уравновешиванием заряда используются в измерительных приборах высокой точности.

АЦП встроены в большую часть современной звукозаписывающей аппаратуры, поскольку обработка звука делается, как правило, на компьютерах; даже при использовании аналоговой записи АЦП необходим для перевода сигнала в PCM-поток, который будет записан на компакт-диск[7].

Современные АЦП, используемые в звукозаписи, могут работать на частотах дискретизации до 192 кГц. Можно сказать, что звуковой аналоговый сигнал не содержит столько информации, сколько может быть сохранено в цифровом сигнале при такой высокой частоте дискретизации, и зачастую для Hi-Fi-аудиотехники используется частота дискретизации 44,1 кГц (стандартная для компакт-дисков) или 48 кГц (типична для представления звука в компьютерах). Однако широкая полоса упрощает и удешевляет реализацию антиалиасинговых фильтров, позволяя делать их с меньшим числом звеньев или с меньшей крутизной в полосе заграждения, что положительно сказывается на фазовой характеристике фильтра в полосе пропускания. Аналого-цифровые преобразователи для звукозаписи имеют широкий диапазон цен — от 100 до 10 тыс. долл. и выше за двухканальный АЦП.


1.5. Цифро-аналоговый преобразователь
Цифро-аналоговый преобразователь (ЦАП) — устройство для преобразования цифрового (обычно двоичного) кода в аналоговый сигнал (ток, напряжение или заряд). Цифро-аналоговые преобразователи являются интерфейсом между дискретным цифровым миром и аналоговыми сигналами.

Рис 6. Цифро-аналоговый преобразаватель


Звуковой ЦАП обычно получает на вход цифровой сигнал в импульсно-кодовой модуляции (англ. PCM, pulse-code modulation). Задача преобразования различных сжатых форматов в PCM выполняется соответствующими кодеками.

ЦАП применяется всегда, когда надо преобразовать сигнал из цифрового представления в аналоговое, например, в проигрывателях компакт-дисков (Audio CD).



Наиболее общие типы электронных ЦАП:

  • Широтно-импульсный модулятор — простейший тип ЦАП. Стабильный источник тока или напряжения периодически включается на время, пропорциональное преобразуемому цифровому коду, далее полученная импульсная последовательность фильтруется аналоговым фильтром нижних частот. Такой способ часто используется для управления скоростью электромоторов, а также становится популярным в Hi-Fi-аудиотехнике;

  • ЦАП передискретизации, такие как дельта-сигма-ЦАП, основаны на изменяемой плотности импульсов. Передискретизация позволяет использовать ЦАП с меньшей разрядностью для достижения большей разрядности итогового преобразования; часто дельта-сигма ЦАП строится на основе простейшего однобитного ЦАП, который является практически линейным. На ЦАП малой разрядности поступает импульсный сигнал с модулированной плотностью импульсов (c постоянной длительностью импульса, но с изменяемой скважностью), создаваемый с использованием отрицательной обратной связи. Отрицательная обратная связь выступает в роли фильтра верхних частот для шума квантования.

Большинство ЦАП большой разрядности (более 16 бит) построены на этом принципе вследствие его высокой линейности и низкой стоимости. Быстродействие дельта-сигма ЦАП достигает сотни тысяч отсчетов в секунду, разрядность — до 24 бит. Для генерации сигнала с модулированной плотностью импульсов может быть использован простой дельта-сигма модулятор первого порядка или более высокого порядка как MASH (англ. Multi stage noise SHaping). С увеличением частоты передискретизации смягчаются требования, предъявляемые к выходному фильтру низких частот и улучшается подавление шума квантования;

  • ЦАП взвешивающего типа, в котором каждому биту преобразуемого двоичного кода соответствует резистор или источник тока, подключенный на общую точку суммирования. Сила тока источника (проводимость резистора) пропорциональна весу бита, которому он соответствует. Таким образом, все ненулевые биты кода суммируются с весом. Взвешивающий метод один из самых быстрых, но ему свойственна низкая точность из-за необходимости наличия набора множества различных прецизионных источников или резисторов и непостоянного импеданса. По этой причине взвешивающие ЦАП имеют разрядность не более восьми бит;

ЦАП находятся в начале аналогового тракта любой системы, поэтому параметры ЦАП во многом определяют параметры всей системы в целом. Далее перечислены наиболее важные характеристики ЦАП.

  • Разрядность — количество различных уровней выходного сигнала, которые ЦАП может воспроизвести. Обычно задается в битах; количество бит есть логарифм по основанию 2 от количества уровней. Например, однобитный ЦАП способен воспроизвести два (21) уровня, а восьмибитный — 256 (28) уровней. Разрядность тесно связана с эффективной разрядностью (англ. ENOB, Effective Number of Bits), которая показывает реальное разрешение, достижимое на данном ЦАП.

  • Максимальная частота дискретизации — максимальная частота, на которой ЦАП может работать, выдавая на выходе корректный результат. В соответствии с теоремой Найквиста — Шеннона (известной также как теорема Котельникова), для корректного воспроизведения аналогового сигнала из цифровой формы необходимо, чтобы частота дискретизации была не менее, чем удвоенная максимальная частота в спектре сигнала. Например, для воспроизведения всего слышимого человеком звукового диапазона частот, спектр которого простирается до 20 кГц, необходимо, чтобы звуковой сигнал был дискретизован с частотой не менее 40 кГц. Стандарт Audio CD устанавливает частоту дискретизации звукового сигнала 44,1 кГц; для воспроизведения данного сигнала понадобится ЦАП, способный работать на этой частоте. В дешевых компьютерных звуковых картах частота дискретизации составляет 48 кГц. Сигналы, дискретизованные на других частотах, подвергаются передискретизации до 48 кГц, что частично ухудшает качество сигнала.

  • THD N (суммарные гармонические искажения шум) — мера искажений и шума вносимых в сигнал ЦАПом. Выражается в процентах мощности гармоник и шума в выходном сигнале. Важный параметр при малосигнальных применениях ЦАП.

  • Динамический диапазон — соотношение наибольшего и наименьшего сигналов, которые может воспроизвести ЦАП, выражается в децибелах. Данный параметр связан с разрядностью и шумовым порогом.

  • Частотные характеристики:

    • SNDR (отношение сигнал/шум искажения) — характеризует в децибелах отношение мощности выходного сигнала к суммарной мощности шума и гармонических искажений;

    • HDi (коэффициент i-й гармоники) — характеризует отношение i-й гармоники к основной гармонике;

Аудиокодек

Аудиокодек (англ. Audio codec; аудио кодер/декодер) — компьютерная программа или аппаратное средство, предназначенное для кодирования или декодирования аудиоданных.

Аппаратный кодек

Аудиокодек на аппаратном уровне обозначает отдельную микросхему, которая кодирует и декодирует аналоговый звуковой сигнал в цифровой сигнал и наоборот при помощи аналогово-цифрового и цифро-аналогового преобразователей. Цифро-аналоговая конвертация происходит, когда компьютер посылает звук на внешние динамики, а аналого-цифровая конвертация происходит, когда звук подаётся на компьютер извне.

Аудиокодек является основной, но не всегда единственной составной частью звуковой карты. Он является промежуточным звеном, интерфейсом между аналоговыми портами приёма и передачи звука и блоками цифровой обработки звука.

В массовых встроенных в материнские платы звуковых картах аудиокодек фактически представляет собой всю звуковую карту: он преобразовывает аналоговый сигнал, получаемый с разъёмов, в цифровой, и передаёт его на южный мост материнской платы, откуда цифровой звук попадает на центральный процессор. Чип звукового кодека обычно имеет площадь около 7  мм² и, в случае интегрированной звуковой карты, обычно располагается близко к задней панели материнской платы. Основными производителями аппаратных звуковых кодеков являются компании Realtek, VIA Technologies, C-Media, Intel и Analog Devices.

Программный кодек

Аудиокодек на программном уровне является специализированной компьютерной программой, кодеком, который сжимает (производит компрессию) или разжимает (производит декомпрессию) цифровые звуковые данные в соответствии с файловым звуковым форматом или потоковым звуковым форматом. Задача аудиокодека как компрессора заключается в предоставлении аудиосигнала с заданным качеством/точностью и минимально возможным размером. Благодаря сжатию уменьшается объём пространства, требуемого для хранения аудиоданных, а также возможно снизить полосу пропускания канала, по которому передаются аудиоданные. Большинство аудиокодеков осуществлены как программные библиотеки, которые взаимодействуют с одним или несколькими аудиоплеерами, такими как Foobar2000, QuickTime Player, XMMS, Winamp, VLC media player, KMPlayer или Windows Media Player[8].


Выводы по первой главе
Звук – волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, то есть двоичный код. Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

Звук является простой волной, а оцифрованный звук — цифровое представление этой волны. Это достигается запоминанием уровня аналогового сигнала множество раз в течение одной секунды.

Совокупность преобразований, позволяющая эффективно сжимать звуковые данные с возможностью их полного восстановления. Как и любое сжатие без потерь, сжатие звуковых данных эксплуатирует какую-либо особенность данных.

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации.

  1   2   3

  • УТВЕРЖДАЮ
  • _________________
  • ГЛАВА 1. АНАЛИЗ ПРИНЦИПЫ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА Кодирование звуковой информации
  • Кодирование оцифрованного звука перед его записью на носитель
  • Сжатие звука без потерь и с потерями
  • 1.3. ДЕКОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
  • 1.3.1. Декодирование звука с учётом ReplayGain
  • 1.4. Аналого-цифровой преобразователь
  • 1.5. Цифро-аналоговый преобразователь