Darbe.ru

Быт техника Дарби
24 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Двоичное кодирование звуковой информации

Двоичное кодирование звуковой информации

С начала 90-х годов персональные компьютеры получили возмож­ность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. С помощью специальных про­граммных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса.

Звуковой сигнал — это непрерывная волна с изменяющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компью­тер мог обрабатывать непрерывный звуковой сигнал, он должен быть дистретизирован, т.е. превращен в последовательность электрических им­пульсов (двоичных нулей и единиц).

При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок — отсчетов.

Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний. Для определения количества бит, необходимых для кодирования, решим показательное уравнение:

Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц. При частоте 8 Кгц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 Кгц — качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.

Можно оценить информационный объем моном аудио файла длительно­стью звучания 1 секунду при среднем качестве звука (16 бит, 24 Кгц). Для этого количество бит на одну выборку необходимо умножить на количе­ство выборок в 1 секунду:

16 бит * 24000 = 384000 бит = 48000 байт или 47 Кбайт

Кодирование видеоинформации

Чтобы хранить и обрабатывать видео на компьютере, необходимо закодировать его особым образом. При этом кодирование звукового сопровождения ничем не отличается от кодирования звука, описанного в предыдущей теме. Изображение в видео состоит из отдельных кадров, которые меняются с определенной частотой. Кадр кодируется как обычное растровое изображение, то есть разбивается на множество пикселей. Закодировав отдельные кадры и собрав их вместе, мы сможем описать все видео.

Видеоданные характеризуются частотой кадров и экранным разрешением. Скорость воспроизведения видеосигнала составляет 30 или 25 кадров в секунду, в зависимости от телевизионного стандарта. Наиболее известными из таких стандартов являются: SECAM, принятый в России и Франции, PAL, используемый в Европе, и NTSC, распространенный в Северной Америке и Японии. Разрешение для стандарта NTSC составляет 768 на 484 точек, а для PAL и SECAM – 768 на 576 точек. Не все пиксели используются для хранения видеоинформации. Так, при стандартном разрешении 768 на 576 пикселей, на экране телевизора отображается всего 704 на 540 пикселей. Поэтому для хранения видеоинформации в компьютере или цифровой видеокамере, размер кадра может отличаться от телевизионного. Например, в формате Digital Video или, как его еще называют DV, размер кадра составляет 720 на 576 пикселей. Такое же разрешение имеет кадр стандарта DVD Video. Размер кадра формата Video-CD составляет 352 на 288 пикселей.

В основе кодирования цветного видео лежит известная модель RGB. В телевидении же используется другая модель представления цвета изображения, а именно модель YUV. В такой модели цвет кодируется с помощью яркости Y и двух цветоразностных компонент U и V, определяющих цветность. Цветоразностная компонента образуется путем вычитания из яркостной компоненты красного и зеленого цвета. Обычно используется один байт для каждой компоненты цвета, то есть всего для обозначения цвета используется три байта информации. При этом яркость и сигналы цветности имеют равное число независимых значений. Такая модель имеет обозначение 4:4:4.

Опытным путем установлено, что человеческий глаз менее чувствителен к цветовым изменениям, чем к яркостным. Без видимой потери качества изображения можно уменьшить количество цветовых оттенков в два раза. Такая модель обозначается как 4:2:2 и принята в телевидении. Для бытового видео допускается еще большее уменьшении размерности цветовых составляющих, до 4:2:0.

Если представить каждый кадр изображения как отдельный рисунок указанного выше размера, то видеоизображение будет занимать очень большой объем, например, одна секунда записи в системе PAL будет занимать 25 Мбайт, а одна минута – уже 1,5 Гбайт. Поэтому на практике используются различные алгоритмы сжатия для уменьшения скорости и объема потока видеоинформации.

Если использовать сжатие без потерь, то самые эффективные алгоритмы позволяют уменьшить поток информации не более чем в два раза. Для более существенного снижения объемов видеоинформации используют сжатие с потерями.

Среди алгоритмов с потерями одним из наиболее известных является MotionJPEG или MJPEG. Приставка Motion говорит, что алгоритм JPEG используется для сжатия не одного, а нескольких кадров. При кодировании видео принято, что качеству VHS соответствует кодирование MJPEG с потоком около 2 Мбит/с, S-VHS – 4 Мбит/с.

Свое развитие алгоритм MJPEG получил в алгоритме DV, который обеспечивает лучшее качество при таком же потоке данных. Это объясняется тем, что алгоритм DV использует более гибкую схему компрессии, основанную на адаптивном подборе коэффициента сжатия для различных кадров видео и различных частей одного кадра. Для малоинформативных частей кадра, например, краев изображения, сжатие увеличивается, а для блоков с большим количеством мелких деталей уменьшается.

Читайте так же:
Знак сатаны символ на клавиатуре

Еще одним методом сжатия видеосигнала является MPEG. Поскольку видеосигнал транслируется в реальном времени, то нет возможности обработать все кадры одновременно. В алгоритме MPEG запоминается несколько кадров. Основной принцип состоит в предположении того, что соседние кадры мало отличаются друг от друга. Поэтому можно сохранить один кадр, который называют исходным, а затем сохраняются только изменения от исходного кадра, называемые предсказуемыми кадрами. Считается, что за 10-15 кадров картинка изменится настолько, что необходим новый исходный кадр. В результате при использовании MPEG можно добиться уменьшения объема информации более чем в двести раз, хотя это и приводит к некоторой потере качества. В настоящее время используются алгоритм сжатия MPEG-1, разработанный для хранения видео на компакт-дисках с качеством VHS, MPEG-2, используемый в цифровом, спутниковом телевидении и DVD, а также алгоритм MPEG-4, разработанный для передачи информации по компьютерным сетям и широко используемый в цифровых видеокамерах и для домашнего хранения видеофильмов.

Звуковая плата производит двоичное кодирование аналогового звукового

Знание составляется из мелких
крупинок ежедневного опыта.
Д.И. Писарев

Цели: Применение теоретических знаний на практике.
Задачи урока:
Научить принципу двоичного кодирования при оцифровке звука;
Познакомить с понятием временной дискретизации звука;
Установить зависимость между качеством кодирования звука, глубиной кодирования и частотой дискретизации;
Научить оценивать информационный объем аудиофайла;
Записывать звук с помощью компьютера, сохранять его в звуковых файлах в формате WAV, воспроизводить.

Ход урока:

I. Организационный момент 1. Звучит музыка
2. Слова учителя:

Тема нашего урока «Двоичное кодирование звуковой информации». Сегодня мы познакомимся с понятием временной дискретизации звука, установим эксперементальным путем зависимость между качеством кодирования звука, глубиной кодирования и частотой дискретизации, научимся оценивать объем аудифайлов, записывать звук с помощью компьютера, сохранять его в звуковых файлах в формате WAV и воспроизводить.

II. Актуализация знаний учащихся. Вопросы: (ответы записывать в бланк №1)

1. Перечислите виды существования информации? (числовая, текстовая, графическая, звуковая).
2. Какое ключевое слово можно подобрать к видеоряду? (кодирование информации).
3. Что называют глубиной звука? (глубина звука или глубина кодирования — количество бит информации на кодировку звука).
4. Какие уровни громкости может иметь звук? (звук может иметь различные уровни громкости.

Количество различных уровней рассчитывается по формуле , где I — глубина звука).

5. Что называется частотой дискретизации? (Частота дискретизации — количество измерений уровня входного сигнала в единицу времени (за 1 секунду).
6. По какой формуле вычисляется размер цифрового моноаудиофайла?
(А=Д*Т*I).
Д- частота дискретизации;
Т- время звучания или записи звука;
I- разрядность регистра.
7. По какой формуле вычисляется размер цифрового стереоаудиофайла?
А=2*Д*Т*I

III. Решение задач. Задача №1 (Семакин. №88 стр. 157, задачник №1). Бланк №1.

Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44.1 кГц и расширении 16 бит.

Дано:Решение:
Д=44,1 кГц=44,1* 1000=44100 Гц
Т=2 мин=2*60=120с.
I= 16 бит
А=?
А=Д*Т*I=44100*120*16=84672000бит=
=10584000байт=10335,9375Кб=10,094Мб.
Ответ: 10 Мб

Задача №2 (Семакин, №95, стр 157, задачник № 1). Бланк №2.

Объем свободной памяти на диске — 0,01 Гб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44100 Гц.

Дано:Решение:
I=2 байта
А=0,01 Гб=0,01* 1024*1024*1024=10737418,24 байта
Д=44100Гц
Т=?
А= Д*Т*I
Т=А/Д/I
Т=10737418,24/44100/2=121,74сек=2,03 мин
Ответ: 2,03 мин.

IV. Изучение нового материала.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.
С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при помощи голоса.
Из курса физики вам известно, что звук представляет собой механическую волну с непрерывно меняющейся амплитудой и частотой (рис. 1). Чем выше амплитуда, тем громче звук, чем меньше частота, тем ниже тон. Компьютер -устройство цифровое, поэтому непрерывный звуковой сигнал должен быть преобразован в последовательность электрических импульсов (нулей и единиц). Для этого плоскость, на которой графически представлена звуковая волна, разбивается на горизонтальные и вертикальные линии (рис. 2 и рис. 3). Горизонтальные линии -это уровни громкости, а вертикальные — количество измерений за 1 секунду(одно измерение в секунду — это один герц), или частота дискретизации (Гц). Такой способ позволяет заменить непрерывную зависимость на дискретную последовательность уровней громкости, каждой из которых присваивается значение в двоичном коде (рис. 4).

рис.1рис.2рис.3рис.4

Количество уровней громкости зависит от глубины звука — количества байтов, используемыз для кодирования одного уровня. Обычно 8 кГц и уровень квантования (код длиной 8 бит).
, где N- количество уровней громкости, а I — глубина звука (биты)

2) Для расчета информационного объема закодированного звука (А) используется простая формула: А = D * i * Т, где: D — частота дискретизации (Гц); i — глубина звука (бит); Т — время звучания (сек).
Получаем: А = 5 Гц * 4 бита * 1 сек = 20 бит.

Группы №1-5. Установить зависимость между качеством двоичного кодирования звука и информационным объемом аудиофайла для звуковой информации различного содержания (монологическая речь, диалогическая речь, стихотворение, песня); зависимость между информационным объемом файла и режимом записи (моно, стерео).

Умен ты или глуп,
Велик ты или мал,
Не знаем мы, пока
Ты слова не сказал.
(Саади)
Во поле березка стояла,
Во поле кудрявая стояла.
— Что трудно?
Познать самого себя.
Что легко?
Давать советы другим.
(Фалес)
Гибкость ума
не может заменить красоту.
(Стендаль)

Ход исследовательской работы:

1) Заполнить бланк №2.
2) Записать результаты в таблицу, полученные в ходе эксперимента.
3) Сделать вывод.

VII. Подведение итогов работы в группах
VIII. Мини проект Музыкальные и звуковые возможности.
Обозначения:

Диез — « # или +»
бемоль — «-»
До — с
ре -d
Ми — е
фа -f
Соль — j
ля — а
Си-Ь
Целая -1
половинная-2
Четвертная-4
Восьмая-8
Шестнадцатая -16
Длительность нескольких подряд идущих одинаковых нот
указывается один раз после английской буквы L.
Длительность пауз P1, P2 и т.д.
Октавы обозначаются «О» с указанием номера от 0 до 6.

Программа: «В лесу родилась елочка»
SCRN 7
LINE (20,0)-(300,180),2,BF
FOR I=l TO 2000
X=280*RND+20 Y=180*RND
C=16*RND
PSET(X,Y),C
NEXT I
SLEEP 1
LINE (150,140)-(170,160),6,BF
PSET(110,140)
LINE-(210,140), 10
LINE-(160,110),10
LINE- (110,140),10
PAINT (160,120), 10,10
LOCATE 24,10
PRINT «В лесу родилась елочка»
PLAY «ms+80 02 18 caajafcc»
PSET (120,110)
LINE-(200,110),10
LINE-(160,85),10
LINE-(120,110),10
PAINT (160,90),10,10
LOCATE 24,10
PRINT «В лесу она росла»,
PLAY «caab->dc4»
PSET (130,85)
LINE-(190,85),10
LINE-(160,65),10
LINE-(130,85), 10
PAINT (160,70),10,10
LOCATE 24,10
PRINT «ЗИМОЙ И ЛЕТОМ СТРОЙНАЯ»
PLAY «c IX Итог урока

    а) качеству звучания аудио-CD;
    б) качеству радиотрансляции;
    в) среднему качеству.
    a) DOC;
    б) WAV;
    в) BMP.
    а) от частоты дискретизации и глубины кодирования;
    б) от глубины цвета и разрешающей способности монитора;
    в) от международного стандарта кодирования.
    а) в 4 раза;
    б) объемы одинаковые;
    в) в 2 раза.

Безусловно, оценка качества звучания — во многом субъективна и зависит от нашего восприятия. Компьютер, так же как и человек, кодирует звуковую информацию с целью хранения и последующего воспроизведения. Подумайте, а в чем разница между звуковой информацией, хранимой в памяти ПК и в памяти человека? (Ответ: у человека процесс кодирования звука тесно связан с эмоциями).
Таким образом, компьютер хранит звук, а человек музыку. Музыка -единственный язык, на котором душа говорит с душою (Бертольд Авербах). Она может поднять в небеса, пробудить чувства, сковать разум и вселить страх. Для каждого человека музыка своя. Какие эмоции или ассоциации вызывает у вас «Лунная соната». Теплый взгляд любящего человека, нежное касание материнской руки, а теперь возможно, что эти чарующие звуки будут напоминать вам и об уроке информатики. Все это, согласитесь, недоступно цифровому двоичному коду.

Кодирование звуковой информации. Представление звука в памяти компьютера.

Томас Эдисон и его фонограф

На этой же идее было основано производство целлулоидных грампластинок и механизмов, воспроизводящих записанный на них звук: граммофона и патефона.
В середине XX века появился электрофон — электрический аналог патефона.

Аналоговое представление звука
Звуковая дорожка грампластинки — это пример непрерывной формы записи звука.
Такую форму называют аналоговой. В электрофоне колебания движущейся по звуковой дорожке иглы превращаются в непрерывный электрический сигнал, показанный. Такой график называется осциллограммой. Он может быть получен с помощью прибора, который называется осциллографом.

осциллограф

Электрический сигнал передается на динамик электрофона и превращается в звук.
В XX веке был изобретен магнитофон — устройство для записи звука на магнитную ленту. Здесь также используется аналоговая форма хранения звука. Только теперь звуковая дорожка — это не механическая «бороздка с ямками», а линия с непрерывно изменяющейся намагниченностью. С помощью считывающей магнитной головки создается переменный электрический сигнал, который озвучивается акустической системой.
До недавнего времени вся техника передачи звука была аналоговой. Это и телефонная связь, и радиосвязь. При телефонном разговоре звуковые колебания мембраны микрофона превращаются в переменный электрический сигнал, который передается по электрическим проводам. В принимающем телефоне они превращаются в звук.

Цифровое представление звука
Вам уже знаком основной принцип хранения информации в памяти компьютера — принцип дискретности: любые данные в памяти компьютера хранятся в виде цепочек битов, т. е. последовательностей нулей и единиц. Современные компьютеры умеют работать со звуком. Значит и звук в компьютерной памяти хранится в дискретной форме, т. е. в виде цифр.

Что такое АЦП и ЦАП
Запись звука происходит через микрофон, который создает непрерывный электрический сигнал, а воспроизведение — через динамики, которые звучат также под действием непрерывного электрического сигнала. Как же работа этих устройств совмещается с дискретными данными в памяти компьютера? Происходит преобразование аналоговой формы представления звука в дискретную и обратное преобразование. Первый процесс называется аналого-цифровым преобразованием (АЦП), второй — цифро-аналоговым преобразованием (ЦАП).

Коротко о главном
Непрерывная форма представления звука называется аналоговой формой.
Звук, записанный на фонографе, грампластинке, магнитной ленте, — это «аналоговый звук».
В компьютере звук представляется в дискретной (цифровой) форме.
АЦП — преобразование из аналоговой формы в цифровую (дискретную); ЦАП — преобразование из цифровой формы в аналоговую.

  1. система ввода/вывода звука;
  2. устройства для работы с видеокадрами;
  3. устройства хранения мультимедийной информации.

Система ввода/вывода звука
Микрофон используется для ввода звука в компьютер. Непрерывные электрические колебания, идущие от микрофона, преобразуются в числовую последовательность. Эту работу выполняет устройство, подключаемое к компьютеру, которое называется аудиоадаптером, или звуковой картой. Воспроизведение звука, записанного в компьютерную память, также происходит с помощью аудиоадаптера, преобразующего оцифрованный звук в аналоговый электрический сигнал звуковой частоты, поступающий на акустические колонки или стереонаушники. Из сказанного следует, что звуковая карта совмещает в себе функции ЦАП и АЦП. Рис.3 иллюстрирует описанный процесс.

Преобразование звука при вводе и выводе

Рис.3. Преобразование звука при вводе и выводе.

Устройства для работы с видеокадрами
Запись и воспроизведение видеофильмов на компьютере, как и работа со звуком, связаны с преобразованием ЦАП -АЦП. Для этих целей существуют специальные карты ввода/вывода видеоизображения. Оцифрованные и занесенные в компьютерную память видеокадры могут быть подвергнуты редактированию.
Для демонстрации мультимедиа приложения в большой аудитории используют мультимедиа проектор. Такой проектор переносит на большой экран изображение с экрана монитора.

Устройства хранения мультимедийной информации
Звук, видео, графика, объединенные в мультимедиа приложение, требуют больших объемов памяти. Поэтому для их хранения нужны достаточно емкие и, желательно, недорогие носители. Этим требованиям удовлетворяют оптические компакт-диски (CD — Compact Disk). Наряду с большой емкостью (около 700 Мбайт) они имеют надежную защиту от потери данных. В настоящее время широко используются диски CD-ROM и CD-RW. Наибольшей информационной емкостью обладают цифровые видеодиски — DVD. На современном DVD может храниться до 20 Гбайт информации. Этого достаточно для размещения полнометражного кинофильма с высококачественным звуковым сопровождением.

Двоичное кодирование звуковой информации

Современные звуковые карты обеспечивают 16-битную глубину кодировки звука. Количество различных уровней сигнала можно рассчитать по формуле: N=2 16 =65536. Т.о., современные звуковые карты обеспечивают кодирование 65536 уровней сигнала. Каждому значению амплитуды присваивается 16-ти битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, т.е. частотой дискретизации. Чем большее количество измерений проводится в 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Частота дискретизации аналогового звукового сигнала может принимать значения от 8 кГц до 48 кГц. При частоте 8 кГц качество дискретизованного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц – качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стереорежимы.

Попробуем оценить информационный объем стереоаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 бит, 48 кГц). Для этого количество битов нужно умножить на количество выборок в 1 секунду и умножить на 2 (стерео):

16 бит*48 000 *2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт

Список литературы
Название литературы
1.Учебно-тренировочные материалы для подготовки к единому государственному экзамену. Информатика/ Крылов С.С., Лещинер В.Р., Супрун П.Г., Якушкин П.А.; под ред. Лещинера В.Р. – М. Интеллект-Центр, 2005 – 136 с.
2.Информатика и информационные технологии. Учебник для 10-11 классов/ Н.Д. Угринович Н.Д. – М.: Бином. Лаборатория знаний, 2003. – 512 с.: ил.
3.Информатика. 7-8 класс/ Под ред. Н. В. Макаровой. – СПб: Издательство «Питер», 2000. – 368с.: ил.
4.Информатика: Учеб. Пособие для 10-11 кл. общеобразоват. Учреждений/ Л. З. Шауцукова. – 3-е изд. – М.: Просвещение, 2003. – 416 с.: ил.
5.Информатика №13, 2005/Метод. газета для учителей информатики – М. «Первое сентября»
Задания для самостоятельного решения

1. Считая, что каждый символ кодируется одним байтом, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах):

Сегодня метеорологи предсказывали дождь.

  1. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объём следующего предложения в кодировке Unicode (в байтах):

Каждый символ кодируется восемью битами.

3. Сколько существует различных последовательностей из символов «а» и «б» длиной ровно в 10 символов?

4. В зрительном зале две прямоугольные области зрительских кресел: одна 10х12, а другая 17х8. Какое минимальное количество бит потребуется для кодирования каждого места в автоматизированной системе?

5. Сообщение передано в семибитном коде. Каков его информационный объём в байтах, если известно, что передано 2000 символов?

6. В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?

1) 162) 83) 104) 32

7. Алфавит племени содержит всего 8 букв. Какое количество информации несет одна буква этого алфавита?

  1. Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.
  2. Сколько байт в 32 Гбайт?
  1. Как представляется число 16310 в двоичной системе счисления?
  2. Переведите число 110110112 в десятичную систему счисления.

12. Найдите значение суммы: 1010112 + 2318 = ?8

13. Найдите значение суммы: 1110112 + F116 = ?2

14. Найдите значение суммы: 1216 + 1128 = ?8

15. Найдите значение суммы: 1010112 + 1C16 = ?16

Этапы аналогово-цифрового преобразования звука.

Темы аналого-цифрового и цифро-аналогового преобразований являются достаточно важными в курсе электроники, поскольку большинство устройств, взаимодействующих с компьютером, имеют аналоговый вход/выход, а компьютер умеет обрабатывать исключительно цифровые сигналы. В этой статье я хочу поделиться с вами самыми основами таких преобразований.

Аналого-цифровое преобразование

Преобразование аналогового звукового сигнала в цифровой включает в себя несколько этапов. Сначала аналоговый звуковой сигнал подается на аналоговый фильтр, который ограничивает полосу частот сигнала и устраняет помехи и шумы. Затем из аналогового сигнала с помощью схемы выборки / хранения выделяются отсчеты: с определенной периодичностью осуществляется запоминание мгновенного уровня аналогового сигнала. Далее отсчеты поступают в аналого-цифровой преобразователь (АЦП), который преобразует мгновенное значение каждого отсчета в цифровой код или числа. Полученная последовательность бит цифрового кода, собственно, и является звуковым сигналом в цифровой форме. В результате преобразования непрерывный аналоговый звуковой сигнал превращается в цифровой — дискретный как по времени, так и по величине. Для примера на рисунке показана структурная схема канала цифровой записи звука.

Главную роль в процессе преобразования сигнала из аналоговой формы в цифровую играет АЦП (Analog/Digital Converter — ADC). Обратный процесс преобразование цифрового звукового сигнала в аналоговый реализуется с помощью цифро-аналогового преобразователя — ЦАП (Digital/Analog Converter — DAC).

Дискретизация

Важнейшим этапом аналого-цифрового преобразования является дискретизация аналогового сигнала. Вместо термина «дискретизация» в технической литературе иногда употребляют термин «выборка», а в литературе, посвященной обработке звука используется понятие — «сэмплирование».

С английского языка слово Sample дословно переводится как «образец». Поэтому это слово в мультимедийной и профессиональной терминологии имеет несколько значений для обозначения разных типов «образцов». Чаще всего сэмплом называют промежуток времени между двумя измерениями аналогового сигнала. Кроме промежутка времени сэмплом называют последовательность цифровых данных, полученных в результате аналого-цифрового преобразования, а сам процесс преобразования — сэмплированием. В иностранных журнальных публикациях такой термин как частота дискретизации вы не встретите, но в изобилии столкнетесь с частотой сэмплирования, хотя эти термины обозначают одно и то же. Термин «дискретизация» нам более привычен. Поэтому далее мы будем использовать термин «дискретизация».

По определению, дискретизация — это процесс взятия отсчетов непрерывного во времени сигнала в равноотстоящих друг от друга по времени точках. Иными словами, в процессе дискретизации измеряется и запоминается уровень аналогового сигнала. Через заданный интервал времени, который называется интервалом дискретизации, процедура повторяется. Для качественного преобразования аналогового сигнала в цифровой необходимо производить достаточно большое количество отсчетов даже в течение одного периода изменения аналогового сигнала, другими словами, значение частоты дискретизации не может быть произвольным.

И действительно, значение частоты дискретизации фактически определяет ширину полосы частот сигнала, который может быть записан с помощью используемой цифровой системы. Ширина этой полосы не может быть больше половины значения частоты дискретизации, как определяет теорема отсчетов (Котельникова-Найквиста). Эта теорема имеет важнейшее значение в технике записи и передачи звука в цифровой форме. Теорема гласит: сигнал, спектр частот которого занимает область от Fмин до Fмакс (низкочастотный звуковой сигнал), может быть полностью представлен своими дискретными отсчетами с интервалом Тд, если Тд не превышает 1/2Fмакс. Другими словами, частота дискретизации FД = 1/ТД в процессе преобразования должна быть, как минимум, вдвое больше наивысшей частоты звукового сигнала Fмакс.

Почему же именно в два раза? Да потому, что спектр сигнала, преобразованного с помощью АЦП в цифровую форму, имеет периодический характер.

В соответствии с теоремой Фурье сигнал любой формы может быть представлен в виде суммы простейших синусоидальных колебаний разной частоты и амплитуды. По окончании аналого-цифрового преобразования звуковой сигнал, представленный в цифровой форме, содержит, кроме низкочастотных, соответствующих исходному аналоговому сигналу, еще и высокочастотные компоненты. Эти компоненты есть повторение низкочастотного спектра сигнала в виде боковых полос с центрами в точках, кратных частоте дискретизации (fд, 2fд 3fд 4fд и т.д.).

Если уменьшить частоту дискретизации, то произойдет наложение (перекрытие) низкочастотной части спектра и боковой полосы с центром в точке. Наложение спектров приведет к появлению новых спектральных составляющих в сигнале и, следовательно, к невозможности его правильного восстановления.

Классическим примером наложения спектров является случай, когда при просмотре кинофильма кажется, что колесо движущейся кареты крутится со скоростью, не соответствующей скорости движения кареты, или даже в обратную сторону. Возникновение этого эффекта обусловлено тем, что скорость смены кадров (частота дискретизации изображения) мала по сравнению с угловой скоростью вращения колеса.

Чтобы при записи звукового сигнала избежать наложения спектров, перед АЦП устанавливается фильтр низких частот (ФНЧ), подавляющий все частоты, лежащие выше частоты дискретизации. При этом желательно, чтобы фронты АЧХ этого фильтра были как можно круче.

Если учесть, что человек способен слышать звуковые колебания, частота которых находится в диапазоне от 16-20 Гц до 20 кГц, и с позиций теоремы отсчетов взглянуть на требования к частотным характеристикам высококачественной звукотехники (например, проигрывателей аудиокомпакт-дисков), становится ясно, что частота дискретизации исходного звукового сигнала должна составлять не менее 40 кГц. Реально для подобных систем частота дискретизации выбирается не менее 44,1 кГц. Стандартное значение частоты дискретизации большинства звуковых карт составляет 44,1 и 48,0 кГц.

Итак, результатом дискретизации является дискретный во времени сигнал, представляющий собой последовательность отсчетов — мгновенных значений уровня аналогового сигнала. Чем выше частота дискретизации, тем более точно будет восстановлен звуковой сигнал.

Процедура дискретизации технически реализуется с помощью устройства выборки / хранения. В качестве запоминающего элемента обычно используют конденсатор, заряжающийся до уровня напряжения входного сигнала. При этом потенциал заряда конденсатора соответствует мгновенному значению напряжения сигнала. Напряжение на конденсаторе сохраняется неизменным в течение некоторого отрезка времени, называемого временем хранения. В идеальном случае взятие отсчета должно происходить мгновенно, реально же длительность этого процесса составляет приблизительно 1 мкс.

Квантование

После дискретизации происходит второй этап аналого-цифрового преобразования — квантование отсчетов. В процессе квантования производится измерение мгновенных значений уровня сигнала, полученных в каждом отсчете, причем осуществляется оно с точностью, которая напрямую зависит от количества разрядов, используемых для записи значения уровня.

Если, задав длину N-кодового слова, записать значения уровня сигнала с помощью двоичных чисел, то количество возможных значений будет равно 2 n . Столько же может быть и уровней квантования. Например, если значение амплитуды отсчета представляется 16-разрядным кодовым словом, то максимальное количество градаций уровня сигнала (уровней квантования) будет равно 65536 (2 16 ). При 8-разрядном представлении будем иметь 256 (2 8 ) градаций уровня.

Шумы квантования. Преобразование сигнала из аналоговой формы в цифровую можно произвести только с какой-то степенью точности, при этом, чем выше частота дискретизации и разрядность АЦП, тем точнее происходит преобразование.

Искажения сигнала, возникающие в процессе квантования отсчетов, влекут за собой потерю информации, которую при обратном цифро-аналоговом преобразовании в ходе воспроизведения записанного звукового сигнала ликвидировать или уменьшить практически невозможно.

Например, если преобразовать линейно нарастающий по напряжению аналоговый сигнал, то дискретный и восстановленный сигналы будут различаться на величину напряжения ошибки Uош. При записи звука зависимость ошибки от времени гораздо сложнее, а ее спектр подобен спектру белого шума и занимает частотный диапазон от нуля до частоты дискретизации. Появление ошибок квантования при записи звукового сигнала в цифровой форме эквивалентно добавлению к восстановленному сигналу некоторого шума. Поэтому ошибки квантования называются шумом квантования. Шум квантования можно рассматривать и как специфические искажения сигнала, особенно заметные при малых его уровнях. Уровень шума квантования обычно измеряется в присутствии сигнала как уровень (в децибелах) относительно максимального значения сигнала. Чем меньше этот уровень, тем выше качество звука. Достижимый уровень шума определяется разрядностью квантования и частотой дискретизации.

Затраты памяти на запись звука в цифровой форме

Зная разрядность АЦП, а точнее, количество разрядов, используемых для записи звукового сигнала в цифровой форме, можно получить некоторые интересные цифры.

Например, если умножить число разрядов кодового слова на частоту дискретизации сигнала, выраженную в герцах, то получим скорость передачи данных, которую должен обеспечивать цифровой канал записи / воспроизведения звука. Если полученную скорость передачи данных умножить на общую длительность звукового сигнала в секундах, получим объем памяти на магнитном носителе, например, на жестком диске, который потребуется для хранения звуковых данных. В случае записи стереосигнала, когда запись идет по двум (левому и правому) стереоканалам, скорость передачи данных и необходимый объем памяти удваиваются.

Передискретизация (оверсэмплинг)

Для того чтобы осуществить аналого-цифровое преобразование с высоким качеством, необходимо выполнить ряд условий.

Прежде всего, при оцифровке звукового сигнала следует использовать как можно более высокую частоту дискретизации: чем выше будет частота дискретизации, тем более качественно будет восстановлен исходный сигнал. К сожалению, пропорционально увеличению частоты дискретизации возрастает поток цифровых данных в канале звукозаписи, а также объем памяти, необходимой для хранения звукового сигнала в цифровой форме.

Другое условие аналого-цифрового преобразования заключается в том, что перед дискретизацией необходимо ограничить спектр входного сигнала с помощью фильтра низкой частоты (ФНЧ). Он должен удалить все гармоники с частотами, лежащими выше частоты дискретизации, и тем самым предотвратить наложение спектров.

В современных АЦП проблема фильтрации с целью устранения высокочастотных компонент спектра решается с помощью передискретизации — дискретизации на повышенной частоте. Термину передискретизация в зарубежной технической литературе соответствует термин оверсэмплинг, который в дальнейшем и будем использовать.

При оверсэмплинге диапазон частот входного аналогового звукового сигнала ограничивается с помощью ФНЧ низкого порядка (обычно 3-5-го), имеющего линейную фазовую характеристику и практически не искажающего импульсный сигнал. Частота среза фильтра выбирается значительно выше частоты полезного сигнала и составляет 25-30 кГц. В результате исключаются фазовые искажения, характерные для аналоговых фильтров высокого порядка, и подавление полезных сигналов высших частот. Отфильтрованный сигнал, имеющий ограниченный по частоте спектр, подвергается дискретизации на повышенной частоте, что исключает наложение и искажение спектра.

Далее дискретные отсчеты сигнала преобразуются в последовательность чисел с помощью АЦП, причем поток цифровых данных включает и нежелательные высокочастотные компоненты спектра.

Полученные цифровые данные подвергаются цифровой фильтрации. Цифровой фильтр высокого порядка с крутым срезом частотной характеристики изготовить гораздо проще. Причем, благодаря линейности фазовой характеристики цифрового фильтра, фазовые искажения сигнала будут отсутствовать. После цифрового фильтра сигнал будет иметь спектр, корректно ограниченный по частоте.

После цифровой фильтрации частота дискретизации сигнала понижается до удвоенного значения наивысшей полезной частотной составляющей путем удаления «избыточных» отсчетов.

В результате овэрсемплинга нежелательные высокочастотные составляющие будут ликвидированы, в то время как высокочастотные составляющие исходного звукового сигнала будут сохранены.

голоса
Рейтинг статьи
Ссылка на основную публикацию
Adblock
detector