Что означает частота дискретизации звука
Что такое частота дискретизации звука? Что такое кодирование звука?
Содержание:
Кодирование звуковой информации и частота дискретизации звука — это два взаимосвязанных понятия, чуть ниже вы поймете почему.
Все понимают значение термина «звук»? Любое звучание — это всего лишь колебание невидимых волн, которые могут распространяться по воздуху, в водной стихии или в любом другом окружении; эти волны имеют бесперебойную частотность и интенсивность колебания. Люди улавливают различные звуки при помощи своего уха, что дает им возможность различать их громкость и тональность. Причем тон зависит от частотности волн, а громкость от ее интенсивности.
Чтобы измерить громкость звука, люди используют специализированную единицу измерения — Дб (децибел). Громкость звучания имеет прямую зависимость от его интенсивности, поэтому когда мы говорим, что громкость уменьшилась или увеличилась на 15 Дб, это означает, что интенсивность уменьшилась или увеличилась в 15 раз.
Если громкость измеряется в Дб, то частотность звука измеряют в Гц (Герцах). Герцы показывают сколько колебаний в секунду делает звуковая волна.
Кодирование звуковой информации
Как мы знаем, современный компьютер — это мощное устройство для обработки различных типов данных. Компьютер также может обрабатывать и звук, поэтому когда мы произносим «кодирование звуковой информации», то косвенно подразумеваем наличие компьютера. Но компьютер не осуществляет кодирование нашего привычного аналогового звука, который мы улавливаем своим ухом. Для компьютера пригоден только цифровой звук. Чтобы преобразовать стандартный звук в цифровой необходимо специальное устройство. На компьютере таким устройством является звуковая карта.
Преобразование звука из «привычного человеческому уху» в цифровой — это и есть процесс дискретизации. Причем для дискретизации звука, так же как и обычному звучанию, свойственна частотность и интенсивность.
Кодирование звуковой информации: частота дискретизации звука
Чтобы компьютерное устройство смогло преобразовать стандартный звук в цифровой формат (последовательность цифр), ему необходимо само звучание привести в соответствующий дискретный формат. Для этого применяется такое свойство, как «временная дискретизация».
Временная дискретизация представляет собой процесс разбивки и фиксации «привычного нам» звучания на небольшие промежутки по времени. В каждом зафиксированном промежутке измеряется показатель интенсивности звучания.
Частота дискретизации звука — это количественное значение фиксации интенсивности звучания в течение одной секунды. Чем больше частотность дискретизации звучания, тем четче оцифрованный звуковой сигнал будет отражать «привычный нашему уху» звук, соответственно, кодирование звуковой информации будет качественней. Частота дискретизации звука располагается в интервале от 8000 и до 48 000 измерительных фиксаций интенсивности в секунду. Вообще-то сегодняшние компьютерные звуковые системы смогут осуществлять куда большее количество фиксаций громкости в секунду, чем 48 000 (48кГц), некоторые могут вплоть до 192 000. Просто 48 кГц — это частота дискретизации стандарта DAT, который часто используется на компьютере, также есть стандарт CD со своими 44.1 кГц.
У вас может возникнуть такой вопрос. Мы же знаем, что, раз используется большая частота дискретизации звука, тогда и лучше будет само кодирование звуковой информации и, соответственно, оцифрованное звучание будет качественней. Это не совсем так. Чем интенсивней частота дискретизации, тем сильнее возрастает нагрузка на вычислительные мощности компьютера. Поэтому важно найти «золотую середину», чтобы и звук был хороший, и компьютер справлялся. Для этого оптимальную частоту дискретизации звука выбрали по-другому пути. Известно, что человеческое ухо улавливает частоты до 20 кГц. Опираясь на теорему Котельникова, можно посчитать, что, для того, чтобы цифровой звук соответствовал 20 кГц аналогового, то частотность его дискретизации должна составлять примерно в 2 раза больше, то есть около 40 кГц. Делать частотность дискретизации намного больше нет смысла, потому что человеческое ухо не рассчитано на такой диапазон.
Кодирование звуковой информации: глубина кодирования звука
Глубина кодирования звука — это количественная мера, которая показывает объем информации, необходимый для кодирования уровней в момент дискретизации. Простыми словами: в момент дискретизации происходит «срез» интенсивности звучания. Чтобы этот «срез» как-то оцифровать, нужна определенная величина информации. Вот эта величина информации и есть глубина кодирования звука.
Глубина кодирования звука исчисляется в битах. Самые распространенные варианты это звук в 8 или 16 бит. Но нужно понимать, что есть звуковые карты, которые выдают глубину кодирования звучания и в 24 бита.
Кодирование звуковой информации с глубиной кодирования звука в 16 бит будет означать, что зафиксированным «срезам» громкости при дискретизации звучания будет задаваться 16-битный код двоичной системы счисления.
Кодирование звуковой информации напрямую имеет зависимость от частоты дискретизации и глубины кодирования звука. Например, нижайшее качество звучания будет обеспечено частотностью в 8 кГц и глубиной 8 бит. Самое высшее качество звучания будет обеспечено частотностью в 48 кГц и глубиной в 16 бит. Но самое главное, чем больше качество звучания, тем больше будет его «вес».
Что означает частота дискретизации звука
Учитывая широкое распространение недорогого звукового оборудования на основе цифровых технологий, предлагаем вам поближе познакомиться с цифровым звуком.
Акустический звук представляет собой непрерывный во времени и по амплитуде процесс, то есть давление воздуха изменяется во времени плавно, а не перепрыгивает от одного значения к другому. Акустический звук может быть преобразован в электрический сигнал при помощи микрофона, который в зависимости от изменения давления воздуха изменяет создаваемое им на выходе электрическое напряжение. После перевода акустического звука в электрический сигнал непрерывность во времени и по амплитуде сохраняется: напряжение сигнала изменяется аналогично изменению давления воздуха, вот почему данный звук называют аналоговым. Мы можем записать электрический сигнал на магнитную ленту и превратить его вновь в звук при помощи динамика, который работает как «микрофон наоборот»: перемещает воздух в соответствии с изменениями напряжения. Соответственно, сохраняется и упомянутая непрерывность сигнала.
Как видно на рисунке, результат измерений не является точным аналогом непрерывного электрического сигнала. Насколько все же соответствует цифровой звук аналоговому? Очевидно, что это соответствие будет тем полнее, чем чаще происходят измерения и чем они точнее. Частота, с которой производятся измерения, называется частотой дискретизации. А на точность измерений амплитуды указывает число бит, использующихся для представления результата измерений. Этот параметр называют разрядностью.
От выбора частоты дискретизации зависит частотный диапазон полученного цифрового звука или максимальная частота аналогового сигнала, правильно представленная в цифровом. Считается, что диапазон частот, которые слышит человек, составляет от 20 до 20000 Гц. Согласно известной теореме Найквиста, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты. Звуковая частота, равная половине частоты дискретизации, называется частотой Найквиста и является максимальной частотой, которую данная цифровая система может правильно сохранить и воспроизвести. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 Гц до 20 кГц, то частота дискретизации такого сигнала должна быть не меньше, чем 40 кГц. Сегодня самыми распространенными частотами дискретизации являются 44,1 кГц (CD) и 48 кГц (DAT). Впрочем, в последнее время идет немало разговоров о том, что обертоны, расположенные свыше 20 кГц, вносят немалый вклад в звучание и в результате появляются преобразователи, использующие частоты дискретизации 96 кГц и 192 кГц, а в недалеком будущем ожидается появление и систем с частотой 384 кГц.
Тем не менее, исходный аналоговый сигнал обычно имеет спектр, сосредоточенный в основном в полосе частот от 20 Гц до, примерно, 20 кГц. Однако, кроме того в сигнале обычно содержатся помехи с частотами до нескольких сот килогерц. Это различные трудно устранимые наводки от компьютерной техники, промышленных и электробытовых приборов, трамваев, троллейбусов и т. д. На рисунке внизу вы видите спектр исходного аналогового сигнала.
В процессе дискретизации частотный спектр аналогового сигнала претерпевает значительные изменения. Во-первых, при оцифровке сигнала с частотой больше, чем частота Найквиста, получается звук с более низкой частотой, чем у оригинала. То есть, происходит «свертка» всего первоначального спектра аналогового сигнала, простирающегося от, примерно, 20 Гц до нескольких сот килогерц, вовнутрь полосы частот от 0 Гц до частоты Найквиста (половины частоты дискретизации). Результат этого процесса показан на рисунке внизу.
Все это выглядит весьма непривычно, если не сказать, что вообще противоречит здравому смыслу! Получается, что происходит дискретизация высокочастотных сигналов, лежащих значительно выше не только частоты Найквиста, но и самой частоты дискретизации. На первый взгляд это даже противоречит упомянутой выше теореме Найквиста. Однако это происходит именно так и подробнее узнать о том, почему так происходит, вы можете из врезки «Свертка».
Так как весь исходный спектр свернулся в полосу частот от 0 Гц до частоты Найквиста, то логично и естественно, что расширение спектра происходит дублированием спектра из полосы от 0 Гц до частоты Найквиста. В конечном итоге, спектр дискретизированного сигнала представляет собой несколько десятков сдвинутых по частоте копий спектров, полученных в результате свертки спектра исходного аналогового сигнала вовнутрь полосы частот от 0 Гц до частоты Найквиста.
Итак, реальные аналоговые сигналы часто содержат высокочастотные составляющие, плохо поддающиеся оцифровке на стандартных частотах 44,1 кГц или 48 кГц. Поэтому перед дискретизацией необходима аналоговая фильтрация, то есть удаление всех частот выше частоты Найквиста, являющаяся довольно сложной задачей. Аналоговые фильтры не могут пропустить, скажем, все частоты от 0 Гц до 24 кГц и подавить все частоты выше 24 кГц. Аналоговый фильтр низких частот начинает подавлять высокие частоты начиная с некоторой частоты, называемой частотой среза. Подавление плавно усиливается с ростом частоты. Поэтому, чтобы добиться отсутствия частот выше 24 кГц необходимо устанавливать частоту среза фильтра примерно на 16..20 кГц, а это уже плохо, так как будут ослаблены полезные частоты в слышимом диапазоне 16..20 кГц. Еще одна неприятность состоит в том, что чем более узкой мы пытаемся сделать переходную область между полосой пропускания и полосой подавления фильтра, тем сильнее вносимые фазовые искажения, длиннее переходный процесс (фильтр начинает «звенеть») и тем сложнее и капризнее в настройке такой аналоговый фильтр.
После цифрового фильтра получается цифровое представление сигнала, имеющего спектр, правильно ограниченный по частоте. Применяя к такому сигналу теорему Найквиста мы можем резко понизить частоту его дискретизации до удвоенной величины наивысшей полезной частотной составляющей, чего мы и хотели добиться. Надо отметить, что часто цифровые фильтры находятся в той же микросхеме, что и другие узлы АЦП, так что пользователь даже может и не подозревать какие сложные процессы происходят в его АЦП.
Применяется дискретизация на повышенной частоте (oversampling) и в цифро-аналоговых преобразователях (ЦАП). В ЦАП также есть проблема сложности аналоговых восстанавливающих (интерполирующих) фильтров. Ведь сразу после ЦАП сигнал представляет собой серию дискретных импульсов, имеющих многочисленные алиазинговые спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (скажем 0..24 кГц) и, по возможности, наиболее полно подавить ненужные высокочастотные компоненты. И, конечно, чисто аналоговому фильтру выполнить такие противоречивые требования очень сложно. Поэтому сначала цифровой сигнал интерполируют, то есть вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам и, тем самым, резко увеличивают частоту дискретизации. Это приводит к тому, что алиазинговые спектральные компоненты на выходе ЦАП далеко отстоят от частотных компонент основного сигнала и, соответственно, чтобы отфильтровать (подавить) их достаточно применить простой аналоговый фильтр.
Таким образом, процесс квантования амплитуд отсчетов фактически заключается в измерении их величин по отношению к некоторому опорному источнику напряжения (линейка в предыдущих объяснениях), обычно имеющемуся внутри корпуса микросхемы АЦП, и выражении этих величин в виде чисел, состоящих из конечного числа бит. Причем числа могут быть не только целые, например 16-, 18-, 20-, 24-битные, но и 24- или 32-битные с плавающей запятой или с другой кодировкой (например, в кодах с исправлением ошибок), зависящей от конкретной реализации устройства АЦП. Довольно часто используется все же кодирование результатов измерения амплитуд отсчетов в виде целых чисел.
В обычном АЦП число бит на один отсчет (разрядность числа) выходного цифрового потока данных непосредственно с квантователя амплитуд дискретов и на выходе всего АЦП равны, так как числа с квантователя амплитуд поступают непосредственно на выход устройства. Однако, квантователь АЦП не обязательно должен иметь высокую разрядность для того, чтобы выходной поток цифровых данных АЦП имел таковую. Увеличение эффективной разрядности АЦП может быть достигнуто использованием метода увеличения частоты дискретизации (oversampling) и цифровой фильтрации. Подробнее об этом вы можете узнать из врезки «Увеличение разрядности».
То есть, чтобы 16-битная запись звучала чисто, необходимо предотвратить понижение уровня сигнала: он не должен становиться фактически 8-битным. Получается, что исходный музыкальный материал должен быть скомпресcирован тем или иным способом с целью уменьшения его динамического диапазона и предотвращения грязного звучания на слишком маленьких уровнях. Однако, сжатие динамического диапазона исходного музыкального материала, достигающего порой 100 и более дБ (например, для электрогитары), на 48 и более дБ без заметных на слух искажений представляется крайне сложной (если вообще выполнимой) задачей. А иногда и художественное содержание музыкального произведения требует чередования громких и очень тихих звуков и, следовательно, искусственное сжатие динамического диапазона неприемлемо. В таких случаях применяется дизеринг (dithering), позволяющий частично «обменять» эффект грязного звучания на незначительное увеличения высокочастотного шума.
Метод дизеринга заключается в добавлении небольшого шумового (обычно высокочастотного) сигнала во входной сигнал АЦП или уже к цифровому сигналу в момент понижения разрядности (например, с 20 и более бит исходного музыкального материала до 16 бит для записи на компакт диск). Это приводит к независимости шумов квантования и сигнала, однако общий уровень шумов немного возрастает.
Нойс шейпинг
В результате оцифровки входного аналогового сигнала к нему добавляется шум квантования. Его спектр равномерен и простирается начиная от 0 Гц и до частоты Найквиста (половины частоты дискретизации). Равномерность по частоте и отсутствие взаимосвязи (некоррелированность) шума с сигналом достигается применением дизеринга и правилом квантования, при котором округление амплитуды происходит к ближайшей опорной величине.
Применение более сложных правил округления позволяет получить другие (неравномерные) спектральные характеристики шумов округления при сохранении полной мощности шумов неизменной. Учитывая, что человеческий слуховой аппарат имеет спад чувствительности на высоких и на очень низких частотах, возможно, используя специальные правила округления при квантовании, получить спектр шумов округления, большей частью сосредоточенный в области частот, которые наименее заметны на слух (выше 20 кГц). Частота дискретизации для ЦАП с 256-кратным превышением частоты около 11,2 МГц, и следовательно, мы имеем возможность переместить весь шум квантования в область частот, практически неслышимую человеческим ухом (от 20 кГц до 5,6 МГц). Таким образом, можно значительно улучшить отношение сигнал/шум в диапазоне слышимых частот в цифровом сигнале не увеличивая количество бит на один отсчет.
Применение нойс шейпинга (noise shaping) возможно и без перемещения шумов в полностью неслышимую высокочастотную область. Для этого при переходе от 20..24-битного исходного сигнала к 16-битному формируется спектр шумов квантования, имеющий форму, обратную кривой чувствительности слухового аппарата человека. То есть там, где наш слух наиболее чувствителен к шумам, будет минимум на кривой спектра мощности шумов и наоборот, там где наш слух менее чувствителен к шуму будет сосредоточен максимум шумов. Таким образом, особенно раздражающее слух шипение в области 3-4 кГц становится более мягким и незаметным, а «грязь» при небольших уровнях сигнала становится менее очевидной.
В мастеринге, например, целесообразно звуковой материал оцифровать на повышенной частоте дискретизации (скажем 96 кГц, если ваш АЦП это позволяет) и с высокой разрядностью (20..24-бит), а преобразование звука в 16-битный с частотой 44,1 кГц (необходимое для СD) произвести в самом конце работы с помощью специального программного обеспечения или аппаратных устройств, использующих компрессию, дизеринг, нойс шейпинг и другие алгоритмы обработки. Таким образом, можно достичь субъективно лучшего отношения сигнал/шум на СD, хотя объективные измерения могут показать незначительное ухудшение этого параметра за счет увеличения мощности высокочастотных шумов.
Вообще же стоит относиться критически к рекламным заявлениям фирм о «колоссальном» и «драматическом» улучшении звука после дизеринга, нойс шейпинга и т. д. Очевидно, что панацеи не существует и именно поэтому безработица инженерам по звуку пока не грозит.
В современных цифровых системах звукозаписи и воспроизведения основным источником джиттера является АЦП, поскольку современные синхронизаторы частоты дискретизации настолько совершенны, что вносят джиттер гораздо меньший, чем АЦП. Рассмотрим, как образуется джиттер в АЦП. Частота дискретизации АЦП обычно задается кварцевым генератором, а любой кварцевый генератор (особенно дешевый, низкокачественный) имеет фазовые шумы. Таким образом, моменты времени получения отсчетов сигнала расположены на оси времени не совсем равномерно. Это приводит к размыванию спектра сигнала и ухудшению отношения сигнал/шум. Кроме того, на высокочастотных компонентах сигнала джиттер может привести к пульсации амплитуд. Для борьбы с этим явлением надо использовать высококачественные кварцевые генераторы с хорошо стабилизированными источниками питания, что на практике обычно означает попросту покупку более дорогого и высококачественного устройства АЦП.
Если не рассматривать низкокачественные АЦП, то джиттер возникает при передаче цифрового сигнала от одного устройства другому из-за неоднородности среды передачи. Джиттер слышен при мониторинге во время передачи, когда частота дискретизации принимающего устройства синхронизирована с частотой передающего. Если джиттер не настолько силен, чтобы появились щелчки или треск, то он не сохраняется на записи, поскольку воспроизводящее устройство регенерирует тактовую частоту при помощи собственного генератора. С этим связан и известный парадокс цифрового звука, когда копия может звучать лучше оригинала. Бороться с джиттером можно использованием качественной коммутации (в том числе согласованием сопротивлений, чтобы не было отражений сигнала) и применением устройств, регенерирующих цифровой сигнал. Также необходимо отключать внешнюю синхронизацию частоты дискретизации устройства при воспроизведении, если подобная синхронизация не требуется.
Те, кто использует системы типа АЦП-компьютер-CD, могут вообще не задумываться над этой проблемой. Кроме джиттера, связанного с АЦП, никакого дополнительного джиттера из-за неоднородности среды при передаче цифрового сигнала от одного устройства другому для таких систем вообще не существует. То есть, если вы программно обрабатываете звуковые файлы и записываете на CD с помощью CD-рекордеров, подключенных к вашему компьютеру по SCSI или IDE интерфейсу, то никаких проблем с джиттером у вас никогда не будет и можете вообще смело забыть это слово.
Частота дискретизации
Частота дискретизации (или частота семплирования, англ. sample rate) — частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем). Измеряется в герцах.
Термин применяется и при обратном, цифро-аналоговом преобразовании, особенно если частота дискретизации прямого и обратного преобразования выбрана разной (Данный приём, называемый также «Масштабированием времени», встречается, например, при анализе сверхнизкочастотных звуков, издаваемых морскими животными).
Чем выше частота дискретизации, тем более широкий спектр сигнала может быть представлен в дискретном сигнале. Как следует из теоремы Котельникова, для того, чтобы однозначно восстановить исходный сигнал, частота дискретизации должна более чем в два раза превышать наибольшую частоту в спектре сигнала.
Некоторые из используемых частот дискретизации звука:
Ссылки
См. также
Полезное
Смотреть что такое «Частота дискретизации» в других словарях:
частота дискретизации — (МСЭ Т G.991.2). [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN sampling rate … Справочник технического переводчика
частота дискретизации — 3.20 частота дискретизации (sampling frequency): Число выборочных значений сигнала в единицу времени (секунду) при записи или представлении сигнала в цифровом виде. Источник … Словарь-справочник терминов нормативно-технической документации
частота дискретизации — diskretizavimo dažnis statusas T sritis automatika atitikmenys: angl. discretization frequency vok. Diskretisierungsfrequenz, f rus. частота дискретизации, f pranc. fréquence de discrétisation, f … Automatikos terminų žodynas
частота дискретизации сигнала электросвязи — Число отсчетов сигнала электросвязи в единицу времени. [ГОСТ 22670 77] Тематики сети передачи данных Синонимы частота дискретизации EN sampling rate … Справочник технического переводчика
частота дискретизации сигнала цветности — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN chrominance sampling frequency … Справочник технического переводчика
Частота дискретизации сигнала электросвязи — 32. Частота дискретизации сигнала электросвязи Частота дискретизации Sampling rate Число отсчетов сигнала электросвязи в единицу времени Источник: ГОСТ 22670 77: Сеть связи цифровая интегральная. Термины и определения оригинал документа … Словарь-справочник терминов нормативно-технической документации
Частота дискретизации сигнала электросвязи — 1. Число отсчетов сигнала электросвязи в единицу времени Употребляется в документе: ГОСТ 22670 77 Сеть связи цифровая интегральная. Термины и определения … Телекоммуникационный словарь
минимальная частота дискретизации (сигнала) — — [http://slovarionline.ru/anglo russkiy slovar neftegazovoy promyishlennosti/] Тематики нефтегазовая промышленность EN minimum sampling frequency … Справочник технического переводчика
минимально допустимая частота дискретизации — — [Я.Н.Лугинский, М.С.Фези Жилинская, Ю.С.Кабиров. Англо русский словарь по электротехнике и электроэнергетике, Москва] Тематики электротехника, основные понятия EN Nyquist frequency … Справочник технического переводчика
частота — 3.2 частота: Вероятность появления последствия (возникновения опасного события). Источник: ГОСТ Р ИСО/ТС 14798 2003: Лифты, эскалаторы и пассажирские конвейеры. Методология анализа риска 06.01.15 частота [ frequency]: Число циклов периодического… … Словарь-справочник терминов нормативно-технической документации
Частота дискретизации при оцифровке
Частота дискретизации – частота выборки отсчетов сигнала при оцифровке.
Частоту дискретизации еще называют частотой сэмплирования (sample rate).
Для большего понимания этого понятия давайте посмотрим на рисунок, на котором представлена форма волны сигнала.
Значения «O» представляет собой один отсчет – промежуток времени отдельно взятого сэмпла. А частота дискретизации показывает сколько отсчетов (сэмплов одинаковой продлжительности «O») взято за одну секунду.
Если оцифрованный сигнал имеет частоту дискретизации 48 кГц, то это означает, что каждая секунда этого сигнала разбита на 48000 отсчетов.
Например трэк продолжительностью 7 мин (420 секунд) с частотой сэмплирования 48 кГц будет иметь 20160000 отсчетов (420х48000).
Из выше сказанного можно сделать вывод, что чем больше частота дискретизации, тем выше качество аудиосигнала. Но при выборе больших значений sample rate при преобразовании аудиосигнала повышается интенсивность потока цифровых данных и нагрузка на цифровые процессы обработки информации, а также увеличивается объем результирующего файла.
Учитывая теорему Найквиста (в любой системе, осуществляющей дискретизацию по времени частота дискретизации должна быть как минимум в два раза больше чем наибольшая частота, которую необходимо передать) и то, что человек может слышать звук в диапазоне 20 – 20000 Гц, то можно сказать, что для качественного преобразования аналогового сигнала в цифровой будет достаточно использовать частоту дискретизации в 44,1 кГц (44100/2 = 22050).
Напоследок приведу несколько примеров использования частоты дискретизации звука.
— 8 000 Гц – телефон (частота достаточная для передачи речи);