KnigaRead.com/
KnigaRead.com » Компьютеры и Интернет » Прочая околокомпьтерная литература » Александр Загуменнов - Компьютерная обработка звука

Александр Загуменнов - Компьютерная обработка звука

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Александр Загуменнов, "Компьютерная обработка звука" бесплатно, без регистрации.
Перейти на страницу:

Пространственное впечатление возникает из слухового восприятия в частично или полностью закрытом пространстве. Пространственное впечатление складывается из ряда составляющих:

• ощущение, что слушатель находится в одном помещении с источником звука;

• представление о размерах помещения;

• гулкость;

• пространственность.

Пространственное впечатление основывается на сознательном различении отраженного и прямого звуковых сигналов.

Гулкость

Гулкостью называют такое ощущение, что кроме прямого звука имеется и отраженный звук, воспринимаемый не как повторение сигнала. В больших помещениях гулкость зависит от отношения поздней энергии отзвука к ранней. К ранней относится энергия прямого звука и отражений, которые при звучании речи приходят примерно за первые 50 мс, а при звучании музыки – за 80 мс после прихода прямого звука.

Эхо Эхом называют такие повторения звукового сигнала, при которых первичный и вторичный сигналы воспринимаются во времени, а в некоторых случаях и в пространстве, как самостоятельные слуховые объекты. Если повторение сигнала обусловлено отражениями, то для раздельного его восприятия необходимое время запаздывания – около 50 мс, в зависимости от вида сигнала. В тех случаях, когда периодические повторения сигнала следуют так быстро друг за другом, что уже не воспринимаются слухом как отдельные сигналы, говорят о многократном эхе.

Аналоговый и цифровой сигналы

Как известно, преобразование аналогового (непрерывного во времени) сигнала в цифровой происходит в три приема: выборка, квантование и кодирование.

Сначала аналоговый сигнал преобразуется в последовательность аналоговых же выборок, полученных через равные промежутки времени. Квантование аналогового сигнала представляет собой выбор конечного числа уровней, которые, как правило, равномерно распределены в диапазоне от – U до +U шкалы входного сигнала аналого-цифрового преобразователя (АЦП). Количество уровней квантования почти однозначно связывается с выходным цифровым сигналом посредством кодирования. Наиболее распространенным является прямое двоичное кодирование.

Если спектр преобразуемого аналогового сигнала располагается в полосе частот от 0 до F, то частота выборки (или частота дискретизации) не должна быть менее 2F. Таким образом, если реальный аналоговый сигнал содержит частотные компоненты от 0 Гц до 20 кГц, то частота дискретизации такого сигнала должна быть выбрана не меньше 40 кГц.

На этот счет существует теорема Шеннона-Котельникова и частота Найквиста (F) как следствие из данной теоремы. Однако теорема не содержит утверждения о точном восстановлении аналогового сигнала при указанном условии (> 2F). На самом деле восстановленный сигнал имеет произвольные амплитуду и фазу (в конкретных пределах). Статистически достоверное восстановление исходного аналогового сигнала имеет место при частоте выборки не менее 5F.

Отношение сигнал/шум на выходе N-разрядного АЦП в идеальном случае равно (6N-6) дБ, поскольку существует неустранимая погрешность квантования (так называемый шум квантования) равная половине разности между соседними уровнями квантования, что эквивалентно потере 6 дБ в отношении сигнал/шум. Повышение частоты преобразования существенно снижает интермодуляционные искажения, обусловленные наложением спектров – aliasing (совмещение, алиазинг), – и повышает достоверность восстановления аналогового сигнала. Реальный музыкальный сигнал далек от белого шума (близок к розовому – шуму дождя, прибоя, ветра – то есть шуму, плотность которого спадает с ростом частоты), но шум квантования не зависит от сигнала, если число уровней квантования неизменно и распределение их равномерно. Другое дело – погрешность преобразования, которая действительно зависит от амплитуды и частоты входного сигнала и выражается в реальных нелинейных и интермодуляционных искажениях, то есть паразитных спектральных составляющих.

На слух такие ошибки воспринимаются как «зернистость» во фрагментах записи с низким уровнем сигнала. При этом возникает ощущение «грязного» звука. Оно же появляется при изменении разрядности записи, например когда 20-разрядную запись приводят к 16-разрядной или последнюю – к 8-разрядной.

В таких случаях для уменьшения ошибок квантования в цифровых записях применяется дизеринг. Дизеринг (dithering – размывание) представляет собой подмешивание в исходный сигнал (в цифровой форме) псевдослучайного шума со специально подобранным спектром. В результате наиболее заметные (для человеческого слуха) паразитные спектральные составляющие перемещаются из среднечастотной (3–5 кГц) в высокочастотную область (15–17 кГц).

Другими словами, метод дизеринга заключается в добавлении при крайне низком уровне сигнала специального вида шума, обычно высокочастотного. Это приводит к независимости шумов квантования и сигнала, однако общий уровень шумов немного возрастает. Действительно, добавленный шум может восприниматься на слух как постоянное шипение. Однако это едва ощутимо и намного «приятнее» на слух, чем искажения, появляющиеся при отбрасывании младших разрядов.

В результате обработки сигнала с применением дизеринга к нему добавляется шум квантования. Его спектр равномерен и занимает полосу от 0 Гц до половины частоты дискретизации. Равномерность по частоте и некоррелированность шума с сигналом достигается благодаря дизерингу, а также правилу квантования, согласно которому амплитуда в отсчете округляется до ближайшей опорной величины. Применение более сложных правил округления позволяет получить другие (неравномерные) спектральные характеристики шумов округления при сохранении полной мощности шумов неизменной. Учитывая, что слух человека имеет спад чувствительности на высоких и на очень низких частотах, можно, используя специальные правила округления при квантовании, получить спектр шумов округления, большей частью сосредоточенный в области наименее заметных на слух частот. Следовательно, можно значительно увеличить отношение сигнал/шум в диапазоне слышимых частот в цифровом сигнале, не увеличивая количество битов на один отсчет.

Для этого формируется спектр шумов квантования, имеющий форму, обратную кривой чувствительности слухового аппарата человека. То есть там, где наш слух наиболее чувствителен к шумам, кривая спектра мощности шумов будет иметь минимум, и наоборот, там, где наш слух менее чувствителен к шуму, будет сосредоточен максимум шумов. Подобный метод называется нойс-шейпингом (noise-shaping – формирование шума).

Применяя такие методы обработки сигнала, можно достичь субъективно лучшего восприятия звука, хотя объективные измерения отношения сигнал/шум во всем частотном диапазоне могут показать ухудшение этого параметра за счет увеличения мощности высокочастотных шумов.

Простейшее редактирование

Операции редактирования можно условно разделить на четыре группы:

• простейшее редактирование;

• звуковые процессы;

• звуковые эффекты;

• дополнительные инструменты.

К группе простейшего редактирования относят операции, которые не затрагивают внутренней структуры звука, то есть не изменяют его акустических, частотных характеристик и пр.

Большинство из них используют буфер обмена, который представляет собой временную область для хранения. Буфер обмена может применяться также для перемещения данных из одного окна в другое.

Чаще всего используются операции, перечисленные ниже.

Cut (Отрезать). Выделенная часть данных удаляется из звуковой волны и копируется в буфер обмена.

Clear/Delete (Очистить/Удалить). Выделенный фрагмент данных удаляется без копирования в буфер обмена.

Trim/Crop (Вырезать/Обрезать). Удаляются все данные из окна, за исключением выделенного фрагмента.

Copy (Копировать). Копируется выделенный фрагмент данных в буфер обмена.

Paste (Вставить). Вставляется содержимое буфера обмена в окно данных, начиная с текущей позиции курсора, или заменяется выделение.

Mix (Смешать). Смешивается содержимое буфера обмена с данными в окне, начиная с текущей позиции курсора или с начала выделения.

Crossfade (Плавно заместить). Данные в окне плавно замещаются содержимым буфера обмена, начиная с позиции курсора (громкость одного сигнала плавно затухает, а другого нарастает).

Технология выполнения описываемых операций в программе Samplitude 2496 несколько отличается. Для временного хранения используется не отвлеченный буфер обмена, а две конкретные области: Clip для аудиоданных из Wave Projects (Волновые проекты) и VirtClip для Virtual Projects (Виртуальные проекты).

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*