Александр Загуменнов - Компьютерная обработка звука
К параметрам, определяющим акустические сигналы, относятся значения уровня в частотном и временном представлениях, средние значения уровней, динамический диапазон, форма спектра и занимаемая полоса частот, а также время корреляции.
Слушатель всегда имеет собственное представление о «хорошем звуке», сформированное личным опытом, и оценивает звучание по многим субъективным критериям. Поэтому, говоря о свойствах звука, необходимо определить также критерии оценки, согласованные с субъективным восприятием звука.
Рассмотрим основные понятия, определяющие первичный акустический сигнал.
Динамический диапазон и уровни
Уровень акустического сигнала непрерывно изменяется во времени. Интервал таких изменений может быть довольно широким. На рис. 1.7 показана возможная зависимость уровня сигнала от времени.
Рис. 1.7. Зависимость уровня сигнала от времени: L – уровень сигнала; t – время; T – длительность сигнала; D – динамический диапазон
Разность между максимальным и минимальным уровнями (по мощности) называют динамическим диапазоном. Обычно единицей измерения динамических диапазонов является децибел (дБ). Диапазон в децибелах определяют как 20 десятичных логарифмов от квадрата максимального размаха (разности уровней) сигнала.
Сама по себе громкость звука определяется только как субъективный параметр. Но на практике уровни громкости также измеряют в децибелах.
Динамические диапазоны разных акустических сигналов существенно различаются. Некоторые из них приведены в табл. 1.1.
Таблица 1.1. Динамические диапазоны некоторых акустических сигналовСледует различать динамические диапазоны первичного акустического сигнала и электроакустического тракта.
Частотный диапазон и спектры
Спектры акустических сигналов (форма и относительные мощности отдельных компонентов, полоса частот) для разных источников звука сильно отличаются. Любой сигнал можно представить в виде значений его уровня в любой момент времени. Такое представление называют импульсным. Другая форма представления сигнала – частотная. В этом случае сигнал изображают непрерывной совокупностью гармонических колебаний. Спектр звукового сигнала – это совокупность звуковых гармонических колебаний. Формально определением спектра является специальное интегральное преобразование, выполняемое на бесконечно большом отрезке времени. На практике временные интервалы, на которых определяют спектры сигналов, ограничены, но они все же должны быть намного больше обратного значения возможной полосы частот сигнала.
Зависимость амплитуды гармонического сигнала от частоты называют частотной характеристикой. Частотные характеристики реальных сигналов с ростом частоты спадают. Под полосой частот сигнала понимают тот интервал, где уровень частотных компонентов превышает некоторое заданное значение, например -60 дБ. За пределами этого интервала значения уровня частотных составляющих принимаются за 0.
К временным (импульсным) характеристикам относятся волновая форма сигнала и время корреляции. Корреляция – это достаточно сложный и важный параметр, заимствованный из теории вероятности. Дело в том, что любой несущий информацию сигнал следует рассматривать как случайный процесс. Белым шумом называют такой случайный сигнал, в котором все последующие значения уровня никак не зависят от предыдущих. Белый шум имеет нулевое среднее значение размаха сигнала и бесконечно широкий спектр. Реальные сигналы отличаются от белого шума тем, что последующие значения зависят от предыдущих. Такая зависимость и называется корреляцией, а среднее значение интервала времени, в пределах которого эта зависимость сохраняется, называется временем корреляции. Время корреляции, в частности, важно учитывать потому, что оно определяет время взаимодействия (интерференции) с отраженными сигналами, а следовательно, и интенсивность интерференционных помех.
Волновая форма сигнала дает возможность определить резкие переходы интенсивности звукового сигнала.
Возможны самые разнообразные нарушения точности передачи сигнала через электроакустические тракты. Основные из них: потеря акустической перспективы, смещение уровней, ограничение динамического и частотного диапазонов сигнала, помехи и искажения. Поэтому основной задачей электроакустических систем, в частности систем обработки звука, является максимальное достижение идентичности характеристик первичных и вторичных акустических сигналов. Совершенно очевидно, что для этого необходима обширная гамма средств, конкретно воздействующих на тот или иной параметр акустического сигнала.
Первичный акустический сигнал обладает широким спектром, и для его правильной передачи электроакустический тракт должен иметь достаточно широкий частотный диапазон. Системы обработки звука при этом должны соответственно работать во всем диапазоне.
Время реверберации
Время реверберации определяется как время, за которое после отключения источника сигнала звук в помещении, затухая, ослабнет в 1000 раз, то есть на 60 дБ. При превышении некоторых предельных значений этой величины снижаются разборчивость речи и «прозрачность» музыки (для речи – около 1,2 с, для музыки – 2 с).
Следует различать ранние и поздние отражения. Граница между ними лежит вблизи 50 мс для речи и 80 мс для музыки от момента прихода прямого звука.
При обработке звука необходимо учитывать, что в помещении время реверберации имеет частотную зависимость, то есть оказывает влияние на тембровую окраску звучания.
Субъективные критерии оценки звучания
Специфическая особенность всех процессов обработки звука заключается в том, что обязательным (если не важнейшим) его этапом является субъективная оценка качества звучания. Это, в свою очередь, обусловлено тем, что используемый в настоящее время набор объективных параметров – диапазон частот, неравномерность амплитудно-частотной характеристики, уровень нелинейных искажений и др. (хотя он постоянно расширяется и обновляется) – неоднозначно определяет «слуховой образ», воспринимаемый слушателем.
Поэтому субъективная экспертиза является обязательной процедурой на всех этапах записи и обработки звука, а также служит главным критерием оценки полученного результата.
Результаты оценки качества звучания зависят от многих факторов, таких как параметры помещения прослушивания, выбор тестовых программ, отбор и тренировка экспертов, метод выбора оценок и обработки результатов и т. д.
Если для речи важнейшим параметром является ее разборчивость (артикуляция) и степень зависимости от уровня громкости и посторонних шумов, то для музыки высокое качество звучания определяется факторами, которые в определенной степени могут быть охарактеризованы с помощью понятий уровня громкости, прозрачности, пространственного впечатления, тембровой окраски звучания, баланса и подобных субъективных критериев.
Слоговая разборчивостьДля речи существует один субъективный критерий качества звучания – хорошая слоговая разборчивость (артикуляция). Следует различать чисто информативную речь – доклад, объявление и т. п. – и речь художественную, имеющую определенное эстетическое содержание в первую очередь благодаря интонации. Во втором случае для оценки качества звука только разборчивости недостаточно. Для художественной речи критерии качества ее звучания такие же, как и для музыки. Разборчивость зависит от уровней громкости полезного сигнала и шума, а также от акустических свойств помещения (ранних отражений и реверберации).
ОтзвукОтзвуком называют сохраняющийся после внезапного умолкания источника звукового сигнала и ослабевающий со временем звук, обусловленный последовательностью повторяющихся отражений, и связанное с этим явлением постепенное стихание звукового сигнала.
Длительность отзвукаДлительность отзвука – это время, в течение которого отзвук еще слышен. Длительность отзвука зависит от времени реверберации (свойств акустики помещения), уровня звукового сигнала, уровня помех, а также от порога слуха и частоты сигнала.
ПрозрачностьПод прозрачностью обычно понимают различимость одновременно звучащих тонов и инструментов, несмотря на налагающийся отзвук помещения. Отметим, что временная граница для полезных с точки зрения прозрачности и пространственного впечатления первых отражений и отзвука помещения, определяющего его гулкость (сумма поздних отражений), составляет около 80 мс.
Пространственное впечатлениеПространственное впечатление возникает из слухового восприятия в частично или полностью закрытом пространстве. Пространственное впечатление складывается из ряда составляющих: