Компрессия аналогового речевого сигнала

Компрессия аналогового речевого сигнала

Речевой сигнал, с учетом разброса его параметров и индивидуальных особенностей для разных людей, имеет довольно широкий динамический диапазон. Он требует для передачи по каналу связи низкого уровня помех и высокой верхней границы неискаженной передачи.

В реальных каналах верхняя граница бывает жестко ограничена требованиями согласования при переходах в другие каналы, перегрузкой усилителей и другими причинами, а уровень помех бывает довольно высоким. Поэтому пропустить речевой сигнал через канал без искажений невозможно из-за перегрузки сильных и маскировки помехами слабых по уровню звуков речи. Выход один — сжать или ограничить динамический диапазон речевого сигнала до величины динамического диапазона канала, повысив тем самым помехозащищенность передачи речи и ее разборчивость на приеме. Компрессия динамического диапазона необходима и для обработки речевого сигнала в тех случаях, когда он должен подвергаться преобразованиям типа вокодерных (от англ, voice + coder — собирательное название устройств преобразования речевых сигналов).

Кроме того, при передаче по системе связи желательно сжать частотный диапазон речевого сигнала. Спектр речи занимает полосу частот до 20 кГц, но верхние частоты спектра имеют малую информативность, поэтому сигнал ограничивают по полосе частот. Известно (экспериментально определено и закреплено в отечественных и международных стандартах), что для радиотелефонной передачи речи, особенно в условиях флуктуационных шумов с равномерной плотностью по частоте, ограничение частотного диапазона сверху частотой 3400 Гц и снизу частотой 300 Гц не вызывает заметного снижения разборчивости речи. Дальнейшее сужение частотного диапазона приводит уже к существенному ухудшению разборчивости. В отсутствии шумов и помех достаточная величина разборчивости речи получается даже при передаче полосы частот шириной 1000 Гц. Соответственно минимальная частота дискретизации для неискаженной передачи речи должна быть 7 кГц.

Но с учетом неидеальности фильтров, восстанавливающих сигнал после цифроаналоговых преобразований на приемной стороне, выбирают 8 кГц. Наиболее простой способ сокращения частотного диапазона речи — это ограничение его сверху и снизу.

Неоднократно предлагался метод сужения частотного диапазона речи путем равномерного деления его на ряд полос и передачи части каждой из них. Этот метод, как не учитывающий распределение речевой информации по частотному диапазону, приводит лишь к тому, что теряется информация и снижается помехозащищенность передачи.

Яндекс.Метрика