Временное компандирование

Временное компандирование

При временном компандировании на передающей стороне линии из речи исключаются некоторые временные интервалы. Вследствие такой дискретизации в передаче образуются паузы, которые могут быть заполнены другой передачей.

На приемной стороне интервалы в передаче заполняются предшествующим паузе отрывком речи. Иногда после исключения из речи временных интервалов остающиеся отрывки речи растягиваются на весь интервал до следующего отрывка. Вследствие этого понижаются частоты колебаний и весь частотный диапазон речи соответственно сжимается. Таким образом, временное компандирование превращается в частотное.

Сначала было предложено делить речевой сигнал по времени на равные интервалы и затем исключить их так, чтобы оставались речевые отрывки одинаковой длины и на равных интервалах. Но и этот метод оказался неэффективным, так как длительные звуки сохраняют большую избыточность, а короткие исчезают. В дальнейшем этот метод был усовершенствован с учетом того, что главным признаком распознавания звуков речи являются временные изменения форматных частот. Соответственно этому принципу нет смысла в полной передаче установившихся значений формантных образов, а передавать следует только те временные участки звуков речи, в которых содержатся изменения формантных частот. Поскольку гласные звуки и ряд согласных имеют длительный период, в течение которого формантные изменения не происходят, то такие участки передачи могут быть без ущерба для речи почти исключены из передачи в компрессирующем устройстве. На приеме они могут быть легко восстановлены по предыдущим отрывкам и вставлены в паузы между отрывками звуков речи.

Анализ участков речи, имеющих постоянные формантные частоты, показал, что совершенно свободно, без сколько-нибудь заметного снижения разборчивости и качества звучания речи, может быть исключено примерно 54 % всей длительности передачи. Таким образом, двухкратная временная компрессия речи не должна вносить искажений при передаче. Была проведена экспериментальная проверка зависимости разборчивости речи от величины временной компрессии и ее периода разделения (период разделения — это промежуток времени, занимаемый оставляемым и выбрасываемым отрывками речи). За коэффициент компрессии принимается отношение паузы между отрывками к периоду разделения. Измеряется слоговая разборчивость для фонетически сбалансированных, но бессмысленных слогов, которые собираются в специальные тестовые таблицы. Коэффициент компрессии изменялся в пределах 0,4...0,9, величина пауз — 0,01 ...0,24 с.

Компрессия аналогового речевого сигнала

Компрессия аналогового речевого сигнала

Речевой сигнал, с учетом разброса его параметров и индивидуальных особенностей для разных людей, имеет довольно широкий динамический диапазон. Он требует для передачи по каналу связи низкого уровня помех и высокой верхней границы неискаженной передачи.

В реальных каналах верхняя граница бывает жестко ограничена требованиями согласования при переходах в другие каналы, перегрузкой усилителей и другими причинами, а уровень помех бывает довольно высоким. Поэтому пропустить речевой сигнал через канал без искажений невозможно из-за перегрузки сильных и маскировки помехами слабых по уровню звуков речи. Выход один — сжать или ограничить динамический диапазон речевого сигнала до величины динамического диапазона канала, повысив тем самым помехозащищенность передачи речи и ее разборчивость на приеме. Компрессия динамического диапазона необходима и для обработки речевого сигнала в тех случаях, когда он должен подвергаться преобразованиям типа вокодерных (от англ, voice + coder — собирательное название устройств преобразования речевых сигналов).

Кроме того, при передаче по системе связи желательно сжать частотный диапазон речевого сигнала. Спектр речи занимает полосу частот до 20 кГц, но верхние частоты спектра имеют малую информативность, поэтому сигнал ограничивают по полосе частот. Известно (экспериментально определено и закреплено в отечественных и международных стандартах), что для радиотелефонной передачи речи, особенно в условиях флуктуационных шумов с равномерной плотностью по частоте, ограничение частотного диапазона сверху частотой 3400 Гц и снизу частотой 300 Гц не вызывает заметного снижения разборчивости речи. Дальнейшее сужение частотного диапазона приводит уже к существенному ухудшению разборчивости. В отсутствии шумов и помех достаточная величина разборчивости речи получается даже при передаче полосы частот шириной 1000 Гц. Соответственно минимальная частота дискретизации для неискаженной передачи речи должна быть 7 кГц.

Но с учетом неидеальности фильтров, восстанавливающих сигнал после цифроаналоговых преобразований на приемной стороне, выбирают 8 кГц. Наиболее простой способ сокращения частотного диапазона речи — это ограничение его сверху и снизу.

Неоднократно предлагался метод сужения частотного диапазона речи путем равномерного деления его на ряд полос и передачи части каждой из них. Этот метод, как не учитывающий распределение речевой информации по частотному диапазону, приводит лишь к тому, что теряется информация и снижается помехозащищенность передачи.

Информационное сжатие (уменьшения объема) сигнала

Информационное сжатие (уменьшения объема) сигнала

Для информационного сжатия (уменьшения объема) сигнала применяется метод компрессии и последующего экспандирования (сокращенно, методыкомпандирования).

Используются непосредственные, параметрические и речеэлементные методы компандирования речевого сигнала. Непосредственные методы делятся на аналоговые и дискретные. Первые основаны на непосредственной компрессии объема речевого сигнала в передающей части тракта путем сжатия любого из входящих в (6.4) трех его измерений или любой из их комбинаций с восстановлением объема сигнала в этих измерениях на приемном конце тракта (в пределах возможностей соответствующего метода). Поэтому в передающей части тракта сигнал в соответствующих измерениях деформируется. При деформации сигнал подвергается искажениям, которые могут рассматриваться как своего рода помехи. Частично эти искажения могут быть скомпенсированы в приемной части тракта, а некоторые из них совсем не поддаются такой компенсации. Для всех методов компандирования характерно сохранение, в основном, микроструктуры речевого сигнала.

В соответствии с тем, по какому измерению объема сигнала происходит компандирование, оно подразделяется на компандирование динамического диапазона, частотного диапазона и временное компандирование.

К методам непосредственной компрессии аналогового речевого сигнала можно отнести и методы ограничения сигнала. При ограничении сигнала по динамическому или частотному диапазону, а также во времени некоторое количество информации исключается за счет выбрасывания отдельных участков частотного диапазона, ограничения громких звуков или исключения среднего (установившегося) временного участка длительных звуков речи. При жестком ограничении сигнала восстановить его на приемном конце, как правило, не удается, т.е. в этом случае имеет место компрессия сигналов, но невозможно его экспандирование.

К методам обработки и непосредственного компандирования речевого сигнала в дискретной форме относятся методы импульсно-кодовой модуляции (ИКМ) и дельта-модуляции (ДМ) в различных модификациях и комбинациях. Так как при двоичной системе кодирования амплитуда сигнала остается неизменной, при соответствующей компрессии речевого сигнала снижается или скорость, или время передачи сигнала. Тем самым уменьшается его объем с последующим его восстановлением на приемном конце.

Конечно, при этом в передающей части тракта возникают искажения, рассматриваемые как помехи, и сигнал не всегда может быть точно восстановлен. Существенным отличием непосредственных методов компандирования речевого сигнала в дискретной форме от других дискретных методов является то, что сигнал восстанавливается сам по себе, т.е. для восстановления сигнала достаточно иметь только последовательность импульсов без передачи какой-либо вспомогательной информации или управляющих сигналов.

Методы представления речевого сигнала

Методы представления речевого сигнала

Для повышения качества передачи речевых сообщений по сетям связи и обеспечения информационной безопасности функционирования таких сетей применяются методы преобразования речи.

Наиболее простыми являются методы прямого цифрового преобразования речевых сигналов, при которых каждый отсчет речевого сигнала формируется и преобразуется независимо от других. Поэтому такие способы кодирования иногда называются скалярными. К ним можно, в частности, отнести хорошо известные импульсно-кодовую модуляцию (ИКМ) или дельта-модуляцию (ДМ), а также их многочисленные разновидности.

Другими более сложными и эффективными являются способы представления речевых сигналов, при которых результирующие цифровые значения представлений вычисляются как функции от нескольких значений временной функции или, более точно, являются функционалами от временных функций, взятых на некотором участке анализа. Такие способы кодирования иногда называются векторными. К векторным относятся способы представления, использующие кратковременные амплитудные спектры, частотные (или полосовые) параметры речевых сигналов, коэффициенты линейного предсказания и некоторые другие.

Полное количество информации, содержащейся в непрерывном речевом сигнале, определяется его длительностью, шириной спектра и динамическим диапазоном. Естественно, не вся информация, заключенная в сигнале, полезна. Например, информация, заключенная в фазе речевого сигнала, не содержит сведений о звуках речи и не нужна для ее восприятия.

Динамический диапазон сигнала определяется соотношением пиковой мощности сигнала к минимальной или разностью их уровней есть объем сигнала.

1

Пропускная способность канала связи также определяется дли тельностью работы канала, полосой пропускаемых частот и динамическим диапазоном Vk = TkFkDk. В этом случае нижняя граница динамического диапазона определяется уровнем помех, а верхняя — перегрузкой канала связи.

2

Страница 2 из 212
Яндекс.Метрика