Формантные вокодеры

Формантные вокодеры

В них спектральная огибающая речевого сигнала аппроксимируется комбинацией нескольких простых резонансных кривых. Принципы построения формантного вокодера во многом аналогичны принципам естественного речеобразования и восприятия речи.

Поскольку речевой тракт представляет собой комплекс резонаторов, резонансные частоты и добротности которых изменяются во времени в соответствии с управляющими сигналами, то и в формантном вокодере происходит выделение из речи управляющих сигналов, которые на приеме воздействуют на резонансные контуры и приближенно воспроизводят передаваемую огибающую спектра. Такими управляющими сигналами могут быть: частоты формант, номер форманты, амплитуды формант, ширина их спектра на уровне 3 дБ. Существует много способов выделения формантных частот.

Некоторые из них зависят даже от различных априорных определений понятия «формантная частота».

Для глухих звуков речи вместо форматных функций используются меняющиеся во времени нулевой, первый и второй моменты частотного спектра (i = 1,2,3):

Формантные вокодеры

style="display:block; text-align:center;"
data-ad-layout="in-article"
data-ad-format="fluid"
data-ad-client="ca-pub-6007240224880862"
data-ad-slot="8925203109">

где интегрирование ведется по первой, второй или третьей формантным областям. При реальных вычислениях, конечно, интегрирование заменяется суммированием и некоторым шагом по t.

Таким образом, при использовании формантного вокодера по каналу связи нужно передать дискретизированные по времени и квантованные по амплитуде величины: сигналы тон-шум, значения частоты основного тона и девять функций.

Учитывая плавность изменения во времени выше перечисленных сигнальных параметров параметров, дискретизацию можно проводить с частотой 40 Гц, квантование в среднем 16 уровнями (4 бита), а частоты основного тона — 128 уровнями (7 бит), что в сумме потребует канала связи с пропускной способностью, равной 1700 бит/с.

На одном из вокодеров формантного типа со скоростью 1200 бит/с получена слоговая разборчивость 80...82 %. Разборчивость речи при использовании формантных вокодеров и передаче со скоростью 2400 бит/с превышает разборчивость обычной телефонной связи.

На приемном конце линии связи при восстановлении (синтезе) речи, применяются управляемые формантные контуры, генератор шума, модуляторы, сумматоры.

Яндекс.Метрика