Методы функционального преобразования речевого сигнала

А. Параметрические системы на основе использования полосовых вокодеров
Принцип работы параметрических систем основан на замене речи ее параметрами, в качестве которых используются уровни в узких полосах частотного диапазона. Число полос (каналов), на которые разбивается весь диапазон речи набором фильтров первоначально равнялось десяти (Дадли 1939 г.). Анализ речи с целью выделения информационных параметров и синтез речи производится в устройствах, называемых вокодерами. В последующем стали использоваться 16-ти канальные вокодеры.
Структурно спектрально-полосовой вокодер можно представить рисунком.

Сигналы на выходе амплитудных детекторов (D1, … Dn) определяют средний уровень речи в соответствующей полосе частот. По этим данным восстанавливается СПМ речи на ПРМ стороне. ГИ создает сигнал со спектром, который аналогичен спектру голосовых связок (звонкие звуки).  Частота следования импульсов изменяется по закону основного тона (характеризует высоту голоса – «узнаваемость голоса»). Это обеспечивает более естественное звучание речи. ГШ формирует сигнал со спектром, аналогичным спектру глухих согласных звуков. Тон/шум (Т/Ш)  различает звонкие и глухие звуки и в зависимости от  этого коммутирует генератор импульсов или генератор шума.
Полосовые вокодеры обеспечивают 8-10 кратное сжатие полосы занимаемых частот при достаточно высокой разборчивости речи. В упрощенных вокодерах исключают канал передачи сигнала с частотой основного тона, но при этом речь звучит монотонно.
Б. Формантный вокодер
Как отмечено, основная часть спектра речевого сообщения определяется формантами (энергия участка спектра), которые расположены в области 300-3400 Гц. Число формант определяет своеобразие голоса. Принцип работы систем с использованием формантных вокодеров основан на замене речи ее уровнями полос частотного диапазона, соответствующих формантам. Структурная схема подобна частотно-полосовому вокодеру: используется фильтр основного тона (до 350 Гц), фильтр первой форманты (300-1000 Гц), фильтр второй форманты (700-2400 Гц) и фильтр третьей форманты (2400-3500 Гц). Кроме того имеется устройство выделения глухих звуков. На выходе фильтров используются амплитудные детекторы (для определения уровней) и частотные детекторы. В силу многомодальности спектра в каждой форманте, используют дальнейшее разделение формантных областей фильтрами. Общее число достигает до 36. При этом используется электронная схема искателя максимального напряжения.
Формантные вокодеры по сравнению с полосовыми требуют меньшую полосу частот.
В. Фонемные системы связи
В фонемном вокодере в качестве параметров используются фонемы – фонетические элементы речи, т.е. типизированные звуки, освобожденные от индивидуальных особенностей говорящего и служащие основным признаком для различения слов данного языка. Принципиальное функционирование основано на распознавании звуков речи и передаче по КС цифровых сигналов, соответствующих этим звукам. Фонемный вокодер может использоваться для непосредственного общения человека с ЭВМ.


Вход в систему

Новости

  • Смог над землею

  • Селигер 2009

  • Мотопарапланы

  • Графический язык ДРАКОН

  • Apple iPhone

Новые пользователи

  • Melbafikl
  • radiopodarok
  • korovvinals
  • stock847
  • arvelhyt

Партнеры

Навигация по подшивке