PHRASE researh group
     
технологии

SpyLOG

NPES вокодер

Алгоритм анализа/синтеза речи, основанный на "натуральной" модели речевого тракта. В этой модели локально-постоянными параметрами речевого сигнала являются: частота основного тона, частота вокализованности, частоты и амплитуды формант. Такая параметризация позволяет использовать NPES вокодер в качестве единого алгоритма предварительной обработки цифрового сигнала для задач сжатия, идентификации и распознавания речи. подробнее

Характеристики NPES вокодера

  • Класс сигналов - речь одного диктора.
  • Частота дискретизации - до 16 КГц.
  • Полоса частот формант - 80..3800 Гц.
  • Полоса частоты основного тона - 50..Fs/2 Гц.
  • Скорость передачи речи - фиксированная в диапазоне 800..2400 бит/сек.
  • Качество передачи речи - 2.6..3.6 MOS.
  • Задержка обработки - 25 миллисекунд.
  • Встроенная адаптивная фильтрация шума.
  • Преобразование параметров речи.
  • Устойчивость к ошибкам в канале передачи.
  • Возможность аппаратной реализации синтезатора.
  • Алгоритм реализован на ANSI C++ в виде SDK для процессоров с плавающей арифметикой.

Область применения NPES вокодера

  • Сжатие речи для передачи и хранения.
  • Преобразование речи. С помощью программы VoiceVary можно в реальном времени изменять высоту голоса и размеры речевого тракта.
  • Синтез речи по тексту.
  • Распознавание речи.
  • Идентификация диктора.
  • Определение частоты основного тона. С помощью программы Fork можно настраивать музыкальные инструменты.

ADSS фильтр

Алгоритм адаптивной цифровой фильтрации звуковых сигналов, основанный на различии в динамике изменений частотных характеристик полезного сигнала и шума. ADSS фильтр способен выделять широкий класс полезных сигналов из смеси с аддитивной гармонической и стохастической помехой произвольной окраски. подробнее

Характеристики ADSS фильтра

  • Класс сигналов - речь, музыка.
  • Частота дискретизации - до 44 КГц.
  • Подавление белого шума - до 10 дБ.
  • Подавление одиночного тона - до 20 дБ.
  • Задержка обработки - 20 msec.
  • Алгоритм реализован на ANSI C,C++ в виде SDK для процессоров с плавающей и целочисленной арифметикой и готов для переноса на любые платформы.

Область применения ADSS фильтра

  • Получение качественных звукозаписей. С помощью программы SoundClear можно получать качественный звук на обычном компьютере без использования студийного оборудования.
  • Системы передачи звуковых сигналов. (телефония, радио и телевидение)
  • Предварительная обработка для задач сжатия, идентификации и распознавания речи.


Все представленные технологии являются оригинальными разработками нашей группы и по многим характеристикам превосходят существующие аналоги. Они находятся в состоянии развития и имеют потенциал для улучшения.

 

технологии | программы | статьи | ссылки | о нас | NPES вокодер | NPES SDK | ADSS фильтр | ADSS SDK | Fork | VoiceVary | SoundClear | P861 | P56 |

© Phrase Research Group, 2002 © Phrase Art, 2002