English version

ШПВ - Очистка речи от шумов для низкоскоростных вокодеров

Общее описание

Низкоскоростные вокодеры используют параметрическое описание речевых сигналов. Точность оценки параметров модели зависит от качества исходного речевого сигнала и падает при уменьшении отношения сигнал/шум (ОСШ) на входе вокодера. При этом качество и разборчивость выходной синтетической речи сильно деградируют.

Разработанный алгоритм шумопонижения предназначен для совместной работы с низкосокоростными параметрическими вокодерами (РПУ) и дает заметный положительный эффект повышения качества и разборчивости синтетической речи на выходе РПУ, зависящий от типа шумов, в диапазоне входных отношений сигнал/шум (ОСШ) 0…+20 дБ.

Данный алгоритм очистки речи от шумов относится к адаптивным алгоритмам шумоочистки с одним входом. Разделение речи и шумов с перекрывающимися частотными спектрами проводится на основе адаптивной нелинейной фильтрации в частотной области, построенной на статистических методах оценки амплитудного спектра речи. Устройство адаптируется к спектральному составу шумового сигнала и повышает контрастность спектра речевого сигнала так, чтобы улучшить оценку параметров речи вокодером. При применении совместно с параметрическими вокодерами алгоритм отличается малой дополнительно вносимой алгоритмической задержкой.

Основным признаком, отличающим шум от речи является его квазистационарность. Предполагается, что статистические характеристики спектра шума изменяются медленнее, чем у спектра речи.

Оценка качества работы тандема (ШПВ+вокодер) проводилась как субъективно, методом относительных сравнений, так и объективно, на основе рекомендации ITU-T P.862 PESQ-MOS при испытаниях с различными низкоскоростными вокодерами.

Испытания показали, что применение ШПВ на входе вокодера при работе в шумах способно повысить качество и разборчивость синтетической речи на выходе вокодера и, таким образом, обеспечить более надежную связь в реальных условиях эксплуатации.

[наверх] [на главную]

Реализация

Алгоритм реализован в виде Си модели для ПЭВМ с файловым вводом-выводом сигналов, а также в виде DLL для ОС WIN32, работающей в реальном масштабе времени.

Многоканальная реализация для ЦПОС семейства TMS320C54x/C55x, осуществляется под заказ.

[наверх] [на главную]

Звук

По следующим звуковым файлам вы сможете оценить качество работы ШПВ совместно с вокодером RMELP 4400 бит/с:

Шум автомобиля, ОСШ +12 дБ

Зашумленная речь

fspeech.wav

Речь на выходе РПУ 4400 бит/с без ШПВ

fspeech.wav

Речь на выходе ШПВ + РПУ 4400 бит/с

fspeech.wav

Шум автомобиля, ОСШ +9 дБ

Зашумленная речь

fspeech.wav

Речь на выходе РПУ 4400 бит/с без ШПВ

fspeech.wav

Речь на выходе ШПВ + РПУ 4400 бит/с

fspeech.wav

Шум автомобиля, ОСШ +6 дБ

Зашумленная речь

fspeech.wav

Речь на выходе РПУ 4400 бит/с без ШПВ

fspeech.wav

Речь на выходе ШПВ + РПУ 4400 бит/с

fspeech.wav

Шум автомобиля, ОСШ +3 дБ

Зашумленная речь

fspeech.wav

Речь на выходе РПУ 4400 бит/с без ШПВ

fspeech.wav

Речь на выходе ШПВ + РПУ 4400 бит/с

fspeech.wav

[наверх] [на главную]

Навигация

Общее описание

Реализация

Звук


По вопросам приобретения библиотек, исходных текстов программ или реализаций готовых устройств пожалуйста обращайтесь по e-mail:

e-mail в графическом файле

Подробная контактная информация представлена в разделе "О Центре"

Copyright © 1999-2012, Центр ЦОС СПб ГУТ