Низкоскоростные вокодеры используют параметрическое описание
речевых сигналов. Точность оценки параметров модели зависит от качества
исходного речевого сигнала и падает при уменьшении отношения сигнал/шум
(ОСШ) на входе вокодера. При этом качество и разборчивость выходной синтетической
речи сильно деградируют.
Разработанный алгоритм шумопонижения предназначен для
совместной работы с низкосокоростными параметрическими вокодерами (РПУ)
и дает заметный положительный эффект повышения качества и разборчивости
синтетической речи на выходе РПУ, зависящий от типа шумов, в диапазоне
входных отношений сигнал/шум (ОСШ) 0…+20 дБ.
Данный алгоритм очистки речи от шумов относится к адаптивным
алгоритмам шумоочистки с одним входом. Разделение речи и шумов с перекрывающимися
частотными спектрами проводится на основе адаптивной нелинейной фильтрации
в частотной области, построенной на статистических методах оценки амплитудного
спектра речи. Устройство адаптируется к спектральному составу шумового
сигнала и повышает контрастность спектра речевого сигнала так, чтобы улучшить
оценку параметров речи вокодером. При применении совместно с параметрическими
вокодерами алгоритм отличается малой дополнительно вносимой алгоритмической
задержкой.
Основным признаком, отличающим шум от речи является его
квазистационарность. Предполагается, что статистические характеристики
спектра шума изменяются медленнее, чем у спектра речи.
Оценка качества работы тандема (ШПВ+вокодер) проводилась
как субъективно, методом относительных сравнений, так и объективно, на
основе рекомендации ITU-T P.862 PESQ-MOS при испытаниях с различными низкоскоростными
вокодерами.
Испытания показали, что применение ШПВ на входе вокодера
при работе в шумах способно повысить качество и разборчивость синтетической
речи на выходе вокодера и, таким образом, обеспечить более надежную связь
в реальных условиях эксплуатации.
Алгоритм реализован в виде Си модели для ПЭВМ с файловым
вводом-выводом сигналов, а также в виде DLL для ОС WIN32, работающей в
реальном масштабе времени.
Многоканальная реализация для ЦПОС семейства TMS320C54x/C55x,
осуществляется под заказ.
По следующим звуковым файлам вы сможете оценить качество работы ШПВ совместно
с вокодером RMELP 4400 бит/с:
Шум автомобиля, ОСШ +12 дБ
Зашумленная речь
|
|
Речь на выходе РПУ 4400 бит/с без ШПВ |
|
Речь на выходе ШПВ + РПУ 4400 бит/с |
|
Шум автомобиля, ОСШ +9 дБ
Зашумленная речь |
|
Речь на выходе РПУ 4400 бит/с без ШПВ |
|
Речь на выходе ШПВ + РПУ 4400 бит/с |
|
Шум автомобиля, ОСШ +6 дБ
Зашумленная речь |
|
Речь на выходе РПУ 4400 бит/с без ШПВ |
|
Речь на выходе ШПВ + РПУ 4400 бит/с |
|
Шум автомобиля, ОСШ +3 дБ
Зашумленная речь |
|
Речь на выходе РПУ 4400 бит/с без ШПВ |
|
Речь на выходе ШПВ + РПУ 4400 бит/с |
|
|