ГЛАВНАЯ | РАЗРАБОТКИ | ИССЛЕДОВАНИЯ | ОБУЧЕНИЕ | О ЦЕНТРЕ | ENGLISH VERSION |
Вокодер LPC1200 на 1.2 кбит/с Разработчики для скорости 1200 бит/с выбрали вокодер с линейным предсказанием. Структурно вокодер состоит из двух частей. Первая часть - анализатор, функции которого заключаются в выделении текущих параметров речевого сигнала и их упаковке в кадр соответствующего формата. Вторая часть - синтезатор по принятому кадру восстанавливает с некоторой ошибкой параметры текущего фрагмента сигнала и с их помощью воспроизводит синтетическую речь. Цифровой сигнал поступает на предыскажающий фильтр (1-0.9375*z-1) и далее из него посредством полусинхронной с основным тоном процедуры выделяется фрагмент анализа. Предыскажение, кроме компенсации высокочастотной части спектра речевого сигнала, служит для снижения необходимой точности вычислений. Полусинхронная с основным тоном процедура выделения фрагмента анализа заключается во взвешивании фрагмента треугольным окном переменной длины, зависящей от текущего основного тона. Треугольное окно в данном варианте алгоритма располагается в центре фрагмента. После получения фрагмента анализа коэффициенты линейного предсказания вычисляются путем использовани ковариационного метода. Выбор ковариационного метода (среди двух возможных: автокорреляционного и ковариационного) обусловлен тем, что длина фрагмента анализа определяется основным тоном, а при возможных малых значениях длины фрагмента автокорреляционный метод даст значительные искажения текущего спектра сигнала. Оценка периода основного тона производится по алгоритму, основанному на базе метода Голда-Рабинера. В канал связи передаются квантованные логарифмы отношени площадей (LAR). При этом квантование производится по неравномерным квантователям. Значение LAR1 на вокализованных и шумовых фрагментах квантуются различными квантователями. В синтезаторе производится задержка на 1 кадр, поэтому сглаживание канальных ошибок производится на основе принятых параметров из трех текущих кадров - прошлого, настоящего и будущего. Степень сглаживани параметров зависит от числа детектированных канальных ошибок. При увеличении числа ошибок в канале степень сглаженности возрастает. Сглаженные параметры после интерполяции поступают на синтезирующий фильтр. В настоящем алгоритме приняты следующие правила для интерполяции:
В качестве возбуждения на невокализованных фрагментах используется белый шум, а на вокализованных - импульсный отклик фазового звена. Синтезирующий фильтр реализуется в прямом виде. Его коэффициенты представлены с 16-разрядной точностью. Выходной сигнал пропускается через фильтр, обратный предыскажающему, и после цифро-аналогового преобразовани синтетический сигнал поступает на выход. Более подробное описание алгоритма
речевого кодирования LPC1200 на скорости 1200 бит/с можно найти в:
Реализация для ЦПОС семейства TMS320C3x Алгоритм реализован для ЦПОС семейства TMS320C3x фирмы Texas Instruments. Реализация удовлетворяет следующим требованиям:
Ресурсоемкость реализации для TMS320C3x
Звук По следующим звуковым файлам вы сможете оценить качество алгоритма LPC1200:
Документация Можно получить подробную документацию по представленным
реализациям алгоритма LPC1200, описание API реализации, подробные инструкции
по встраиванию алгоритма в систему обработки речевых сигналов: |
Навигация По вопросам приобретения библиотек, исходных текстов программ или реализаций готовых устройств на основе малогабаритных DSP модулей обращайтесь по e-mail:
Подробная контактная информация представлена в разделе "О Центре" |
Copyright © 1999-2009, Центр ЦОС СПб ГУТ |
|