logo
Шпора по ЕЯИС, 2ой семестр (Головня) [8282 вопросов]

65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания

Рассмотрим метод коэффициентов линейного предсказания (КЛП или LPС). В этом методе анализа речевого сигнала используется мощная математическая теория, решающая задачу описания нуль-полюсной модели речевого сигнала. Основная идея – описание речевого спектра с помощью информации о нулях и полюсах, для этого используется аппарат дифференциальных уравнений и др. математика. Реальный алгоритм получения параметров описания на основе модели линейного предсказания коротко состоит в следующем. Предположим, что анализируемый случайный процесс является выходом фильтра, на вход которого поступает белый шум. Этот фильтр задается как рекурсивный фильтр с импульсной характеристикой бесконечной протяженности. В той мере, насколько справедлива эта модель, энергетический спектр сигнала описывается выражением

где T - частота дискретизации. Коэффициенты p, a[1], a[2], ..., a[m] определяются из решения уравнений Юла-Уолкера при помощи рекурсивного алгоритма Левинсона. Уравнения Юла-Уолкера для коэффициентов a[k], k=1,...,m совпадают с уравнениями, возникающими при постановке задачи линейного. Коэффициенты a[k], k=1,...,m называют коэффициентами линейного предсказания, а спектр, полученный методом авторегрессии, называется спектром линейного предсказания. Спектр линейного предсказания, также как и спектр БПФ, в явном виде при обработке речи не используется. Обычно диапазон частот спектра линейного предсказания разбивается на заданное число каналов. Для каждого канала рассчитывается средняя мощность. Эти значения мощности используются как коэффициенты вектора параметров. Коэффициенты линейного предсказания используются также для расчета кепстральных коэффициентов линейного предсказания.  Вектор основных параметров, составленный на базе описанных выше методов не может исчерпывающим образом описать все возможные вариации речи. Несмотря на возможность управления разрешением спектра и увеличения числа кепстральных коэффициентов, это не приводит в конечном итоге к улучшению точности распознавания. Поскольку оценки спектра получаются достаточно сглаженными, увеличение разрешения спектра не дает новой существенной информации о сигнале, поэтому на практике используются не более 20 каналов. В качестве компонент вектора параметров обычно используются не более 14 первых кепстральных коэффициентов, поскольку более высокие коэффициенты практически нечувствительны к изменениям в сигнале. Ранее уже отмечалось, что при покадровой сегментации для упрощения вычисления векторы параметров разных окон считаются независимыми друг от друга, тем самым теряется информация о динамике речевых характеристик. Однако такая информация может быть восстановлена путем аппроксимации производной каждого параметра конечной разностью по нескольким последовательным выборкам речевого сигнала. Полученные таким образом величины, являющиеся по сути производными от основных параметров, позволяют добавить весьма важную информацию в вектор параметров и носят название дельта-параметров.  Если вектор параметров обозначить как , где - компоненты вектора речевых параметров, d – размерность вектора, а вектор параметров для n-го окна как , то последовательность X векторов параметров при покадровой обработке есть . Таким образом, при помощи рассмотренных выше алгоритмов на выходе блока параметрического описания речевого сигнала формируется последовательность X векторов параметров описания речевого сигнала.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4