logo search
Шпора по ЕЯИС, 2ой семестр (Головня) [8282 вопросов]

63. Методы анализа речевого сигнала.

Существует несколько методов анализа речевого сигнала. Каждый из методов предназначен для выделения в сплошном потоке речи некоторого определенного набора параметров, в которых заключается основная (смысловая) информация, а также отделения набора параметров, описывающих дополнительную информацию.

Для формирования параметрического описания речевых сигналов в современных системах распознавания речи широко используются, как правило, три основных метода спектрального анализа: • метод цифровой фильтрации; • метод быстрых алгоритмов преобразования Фурье; • метод, основанный на линейном предсказании речевого сигнала.

Метод цифровой фильтрации

В этом методе реализуется наиболее простой и понятный подход к спектральному разложению сигналов. Анализаторы, основанные на данном подходе, состоят из набора параллельно включенных цифровых полосовых фильтров, спектральные характеристики которых представляют собой узкие примыкающие друг к другу полосы, перекрывающие необходимый диапазон частот. Для получения спектра сигнала достаточно измерить значение мощности на выходе каждого фильтра и рассматривать их как точки спектра, соответствующие центральным частотам полос пропускания. Практически формирование вектора параметров в задачах распознавания речи осуществляется на основе способа «кадр-за-кадром» с их пошаговым перекрытием. Поскольку с каждым новым шагом изменяется только часть данных, такой способ сегментирования гарантирует отслеживание всех акустических явлений в речевом сигнале, обеспечивая в то же время достаточно плавное изменение параметров от выборки к выборке. Поэтому на выходе каждого канала «кадр-за-кадром» вычисляются оценки значений мощности, которые используются в качестве компонент вектора спектральных параметров описания речевых сигналов.

Спектральный анализ с использованием алгоритмов БПФ

Быстрое преобразование Фурье (БПФ) - это название целого ряда эффективных алгоритмов, предназначенных для вычисления дискретно-временного ряда Фурье. Основы построения таких алгоритмов, аппаратурная и программная реализация, а также принципы их применения для спектрального анализа подробно освещены в ряде работ. Поскольку, как правило, спектр дискретизируется с достаточно тонким разрешением, большое количество отсчетов спектра, получаемых с помощью алгоритмов БПФ, не позволяет использовать их напрямую в качестве параметров описания речевых сигналов и требует некоторой процедуры сглаживания, к примеру, в виде взвешенной суммы полученных значений спектральных плотностей мощности, лежащих внутри заданного «канального» диапазона частот. Поэтому на основе спектрального анализа через алгоритмы БПФ для формирования вектора параметров описания речевых сигналов обычно используют взвешенные поканальные значения мощности. Использование в распознавании речи гомоморфных параметров, к числу которых можно отнести кепстральные коэффициенты позволяет отделить сигнал возбуждения от формы голосового тракта. Кепстр преобразования Фурье представляет собой обратное преобразование Фурье от логарифма спектра.

Спектральный анализ на основе линейного предсказания

Рассмотрим метод коэффициентов линейного предсказания (КЛП или LPС). В этом методе анализа речевого сигнала используется мощная математическая теория, решающая задачу описания нуль-полюсной модели речевого сигнала. Основная идея – описание речевого спектра с помощью информации о нулях и полюсах, для этого используется аппарат дифференциальных уравнений и др. математика. Реальный алгоритм получения параметров описания на основе модели линейного предсказания коротко состоит в следующем. Предположим, что анализируемый случайный процесс является выходом фильтра, на вход которого поступает белый шум. Этот фильтр задается как рекурсивный фильтр с импульсной характеристикой бесконечной протяженности. В той мере, насколько справедлива эта модель, энергетический спектр сигнала описывается выражением

где T - частота дискретизации. Коэффициенты p, a[1], a[2], ..., a[m] определяются из решения уравнений Юла-Уолкера при помощи рекурсивного алгоритма Левинсона . Уравнения Юла-Уолкера для коэффициентов a[k], k=1,...,m совпадают с уравнениями, возникающими при постановке задачи линейного. Коэффициенты a[k], k=1,...,m называют коэффициентами линейного предсказания, а спектр, полученный методом авторегрессии, называется спектром линейного предсказания. Спектр линейного предсказания, также как и спектр БПФ, в явном виде при обработке речи не используется. Обычно диапазон частот спектра линейного предсказания разбивается на заданное число каналов. Для каждого канала рассчитывается средняя мощность. Эти значения мощности используются как коэффициенты вектора параметров. Коэффициенты линейного предсказания используются также для расчета кепстральных коэффициентов линейного предсказания.