65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
Рассмотрим метод коэффициентов линейного предсказания (КЛП или LPС). В этом методе анализа речевого сигнала используется мощная математическая теория, решающая задачу описания нуль-полюсной модели речевого сигнала. Основная идея – описание речевого спектра с помощью информации о нулях и полюсах, для этого используется аппарат дифференциальных уравнений и др. математика. Реальный алгоритм получения параметров описания на основе модели линейного предсказания коротко состоит в следующем. Предположим, что анализируемый случайный процесс является выходом фильтра, на вход которого поступает белый шум. Этот фильтр задается как рекурсивный фильтр с импульсной характеристикой бесконечной протяженности. В той мере, насколько справедлива эта модель, энергетический спектр сигнала описывается выражением
где T - частота дискретизации. Коэффициенты p, a[1], a[2], ..., a[m] определяются из решения уравнений Юла-Уолкера при помощи рекурсивного алгоритма Левинсона. Уравнения Юла-Уолкера для коэффициентов a[k], k=1,...,m совпадают с уравнениями, возникающими при постановке задачи линейного. Коэффициенты a[k], k=1,...,m называют коэффициентами линейного предсказания, а спектр, полученный методом авторегрессии, называется спектром линейного предсказания. Спектр линейного предсказания, также как и спектр БПФ, в явном виде при обработке речи не используется. Обычно диапазон частот спектра линейного предсказания разбивается на заданное число каналов. Для каждого канала рассчитывается средняя мощность. Эти значения мощности используются как коэффициенты вектора параметров. Коэффициенты линейного предсказания используются также для расчета кепстральных коэффициентов линейного предсказания. Вектор основных параметров, составленный на базе описанных выше методов не может исчерпывающим образом описать все возможные вариации речи. Несмотря на возможность управления разрешением спектра и увеличения числа кепстральных коэффициентов, это не приводит в конечном итоге к улучшению точности распознавания. Поскольку оценки спектра получаются достаточно сглаженными, увеличение разрешения спектра не дает новой существенной информации о сигнале, поэтому на практике используются не более 20 каналов. В качестве компонент вектора параметров обычно используются не более 14 первых кепстральных коэффициентов, поскольку более высокие коэффициенты практически нечувствительны к изменениям в сигнале. Ранее уже отмечалось, что при покадровой сегментации для упрощения вычисления векторы параметров разных окон считаются независимыми друг от друга, тем самым теряется информация о динамике речевых характеристик. Однако такая информация может быть восстановлена путем аппроксимации производной каждого параметра конечной разностью по нескольким последовательным выборкам речевого сигнала. Полученные таким образом величины, являющиеся по сути производными от основных параметров, позволяют добавить весьма важную информацию в вектор параметров и носят название дельта-параметров. Если вектор параметров обозначить как , где - компоненты вектора речевых параметров, d – размерность вектора, а вектор параметров для n-го окна как , то последовательность X векторов параметров при покадровой обработке есть . Таким образом, при помощи рассмотренных выше алгоритмов на выходе блока параметрического описания речевого сигнала формируется последовательность X векторов параметров описания речевого сигнала.
Yandex.RTB R-A-252273-3- 1. Фонетическое членение речи.
- 2. Звуки. Артикуляционный аспект звуков речи.
- 3. Артикуляционная характеристика звуков.
- 4. Гласные звуки. Классификация гласных звуков.
- 5. Согласные звуки. Классификация согласных звуков.
- 6. Акустический аспект звуков речи. Качественные характеристики звуков.
- 7. Функциональный аспект звуков речи (фонология). Понятие о фонеме.
- 8. Система фонем в современном русском языке.
- 9. Фонологические позиции. Сильные и слабые фонемы.
- 10. Позиционные чередования гласных фонем. Количественная и качественная редукция гласных фонем.
- 11. Позиционные чередования согласных фонем. Ассимиляция и диссимиляция по глухости/звонкости и по твердости/мягкости.
- 12. Исторические чередования фонем.
- 13. Падение редуцированных гласных фонем и последствия этого явления.
- 14. Чередования, связанные с историей носовых звуков в древнерусском языке.
- 15. Палатализация заднеязычных.
- 17. Фонетическая транскрипция. Фонематическая транскрипция
- 18. Слог. Слогораздел. Типы слогов.
- 19. Фонетическое слово. Ударение
- 20. Речевой такт. Интонация
- 21. Ударение. Интонационные конструкции
- 21. Фраза. Интонация
- 22. Понятие об орфоэпии
- 23. Основные правила русского литературного произношения.
- 24. Произношение гласных под ударением. Произношение безударных гласных.
- 25. Произношение отдельных согласных звуков.
- 26. Произношение групп согласных.
- 27. Произношение некоторых грамматических форм.
- 28. Произношение некоторых аббревиатур. Особенности произношения иноязычных слов.
- 29. Трудные случаи усвоения ударения в русском языке.
- 30. Развитие русского литературного произношения.
- 31. Грамматическое кодирование
- 32. Семантическое кодирование. Двухаргументные (временные признаки): причинность.
- 33. Семантическое кодирование. Двухаргументные (временные признаки): следствие, результат, цель.
- 34. Семантическое кодирование. Двухаргументные (временные признаки): превращение, изменение
- 35. Семантическое кодирование. Двухаргументные (временные признаки): взаимодействие, группировка, общность, объединение
- 36. Семантическое кодирование. Двухаргументные (временные признаки): разделение, влияние, условие, вхождение.
- 37. Семантическое кодирование. Двухаргументные (временные признаки): соответствие, управление, подчинение, зависимость.
- 38. Семантическое кодирование. Одноаргументные (постоянные признаки):свойство, необходимость, возможность, вероятность, есть, нет.
- 39. Семантическое кодирование. Одноаргументные (постоянные признаки): истинность, ложность.
- Семантический код. Его цели. Предназначение. Принцип построения. Возможности.
- Предназначение семантического кода. Термин «смысл».
- Предназначение семантического кода. Текст. Информация. Гипертекст в освоении информации.
- 43. Грамматический и семантический анализ при семантическом кодировании.
- 44. Русский семантический словарь сочетаемости и ассоциативный словарь при семантическом кодировании.
- Предназначение семантического кода. Системный изоморфизм.
- Предназначение семантического кода. Принцип необходимого и достаточного.
- Предназначение семантического кода. Связность классов и подклассов
- 48. Предназначение семантического кода. Принцип иерархичности/ неиерархичности.
- 49. Предназначение семантического кода. Системная метафоричность.
- 50. Ситуативный (ситуационный) семантический код.
- 51. Семантическое кодирование. Выравнивающе-толковательный код. Матрешный код.
- 52. Основные задачи и ключевые понятия речевого интерфейса.
- 53. Исторический обзор проблемы распознавания и синтеза речи.
- 54. Системы автоматического синтеза речи. Практические приложения речевого интерфейса.
- 55. Системы автоматического распознавания речи. Практические приложения речевого интерфейса.
- 56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
- 57. Структура речевого сигнала. Анализ и синтез. Спектрально-временные характеристики речевого сигнала.
- 58. Информационная и модуляционная структура речевого сигнала.
- 59. Методы синтеза речевого сигнала. Обобщенные математические модели описания речевых сигналов.
- 60. Методы синтеза речевого сигнала. Геометрическая модель речевого тракта.
- 61. Методы синтеза речевого сигнала. Формантная модель.
- 62. Компиляционные методы синтеза речевого сигнала.
- 63. Методы анализа речевого сигнала.
- 64. Метод цифровой фильтрации речевого сигнала. Спектральный анализ с использованием алгоритмов бпф. Метод цифровой фильтрации
- Спектральный анализ с использованием алгоритмов бпф
- 65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
- Формантно-параметрическое описание речевого сигнала
- 66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
- 67. Свойства рецептивного восприятия речевых сигналов. Природа слуховых (фонетических) признаков речевого сигнала. Свойства рецептивного восприятия речевых сигналов
- Природа слуховых (фонетических) признаков речевого сигнала
- 68. Свойства восприятия минимальных смыслоразличительных элементов речи
- 69. Синтез речи по тексту. Структура синтезатора речи по тексту.
- Структура синтезатора речи по тексту Ключевые понятия:
- 70. Лингвистический процессор. Предварительная обработка текста. Пофразовая обработка текста.
- Предварительная обработка текста
- Пофразовая обработка текста
- 71. Пословная обработка теста. Пример работы лингвистического процессора. Пословная обработка текста
- Пример работы лингвистического процессора
- 72. Просодический процессор
- 73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
- 74. Аллофонный фонетический процессор. Акустический процессор.
- 75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.
- 76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.
- 77. Классификация методов распознавания речи.
- 78. Метод динамического программирования.
- 79. Метод скрытых марковских моделей.
- 80. Структурно-экспертные методы распознавания речи. Экспертный подход к фонемному распознаванию речи.
- 81. Проблемы обучения в распознавании речи и методы создания эталонных слов. Метод создания многокластерных эталонов речи.
- 82.Проблема плотных упаковок. Формульное представление знаний как вариант плотных упаковок.