66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
Еще одним активно используемым в настоящее время методом анализа РС является метод кепстральных коэффициентов (рис.). Слово "CEPSTRUM" произошло от слова "SPECTRUM" и вторично по отношению к нему. Так как при спектрально-полосном кодировании берутся отдельные отсчеты спектра (рис. а), а при кепстральном кодировании применяется вторичное разложение отсчетов спектра в ряд Фурье, рассматриваются синусоиды для каждого отсчета (рис.б,в) и рассчитываются спектральные коэффициенты (Cn) для каждого отсчета (Si) по формуле
|
Особенности восприятия речи:
Еще одним очень важным направлением исследований особенностей естественной речи является исследование вопросов восприятия речи человеком. Результаты, полученные в этом направлении, могут оказать важное влияние на разработку методов автоматического распознавания речи. Самым любопытным в данных исследованиях является тот факт, что человек умеет слышать и воспринимать речь в различных условиях и в разных состояниях. Слух человека способен отличить речь от других звуков, которые его окружают. При этом решается самая главная задача – понимание. Кроме того, слух человека и его способность слушать и понимать услышанное является результатом высшей нервной деятельности, присущей только разумному существу.
Свойства рецептивного восприятия речевых сигналов
Слуховой аппарат человека, как известно, способен воспринимать и анализировать акустические сигналы, существенно отличные от речевых как по динамическому и частотному диапазонам, так и по своей природе. Поскольку в силу эволюционного развития речь появилась на более поздних его этапах, можно ожидать, что для восприятия акустических сигналов самого различного происхождения слуховой анализатор должен обладать некоторыми универсальными свойствами. И действительно, как показали опыты по восприятию, слуховой анализатор одинаково хорошо справляется с анализом как коротких (импульсных), так и длительных сигналов, как чистых тонов, так и сложных сигналов, как стационарных, так и изменяющихся во времени (модулированных) сигналов. Одним из важных проявлений универсальности слухового анализатора состоит в том, что он обладает высокой разрешающей способностью как по частоте, так и по времени. Высокая разрешающая способность по времени указывает на то, что частотная избирательная система слухового анализатора на первичном (рецепторном) этапе восприятия должна быть эквивалентна набору широкополосных фильтров. И действительно, снятые экспериментально амплитудно-частотные характеристики основной мембраны обнаружили низкую (порядка единицы) добротность избирательных фильтров слухового анализатора. Было установлено, что основная мембрана эквивалентна анализатору спектра с малой разрешающей способностью по частоте, но с высокой разрешающей способностью по времени. Высокую разрешающую способность по частоте слуховой анализатор приобретает на последующих этапах обработки информации, на нейронном уровне. При этом возможны различные механизмы повышения разрешающей способности по частоте - как путем обострения частотных характеристик основной мембраны, так и путем оценки величин, обратных интервалу времени между импульсами возбуждения нейронов, т.е. путем временного анализа функций возбуждения эквивалентных фильтров основной мембраны. Последнее предполагает запоминание прошлых значений сигналов возбуждения основной мембраны на некоторое время. Хотя из-за методологических трудностей прямых доказательств этого получить не удалось, но изученные свойства слуховосприятия хорошо согласуются с гипотезой о существовании такого механизма. Таким образом, накопленные данные о свойствах слухового анализатора свидетельствуют в пользу того, что: • на первом рецептивной уровне (уровне ощущения) используется полное описание акустического сигнала в виде несглаженных частотно-временных функций возбуждения основной мембраны, запоминаемые в кратковременной оперативной памяти с временным окном порядка 70-150 мсек, т.е. описание сигнала в виде спектрально-временного рельефа, образующегося с помощью гребенки широкополосных фильтров основой мембраны; • в зависимости от того, какая решается задача – сравнение сигналов (установление тождества или различия, определение степени сходства сигналов) или оценка сигнала (отнесение его к какой-либо группе сигналов, выбор формы реагирования на сигналы той или иной группы) – используется, соответственно, или полное спектрально-временное описание сигналов, или их сокращенное описание в терминах параметров и признаков спектрально-временного описания, полезных в данной ситуации; • переход к сокращенному описанию сигналов по полезным параметрам и признакам относится к следующему за перцептивным этапом обработки информации, а сами параметры и признаки – к приобретенным в процессе обучения.
- 1. Фонетическое членение речи.
- 2. Звуки. Артикуляционный аспект звуков речи.
- 3. Артикуляционная характеристика звуков.
- 4. Гласные звуки. Классификация гласных звуков.
- 5. Согласные звуки. Классификация согласных звуков.
- 6. Акустический аспект звуков речи. Качественные характеристики звуков.
- 7. Функциональный аспект звуков речи (фонология). Понятие о фонеме.
- 8. Система фонем в современном русском языке.
- 9. Фонологические позиции. Сильные и слабые фонемы.
- 10. Позиционные чередования гласных фонем. Количественная и качественная редукция гласных фонем.
- 11. Позиционные чередования согласных фонем. Ассимиляция и диссимиляция по глухости/звонкости и по твердости/мягкости.
- 12. Исторические чередования фонем.
- 13. Падение редуцированных гласных фонем и последствия этого явления.
- 14. Чередования, связанные с историей носовых звуков в древнерусском языке.
- 15. Палатализация заднеязычных.
- 17. Фонетическая транскрипция. Фонематическая транскрипция
- 18. Слог. Слогораздел. Типы слогов.
- 19. Фонетическое слово. Ударение
- 20. Речевой такт. Интонация
- 21. Ударение. Интонационные конструкции
- 21. Фраза. Интонация
- 22. Понятие об орфоэпии
- 23. Основные правила русского литературного произношения.
- 24. Произношение гласных под ударением. Произношение безударных гласных.
- 25. Произношение отдельных согласных звуков.
- 26. Произношение групп согласных.
- 27. Произношение некоторых грамматических форм.
- 28. Произношение некоторых аббревиатур. Особенности произношения иноязычных слов.
- 29. Трудные случаи усвоения ударения в русском языке.
- 30. Развитие русского литературного произношения.
- 31. Грамматическое кодирование
- 32. Семантическое кодирование. Двухаргументные (временные признаки): причинность.
- 33. Семантическое кодирование. Двухаргументные (временные признаки): следствие, результат, цель.
- 34. Семантическое кодирование. Двухаргументные (временные признаки): превращение, изменение
- 35. Семантическое кодирование. Двухаргументные (временные признаки): взаимодействие, группировка, общность, объединение
- 36. Семантическое кодирование. Двухаргументные (временные признаки): разделение, влияние, условие, вхождение.
- 37. Семантическое кодирование. Двухаргументные (временные признаки): соответствие, управление, подчинение, зависимость.
- 38. Семантическое кодирование. Одноаргументные (постоянные признаки):свойство, необходимость, возможность, вероятность, есть, нет.
- 39. Семантическое кодирование. Одноаргументные (постоянные признаки): истинность, ложность.
- Семантический код. Его цели. Предназначение. Принцип построения. Возможности.
- Предназначение семантического кода. Термин «смысл».
- Предназначение семантического кода. Текст. Информация. Гипертекст в освоении информации.
- 43. Грамматический и семантический анализ при семантическом кодировании.
- 44. Русский семантический словарь сочетаемости и ассоциативный словарь при семантическом кодировании.
- Предназначение семантического кода. Системный изоморфизм.
- Предназначение семантического кода. Принцип необходимого и достаточного.
- Предназначение семантического кода. Связность классов и подклассов
- 48. Предназначение семантического кода. Принцип иерархичности/ неиерархичности.
- 49. Предназначение семантического кода. Системная метафоричность.
- 50. Ситуативный (ситуационный) семантический код.
- 51. Семантическое кодирование. Выравнивающе-толковательный код. Матрешный код.
- 52. Основные задачи и ключевые понятия речевого интерфейса.
- 53. Исторический обзор проблемы распознавания и синтеза речи.
- 54. Системы автоматического синтеза речи. Практические приложения речевого интерфейса.
- 55. Системы автоматического распознавания речи. Практические приложения речевого интерфейса.
- 56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
- 57. Структура речевого сигнала. Анализ и синтез. Спектрально-временные характеристики речевого сигнала.
- 58. Информационная и модуляционная структура речевого сигнала.
- 59. Методы синтеза речевого сигнала. Обобщенные математические модели описания речевых сигналов.
- 60. Методы синтеза речевого сигнала. Геометрическая модель речевого тракта.
- 61. Методы синтеза речевого сигнала. Формантная модель.
- 62. Компиляционные методы синтеза речевого сигнала.
- 63. Методы анализа речевого сигнала.
- 64. Метод цифровой фильтрации речевого сигнала. Спектральный анализ с использованием алгоритмов бпф. Метод цифровой фильтрации
- Спектральный анализ с использованием алгоритмов бпф
- 65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
- Формантно-параметрическое описание речевого сигнала
- 66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
- 67. Свойства рецептивного восприятия речевых сигналов. Природа слуховых (фонетических) признаков речевого сигнала. Свойства рецептивного восприятия речевых сигналов
- Природа слуховых (фонетических) признаков речевого сигнала
- 68. Свойства восприятия минимальных смыслоразличительных элементов речи
- 69. Синтез речи по тексту. Структура синтезатора речи по тексту.
- Структура синтезатора речи по тексту Ключевые понятия:
- 70. Лингвистический процессор. Предварительная обработка текста. Пофразовая обработка текста.
- Предварительная обработка текста
- Пофразовая обработка текста
- 71. Пословная обработка теста. Пример работы лингвистического процессора. Пословная обработка текста
- Пример работы лингвистического процессора
- 72. Просодический процессор
- 73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
- 74. Аллофонный фонетический процессор. Акустический процессор.
- 75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.
- 76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.
- 77. Классификация методов распознавания речи.
- 78. Метод динамического программирования.
- 79. Метод скрытых марковских моделей.
- 80. Структурно-экспертные методы распознавания речи. Экспертный подход к фонемному распознаванию речи.
- 81. Проблемы обучения в распознавании речи и методы создания эталонных слов. Метод создания многокластерных эталонов речи.
- 82.Проблема плотных упаковок. Формульное представление знаний как вариант плотных упаковок.