68. Свойства восприятия минимальных смыслоразличительных элементов речи
Свойства восприятия минимальных смыслоразличительных элементов речи
Признаки, свойственные минимальным смыслоразличительным элементам речи – фонемам, составляют основу для первичного их восприятия (текущего фонемного кодирования речевого сигнала, допускающего исправление ошибочных фонемных решений на последующих уровнях восприятия речи). Свойства восприятия на этом этапе говорят о том, что информация о фонемных образах распределена во времени. При этом группам звуков присущи свои особенности распределения во времени. Если условно принять фразу смыкания артикуляторов при образовании звуков речи за сегмент собственного согласного, а фразу размыкания – за сегмент собственного гласного, то по относительной доле информативности этих сегментов звуки речи группируются следующим образом:
• информация о гласных сосредоточена на их стационарных сегментах (в особых точках);
• сегмент собственно согласного фрикативных несет всю необходимую информацию для выбора фонемы;
• сегмент собственно согласного сонорных несет сведения для выбора фонемы, однако их недостаточно для безошибочного распознавания. Важна информация о переходных сегментах;
• смычка звонких взрывных выступает в роли группового признака и почти не несет информации о выборе фонемы. Основная информация для выбора фонемы определяется признаками переходных сегментов;
• для глухих взрывных в начальном положении вся информация содержится в переходном сегменте, для конечных глухих взрывных важным является также и сегмент взрыва.
Таким образом, распределение информации в речевом потоке носит неравномерный характер. Перераспределение и преобразование информации в дискретные фонемные решения происходит в пределах отрезка речевого потока, превышающего по длительности звук речи в обычном понимании этого слова. Этим во многом объясняется, почему два сходных отрезка речевого потока, соотносимые с отдельными речевыми звуками в различном окружении могут реализовываться как две различные фонемы и наоборот – два различных отрезка – как одна фонема. Это говорит о том, что число фонемных образов в пространстве слуховых признаков больше числа фонем, определяемых лингвистами.
Относительно механизма принятия решений на основе слуховых признаков имеющиеся экспериментальные данные содержат довольно мало сведений. Они скорее указывают на то, каким требованиям должна отвечать модель распознавания фонем.
Одно из требований состоит в том, что процедура распознавания фонем должна обеспечивать сбор информации, содержащейся в слуховых признаках различной природы и распределенной по времени на участках речевого потока, соотносимых по длительности со слоговыми элементами речи. Об этом свидетельствуют приведенные выше свойства слухового восприятия и описания фонем, а также результаты экспериментов по текущей имитации звукосочетаний.
Другое требование состоит в том, что случаи неопределенности не должны приводить к пропуску фонем, т.е. в последовательности фонемных решений должно быть отмечено место нераспознанного элемента речи. Об этом свидетельствуют результаты эксперимента по восприятию речевых сигналов, подверженным сильным частотным искажениям. Анализ ошибочно принятых фраз показал, что хотя они значительно отличались от исходных по звуковому составу, число слогов, последовательность смены гласных и согласных и места ударений распознавались практически безошибочно.
Способность человека безошибочно воспринимать чередование гласных и согласных и, как отмечено выше, различать классы сигналов (периодический - шумовой) при сильных частотных искажениях сигнала, а также воспринимать перепады интенсивности и частоты независимо от их абсолютных значений указывает на высокую устойчивость и, соответственно, надежность восприятия признаков, связанных со способом образования звуков речи. Менее устойчивыми оказываются признаки типа значений формантных частот в особых точках. Было установлено, что фонемное качества таких точек для первой и второй формантных частот зависит от частоты основного тона и частот более высших формант, т.е. связано с индивидуальными формантными характеристиками диктора. Отсюда следует третье требование к модели восприятия фонем, которое состоит в необходимости адаптации (подстройки) модели к ансамблю частотных параметров, представляющих определенного диктора.
Итак, изученные свойства восприятия речи человеком согласуются с иерархической структурой ее модели. Одно из преимуществ такой структуры заключается в том, что каждый из последовательных ее блоков может быть относительно более простым, обходиться меньшими объемами оперативной и долговременной памяти сравнительно с одноступенчатой моделью. Это связано с тем, что каждый предыдущий блок выполняет роль фильтра информации по отношению к последующему блоку, уменьшает размерность сигналов и приводит их к форме более удобной для дальнейшей обработки. Другое важное преимущество иерархической структуры модели состоит в том, что если информация, поступающая на вход данного блока оказывается недостаточной, может быть принято несколько альтернативных решений с указанием их апостериорных вероятностей, а принятие окончательного решения может быть оставлено на последующие этапы вплоть до последнего этапа - распознавания смысла высказывания.
Свойства слухового описания и восприятия речевых сигналов, важные для выработки требований к методам анализа речевых сигналов в концентрированном виде сводятся к следующему:
• на уровне рецептивного восприятия любые сигналы, в том числе и речевые, отображаются в виде несглаженного спектрально-временного рельефа;
• минимальные смыслоразличительные элементы речи фонемы и их различительные (дифференциальные) признаки описываются слуховыми (акустическими) признаками, приобретаемыми в процессе обучения речи;
• слуховые признаки связаны со структурными и параметрическими (формантными) свойствами спектрально-временного описания, являющимися следствием артикуляции звуков речи, т.е. с акустическими признаками артикуляции;
• решение о дифференциальных (различительных) признаках фонем принимаются на интервале времени реализации артикуляции слогового комплекса;
• существует иерархия различительных признаков фонем - признаки способа образования распознаются более устойчиво и надежно сравнительно с признаками места образования звуков речи;
• в условиях неопределенности, возникающей в случаях недостаточности акустической информации, ее искажения помехами различного рода, производится неполное распознавание фонем, состоящее в перечислении дифференциальных признаков, которые удалось распознать, а принятие окончательного решения переносится на более высокие уровни восприятия.
Отмеченные свойства слухового описания речевых сигналов на нижних уровнях восприятия безусловно важны для выработки требований к методам их анализа. Однако представляется очевидным, что полная система требований к методам анализа речевых сигналов, а, главное, первоочередные задачи их анализа и распознавания могут быть определены только в рамках целостной модели распознавания речевых сообщений.
- 1. Фонетическое членение речи.
- 2. Звуки. Артикуляционный аспект звуков речи.
- 3. Артикуляционная характеристика звуков.
- 4. Гласные звуки. Классификация гласных звуков.
- 5. Согласные звуки. Классификация согласных звуков.
- 6. Акустический аспект звуков речи. Качественные характеристики звуков.
- 7. Функциональный аспект звуков речи (фонология). Понятие о фонеме.
- 8. Система фонем в современном русском языке.
- 9. Фонологические позиции. Сильные и слабые фонемы.
- 10. Позиционные чередования гласных фонем. Количественная и качественная редукция гласных фонем.
- 11. Позиционные чередования согласных фонем. Ассимиляция и диссимиляция по глухости/звонкости и по твердости/мягкости.
- 12. Исторические чередования фонем.
- 13. Падение редуцированных гласных фонем и последствия этого явления.
- 14. Чередования, связанные с историей носовых звуков в древнерусском языке.
- 15. Палатализация заднеязычных.
- 17. Фонетическая транскрипция. Фонематическая транскрипция
- 18. Слог. Слогораздел. Типы слогов.
- 19. Фонетическое слово. Ударение
- 20. Речевой такт. Интонация
- 21. Ударение. Интонационные конструкции
- 21. Фраза. Интонация
- 22. Понятие об орфоэпии
- 23. Основные правила русского литературного произношения.
- 24. Произношение гласных под ударением. Произношение безударных гласных.
- 25. Произношение отдельных согласных звуков.
- 26. Произношение групп согласных.
- 27. Произношение некоторых грамматических форм.
- 28. Произношение некоторых аббревиатур. Особенности произношения иноязычных слов.
- 29. Трудные случаи усвоения ударения в русском языке.
- 30. Развитие русского литературного произношения.
- 31. Грамматическое кодирование
- 32. Семантическое кодирование. Двухаргументные (временные признаки): причинность.
- 33. Семантическое кодирование. Двухаргументные (временные признаки): следствие, результат, цель.
- 34. Семантическое кодирование. Двухаргументные (временные признаки): превращение, изменение
- 35. Семантическое кодирование. Двухаргументные (временные признаки): взаимодействие, группировка, общность, объединение
- 36. Семантическое кодирование. Двухаргументные (временные признаки): разделение, влияние, условие, вхождение.
- 37. Семантическое кодирование. Двухаргументные (временные признаки): соответствие, управление, подчинение, зависимость.
- 38. Семантическое кодирование. Одноаргументные (постоянные признаки):свойство, необходимость, возможность, вероятность, есть, нет.
- 39. Семантическое кодирование. Одноаргументные (постоянные признаки): истинность, ложность.
- Семантический код. Его цели. Предназначение. Принцип построения. Возможности.
- Предназначение семантического кода. Термин «смысл».
- Предназначение семантического кода. Текст. Информация. Гипертекст в освоении информации.
- 43. Грамматический и семантический анализ при семантическом кодировании.
- 44. Русский семантический словарь сочетаемости и ассоциативный словарь при семантическом кодировании.
- Предназначение семантического кода. Системный изоморфизм.
- Предназначение семантического кода. Принцип необходимого и достаточного.
- Предназначение семантического кода. Связность классов и подклассов
- 48. Предназначение семантического кода. Принцип иерархичности/ неиерархичности.
- 49. Предназначение семантического кода. Системная метафоричность.
- 50. Ситуативный (ситуационный) семантический код.
- 51. Семантическое кодирование. Выравнивающе-толковательный код. Матрешный код.
- 52. Основные задачи и ключевые понятия речевого интерфейса.
- 53. Исторический обзор проблемы распознавания и синтеза речи.
- 54. Системы автоматического синтеза речи. Практические приложения речевого интерфейса.
- 55. Системы автоматического распознавания речи. Практические приложения речевого интерфейса.
- 56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
- 57. Структура речевого сигнала. Анализ и синтез. Спектрально-временные характеристики речевого сигнала.
- 58. Информационная и модуляционная структура речевого сигнала.
- 59. Методы синтеза речевого сигнала. Обобщенные математические модели описания речевых сигналов.
- 60. Методы синтеза речевого сигнала. Геометрическая модель речевого тракта.
- 61. Методы синтеза речевого сигнала. Формантная модель.
- 62. Компиляционные методы синтеза речевого сигнала.
- 63. Методы анализа речевого сигнала.
- 64. Метод цифровой фильтрации речевого сигнала. Спектральный анализ с использованием алгоритмов бпф. Метод цифровой фильтрации
- Спектральный анализ с использованием алгоритмов бпф
- 65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
- Формантно-параметрическое описание речевого сигнала
- 66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
- 67. Свойства рецептивного восприятия речевых сигналов. Природа слуховых (фонетических) признаков речевого сигнала. Свойства рецептивного восприятия речевых сигналов
- Природа слуховых (фонетических) признаков речевого сигнала
- 68. Свойства восприятия минимальных смыслоразличительных элементов речи
- 69. Синтез речи по тексту. Структура синтезатора речи по тексту.
- Структура синтезатора речи по тексту Ключевые понятия:
- 70. Лингвистический процессор. Предварительная обработка текста. Пофразовая обработка текста.
- Предварительная обработка текста
- Пофразовая обработка текста
- 71. Пословная обработка теста. Пример работы лингвистического процессора. Пословная обработка текста
- Пример работы лингвистического процессора
- 72. Просодический процессор
- 73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
- 74. Аллофонный фонетический процессор. Акустический процессор.
- 75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.
- 76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.
- 77. Классификация методов распознавания речи.
- 78. Метод динамического программирования.
- 79. Метод скрытых марковских моделей.
- 80. Структурно-экспертные методы распознавания речи. Экспертный подход к фонемному распознаванию речи.
- 81. Проблемы обучения в распознавании речи и методы создания эталонных слов. Метод создания многокластерных эталонов речи.
- 82.Проблема плотных упаковок. Формульное представление знаний как вариант плотных упаковок.