56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
Знакомство с устройствами речевого ввода и вывода речевой информации целесообразно начать с изучения основных понятий, характеристик и структуры речевого сигнала. Речевой сигнал содержит данные о лингвистике, акустике и информационной структуре речи.
|
|
Из рис. видно, что с точки зрения лингвистики в речевом сигнале отражаются фонетические и просодические аспекты речи, с точки зрения акустики - акустические характеристики фонем и просодем, а информационная структура содержит дополнительную информацию о речевом сигнале, включающую его смысловое содержание, а также индивидуальные характеристики личности говорящего и передающей среды.
Аналогично тому, как связный текст естественного языка членится на иерархические уровни его изучения, в сплошном потоке речи выделяются основные составляющие. К ним относятся:
высказывание;
фонетический период речи;
фраза;
синтагма;
акцентная группа;
фонетическое слово;
слог;
фонема (звук).
Высказывание в речи соответствует сплошному тексту в естественном языке. Это самый верхний уровень, на котором определяется весь речевой поток.
Высказывание членится на фонетические периоды речи (иногда их называют просто периодами речи), которым в естественно-языковом тексте соответствуют абзацы.
Фонетические периоды речи состоят из фраз, что в естественном языке соответствует предложениям.
Каждая фраза состоит из одной или нескольких синтагм, которым в письменном естественно-языковом тексте нет точного эквивалента.
Синтагма – это самостоятельно сформированные просодические единицы, заканчивающиеся паузами в речи.
Паузы в речи являются ее естественной составляющей, так как при чтении текста любой человек делает дыхательные остановки. Это может быть связано с естественной потребностью сделать очередной вдох либо с необходимостью выделить интонационно какую-либо часть произносимой речи. Во втором случае имеется ввиду выделение той части фразы, которая на письме, как правило, заканчивается знаком препинания: запятой, двоеточием и т.д. Часто синтагмы никак не обозначаются в тексте, а только подразумеваются. Синтагма может состоять как из одного слова, так и из нескольких слов – двух, трех и т.д., в зависимости от фразы и от особенностей дикции говорящего.
Синтагмы могут состоять из одной или нескольких акцентных групп.
Под акцентной группой понимаются одно или несколько слов, объединенных общим групповым ударением.
Акцентная группа, в свою очередь, состоит из фонетических слов.
В отличие от слов в естественно-языковом тексте, фонетическое слово – это значащее слово и (если есть) связанный с этим словом предлог или частица. Например, «на крыше» – в фонетическом смысле это одно фонетическое слово и читается оно слитно, без паузы. В качестве примера фонетического слова с частицей можно привести любое слово с частицей «бы», например, «хотел бы».
Лексика – это активный словарь, с которым работает естественно-языковая система. Например, системы, проверяющие орфографические ошибки с учётом знаний о словообразовании, работают с 1–2 млн словоформ русского языка. Системы распознавания речи работают с меньшими словарями – это десятки, сотни, максимум тысячи слов.
Морфология – это раздел лингвистики, изучающий части речи и правила словообразования, в которых используются морфемы: приставки (префиксы), суффиксы, окончания и т.д. С использованием знаний морфологии, в частности, строятся морфологические таблицы с перечислением всех окончаний, суффиксов, парадигм, спряжений, склонений и т.д.
Фонетика – это раздел лингвистики, занимающийся изучением звукового строя естественного языка. Предметом рассмотрения фонетики являются звуки (фонемы) речи.
Синтаксис – это набор правил образования предложений, с помощью которых осуществляется построение фраз естественного языка.
Семантика занимается вопросами изучения смысла, заключенного в естественно-языковом высказывании. Это особый раздел лингвистики, который имеет тесные связи с искусственным интеллектом и проблемой формализации знаний.
На уровне прагматики рассматривается ситуация, в рамках которой происходит общение. Здесь изучается набор условий, при которых возможно или невозможно возникновение той или иной естественно-языковой фразы.
Просодика – это подраздел фонетики, изучающий ритмику и интонацию речи.
Фонема – это минимальная значимая звуковая единица речи.
Для любой фонемы должны найтись хотя бы два слова, отличающихся только одним звуком, соответствующим этой фонеме. Например, для слов «дом» и «дым» можно выделить фонемы [о] и [ы], так как они отличаются именно этим звуком. Между буквами и фонемами имеется определенная связь, хотя она далеко не всегда очевидна. Так, любое сообщение можно написать буквами, а можно – фонемами.
Транскрипция – это фонетическая запись слов.
Итак, звучащая речь может быть представлена минимально значимыми звуковыми единицами – фонемами. Каждой фонеме соответствует в международной фонетической транскрипции одна и та же буква или символ.
Под местом образования понимается сужение артикуляторного тракта, определяющее его артикуляторную статику и резонансные свойства. Место образования гласных фонем обусловлено положением тела языка (переднее / заднее, высокое / низкое) и губ (огубленное / неогубленное). Место образования согласных фонем определяет положение смычки или щели (губное, зубное, альвеолярное, нёбное, фарингальное), а также заднее или переднее положение тела языка (разделение на мягкие и твердые согласные).
От способа образования фонем зависят энергетические и динамические особенности артикуляции фонемы. Под способом образования фонемы понимается то, каким образом образуется звук при прохождении воздуха через артикуляторный тракт человека во время произнесения фонемы.
Рассмотрим более подробно классификацию фонем. Итак, в соответствии с артикуляторными особенностями образования фонемы отличаются: 1) по способу образования; 2) по месту образования.
По способу образования фонемы подразделяются на следующие виды:
гласные;
плавные;
боковые (латеральные);
носовые
дрожащие;
звонкие;
глухие;
щелевые (фрикативные);
взрывные;
аффрикаты.
- 1. Фонетическое членение речи.
- 2. Звуки. Артикуляционный аспект звуков речи.
- 3. Артикуляционная характеристика звуков.
- 4. Гласные звуки. Классификация гласных звуков.
- 5. Согласные звуки. Классификация согласных звуков.
- 6. Акустический аспект звуков речи. Качественные характеристики звуков.
- 7. Функциональный аспект звуков речи (фонология). Понятие о фонеме.
- 8. Система фонем в современном русском языке.
- 9. Фонологические позиции. Сильные и слабые фонемы.
- 10. Позиционные чередования гласных фонем. Количественная и качественная редукция гласных фонем.
- 11. Позиционные чередования согласных фонем. Ассимиляция и диссимиляция по глухости/звонкости и по твердости/мягкости.
- 12. Исторические чередования фонем.
- 13. Падение редуцированных гласных фонем и последствия этого явления.
- 14. Чередования, связанные с историей носовых звуков в древнерусском языке.
- 15. Палатализация заднеязычных.
- 17. Фонетическая транскрипция. Фонематическая транскрипция
- 18. Слог. Слогораздел. Типы слогов.
- 19. Фонетическое слово. Ударение
- 20. Речевой такт. Интонация
- 21. Ударение. Интонационные конструкции
- 21. Фраза. Интонация
- 22. Понятие об орфоэпии
- 23. Основные правила русского литературного произношения.
- 24. Произношение гласных под ударением. Произношение безударных гласных.
- 25. Произношение отдельных согласных звуков.
- 26. Произношение групп согласных.
- 27. Произношение некоторых грамматических форм.
- 28. Произношение некоторых аббревиатур. Особенности произношения иноязычных слов.
- 29. Трудные случаи усвоения ударения в русском языке.
- 30. Развитие русского литературного произношения.
- 31. Грамматическое кодирование
- 32. Семантическое кодирование. Двухаргументные (временные признаки): причинность.
- 33. Семантическое кодирование. Двухаргументные (временные признаки): следствие, результат, цель.
- 34. Семантическое кодирование. Двухаргументные (временные признаки): превращение, изменение
- 35. Семантическое кодирование. Двухаргументные (временные признаки): взаимодействие, группировка, общность, объединение
- 36. Семантическое кодирование. Двухаргументные (временные признаки): разделение, влияние, условие, вхождение.
- 37. Семантическое кодирование. Двухаргументные (временные признаки): соответствие, управление, подчинение, зависимость.
- 38. Семантическое кодирование. Одноаргументные (постоянные признаки):свойство, необходимость, возможность, вероятность, есть, нет.
- 39. Семантическое кодирование. Одноаргументные (постоянные признаки): истинность, ложность.
- Семантический код. Его цели. Предназначение. Принцип построения. Возможности.
- Предназначение семантического кода. Термин «смысл».
- Предназначение семантического кода. Текст. Информация. Гипертекст в освоении информации.
- 43. Грамматический и семантический анализ при семантическом кодировании.
- 44. Русский семантический словарь сочетаемости и ассоциативный словарь при семантическом кодировании.
- Предназначение семантического кода. Системный изоморфизм.
- Предназначение семантического кода. Принцип необходимого и достаточного.
- Предназначение семантического кода. Связность классов и подклассов
- 48. Предназначение семантического кода. Принцип иерархичности/ неиерархичности.
- 49. Предназначение семантического кода. Системная метафоричность.
- 50. Ситуативный (ситуационный) семантический код.
- 51. Семантическое кодирование. Выравнивающе-толковательный код. Матрешный код.
- 52. Основные задачи и ключевые понятия речевого интерфейса.
- 53. Исторический обзор проблемы распознавания и синтеза речи.
- 54. Системы автоматического синтеза речи. Практические приложения речевого интерфейса.
- 55. Системы автоматического распознавания речи. Практические приложения речевого интерфейса.
- 56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
- 57. Структура речевого сигнала. Анализ и синтез. Спектрально-временные характеристики речевого сигнала.
- 58. Информационная и модуляционная структура речевого сигнала.
- 59. Методы синтеза речевого сигнала. Обобщенные математические модели описания речевых сигналов.
- 60. Методы синтеза речевого сигнала. Геометрическая модель речевого тракта.
- 61. Методы синтеза речевого сигнала. Формантная модель.
- 62. Компиляционные методы синтеза речевого сигнала.
- 63. Методы анализа речевого сигнала.
- 64. Метод цифровой фильтрации речевого сигнала. Спектральный анализ с использованием алгоритмов бпф. Метод цифровой фильтрации
- Спектральный анализ с использованием алгоритмов бпф
- 65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
- Формантно-параметрическое описание речевого сигнала
- 66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
- 67. Свойства рецептивного восприятия речевых сигналов. Природа слуховых (фонетических) признаков речевого сигнала. Свойства рецептивного восприятия речевых сигналов
- Природа слуховых (фонетических) признаков речевого сигнала
- 68. Свойства восприятия минимальных смыслоразличительных элементов речи
- 69. Синтез речи по тексту. Структура синтезатора речи по тексту.
- Структура синтезатора речи по тексту Ключевые понятия:
- 70. Лингвистический процессор. Предварительная обработка текста. Пофразовая обработка текста.
- Предварительная обработка текста
- Пофразовая обработка текста
- 71. Пословная обработка теста. Пример работы лингвистического процессора. Пословная обработка текста
- Пример работы лингвистического процессора
- 72. Просодический процессор
- 73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
- 74. Аллофонный фонетический процессор. Акустический процессор.
- 75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.
- 76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.
- 77. Классификация методов распознавания речи.
- 78. Метод динамического программирования.
- 79. Метод скрытых марковских моделей.
- 80. Структурно-экспертные методы распознавания речи. Экспертный подход к фонемному распознаванию речи.
- 81. Проблемы обучения в распознавании речи и методы создания эталонных слов. Метод создания многокластерных эталонов речи.
- 82.Проблема плотных упаковок. Формульное представление знаний как вариант плотных упаковок.