73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
Рассмотрим следующий блок синтезатора речи – фонетический процессор. На выходе лингвистического процессора мы имели, с одной стороны, просодически размеченный текст, поступающий на вход просодического процессора, с другой стороны, размеченный фонемный текст, который является транскрипцией фраз для синтеза и поступает на вход фонетического процессора. На выходе просодического процессора мы получаем просодические параметры, которые необходимы для синтеза мелодики, интенсивности и длительности речи. На выходе фонетического процессора мы должны получить акустические параметры, которые будут управлять акустическим процессором, с тем чтобы получить речевой сигнал. Фонетический процессор развивался достаточно долго. Поэтому существует несколько вариантов построения фонетического процессора: • артикуляторный; • артикуляторно-формантный; • формантный; • аллофонный. Артикуляторный фонетический процессор (рис. 4.12) является физической или биологической моделью речеобразования. На его вход поступает фонемный текст, а далее моделируются все те процессы, которые происходят в речеобразовании. На начальном этапе фонемный текст преобразуется в набор артикуляторных команд, Известно, что каждой фонеме соответствует определенный набор артикуляторных команд, взаимосвязанных во временной последовательности. В процессе синтеза артикуляторные команды включаются не на отдельные фонемы, а на целый комплекс фонем, например, на слоги или даже на слова (т.е. в процессе эффекта коартикуляции уже в начале слова известно, какие будут последующая и предыдущая команды, т.е. моделируется определенная временная последовательность артикуляторных команд, определяемых фонемным текстом). Далее эти команды поступают на модель артикуляторных движений. Под действием команд, вызванных определенным фонемным текстом, артикуляторные параметры начинают некоторым образом двигаться. При этом в базе данных имеются константы динамики движения. Дело в том, что в зависимости от массы, артикулятор движется с различной скоростью. Например, тело языка имеет большую массу, чем губы, и поэтому язык движется медленнее, а губы быстрее. В результате на выходе имеем некоторую систему артикуляторных параметров, которые характеризуют движение тела языка, кончика языка, губ и т.д. По этим движениям могут быть построены текущие размеры речевого тракта или геометрическая модель речевого тракта. Речевой тракт характеризуется набором сечений Si. По движению отдельных артикуляторов можно создать функции изменения площадей сечений речевого тракта – Si (t). Комплекс этих функций создает геометрическую модель речевого тракта. Надо отметить, что на модель речевого тракта влияет размер речевого тракта, соответствующий разным типам голосов (мужскому, женскому, детскому). хотя рассмотренная модель синтезатора речи является очень естественной и наиболее реально приближенной к процессу речеобразования, до сих пор артикуляторный процессор, выполняющий свои функции удовлетворительно, не построен. Это связано с тем, что мы очень мало знаем об истинных процессах, происходящих в речевом тракте человека. Хотя такие процессоры и были реализованы, они до сих пор не нашли практического применения. Но вполне возможно, что в будущем они обеспечат наивысшее качество синтезируемой речи.
В основу формантного фонетического процессора положена формантная модель акустики речевого сигнала (см. пункт 3.2.2). Работа формантного фонетического процессора заключается в том, чтобы на основе входного размеченного фонемного текста и имеющихся формантных портретов фонем сгенерировать наборы формантных параметров для всех компонентов входного текста. Указанные формантные параметры являются результатом работы формантного фонетического процессора и передаются на вход акустического процессора (см. ниже), который на основе полученных параметров должен будет синтезировать речевой сигнал.
- 1. Фонетическое членение речи.
- 2. Звуки. Артикуляционный аспект звуков речи.
- 3. Артикуляционная характеристика звуков.
- 4. Гласные звуки. Классификация гласных звуков.
- 5. Согласные звуки. Классификация согласных звуков.
- 6. Акустический аспект звуков речи. Качественные характеристики звуков.
- 7. Функциональный аспект звуков речи (фонология). Понятие о фонеме.
- 8. Система фонем в современном русском языке.
- 9. Фонологические позиции. Сильные и слабые фонемы.
- 10. Позиционные чередования гласных фонем. Количественная и качественная редукция гласных фонем.
- 11. Позиционные чередования согласных фонем. Ассимиляция и диссимиляция по глухости/звонкости и по твердости/мягкости.
- 12. Исторические чередования фонем.
- 13. Падение редуцированных гласных фонем и последствия этого явления.
- 14. Чередования, связанные с историей носовых звуков в древнерусском языке.
- 15. Палатализация заднеязычных.
- 17. Фонетическая транскрипция. Фонематическая транскрипция
- 18. Слог. Слогораздел. Типы слогов.
- 19. Фонетическое слово. Ударение
- 20. Речевой такт. Интонация
- 21. Ударение. Интонационные конструкции
- 21. Фраза. Интонация
- 22. Понятие об орфоэпии
- 23. Основные правила русского литературного произношения.
- 24. Произношение гласных под ударением. Произношение безударных гласных.
- 25. Произношение отдельных согласных звуков.
- 26. Произношение групп согласных.
- 27. Произношение некоторых грамматических форм.
- 28. Произношение некоторых аббревиатур. Особенности произношения иноязычных слов.
- 29. Трудные случаи усвоения ударения в русском языке.
- 30. Развитие русского литературного произношения.
- 31. Грамматическое кодирование
- 32. Семантическое кодирование. Двухаргументные (временные признаки): причинность.
- 33. Семантическое кодирование. Двухаргументные (временные признаки): следствие, результат, цель.
- 34. Семантическое кодирование. Двухаргументные (временные признаки): превращение, изменение
- 35. Семантическое кодирование. Двухаргументные (временные признаки): взаимодействие, группировка, общность, объединение
- 36. Семантическое кодирование. Двухаргументные (временные признаки): разделение, влияние, условие, вхождение.
- 37. Семантическое кодирование. Двухаргументные (временные признаки): соответствие, управление, подчинение, зависимость.
- 38. Семантическое кодирование. Одноаргументные (постоянные признаки):свойство, необходимость, возможность, вероятность, есть, нет.
- 39. Семантическое кодирование. Одноаргументные (постоянные признаки): истинность, ложность.
- Семантический код. Его цели. Предназначение. Принцип построения. Возможности.
- Предназначение семантического кода. Термин «смысл».
- Предназначение семантического кода. Текст. Информация. Гипертекст в освоении информации.
- 43. Грамматический и семантический анализ при семантическом кодировании.
- 44. Русский семантический словарь сочетаемости и ассоциативный словарь при семантическом кодировании.
- Предназначение семантического кода. Системный изоморфизм.
- Предназначение семантического кода. Принцип необходимого и достаточного.
- Предназначение семантического кода. Связность классов и подклассов
- 48. Предназначение семантического кода. Принцип иерархичности/ неиерархичности.
- 49. Предназначение семантического кода. Системная метафоричность.
- 50. Ситуативный (ситуационный) семантический код.
- 51. Семантическое кодирование. Выравнивающе-толковательный код. Матрешный код.
- 52. Основные задачи и ключевые понятия речевого интерфейса.
- 53. Исторический обзор проблемы распознавания и синтеза речи.
- 54. Системы автоматического синтеза речи. Практические приложения речевого интерфейса.
- 55. Системы автоматического распознавания речи. Практические приложения речевого интерфейса.
- 56. Лингвистические основы речевого интерфейса. Использование лингвистики в реализации речевых систем.
- 57. Структура речевого сигнала. Анализ и синтез. Спектрально-временные характеристики речевого сигнала.
- 58. Информационная и модуляционная структура речевого сигнала.
- 59. Методы синтеза речевого сигнала. Обобщенные математические модели описания речевых сигналов.
- 60. Методы синтеза речевого сигнала. Геометрическая модель речевого тракта.
- 61. Методы синтеза речевого сигнала. Формантная модель.
- 62. Компиляционные методы синтеза речевого сигнала.
- 63. Методы анализа речевого сигнала.
- 64. Метод цифровой фильтрации речевого сигнала. Спектральный анализ с использованием алгоритмов бпф. Метод цифровой фильтрации
- Спектральный анализ с использованием алгоритмов бпф
- 65. Спектральный анализ на основе линейного предсказания. Формантно-параметрическое описание речевого сигнала. Спектральный анализ на основе линейного предсказания
- Формантно-параметрическое описание речевого сигнала
- 66. Метод кепстральных коэффициентов. Особенности восприятия речи. Свойства рецептивного восприятия речи человеком. Метод кепстральных коэффициентов
- 67. Свойства рецептивного восприятия речевых сигналов. Природа слуховых (фонетических) признаков речевого сигнала. Свойства рецептивного восприятия речевых сигналов
- Природа слуховых (фонетических) признаков речевого сигнала
- 68. Свойства восприятия минимальных смыслоразличительных элементов речи
- 69. Синтез речи по тексту. Структура синтезатора речи по тексту.
- Структура синтезатора речи по тексту Ключевые понятия:
- 70. Лингвистический процессор. Предварительная обработка текста. Пофразовая обработка текста.
- Предварительная обработка текста
- Пофразовая обработка текста
- 71. Пословная обработка теста. Пример работы лингвистического процессора. Пословная обработка текста
- Пример работы лингвистического процессора
- 72. Просодический процессор
- 73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.
- 74. Аллофонный фонетический процессор. Акустический процессор.
- 75. Аппроксимация геометрии речевого такта. Акустический процессор, основанный на компиляционных методах синтеза речи.
- 76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.
- 77. Классификация методов распознавания речи.
- 78. Метод динамического программирования.
- 79. Метод скрытых марковских моделей.
- 80. Структурно-экспертные методы распознавания речи. Экспертный подход к фонемному распознаванию речи.
- 81. Проблемы обучения в распознавании речи и методы создания эталонных слов. Метод создания многокластерных эталонов речи.
- 82.Проблема плотных упаковок. Формульное представление знаний как вариант плотных упаковок.