Шпора по ЕЯИС, 2ой семестр (Головня) [8282 вопросов]

73.Фонетический процессор. Артикуляторно-фонетический процессор. Формантный фонетический процессор.

Рассмотрим следующий блок синтезатора речи – фонетический процессор. На выходе лингвистического процессора мы имели, с одной стороны, просодически размеченный текст, поступающий на вход просодического процессора, с другой стороны, размеченный фонемный текст, который является транскрипцией фраз для синтеза и поступает на вход фонетического процессора. На выходе просодического процессора мы получаем просодические параметры, которые необходимы для синтеза мелодики, интенсивности и длительности речи. На выходе фонетического процессора мы должны получить акустические параметры, которые будут управлять акустическим процессором, с тем чтобы получить речевой сигнал. Фонетический процессор развивался достаточно долго. Поэтому существует несколько вариантов построения фонетического процессора: • артикуляторный; • артикуляторно-формантный; • формантный; • аллофонный. Артикуляторный фонетический процессор (рис. 4.12) является физической или биологической моделью речеобразования. На его вход поступает фонемный текст, а далее моделируются все те процессы, которые происходят в речеобразовании. На начальном этапе фонемный текст преобразуется в набор артикуляторных команд, Известно, что каждой фонеме соответствует определенный набор артикуляторных команд, взаимосвязанных во временной последовательности. В процессе синтеза артикуляторные команды включаются не на отдельные фонемы, а на целый комплекс фонем, например, на слоги или даже на слова (т.е. в процессе эффекта коартикуляции уже в начале слова известно, какие будут последующая и предыдущая команды, т.е. моделируется определенная временная последовательность артикуляторных команд, определяемых фонемным текстом). Далее эти команды поступают на модель артикуляторных движений. Под действием команд, вызванных определенным фонемным текстом, артикуляторные параметры начинают некоторым образом двигаться. При этом в базе данных имеются константы динамики движения. Дело в том, что в зависимости от массы, артикулятор движется с различной скоростью. Например, тело языка имеет большую массу, чем губы, и поэтому язык движется медленнее, а губы быстрее. В результате на выходе имеем некоторую систему артикуляторных параметров, которые характеризуют движение тела языка, кончика языка, губ и т.д. По этим движениям могут быть построены текущие размеры речевого тракта или геометрическая модель речевого тракта. Речевой тракт характеризуется набором сечений Si. По движению отдельных артикуляторов можно создать функции изменения площадей сечений речевого тракта – Si (t). Комплекс этих функций создает геометрическую модель речевого тракта. Надо отметить, что на модель речевого тракта влияет размер речевого тракта, соответствующий разным типам голосов (мужскому, женскому, детскому). хотя рассмотренная модель синтезатора речи является очень естественной и наиболее реально приближенной к процессу речеобразования, до сих пор артикуляторный процессор, выполняющий свои функции удовлетворительно, не построен. Это связано с тем, что мы очень мало знаем об истинных процессах, происходящих в речевом тракте человека. Хотя такие процессоры и были реализованы, они до сих пор не нашли практического применения. Но вполне возможно, что в будущем они обеспечат наивысшее качество синтезируемой речи.

В основу формантного фонетического процессора положена формантная модель акустики речевого сигнала (см. пункт 3.2.2). Работа формантного фонетического процессора заключается в том, чтобы на основе входного размеченного фонемного текста и имеющихся формантных портретов фонем сгенерировать наборы формантных параметров для всех компонентов входного текста. Указанные формантные параметры являются результатом работы формантного фонетического процессора и передаются на вход акустического процессора (см. ниже), который на основе полученных параметров должен будет синтезировать речевой сигнал.

Содержание