logo
Шпора по ЕЯИС, 2ой семестр (Головня) [8282 вопросов]

76. Классификация систем автоматического распознавания речи. Методы автоматического распознавания речи.

На начальных этапах развития проблемы распознавания речи разрабатывались устройства, которые называли анализаторами. Анализаторы преобразовывают речевые сигналы, поступающие с микрофона, в последовательность цифровых кодов с существенно меньшим информационным потоком (см. раздел 3) и с обязательным сохранением передачи смыслового компонента речи. Анализаторы подразделяются на два основных класса: • анализаторы сигналов; • анализаторы сообщений.

В анализаторах сигналов сокращение информационного потока достигается только за счет учета акустических и статистических характеристик речевого сигнала без обращения к его смысловой функции.В анализаторах речевых сообщений (распознавателях) осуществляется сжатие информационного потока за счет введения операции распознавания смысловых элементов речи (фразы, слова, морфемы, фонемы). Анализаторы речевых сообщений, в свою очередь, подразделяются на две группы: • анализаторы ограниченного словаря; • универсальные анализаторы.

Анализаторы ограниченного словаря ориентированы на распознавание заданного конкретной задачей числа речевых команд (рис. 5.1), т.е. на идентификацию одной из произнесенных речевых команд словаря в виде номера команды.Распознавание в анализаторах ограниченного словаря осуществляется путем нелинейного во времени сопоставления эталонов команд с произносимой командой и выбора наиболее схожего эталона. В большинстве существующих анализаторов ограниченного словаря формирование эталонов осуществляется в процессе обучения на используемый словарь и голос диктора. Чаще всего процесс обучения состоит в однократном прочтении оператором всего словаря команд. Еще одним ограничением большинства современных анализаторов этого типа является требование изолированного произнесения речевых команд, т.е. с паузами между словами от 0,3 до 1 с. Распознавание слитной речи даже ограниченного словаря – пока нерешенная научная проблема.

Рисунок 5.1. Схема анализатора речевых сообщений ограниченного словаря

Универсальные анализаторы ориентированы на текущее распознавание полного набора смысловых элементов речи (фонем или морфем), из которых может быть составлено и в конечном счете распознано любое слово или слитно произнесенное речевое сообщение (рис. 5.2). Распознавание осуществляется лингвистическим процессором по правилам, заложенным в базе знаний.

Рисунок 5.2. Схема универсального анализатора речевых сообщений

на системы распознавания речи накладываются разного рода ограничения. Это связано с трудностями реализации таких систем. Пока, к сожалению, разработка полноценной универсальной многодикторской системы распознавания речи неограниченного словаря не представляется возможной. В любой существующей на данный момент системе указанного класса имеется свой набор характеристик и ограничений, например, на объем словаря, либо на контингент дикторов, либо на возможности понимания сообщений и т.д.