logo search
Тюленев

§ 3. Машинный (автоматический) перевод

Машинный перевод3 в типологической классификации перевода про­тивопоставлен переводу естественному (ручному), осуществляемому человеком.

Практика машинного перевода связана с появлением компьюте­ров. В 1949 г. спустя пять лет после начала эксплуатации в США пер­вого довольно мощного компьютера математик У. Вивер призвал уче­ное сообщество использовать ЭВМ для перевода. Собственно автоматический перевод был одной из первых областей, в которых предполагалось применять компьютер. Вначале идея такого перевода была принята на ура. Достижение поставленной цели показалось очень простым. Первые проекты машинного перевода строились на перекодировании текста ИЯ на текст ПЯ без учета грамматики, более поздние и современные, однако, представляли собой уже более слож­ные системы, построенные с учетом грамматики, семантики и даже экстралингвистической информации.

В машинном переводе используется трансформационный метод (см. гл. 9, § 3). В компьютерную программу закладываются слова и словосочетания ИЯ и ПЯ. Далее осуществляется так называемый пословно-пооборотный перевод. При этом неоднозначность соот­ветствий единиц ИЯ и ПЯ заставила разработчиков программ ма­шинного перевода предусмотреть алгоритм выбора правильного соответствия. Такие алгоритмы основаны на двух принципах: син­таксическом и семантическом. Программа, построенная на син­таксическом алгоритме, находит соответствия ИЯ и ПЯ, исходя из синтаксической роли, которую играет та или иная единица ИЯ в предложении. Это дает машине возможность, например, отделить run как существительное от run как глагола. Семантический алго­ритм позволяет определить, какое из значений многозначных слов реализуется в данном тексте. Оба алгоритма применяются в ком­плексе. В более сложных программах к ним подключается и алго­ритм выбора значений слов и оборотов по экстралингвистической информации. Однако такие трехалгоритмовые программы нахо­дятся еще в стадии разработки.

1 Вилами перевода, хотя и не совсем новыми, но относительно недавно вошедши­ ми в поле зрения переводоведения, являются бытовой перевод (в западной терминоло­ гии community interpreting) и сурдоперевод для глухонемых людей [См.: Комиссаров, 2001; Handbuch Translation].

2 Обратим внимание на то, что в разделе о христианском переводе речь идет глав­ ным образом о протестантской традиции в русскоязычном переводе. Православные христианские тексты не имеются в виду.

3 Machine translation, mechanical translation, MT, automatic translation (англ.).

Основой любой программы машинного перевода является автома­тический словарь. Некоторые словари снабжены функцией пополне­ния лексики. Автоматический словарь представляет собой про­граммный модуль, который распознает слова и словосочетания, преобразует встречающиеся в тексте словоформы в словарный вид {gives преобразуется в give), истолковывает грамматическую информа­цию (-5 понимается либо как показатель 3-го лица единственного числа глагола, либо множественного числа существительного), содер­жит информацию о соответствиях данного слова / выражения в ПЯ, грамматических, семантических свойствах этих соответствий, форми­рует семантико-синтаксическое представление входного текста.

Преобразование исходного текста в конечный в специальной лите­ратуре называется трансфер. В процессе трансфера анализируется синтаксис и семантика входного текста, уточняется его структура, за­тем происходит преобразование структуры данного входного предло­жения в ядерную структуру по правилам машинной грамматики. Нако­нец, осуществляется синтез синтаксической структуры соответствующего выходного предложения (см. гл. 9, § 3, 4).

В некоторых программах помимо схемы трансфера используется язык-посредник (interlingua, pivot language), представляющий собой некий универсальный код, объединяющий грамматическую и семан­тическую информацию о тексте на любом языке, через который про­исходит трансформация текста на ИЯ в текст на ПЯ.

После трансфера осуществляется лексический синтез выходного предложения по синтаксическим и семантическим признакам, затем синтезируются нужные словоформы ПЯ (в нужных падежах, лицах, числах, временах и т.п.).

Довольно популярными (в США и других странах) являются сис­темы, базирующиеся на статистических моделях переводных соответ­ствий. Принцип, стоящий за этими моделями, заключается в том, что любое слово одного языка может переводиться любым словом друго­го, но с разной вероятностью. При этом автомат с помощью парал­лельных текстов и сравнения оригинала с выполненными человеком переводами определяет вероятностные величины переводных соот­ветствий. Регистрируются и синтаксические вероятностные величи­ны переводных соответствий. В итоге создается словарь наиболее ве­роятных соответствий. На базе этого словаря и осуществляется автоматический перевод. Если словарь оказывается неполным, обра­батывается новый корпус параллельных текстов.

После первоначальной эйфории в истории машинного перевода было осознано, что перевод связан с объектом чрезвычайной слож­ности — с естественным языком, что с первоначально поставленной задачей разработки полноценного перевода при помощи машины справиться не так легко. К тому же перевод — это творческая дея­тельность, и уже хотя бы поэтому он не может быть в полной мере за­менен машиной.

В результате начальную эйфорию сменили более уравновешенные взгляды на возможности машинного перевода. Стало ясно, что он, хо­тя и не заменил собой переводчика-человека, все же может быть ему полезен.

Сфера использования машинного перевода сведена в настоянщее время к промышленному переводу. Б. Сигурд (В. Sigurd) называет это направление переводом для специальных целей и добавляет, что ма­шинный перевод не разрабатывается для перевода художественных текстов, поэзии, Шекспира или Библии [См.: Sigurd. P. 33]. Он может помочь в рутинной переводческой работе, когда быстрота выполне­ния перевода важнее его качества. Например, машинный перевод мо­жет оказаться кстати для специалиста в какой-либо области, не владе­ющего тем или иным иностранным языком, на котором ему нужно прочитать интересующий его текст. Хотя машинный перевод, как правило, оказывается полным грамматических и лексических оши­бок, синтаксических неувязок, человек вполне может получить общее представление о содержании текста и о том, насколько этот текст ин­тересен для него. Это поможет ему, например, решить, стоит ли зака­зывать более качественный перевод или предпринять попытку отре­дактировать уже полученный. Таким образом, машинный перевод позволяет получить то, что мы условно назвали сигнальным перево­дом (см. гл. 7, § 3).

Машинный перевод оказался очень интересным проектом с пере-водоведческой точки зрения, поскольку заставил ученых пристальнее всмотреться в то, как перевод осуществляется человеком.

Обычно в качестве спонсоров проектов по разработке программ машинного перевода выступают такие организации, как Евратом и НАТО в Европе, НАСА и Пентагон в США. Например, в НАСА авто­матический перевод на постоянной основе использовался для перево­да рабочей документации при осуществлении совместного советско-американского космического проекта «Союз — Аполлон».

В США вообще (особенно во времена «холодной войны») уделя­лось много внимания переводу с русского языка на английский. Си­стемы SYSTRAN и XONICS, например, были сориентированы на перевод с русского на английский. Кроме того, разрабатывались программы перевода с китайского языка на английский (в Калифор­нийском университете в Беркли).

В Канаде с 1976 г. машинный перевод активно используется для перевода прогнозов погоды с английского языка на французский. Си­стема работает со скоростью 1000 слов в минуту. При этом затраты со­ставляют всего лишь треть от затрат на обеспечение естественного пе­ревода того же объема материалов. Каждый день машины переводят до 30 000 слов, работая при этом всего полчаса в день. Успех програм­мы объясняется тем, что в текстах метеорологических сводок исполь­зуется ограниченная по тематике лексика, а также стандартные син­таксические конструкции. Люди привлекаются к осуществлению Перевода лишь тогда, когда машина отвергает какое-либо предложение как непереводимое. Непереводимыми предложения оказываются из-за орфографических ошибок, слов, не зафиксированных в машин­ном словаре, и нарушений английской грамматики.