12. Перевод как прикладная лингвистическая дисциплина. Машинный перевод
Термин перевод многозначен. С одной стороны, он обозначает деятельность, заключающуюся в передаче содержания текста (в широком понимании) на одном языке средствами другого языка, а с другой — сами результаты этой деятельности.
Наука о переводе (англ. translation studies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает несколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает машинный перевод — научная и одновременно технологическая дисциплина, связанная и с наукой о переводе и с компьютерной лингвистикой. Как и многие другие дисциплины прикладной лингвистики, перевод по существу междисциплинарен, будучи связан не только с лингвистикой, но и с литературоведением, когнитивными науками и культурной антропологией.
Междисциплинарность теории перевода и ее практических приложений указывает на то, что перевод является не чисто языковым, а довольно сложным когнитивным феноменом. Переводя с одного языка на другой, человек использует как свои языковые знания и способности, так и самые разнообразные экстралингвистические знания (о физической природе мира, об обществе и его культуре, о ситуациях, в которых был порожден переводимый текст и будет восприниматься его перевод и т. д.), причем этапы понимания и синтеза текста принципиально различаются.
Перевод по полному пути (сплошные жирные стрелки) предполагает, что в его ходе происходит построение некоторого концептуального (понятийного) представления содержания текста, предположительно не зависящего от особенностей входного и выходного языков и учитывающего всю полноту знаний, которые в связи с конкретным текстом могут быть привлечены переводчиком (или переводящим устройством) для максимально более глубокого понимания текста и максимально адекватной передачи его содержания на другом языке. Сокращенная схема перевода (жирные пунктирные стрелки) предполагает установление переводных соответствий между смыслами текстов на языке-источнике и языке-цели; при этом смыслы сохраняют особенности этих языков, и никакого языка-посредника не постулируется. Наконец, при краткой схеме перевода (жирная штрих-пунктирная стрелка) переводные соответствия устанавливаются непосредственно между выражениями языка-источника и языка-цели (скажем, при переводе этикетных формул типа Дамы и господа или Добрый день!). Полную, сокращенную и краткую схему перевода можно назвать когнитивными стратегиями перевода, которые выбираются когнитивной системой человека в зависимости от характера коммуникативной ситуации и ее этапов. Архитектура систем машинного перевода в какой-то мере отражает эти когнитивные стратегии — см. ниже «прямой» перевод, перевод через язык-посредник, перевод через универсальный семантический язык.
Виды перевода:
По характеру переводческой деятельности традиционно выделяются устный и письменный перевод. Для устного перевода важнейшим параметром является фактор линейного развертывания текста во времени (со столь релевантными последствиями, как невозможность «заглянуть вперед» или «вернуться и исправить»), что неминуемо влечет за собой снижение требований к точности и элегантности. . В рамках устного перевода выделяется синхронный и последовательный перевод. При синхронном переводе звучащий текст переводится практически одновременно с его произнесением максимально допустимое запаздывание порядка 10 секунд). При последовательном переводе переводчик прослушивает довольно значительный фрагмент текста — до 15 минут, — фиксирует его в той или иной форме и переводит на соответствующий язык.
По другому основанию перевод разделяется на односторонний (унивелатеральный) и двусторонний (билатеральный). Односторонний перевод осуществляется только с языка-источника (обычно обозначаемого L1) на язык-цель (L2), в отличие от двустороннего, предполагающего перевод; с L1 L2 и наоборот. В обычном случае двусторонний перевод является последовательным, то есть используется в ситуации переговоров и т. п.
Содержательная сторона перевода включает, однако, множество других параметров, по которым может проводится классификация. Так, по основанию цели выделяются и другие типы перевода: (а) «пословный» перевод, в результате которого создается подстрочник, (б) буквальный перевод, называемый в англоязычной традиции grammar translation, (в) филологический перевод, называемый также «документальным», и (г) адаптивный (и как частный случай реферативный) перевод [ReiB 1995, S. 21-23].
Машинный перевод, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.
Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.
Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:
1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.
2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем.
3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том что в оригинале может быть и единственное число).
4. Синтез выходных словоформ и предложения в целом на выходном языке.
Исследования по машинному переводу за свою пятидесятилетнюю историю переживали как подъемы, так и спады. В начале 1960-х годов завершился первоначальный эйфорический этап в развитии МП, чему в сильнейшей степени способствовала публикация так называемой «Черной книги машинного перевода» – доклада Специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, в котором была констатирована невозможность создания в обозримом будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, в особенности теоретических, не произошло.
Новый подъем исследований в области МП начался в 1970-х годах и был связан с серьезными достижениями в области компьютерного моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже МП (датой ее рождения обычно считают 1956), получила название искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.
Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода
Классификация систем АП
1. Системы МП: - программы, осущ-щие полностью автоматиз-ный пер-д. Главным критерием программы явл-ся кач-во пер-да. + для польз-ля важными моментами явл-ся удобство интерфейса, лёгкость интеграции программы с другими ср-вами обработки док-тов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики с-тем МП включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным прогр-ным обеспечением и Эл-ной почтой => примененение мех-мы МП для пер-да Web-страниц, Эл-ных писем и онлайновых разговорных сеансов.
2. Системы с функцией Translation Memory (TM): предоставляют средства для так наз-го Machine Assisted Human Translation (MAHT) – пер-да, выполн-го ч-ком с помощью машины. 1начальное предназначение с-тем ТМ - облегчение работы переводчиков при локализации программных продуктов и создании терминол-ких БД, в дальнейшем с-мы стали развиваться как вспомог-ный инструментарий перев-ка.
3. Контролир-мый яз и МП на основе базы знаний: в с-мах на основе контролир-мого яз реализован переход от свободного входного яз к контролир-му входному яз. Контроль входного яз предусм-ет опред-ные ограничения лексики, грам-ки, сем-ки. Контролир-мый входной яз используется для упрощения выражений исходного т-та, чтобы повысить кач-во пер-да. – с-ма KANT.
4. On-line перев-ки: службы онлайнового пер-да выполняют перевод прямо в окне браузера, не требуя установки программы на компьютер польз-ля. Достаточно большое кол-во ссылок на бесплатные сервисы МП с указаниями направлений пер-дов.
5. Словари on-line - LOGOS ONLINE DICTIONARY (англ, фран, нем, исп, итал, чешский), TRADOS MultiTerm…
- 1. Макроструктура словаря. Микроструктура словаря.
- 2. Типы лингвистических словарей
- 3. Компьютерная обработка текста: описание моделей и направлений разработок
- 4. Статистика речи и автоматический анализ текста
- 5. Речевое общение в системах «Человек - пк»
- 6. Предмет прикладной лингвистки. Связь прикладной лингвистики с теоретической лингвистикой. Российский и западный подходы к термину «прикладная лингвистика»
- 7. Государственное регулирование языка: языковая политика, языковое
- 13. Корпусная лингвистика: цели, задачи, методы.
- 14. Судебная лингвистика: цели, задачи, методы.
- 8. Применение лингвистических знаний в компьютерных технологиях (компьютерная лингвистика)
- 1 Этап: Выбор материала-корпуса языковых данных.
- 2 Этап: Выбор концептуальной переменной и определение ее значений — языковых репрезентантов в тексте
- 4 Этап: Отбор кодировщиков и формулировка инструкций по кодирования
- 5 Этап. Кодировка данных
- 6 Этап.
- 12. Перевод как прикладная лингвистическая дисциплина. Машинный перевод
- 15. Автоматизированные информационные системы, их классификация
- 16. Информационные языки
- 17. Прикладное и теоретическое терминоведение. 3 формы неоднозначности термина.
- 18. Понятие гипертекста, гипертекстовые технологии
- 20. Понятие модели. Моделирование в лингвистике. Типы лингвистических моделей.
- Теория формальных грамматик
- 9. Язык как средство социального влияния и контроля