Автоматизированный перевод
Помимо автоматизированного информационного обслуживания, ЭВМ предоставляет в распоряжение абонентов системы искусственного интеллекта. Системы искусственного интеллекта разрабатывают в целях автоматизации деятельности человека при создании и осмыслении письменных текстов. Они делятся на: 1) системы синтеза и анализа устной речи; 2) системы записи, редактирования и автоматизированного составления текстов; 3) системы автоматического проектирования (САПР) и системы записи музыки и изображений; 4) калькуляции; 5) моделирующие системы; 6) экспертные системы; 7) игровые и обучающие системы; 8) системы автоматизированного, или машинного, перевода. Автоматизированный перевод является центральной системой искусственного интеллекта.
Машинный переводсочетает в себе теорию перевода как особую филологическую теорию и собственно лингвистическую теорию языковых соответствий двух и более языков. По соотношению систематологических и математических средств машинный перевод близок к АСУ. Машинный перевод - это перевод текста с одного языка на другой, выполняемый с помощью ЭВМ по заранее составленному алгоритму. Под алгоритмом понимается определенная последовательность формальных операций, выполнение которых идет от фразы на исходном языке к ее переводному эквиваленту на выходном языке... Алгоритмы представляются в ЭВМ в виде программы, а вспомогательная информация - в форме машинных словарей, таблиц, списков*.
*(См.: Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский. М., 1976. Ч. 1.)
При машинном переводе анализируется исходный текст, определяются роль слова в предложении, его значение, а затем подбирается соответствующий эквивалент в языке перевода и формулируется фраза на языке перевода. Грамматический анализ и синтез, достаточно сложные сами по себе, занимают в машинном переводе относительно небольшое место. Основной объем информации содержит словарь (названный контекстологическим словарем), который по принципам составления и характеру информации о слове не похож на другие словари.
Автоматизированный перевод используется только в некоторых видах словесности. Он целесообразен для оперативного перевода документов, текстов массовой информации, научной и особенно технической литературы. В этих областях необходимо делать перевод оперативно, терминологически строго, с высокими требованиями к стандартизации приемов перевода. (Разумеется, процесс перевода не может вестись без контроля редактора, что является общим требованием к любому переводу.)
Перевод только некоторых текстов предъявляет особые требования к словарю. Дело в том, что в толковых словарях дается общее языковое значение слова, в отраслевых словарях представлены только термины, в словарях информатики - также термины, и притом в особой систематизации, пригодной для данной системы информационного поиска или автоматизированного управления. Реальные же тексты документов, научно-технической литературы и массовой информации составлены преимущественно из общелитературных слов и лишь в небольшой части из терминов; причем значение слов связано с употреблением их именно в данном виде словесности. Это значение оказывается вообще не описанным никакими словарями, кроме контекстологического.
Контекстологический словарь, таким образом, есть словарь текстов определенного вида. Он дву- или многоязычен. Главным предметом такого словаря фактически оказывается межъязыковая омонимия или полисемия слов определенного вида словесности. Словарь составляется на основе материала переводимых текстов (изучаются слова-оригиналы и переводы), значения слов определяются формальными приметами контекста.
"Теоретической основой контекстологического словаря является теория детерминант. Согласно этой теории каждое значение (перевод) многозначного слова... детерминируется в контексте другими словами, с которыми данное слово сочетается, или определенными грамматическими признаками. Эти слова, а также классы или группы слов и грамматические признаки называются детерминантами"*. Такой словарь представляет собой собрание слов, информация о значении которых дается в терминах тех алгоритмов, которые к данному слову будут применены в автоматическом переводе.
*(Марчук Ю.Н. Контекстологический и словарь... С. 4-5.)
Оставляя в стороне характер алгоритмов, необходимо указать на следующие особенности контекстологичекого словаря. Словарь дает максимально полные сведения о применении слов в данном виде словесности:
1) варианты перевода в данном виде словесности;
2) возможные грамматические связи слов в предложении; 3) детализации значения применительно к данному виду словесности; 4) смысловые связи слов по смысловым группам; 5) вхождение во фразеологизмы; 6) сведения о валентностях слов, характерных для данного вида словесности.
Для того, чтобы эти стороны значения и употребления слов можно было отразить в словаре, потребовалась классификация слов по частным лексико-грамматическим группам внутри частей речи (как в античной грамматике: имя собственное, соименное, наименное, родовое, отчество и т.д.). Разумеется, в каждом виде словесности частные лексико-грамматические группы слов будут свои. Так, для общественно-политической лексики в текстах массовой коммуникации пришлось определить, исходя из значения и сочетаемости слов, следующие группы существительных: одушевленные, личные имена, географические названия, местоимения-существительные, денежные единицы, названия организаций, названия партий, названия документов, названия стран, названия воинских единиц, названия должностей, названия изданий, названия металлов, названия собраний людей, названия пищи, количественные числительные и единицы измерения. Лексико-грамматические группы слов, различаемые по значению и сочетаемости, оказались тематически ориентированными.
Особенно трудно группировать глаголы, так как эта часть речи семантически дифференцируется особым образом; причем различия мало заметны в отдельном слове, но весьма значимы для смысла целого текста. Например, в научном тексте отмечено шесть смысловых лексико-грамматических разрядов глаголов.
Разработка контекстологических словарей выходит за пределы интересов одного машинного перевода. Они могут использоваться при изучении языка специальности, в неавтоматическом переводе и в исследованиях по динамике языка и стиля.
- Оглавление
- Часть 1. Языковая деятельность 7
- Часть 2. Предмет и метод языкознания 57
- Часть 3. Фундаментальные и нормативные исследования 113
- Часть 4. Прикладное языкознание 156
- Предисловие
- Часть 1. Языковая деятельность Лекция 1. Проблема происхождения языка Логосическая теория происхождения языка
- Доктрина "Общественный договор"
- Ономатопоэтическая теория Штейнталя - Потебни
- Трудовая теория происхождения языка
- Рекомендуемая литература
- Лекция 2. Общественная сущность языка Акты общения
- Родные и неродные языки. Номенклатура языков
- Классы языков как отражение структуры общества
- Данные языкознания для изучения этнической истории
- Данные языкознания для изучения истории культуры
- Данные языкознания для изучения семиотики
- Язык как общественное явление в свете классификаций языков
- Рекомендуемая литература
- Лекция 3. Отношение языка к мысли и мысли к языку Знаковый характер языка
- Осмысление высказываний
- Формы мысли в речи
- Мысль в риторической форме
- Мысль в поэтической форме
- Мысль в логической форме
- Соединение риторической, поэтической и логической форм мысли
- Отношение мысли к языку (языковое мышление)
- Рекомендуемая литература
- Часть 2. Предмет и метод языкознания Лекция 4. Язык как система знаков Языкознание - гуманитарная наука
- Предмет филологии
- Предмет языкознания
- Языковые факты в языкознании
- Отбор языковых фактов
- Единицы и категории лингвостилистики
- Язык как система языковых подсистем
- Язык как система знаков
- Место системы языка среди других систем
- Рекомендуемая литература
- Лекция 5. Синтагматико-парадигматическая модель языка Выделение единиц языка
- Понятие ярусов языковой системы
- Языковые явления внутри ярусов. Уровни описания
- Проблема сочетаемости языковых единиц
- Рекомендуемая литература
- Лекция 6. Сравнительное языкознание Сопоставительное языкознание
- Типологическое языкознание
- Сравнительно-историческое языкознание
- Методологическое единство сравнительного языкознания и методы смежных наук в языковедческих исследованиях
- Рекомендуемая литература
- Часть 3. Фундаментальные и нормативные исследования Лекция 7. Классификация языковедческих дисциплин Фундаментальное, нормативное и прикладное языкознание
- Универсальная грамматика
- Сравнительно-исторические исследования семей и групп языков
- Исторические исследования одного языка
- Типологические исследования
- История языкознания и систематизация фундаментальных дисциплин
- Рекомендуемая литература
- Лекция 8. Динамика языка Роды динамики языка
- Проблема причинности динамики языка
- Стихийность и сознательность в динамике языка
- Процессы развития языка
- Процессы эволюции языка
- Эволюция и развитие языков
- Рекомендуемая литература
- Лекция 9. Нормирование языка Речевой обиход в бесписьменных языках и оценка правильности речи
- Проблема речевого обихода после создания письменности
- Становление языковой нормы, ее компоненты
- Исторические типы нормализации
- Культурно-исторические типы языков
- Первичная нормализация языков
- Нормирование национальных литературных языков
- Нормирование многонациональных и межнациональных языков
- Рекомендуемая литература
- Часть 4. Прикладное языкознание Лекция 10. Языковая семиотика Приложения языкознания и прикладное языкознание
- Языковая семиотика. Фактура устной речи
- Фактура письменной речи
- Динамика письма
- Соотношение устной и письменной речи
- Рекомендуемая литература
- Лекция 11. Языковая дидактика Предмет языковой дидактики
- Общая языковая дидактика (культура речи)
- Традиции в общей языковой дидактике и ортология языка
- Школьная языковая дидактика
- Профессиональная языковая дидактика
- Проблемы языка науки, техники и делового общения
- Рекомендуемая литература
- Лекция 12. Информационное обслуживание Информационное обслуживание как часть прикладной филологии
- Лингвистическая информатика
- Заголовки и рефераты
- Информационные словари
- Информационный поиск
- Автоматизированные системы управления
- Автоматизированный перевод
- Некоторые языковедческие проблемы, связанные с информационным обслуживанием
- Рекомендуемая литература
- Условные сокращения