35. Компьютерная (корпусная) лингвистика.
Как особое научное направление компьютерная лингвистика оформилась в 60-е гг. Под термином «компьютерная лингвистика» обычно понимается широкая область использования компьютерных инструментов — программ, компьютерных технологий организации и обработки данных — для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных областях, а также сфера применения компьютерных моделей языка не только в лингвистике, но и в смежных с ней дисциплинах. Собственно, только в последнем случае речь идет о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения теории программирования в области лингвистики.
Компьютерная лингвистика как особая прикладная дисциплина выделяется прежде всего по инструменту — то есть по использованию компьютерных средств обработки языковых данных.
Обратимся к тем областям компьютерной лингвистики, которые непосредственно связаны с оптимизацией когнитивной функции языка. Ниже в качестве примера рассматриваются три сферы компьютерного моделирования, в которых используются знания о функционировании языковой системы: моделирование общения, моделирование структуры сюжета и гипертекстовые технологии представления текста.
Моделирование общения. В узком смысле проблематика компьютерной лингвистики часто связывается с моделированием общения, в частности, с обеспечением общения человека с ЭВМ на естественном или ограниченном естественном языке. Это относится к оптимизации языка как средства общения. Впрочем, компьютерные модели общения часто используются для изучения самого процесса общения. Остановимся подробнее на опыте создания и использования именно таких моделей.
Моделирование структуры сюжета. Имеющиеся компьютерные программы моделирования сюжета основываются на трех базовых формализмах представления сюжета — морфологическом и синтаксическом направлениях представления сюжета, а также на когнитивном подходе.
Идеи о морфологическом устройстве структуры сюжета восходят к известным работам Проппа о русской волшебной сказке. Пропп заметил, что при обилии персонажей и событий волшебной сказки количество функций персонажей ограничено. Идеи Проппа легли в основу компьютерной программы TALE, моделирующей порождение сюжета сказки. В основу алгоритма программы TALE положена последовательность функций персонажей сказки. Фактически функции Проппа задавали множество типизированных ситуаций, упорядоченных на основе анализа эмпирического материала. Возможности сцепления различных ситуаций в правилах порождения определялись типичной последовательностью функций — в том виде, в котором это удается установить из текстов сказок. В программе типичные последовательности функций описывались как типовые сценарии встреч персонажей.
Теоретическую основу синтаксического подхода к сюжету текста составили «сюжетные грамматики» (story grammars). Сюжетные грамматики появились в середине 70-х гг. в результате переноса идей порождающей грамматики Н. Хомского на описание макроструктуры текста.
Гипертекст. Феномен гипертекста можно обсуждать с нескольких точек зрения. С одной стороны, это особый способ представления, организации текста, с другой — новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания. И, наконец, это новый способ, инструмент и новая технология понимания текста.
Структурно гипертекст может быть представлен как граф, в узлах которого находятся традиционные тексты или их фрагменты, изображения, таблицы, видеоролики и т.д. Узлы связаны разнообразными отношениями, типы которых задаются разработчиками программного обеспечения гипертекста или самим читателем. Отношения задают потенциальные возможности передвижения или навигации по гипертексту. Отношения могут быть однонаправленными или двунаправленными. Соответственно, двунаправленные стрелки позволяют двигаться пользователю в обе стороны, а однонаправленные — только в одну. Цепочка узлов, через которые проходит читатель при просмотре компонентов текста, образует путь или маршрут.
Корпусная лингвистика
Любое лингвистическое исследование в той или иной мере опирается на анализ языкового материала, языковых данных.
При традиционной технологии сбора и обработки языковых данных обновление собранного материала представляет собой отнюдь не тривиальную задачу. Текущая обработка картотеки, поиск нужных единиц и пр. — все эти абсолютно необходимые операции отнимают значительное время. Кроме того, традиционная технология делает практически невозможным доступ к языковым данным на расстоянии.
Новые информационные технологии и технические средства (компьютерные системы, системы связи, системы мультимедиа) значительно облегчили сбор языковых данных.
Этот технологический рывок создал, однако, другие – не менее серьезные – проблемы, существенно осложняющие использование языкового материала как для чисто научных, так и научно-практических целей. Дело в том, что чрезмерный объем изучаемых данных может и затруднить описание исследуемого феномена.
Встает задача разработки общих принципов построения лингвистических корпусов данных с использованием современных компьютерных технологий. Рассмотрим здесь две важнейших темы корпусной лингвистики, связанные с конструированием корпусов текстов:
– формулировка общих требований к корпусу данных с точки зрения пользователя;
– обсуждение опыта создания корпусов данных для различных исследовательских проектов.
- Вопросы по основным теоретическим направления программы по дисциплине «Филология в системе современного гуманитарного знания»
- 1. Филология как кластер смежных наук.
- Логос (слово, мысль, смысл, понятие)
- Логика Грамматика Риторика
- 2. Достижения осевого времени и их трансляция в современную эпоху.
- 3. Структура научных революций, их проявленность в филологии.
- 4. Методология сциентизма. Истинностная парадигма и ее основные постулаты.
- 5. Отличия гуманитарных исследований от сциентистских. Оценочная парадигма и ее синергетическая основа.
- 6. Конвергенция методов сциентизма и гуманитарных исследований в филологии.
- 7. Система взглядов в. Фон Гумбольта и ее значимость для современной филологии.
- 8. Философия обыденного языка (л. Витгенштейн), ее воздействие на современную филологию.
- 9. Философия диалогичности (м. Бахтин), ее влияние на современную филологию.
- 10. Формализм, формы его проявления на различных этапах развития филологических исследований.
- 11. Функционализм, формы его проявления на различных этапах развития филологических исследований.
- 12. Сущность революции н. Хомского.
- 13. Основные параметры антропологической парадигмы. Потребность в разработке функциональных методов исследования.
- 14. Типология знаков по ч. Пирсу.
- 15. Текст как полный семиотический знак.
- 16. Вторичные знаковые системы.
- 17. Отношения между составляющими модели семиозиса.
- 18. Параметры текстуальности.
- 19. Интертекстуальность как проблема.
- Подходы к изучению интертекста.
- 20. Постулаты когнитивной парадигмы.
- 21. Языки/коды, кодовые переходы. Специфика частных семиотик.
- 22. Модели представления знаний, фреймы и семантические сети.
- 23. Понятие предметной области и ее семиотическое представление.
- 24. Когниотип как дискурсивная форма организации знаний.
- 25. Герменевтика в современной научной ситуации. Герменевтическое (понимающее) мышление, Модели понимания текста.
- Три типа понимания текста (Богин)
- 26. Риторика в современной научной ситуации. Проективное мышление (генерирующее идеи). Риторическая модель.
- По дисциплине «Современные проблемы лингвистики»
- 2. Методология, основанная на тетрахотомической (системной) модели познания.
- 3. Набор базовых единиц языка в системном освещении.
- 4. Отношение token - type в ряду базовых единиц языка.
- 5. Обоснование центральной позиции высказывания и его системных проявлений (высказывание - предложение - пропозиция).
- 6. Текстовое произведение - текст - макроструктуры текста.
- 7. Дихотомия значение/смысл. Методики выявления смысла.
- 8. Семантическая структура высказывания: утверждаемое - пресуппозиции -подразумеваемое.
- 10. Сравнение различных определений термина «дискурс».
- 11. Методики поиска смыслов. Роль энциклопедии в интерпретации текста.
- 12. Язык как полевое образование. Является ли язык знаковой системой?
- 13. Модели языковой личности.
- 14. Ментальные и психологические характеристики языковой личности.
- 15. Взаимодействие ментальных и лингвистических единиц.
- 16. Методы построения когниотипа.
- 17. Когнитивный анализ интеракции.
- 18. Языковая уз семиотическая личность.
- 19. Поликодовый характер семиотической личности.
- 20. Невербальные коды коммуникации.
- 21. Типология дискурсов
- 22. Классификация речевых жанров.
- 23. Классификация речевых актов.
- 24. Конструктивная модель понимания текста.
- 25. Герменевтическая модель понимания текста.
- 26. Модель системомыследеятельности.
- 27. Синергетическая модель понимания текста.
- 28. Проблемная область порождения текста - первичного/ вторичного.
- 29. Лингвистический кластер наук: процессы дивергенции и конвергенции.
- 30. Структуралистская лингвистика.
- 31. Психолингвистика.
- 32. Когнитивная лингвистика.
- 33. Коммуникативная лингвистика.
- 34. Прикладная лингвистика.
- 35. Компьютерная (корпусная) лингвистика.
- Исходные понятия корпусной лингвистики
- 36. Социолингвистика.
- 37. Лингвокультурология.
- 38. Сравнительно-сопоставительная лингвистика.
- По дисциплине «Теория перевода»
- 1. Задачи теоретического изучения перевода.
- 2. Перевод как объект теории. Предмет теории перевода.
- 3. Противопоставление термина «теория перевода» термину «практика перевода» и «переводоведение»
- 4. Общая теория перевода. Частные теории перевода. Специальные теории перевода.
- 7. Этапы развития теории перевода.
- II Средневековый период.
- III Эпоха Возрождения.
- 8. Определение понятия «эквивалентность». Эквивалентность и смысл. Денотативное и сигнификативное значение.
- 9. Понятие и концепт.
- 10. Теория формальной и динамической эквивалентности.
- 11. Понятие прагматического потенциала и прагматического аспекта текста.
- 12. Этапы переводческого процесса.
- 13. Прагматические перестройки в художественной литературе и в переводе научно-технических материалов.
- 14. Прагматический аспект текстов, предназначенных для иноязычного получателя.