3.5. Заключение
К настоящему времени накоплен уже довольно значительный опыт построения корпусов текстов, однако информация о наличии корпусов в разных странах ограничена. Это существенно затрудняет проведение научных исследований и нередко приводит к дублированию работы. Сложность получения информации о существующих корпусах текстов связана с тем, что практически все они создаются по локальным проектам отдельными организациями. Международная координация усилий в этой области пока еще не налажена в должной мере.
Вторая проблема в области корпусной лингвистики связана с первой: локальность проектов приводит к возникновению различных форматов представления корпусов текстов. Отсутствие единого формата представления дополняется и несовместимостью программного обеспечения.
В имеющихся описаниях корпусов нет ясной информации о содержательных принципах отбора материала. Поскольку корпус является сужением проблемной области, то представительность корпуса прямо связана с принципами отбора материала. Если же нет уверенности в представительности корпуса, его заведомо нельзя использовать для многих видов лингвистической деятельности, например, для оценки частоты употребления лексем в тех или иных значениях или для составления словников некоторой проблемной области. Необходимо разработать общепринятую процедуру сужения проблемной области до корпуса текстов. По-видимому, таких процедур должно быть несколько, поскольку соотношение между корпусом и проблемной областью не является постоянной величиной и меняется в зависимости от характера проблемной области и задач исследования.
Необходимо проводить ясное разграничение между «исследовательскими» корпусами и «иллюстративными» корпусами (первые создаются для изучения явления, а вторые — для иллюстрации установленных закономерностей). Очень часто требования, предъявляемые пользователем к исследовательскому корпусу текстов, по сути аналогичны требованиям для иллюстративных корпусов, при том что исследование еще не проведено.
Последовательное выполнение принципов построения корпусов текстов приводит к тому, что корпус может быть построен только после того, как уже завершена та работа, для которой он предназначается. Удел «сборщиков» корпусов — балансирование между этими крайностями — уже завершенной работой и необозримым множеством текстов проблемной области.
Основная литература
1. Баранов А. Н. Автоматизация лингвистических исследований: корпус текстов как лингвистическая проблема//Русистика сегодня. 1998 № 1-2. С. 179-191.
2 Баранов А. Н., Добровольский Д. О. Немецкая корпусная лингвистика // Вестник МГУ. Сер. Иностранные языки. 1998. № 1.
Исаев И. А. Опыт автоматизации лексикографических исследований. Система DIALEX // Слово Достоевского. М., 1996.
Михайлов М. Н. Компьютерное обеспечение корпуса текстов (взгляд пользователя) // Русистика сегодня. 1998. № 1-2. С. 192-201.
Мошкович Ж. Г. Автоматическая лексическая система Унилекс-2. М., 1989.
Фрэнсис У. Н. Проблемы формирования и машинного представления большого корпуса текстов // Новое в зарубежной лингвистике. Вып. XIV Проблемы и методы лексикографии. М., 1983. С. 334-353.
Дополнительная литература
Леннгрен Л., Ферм Л. Уппсальский машинный фонд русского языка // Труды машинного фонда русского языка. Т. 1. М., 1991.
Renouf A. Corpus development at Birmingham University, Corpus linguistics. Recent developments in the use of computer corpora in English language research / Eds. Aarts J. & Meijs W. Amsterdam, 1984.
WordCruncher. WC Index Text Retrieval Sofrware. Birgham Young University, 1989а.
Word Cruncher. WC View Text Retrieval Sofrware. Birgham Young University, 1989b.
- § 2. Рефлексия лингвистической теории в прикладной лингвистике
- Предисловие
- Глава 1 Объект и методы прикладной лингвистики § 1. Понимания термина «прикладная лингвистика»
- § 2. Круг задач прикладной лингвистики
- §3. Методы прикладной лингвистики
- Глава 2 Оптимизация когнитивной функции языка § 1. Компьютерная лингвистика
- 1.1. Компьютерная лингвистика как прикладная лингвистическая дисциплина
- 1.2. Когнитивный инструментарий компьютерной лингвистики
- 1.3. Некоторые направления компьютерной лингвистики
- 1.4. Гипертекстовые технологии представления текста
- § 2. Прикладные аспекты квантитативной лингвистики
- 2.1. Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения
- 2.2. Основные области приложения структурно-вероятностной модели языка
- 2.3. Авторизация текста: пример экспертизы
- § 3. Психолингвистика как приложение лингвистики
- Глава 3 Оптимизация эпистемической функции языка §1. Лексикография
- 1.1. Из истории словарного дела
- 1.2. Базовые параметры типологизации словарей
- 1.3. Основные структурные компоненты словаря
- 1.4. Основные структурные компоненты (зоны) словарной статьи
- 1.5. Компьютерная лексикография
- § 2. Терминоведение и терминография
- 2.1. Исходные понятия
- 2.2. Важнейшие направления деятельности в терминоведении и терминографии
- 2.3. Институциональный аспект терминоведения и терминографии
- 2.4. Лингвистическая терминология как особая терминосистема*
- 2.5. Миры лингвистической терминологии
- Термины семиотики19'
- Термины прагматики
- Термины теории диалога, термины теории речевой коммуникации
- Термины логического анализа естественного языка
- Термины прикладной лингвистики
- Термины теории речевых актов
- Термины искусственного интеллекта
- Термины когнитивной науки
- 2.6. Лингвистическая терминография
- § 3. Корпусная лингвистика
- 3.1. Языковой материал в лингвистическом исследовании
- 3.2. Исходные понятия корпусной лингвистики
- 3.3. Требования к корпусу текстов с точки зрения пользователя
- 3.4. Опыт разработки корпусов текстов
- 3.5. Заключение
- Глава 4 Оптимизация функционирования языка как средства передачи информации § 1. Перевод как прикладная лингвистическая дисциплина*
- 1.1. Лингвистические и нелингвистические аспекты перевода
- 1.2. Виды перевода
- 1.3. «Естественный» перевод: лингвистические проблемы
- 1.4. Машинный перевод
- § 2. Теория и методика преподавания языка*
- 2.1. Грамматико-переводной метод в обучении иностранным языкам
- 2.2. Прямой метод обучения иностранному языку
- 2.3. Аудиолингвальный и аудиовизуальный методы обучения иностранным языкам
- 2.4. Коммуникативно-ориентированный подход в обучении иностранным языкам
- §3. Оптимизация общения с эвм:системы обработки естественного языка
- §4. Теория и практика информационно-поисковых систем
- 4.1. Основные понятия информационного поиска
- 4.2. Типы информационно-поисковых систем
- 4.3. Информационно-поисковые языки
- Глава 5 Оптимизация социальной функции языка, функционирование языка как средства воздействия § 1. Лингвистика и функционирование государства
- § 2. Лингвистические аспекты теории воздействия: языковые механизмы вариативной интерпретации действительности*
- 2.1. Предмет теории воздействия и ее истоки
- 2.2. Языковое варьирование как важнейший источник имплицитного воздействия языка на сознание. Предпосылки языкового варьирования
- 2.3. Типология языковых механизмов воздействия на сознание
- 2.4. Лингвистические аспекты теории аргументации
- 2.5. Языковые механизмы вариативной интерпретации действительности в аргументации: пример анализа
- § 3. Механизмы вариативной интерпретации действительности в нейро-лингвистическом программировании
- 3.1. Нейро-лингвистическое программирование -эффективная практика как теория
- 3.2. Нлп как психотерапевтический метод
- 3.3. Постулаты нлп по отношению к языку: взгляд лингвиста
- 3.4. Роль языковых механизмов вариативной интерпретации действительности в нлп
- §4. Политическая лингвистика
- 4.1. Предмет и задачи политической лингвистики
- 4.2. Методика контент-анализа
- 4.3. Примеры применения методики контент-анализа
- 4.4. Методика когнитивного картирования
- Глава 6 Прикладная и теоретическая лингвистика: проблемы взаимовлияния § 1. Инструментарий прикладной лингвистики в лингвистической теории
- 1.1. Традиционные проблемы лексической семантики с точки зрения когнитивного подхода*
- 1.2. Эвристики лингвистической семантики
- 1.3. Заключение
- § 2. Рефлексия лингвистической теории в прикладной лингвистике
- 2.1. Базовые теоретические оппозиции в прикладной лингвистике
- 2.2. Филологические методы анализа текста как эвристики построения систем искусственного интеллекта*
- Актуальные проблемы прикладной лингвистики
- Список сокращений
- Литература
- Словарные издания