Исходные понятия корпусной лингвистики
Проблемная область. Под проблемной областью понимается область реализаций языковой системы, содержащая феномены, подлежащие лингвистическому описанию. В идеале проблемная область имеет два измерения — языковое и речевое. Речевое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании потенциальной возможности появления других употреблений, дополняющих массив имеющихся реализаций.
Корпус данных. Корпус данных представляет собой сформированную по определенным правилам выборку данных из проблемной области. Тем самым корпус данных представляет собой результат отображения из проблемной области. В отличие от проблемной области, корпус данных имеет только одно измерение — речевое, поскольку сам по себе он не обладает потенцией производства своих составляющих.
Единица хранения корпуса данных – это некоторая совокупность естественноязыковых выражений проблемной области, которой сопоставляется одно описание на некотором метаязыке, определяемом процедурой формирования корпуса.
Корпус текстов. Корпус текстов — это вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области.
Типы корпусов данных.
Исследовательские корпусы. Исследовательскими называются такие корпусы, которые предназначены преимущественно для изучения различных аспектов функционирования языковой системы.
Иллюстративные корпусы. Иллюстративные корпусы создаются после проведения научного исследования: их цель не столько выявить новые факты, сколько подтвердить и обосновать уже полученные результаты.
Корпусы параллельных текстов. Для научных и практических целей формируются корпусы параллельных текстов. По своей структуре это подмножество текстов на языке-источнике и одно или несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели. Например, английский текст «Alice in Wonderland» и его переводы на немецкий, французский и русский языки могут формировать такой корпус или быть частью большего корпуса параллельных текстов.
Требования к корпусу. Корпус данных, будучи отражением проблемной области, должен совмещать, с точки зрения пользователя, самые противоречивые требования: репрезентативность (способность корпуса текстов отражать все свойства проблемной области, релевантные для данного типа лингвистического исследования) полнота (учет релевантных явлений), экономичность (экономия усилия исследователя при изучении проблемной области), структуризация материала, компьютерная поддержка (поддержка корпуса текстов комплексом программ по обработке данных, обеспечивающих функции составления конкордансов, статистической инвентаризации, автоматической словарной обработки и пр.
К настоящему времени накоплен уже довольно значительный опыт построения корпусов текстов, однако информация о наличии корпусов в разных странах ограничена. Это существенно затрудняет проведение научных исследований и нередко приводит к дублированию работы. Сложность получения информации о существующих корпусах текстов связана с тем, что практически все они создаются по локальным проектам отдельными организациями. Международная координация усилий в этой области пока еще не налажена в должной мере.
Вторая проблема в области корпусной лингвистики связана с первой: локальность проектов приводит к возникновению различных форматов представления корпусов текстов. Отсутствие единого формата представления дополняется и несовместимостью программного обеспечения.
В имеющихся описаниях корпусов нет ясной информации о содержательных принципах отбора материала. Поскольку корпус является сужением проблемной области, то представительность корпуса прямо связана с принципами отбора материала. Если же нет уверенности в представительности корпуса, его заведомо нельзя использовать для многих видов лингвистической деятельности, например, для оценки частоты употребления лексем в тех или иных значениях или для составления словников некоторой проблемной области. Необходимо разработать общепринятую процедуру сужения проблемной области до корпуса текстов. По-видимому, таких процедур должно быть несколько, поскольку соотношение между корпусом и проблемной областью не является постоянной величиной и меняется в зависимости от характера проблемной области и задач исследования.
- Вопросы по основным теоретическим направления программы по дисциплине «Филология в системе современного гуманитарного знания»
- 1. Филология как кластер смежных наук.
- Логос (слово, мысль, смысл, понятие)
- Логика Грамматика Риторика
- 2. Достижения осевого времени и их трансляция в современную эпоху.
- 3. Структура научных революций, их проявленность в филологии.
- 4. Методология сциентизма. Истинностная парадигма и ее основные постулаты.
- 5. Отличия гуманитарных исследований от сциентистских. Оценочная парадигма и ее синергетическая основа.
- 6. Конвергенция методов сциентизма и гуманитарных исследований в филологии.
- 7. Система взглядов в. Фон Гумбольта и ее значимость для современной филологии.
- 8. Философия обыденного языка (л. Витгенштейн), ее воздействие на современную филологию.
- 9. Философия диалогичности (м. Бахтин), ее влияние на современную филологию.
- 10. Формализм, формы его проявления на различных этапах развития филологических исследований.
- 11. Функционализм, формы его проявления на различных этапах развития филологических исследований.
- 12. Сущность революции н. Хомского.
- 13. Основные параметры антропологической парадигмы. Потребность в разработке функциональных методов исследования.
- 14. Типология знаков по ч. Пирсу.
- 15. Текст как полный семиотический знак.
- 16. Вторичные знаковые системы.
- 17. Отношения между составляющими модели семиозиса.
- 18. Параметры текстуальности.
- 19. Интертекстуальность как проблема.
- Подходы к изучению интертекста.
- 20. Постулаты когнитивной парадигмы.
- 21. Языки/коды, кодовые переходы. Специфика частных семиотик.
- 22. Модели представления знаний, фреймы и семантические сети.
- 23. Понятие предметной области и ее семиотическое представление.
- 24. Когниотип как дискурсивная форма организации знаний.
- 25. Герменевтика в современной научной ситуации. Герменевтическое (понимающее) мышление, Модели понимания текста.
- Три типа понимания текста (Богин)
- 26. Риторика в современной научной ситуации. Проективное мышление (генерирующее идеи). Риторическая модель.
- По дисциплине «Современные проблемы лингвистики»
- 2. Методология, основанная на тетрахотомической (системной) модели познания.
- 3. Набор базовых единиц языка в системном освещении.
- 4. Отношение token - type в ряду базовых единиц языка.
- 5. Обоснование центральной позиции высказывания и его системных проявлений (высказывание - предложение - пропозиция).
- 6. Текстовое произведение - текст - макроструктуры текста.
- 7. Дихотомия значение/смысл. Методики выявления смысла.
- 8. Семантическая структура высказывания: утверждаемое - пресуппозиции -подразумеваемое.
- 10. Сравнение различных определений термина «дискурс».
- 11. Методики поиска смыслов. Роль энциклопедии в интерпретации текста.
- 12. Язык как полевое образование. Является ли язык знаковой системой?
- 13. Модели языковой личности.
- 14. Ментальные и психологические характеристики языковой личности.
- 15. Взаимодействие ментальных и лингвистических единиц.
- 16. Методы построения когниотипа.
- 17. Когнитивный анализ интеракции.
- 18. Языковая уз семиотическая личность.
- 19. Поликодовый характер семиотической личности.
- 20. Невербальные коды коммуникации.
- 21. Типология дискурсов
- 22. Классификация речевых жанров.
- 23. Классификация речевых актов.
- 24. Конструктивная модель понимания текста.
- 25. Герменевтическая модель понимания текста.
- 26. Модель системомыследеятельности.
- 27. Синергетическая модель понимания текста.
- 28. Проблемная область порождения текста - первичного/ вторичного.
- 29. Лингвистический кластер наук: процессы дивергенции и конвергенции.
- 30. Структуралистская лингвистика.
- 31. Психолингвистика.
- 32. Когнитивная лингвистика.
- 33. Коммуникативная лингвистика.
- 34. Прикладная лингвистика.
- 35. Компьютерная (корпусная) лингвистика.
- Исходные понятия корпусной лингвистики
- 36. Социолингвистика.
- 37. Лингвокультурология.
- 38. Сравнительно-сопоставительная лингвистика.
- По дисциплине «Теория перевода»
- 1. Задачи теоретического изучения перевода.
- 2. Перевод как объект теории. Предмет теории перевода.
- 3. Противопоставление термина «теория перевода» термину «практика перевода» и «переводоведение»
- 4. Общая теория перевода. Частные теории перевода. Специальные теории перевода.
- 7. Этапы развития теории перевода.
- II Средневековый период.
- III Эпоха Возрождения.
- 8. Определение понятия «эквивалентность». Эквивалентность и смысл. Денотативное и сигнификативное значение.
- 9. Понятие и концепт.
- 10. Теория формальной и динамической эквивалентности.
- 11. Понятие прагматического потенциала и прагматического аспекта текста.
- 12. Этапы переводческого процесса.
- 13. Прагматические перестройки в художественной литературе и в переводе научно-технических материалов.
- 14. Прагматический аспект текстов, предназначенных для иноязычного получателя.