20. Текстовый корпус как модель коммуникативной сферы. Текстовая структура Британского национ. Корпуса.
В лингвистике уже разработаны принципы построения текстовых корпусов как коммуникативных моделей (Британский национальный корпус, Национальный корпус русского языка и др.).
В настоящее время начата разработка особого, лингвокультурологического, типа корпусов, включающих, наряду с
лингвистическими, также и нелингвистические данные. Корреляция таких данных в составе
лингвокультурологического корпуса дает возможность системно представить определенный
тип коммуникации, моделировать соответствующую разновидность общения как целостное
культурно-коммуникативное образование.
Иллюстрацией лингвокультурологического корпуса является создаваемый в
Саратовском государственном университете им. Н.Г. Чернышевского мультимедийный
диалектологический корпус (СДК). В его основу положен принцип синтеза лингвистических и
культурологических данных.
Центральное место в лингвокультурологической диалектном корпусе принадлежит
репрезентативному массиву текстов на диалекте, отражающих важнейшие типы диалектной
речи (речь бытовую, фольклорную, речь в условиях официального, обрядового общения);
различные формы речи (диалог, полилог, монолог); разнообразную тематику сельского
общения; социальную дифференциацию носителей говора (по полу, возрасту, профессии,
уровню образования). Текстовая база корпуса содержит не только ценные лингвистические
данные, но и уникальные сведения о судьбах людей, об истории родного села, края и страны в
восприятии и оценках сельских жителей.
Использование текстовых корпусов обеспечивает новый уровень лингвистических
исследований, опирающихся на репрезентативный, значительный по объему речевой
континуум, в наиболее полной мере учитывающих функциональные и статистические
характеристики языковых явлений. «Впервые в истории, – справедливо отмечают О.Н. Лагута и
М.К. Тимофеева, – реально вырисовывается перспектива изучать «язык в действии», о чем
некогда говорил Вильгельм фон Гумбольдт, а позже – И.А. Бодуэн де Куртенэ, А.А. Потебня,
Л.В. Щерба и другие» [Лагута, Тимофеева 2007: 114].
В статье В.А. Плунгяна «Корпус как инструмент и как идеология: о некоторых уроках
современной корпусной лингвистики» обосновывается мысль о том, что появление НКРЯ «не
просто дало в распоряжение лингвистов новый мощный инструмент анализа фактов языка –
оно в определенной степени изменило теоретические приоритеты и отчасти даже взгляды на то,
чем является язык и какие задачи изучения языка являются наиболее важными» [Плунгян 2008:
7-8]; «в настоящее время корпус – это не просто дань техническому прогрессу или более
удобный инструмент для поиска примеров; это именно примета новой идеологии изучения
языка, для которой язык – вообще говоря, и есть корпус…» [Там же: 12], а «текст… главный
объект теоретической рефлексии» [Там же: 14].
Текстовый корпус позволяет получить данные, недоступные для наблюдения при
обращении к другим, традиционным, источникам, ставить принципиально новые задачи, ранее
практически невыполнимые из-за их трудоемкости. Так, объемный текстовый корпус может
послужить надежным источником сведений о типичных для языковой единицы семантических
и грамматических позициях, о частотности ее употребления, о характерных для нее
прагматических и дискурсивных условиях функционирования, о динамике языковых явлений.
Ср., например, приведенные В.А. Плунгяном некоторые конкретные вопросы, данные по
которым могут быть добыты исследователем на материале НКРЯ «простым нажатием кнопки»:
Какой из приставочных коррелятов – прореагировать, отреагировать, среагировать –
употребляется в современном русском языке чаще? К каким контекстам тяготеет каждый из
этих приставочных коррелятов (например, какой из них охотнее сочетается с наречием
быстро)? В какой последовательности они появляются в современном языке – одновременно
или по очереди? Различается ли частота их употребления в разные периоды? Сбор материала
для ответа на подобные вопросы в отсутствии корпуса занял бы месяцы или годы
[Национальный… 2005: 13-14]. Иначе говоря, текстовый корпус позволяет ставить и успешно
решать задачи, связанные с «микроэволюцией» языка на протяжении одного-двух столетий:
наблюдать малозаметные изменения сочетаемости и значений слов, изменения частотности
различных конструкций или частотности употребления лексических и грамматических
вариантов, регистрировать появление или угасание отдельных явлений языка.
Опора на корпусные данные значительно повышает объективность, а следовательно,
научный статус грамматических и словарных описаний языка. «Теперь, – справедливо
отмечают А.Т. Хроленко и А.В. Денисов, – подлинно научные описания грамматического строя
языков, а также авторитетные академические словари – практически все без исключений –
должны составляться на основе корпусов этих языков» [Хроленко, Денисов 2007: 50].
Сотрудниками Института русского языка им. В.В. Виноградова РАН на основе НКРЯ
уже создан ряд экспериментальных словарей. В настоящее время на сайте Института
(http://dict.ruslang.ru/) (Гольдин сказал посмотреть эти словари и сам НКРЯ!) размещены следующие словари этой серии: Е.А. Гришина.
Грамматический словарь новых слов русского языка; О.Н. Ляшевская. Новый
частотный словарь русской лексики; Г.И. Кустова. Словарь русской идиоматики.
Сочетания слов со значением высокой степени; Е.Ю. Калинина. Словарь глагольной
сочетаемости непредметных имен русского языка.
Апелляция к текстовым корпусам национальных языков целесообразна в практике
преподавания филологических дисциплин, в том числе в процессе изучения данного языка как
иностранного. Оптимизируя работу лингвиста в исследовании семантики языковых единиц, в оценке употребительности тех или иных семантических вариантов и языковых выражений, корпуса текстов эффективно используются при проведении лингвистических экспертиз.
Предпочтение, которое отдается современной лингвистикой корпусно-ориентированным
исследованиям, объясняется в целом тем, что корпус «позволяет изучать действительно
существующие в языке, а не мнимые явления» [Плунгян 2008: 17].
Слово «национальный» — своего рода термин, отражающий скорее семантику английского слова «national», чем русского слова «нация». Впервые это определение появилось в названии Британского национального корпуса (British National Corpus, BNC), созданного в 1990-е годы в Великобритании специалистамилексикографами; это не самый первый электронный корпус, созданный в мире, но один из лучших, крупнейших и наиболее известных. Для британцев слово «национальный» означало в первую очередь «характеризующий британский национальный вариант английского языка» (в отличие от американского, австралийского и т. п.), но поскольку этот корпус очень быстро стал практически эталоном корпуса вообще, то значение слова «национальный» незаметно изменилось. Национальным корпусом стали называть просто самый большой и представительный корпус, характеризующий язык данной страны в целом. Самым крупным в настоящее время является также уже упомянутый выше Британский Национальный Корпус (BNC), объем которого достигает ста миллионов словоупотреблений. Корпус начал создаваться в 90-х годах, примерно на 90% он состоит из письменного материала и на 10% – из речевых записей. Содержимое корпуса размечено морфологически.
см. корпус http://www.natcorp.ox.ac.uk/
http://www.ruscorpora.ru/corpora-intro.html
1
- 16. Термин, терминология и специальные подъязыки. Прикладные работы в области терминологии. Стандартизация терминологической лексики.
- 18. Словари лингвистических терминов.
- Примеры словарей.
- 19. Корпусная лингвистика, её идеология и основные понятия.
- 20. Текстовый корпус как модель коммуникативной сферы. Текстовая структура Британского национ. Корпуса.