logo search
Введение в языкознание (2006 г

6.2. Установление состава лексем

К выявлению состава единиц лексикона ведёт лексемный анализ. Этот термин введён здесь по аналогии с термином морфемный анализ, чтобы показать значительное сходство процедур в исследовательской работе с морфемами и словами как основными единицами морфологического уровня языка и вместе с тем обратить внимание на имеющиеся различия, связанные с тем, что слово одновременно принадлежит и морфологическому, и номинативному (лексическому) компонентам языковой системы.

Основные цели лексемного анализа заключаются, во-первых, в установлении границ между словом и морфемой, между словом и словосочетанием, линейных границ между словами (проблема отдельности слова), и, во-вторых, в установлении границ между словом и его вариантами (проблема тождества слова).

Процедура анализа включает в себя три этапа.

— сегментация высказывания на отрезки (лексы), которые соотносимы со словами (лексемами) как абстрактными, инвариантными единицами языковой системы, являясь их актуальными представителями (экземплярами) в высказывании;

— установление лексемного статуса выделенных лексов, т.е. определение того, какую лексему каждый данный лекс репрезентирует, относятся ли два сравниваемых лекса к одной лексеме (как её аллолексы) или являются реализациями двух разных лексем;

— инвентаризация лексем.

Трудности лексемного анализа обусловливаются тем, что слово (лексема) является одновременно и лексической, и грамматической единицей, в соответствии с чем в лексиконе языка оно может быть охарактеризовано как класс носителей лексических значений (семантем), или как класс (в другой терминологии) лексико-семантических вариантов слов (концептем), а в морфологической системе как класс грамматических видоизменений слова (словоформ).

При линейной репрезентации высказывание может выступать как последовательность слов вообще (лексем), как последовательность ЛСВ (слов-концептем), как последовательность словоформ. В силу этого речевой представитель слова оказывается соотнесён со словом-лексемой, с одним из лексико-семантических вариантов (носителем определённой семантемы), с одним из морфологических формообразующих вариантов (словоформой как носителем грамматического значения).

Отдельность слова в речи / тексте (слово в синтагматическом аспекте). Установить однозначно линейные границы слова (вернее, лекса как его речевой реализации) чрезвычайно трудно. Эти границы задаются системой соответствующего языка и определяются далеко неодинаково при использовании разных критериев.

Критериями делимитации (разграничения) слов могут быть:

Графический (орфографический) признак:

В этом случае говорится о графическом слове. Предполагается , что данное слово на письме отграничивается от предшествующего и последующего слов пробелами, но не содержит пробела внутри себя. Возражения: 1) Не все языки имеют письменность. 2) В ряде систем графики (например, в китайской) пробелы между иероглифами или группами иероглифов не используются. 3) Орфография во многих языках очень непоследовательна; ср., например, раздельное написание целостных слов: в открытую, во избежание.

Фонетические признаки:

В этом случае говорится о фонетическом (или фонологическом) слове. Его границы и границы графического слова могут не совпадать. Ниже характеризуются лишь некоторые из фонетических признаков.

— Наличие гортанной смычки в начале слов. Признак не абсолютен. Так, нем. слово может иметь гортанную смычку в начале (das Eis [?aƒes] ‘лёд’), но тот же признак может сигнализировать границу между префиксом и корнем (vereisen [fEr?aƒez«n] ‘оледенеть’).

— Наличие одной акцентной вершины в слове. Возражения: 1) В слове может быть более одного ударения: трин:адцатиэт:ажный. 2) Слово может быть неударным и примыкать в качестве проклитики к последующему или в качестве энклитики к предыдущему слову, входя в структуру так называемого акцентного слова: на_ст:ол, н:а_пол, ст:ал_бы. 3) Язык может не принадлежать к числу акцентных, как, например, французский. Здесь одно синтагматическое (и фразовое) ударение может объединить в единое акцентное целое большую группу слов: Je_ne_le_lui_ai_jamais_dit ‘Я этого ему никогда не говорил’. Собственно говоря, в языках со свободным и подвижным словесным ударением количество акцентных вершин может свидетельствовать лишь о числе слов (практически знаменательных), но не о начальных или конечных их границах, и только в языках с неподвижным начальным или конечным ударением могут быть определены соответствующие границы слов.

— Наличие в слове гармонии гласных (например, в финно-угорских или тюркских языках). Но в венгерском языке гармония гласных не охватывает составляющих сложных слов: Buda-pest. И к тому же явление гармонии гласных не сигнализирует межсловных границ.

Морфологический признак:

Цельнооформленность слова (наличие единого показателя грамматической формы). На основе этого признака иван-чай признаётся одним словом (ср. иван-чая), а диван-кровать придётся рассматривать как сочетание двух слов (ср. дивана-кровати). Во фр. показатель мн. ч. может появиться и внутри: bonhomme ‘добряк’ — мн. ч. bonshommes, что противоречит ощущению целостности данного слова. Англ. silver spoons ‘серебрянные ложки’ имеет единый показатель мн. ч., но вряд ли это образование можно признать единым словом. Межсловные границы этим признаком не сигнализируются.

Синтаксические признаки:

— Способность слова (в отличие от морфемы) самостоятельно вступать в синтаксические связи; ср. англ. stone wall ‘каменная стена’ — stone-of-Carrara-wall ‘стена из каррарского камня’; button shoes ‘туфли с пуговицами’ — red-button shoes ‘туфли с красными пуговицами’.

— Способность выступать в качестве минимума предложения. Возражение: служебные слова в этом случае оказываются исключёнными из корпуса слов.

— Способность выступать в роли члена предложения. Возражение: из числа слов опять-таки исключаются служебные.

— Возможность вставить слово между двумя словами (и вытекающая отсюда непроницаемость слова, невозможность вставить внутрь него другое слово): На лекцию пришли все. — На эту лекцию пришли все. Контрпримеры: В португ. между основой глагола и окончанием буд. времени может быть вставлено личное местоимение (dar-ei ‘дать — 1 л. ед. ч. буд. времени’ — dar-vos-ei ‘(я) вам дам’. В нем. языке так называемая отделяемая приставка наречного происхождения (собственно говоря, наречный компонент сложного глагола) не только может отрываться от глагольного компонента, но и допускает вставление слова или словосочетания между обоими компонентами: aufstehen ‘вставать’ — ich stehe auf ‘я встаю’ — ich stehe um sechs Uhr auf ‘я встаю в шесть часов’. Такой глагол ведёт себя то как цельнооформленное сложное слово, то как сочетание двух слов, часто обладающее свойствами фразеологизма. Ср., далее, рус. никемни с кем. Можно здесь видеть чередование слов синтагматических и парадигматических. Так, stehe auf представляет собой два синтагматических слова, aufstehen — одно синтагматическое слово, парадигматически же (т.е. в системе языка) мы имеем дело с одним словом. Таким же образом могут трактоваться так называемые аналитические формы слов (англ. am writing ‘пишу’, нем. wird kommen ‘придёт’, фр. ai dit ‘сказал’) и так называемые аналитические слова (англ. pride oneself ‘гордиться’, нем. sich erholen ‘отдыхать’, фр. s'enfuir ‘убегать’): парадигматически каждая из этих единиц представляет собой целостное слово, синтагматически же каждая представлена двумя или более словами.

Признак непроницаемости слова, таким образом, не позволяет однозначно установить ни линейные словесные границы, ни количество выделенных слов. И контрпримеры из многих языков поневоле побуждают к допущению даже такой “еретической” мысли, что слова всё-таки членимы, что они обладают свойством “разрывности”.

— Позиционный признак: переместимость слов внутри предложения: Профессор читает лекцию. — Профессор лекцию читает. — Читает профессор лекцию. — Читает лекцию профессор. — Лекцию профессор читает. — Лекцию читает профессор. Возражение: Перемещаются при перестановках собственно не всякие слова как таковые, а слова как носители синтаксических функций членов предложения (синтаксемы), т.е. знаменательные слова в сочетании со служебными. Ср. (здесь звёздочка * обозначает неграмматичность соответствующей конструкции): На лекцию пришли все. — * На пришли лекцию все. — * На все пришли лекцию... (служебные слова “не обладают правом” на свободное перемещение). Правда, линейные границы во многих случаях благодаря этому признаку определяются однозначно.

Семантический признак:

Идиоматичность слова, что можно понимать трояко: 1) Идиоэтничность данного слова, принадлежность его именно данному языку и невозможность его точного, адекватного перевода на другие языки. 2) Немотивированность данного слова, невозможность установить его этимологическое значение. 3) Наличие целостного, “идиоматического” значения у слова, несводимость этого значения к сумме значений элементов, составляющих слово. Возражение по последнему пункту: Русское слово почтамт условно членимо, ибо его компонент -амт невоспроизводим в составе других сложных слов. В целом дефектная членимость присуща достаточно ограниченному множеству слов. К тому же большинство слов допускают морфемную (и, следовательно, линейную семантическую) декомпозицию.

Итак, ни один из рассмотренных здесь критериев сегментации речи на лексемные сегменты (лексы) не обладает достаточной диагностирующей силой, не оказывается абсолютным. Из них относительно большей надёжностью в установлении границ между словами в речи обладает признак позиционной подвижности. Остальные же признаки скорее могут служить приблизительному определению того, сколько слов содержится в анализируемом речевом отрезке.

Некоторые учёные, опираясь скорее на соображения педагогического, нежели научного порядка, стремятся во что бы то ни стало найти универсальное определение слова. Они выражают неудовольствие по поводу того, что Л.В. Щерба мог говорить и в лекциях в студенческой аудитории, и в научных публикациях, что он не знает, что такое слово. Этот выдающийся исследователь подчёркивал, что в каждом конкретном языке слово характеризуется своими особенностями и что нужно обращаться ко множеству самых разных и самых экзотичных языков, а не только европейских. Э. Сепир ещё в 1921 г. в своём учебнике «Язык. Введение в изучение речи» (см. его: Избранные труды по языкознанию и культурологии. М., 1993) смог убедительно показать на материале множества языков (и особенно америндских) трудности отграничения слова от смежных явлений.

Как при фонемной и морфемной сегментации, так и при сегментации высказывания на слова следует принять положение о том, что и “остатки”, обнаруженные в результате лексемной сегментации, квалифицируются тоже как представители слов (ср.: радиопередача, где и радио, и передача способны функционировать самостоятельно; русско-английский словарь, где русско- придётся, хотя с натяжкой, приравнять по своему статусу к лексу английский).

Тождество слова (слово в парадигматическом аспекте). На этапе лексемной идентификации могут использоваться, как и в морфемном анализе, приёмы дистрибутивного анализа, и тоже с учётом двусторонней природы слова. Поэтому первым условием лексемного анализа при сопоставлении двух выделенных в высказывании лексов является требование наличия у них:

— во-первых, тождественного лексического значения (или, во всяком случае, наличия у них лексических значений, связи между которыми могут рассматриваться как следствие процессов образования новых, производных значений; ср. стол1 ‘предмет мебели’ и стол2 ‘пища, еда, съестное’). В противном случае приходится говорить о том или ином типе омонимии слов; ср. лукI ‘растение’ и лукII ‘оружие’;

— во-вторых, тождественного грамматического значения (а вместе с тождеством формального показателя и соответствующей граммемы) или комплекса грамматических значений (иначе нужно фиксировать наличие омонимичных словоформ; ср. стол-0 ‘сущ., им. п. ед. ч.’ и стол-0 ‘сущ., вин. п. ед. ч.’).

Тест на дополнительную дистрибуцию опирается на предположение, что два лекса, если они относятся к одной лексеме на правах её аллолексов, не могут употребляться в одинаковом окружении. Ср.: лексы, репрезентирующие два лексико-семантических варианта слова стол (Стол стоял у стены. — В санатории богатый стол); лексы, представляющие две словоформы слова стол (Стол стоял у стены. — Он подвинул стол к стене). Среди семантических вариантов одной лексемы один может быть признан основным. Точно так же среди морфологических формообразующих вариантов один выделяется как основной.

Тест на свободное варьирование предполагает, что два лекса могут встречаться в одном окружении, не выступая при этом представителями разных лексем. При этом наблюдаются факультативные варианты разного вида; ср. к:омпас ~ комп:ас, свекл:а ~ св:ёкла, тоннель ~ туннель, лиса ~ лисица, картофель ~ картошка, кафе ~ кафешка. Между такими вариантами имеют место различия по стилю, принадлежности к литературному языку либо к просторечию и т.п.

При этом между экспонентами этих вариантов сохраняется частичное фонемное сходство. Иначе пришлось бы говорить о синонимах различного рода (умныйсообразительный, валенкипимы, петухкочет). Факультативными вариантами словоформы являются нем. формы слова Tag ‘день’ в дат. п. ед. ч.: (dem) Tag-0 ~ (dem) Tag-e.

Для установления парадигматических границ слова и инвентаризации лексем особо важно рассмотрение проблемы полисемии и омонимии (см. раздел 6.3). Лексикология ищет здесь ответ на вопрос, являются ли стол в значении ‘предмет мебели’ и стол в значении ‘питание, еда’ двумя разными словами или же одним словом в разных его вариантах.

Классификации лексем. Распределение слов по классам может осуществляться на основании множества разнообразных формальных и семантических признаков. В формальном плане — это различение слов: ударных и безударных, односложных и многосложных, одноморфемных и многоморфемных, одноформенных (неизменяемых) и многоформенных (изменяемых), простых и производных и т.п.

Для грамматики и вообще для лингвистического анализа особое значение имеет функциональная классификация слов по частям речи. В соответствии со своими номинативными особенностями лексемы берут на себя в предложении различные функции.

Главенствуют знаменательные слова, а именно назывные слова (существительные, глаголы, прилагательные, наречия, числительные, так наз. предикативы, или слова категории состояния), а также близко к ним стоящие местоимённо-указательные, или дейктические, слова). К ним примыкают модальные слова.

Знаменательным и модальным словам, а также междометиям, противостоят служебные слова, номинативный потенциал которых менее очевиден. Они либо именуют реально имеющие место отношения между элементами ситуаций (предлоги, послелоги, союзы, связки), либо указывают на характер отношения говорящего к описываемому явлению или к самому акту высказывания (частицы и, в определённой степени, модальные слова), либо характеризуют их принадлежность к определённым грамматическим классам и подклассам (артикли, вспомогательные глаголы).

Среди знаменательных слов выделяются существительные как предметные слова. Они обеспечивают идентификацию наблюдаемых в природе предметов и живых существ, масс вещества, созданных человеком предметов (артефактов), человеческих общностей, социальных институтов и отношений и т.п. (куст, трава, камень, собака, человек, песок, вода, стол, компьютер, племя, партия, население, государство, армия).

Существительные (и образуемые ими именные группы) способны обеспечивать выбор из виртуального денотата как класса реалий какого-то предмета в качестве референта, на который указывает говорящий, отмечая его определённость или неопределённость и т.п. Другие слова не обладают свойством референции.

Существительным противостоят предикатные (или признаковые) слова. Среди них ведущая роль в приписывании (предицировании) тех или иных характеристик (предикатов) предметам или их признакам принадлежит собственно глаголам. Финитный (личный) глагол участвует в акте предикации, открывая валентности (в теории фреймов — слоты) и создавая в сочетании с одним или несколькими именами предложение как пропозитивный (или предикативный) знак. Далее, к предикатным словам относятся прилагательные, наречия, вербоиды (неличные формы глагола), а также отглагольные существительные (выступление писателяписатель выступает) и вообще абстрактные существительные. Для предикатных слов характерно наличие валентностей, открывающих синтаксические позиции для имён носителей признака.

К признаковым словам тяготеют наименования лиц, характеризующие либо их функцию, либо их отношение к другим лицам или предметам (учительтот, кто учит; хозяин (дома)тот, кто владеет (домом); землевладелецтот, кто владеет землёй). Так, существительное отец может выступать как предикатный знак, открывая (вместе со связкой) две валентности (кто? + (по отношению к) кому?: Павел отец Ивана / является отцом Ивана). Вместе с тем такие имена способны к употреблению в референтной функции, замещая позицию подлежащего / субъекта или дополнения / объекта: Отец попросил сына купить лекарства; Дети очень почитают отца; Учитель доходчиво объяснил разницу между звуками и буквами.