logo search
Zagal_39_ne_movoznavstvo_M_Kochergan

3) Та сама форма трапляється в різних позиціях, як було показано вище на прикладі англ. [іи:]. У такому разі ця форма представляє різні класи елементів.

Методи дослідження мови

375

Розрізняють три типи дистрибуції: доповняльну, контрастну та вільного варіювання. Це розрізнення ду­же важливе-для ідентифікації досліджуваних мовних одиниць.

Мовні одиниці знаходяться у відношенні допов­няльної дистрибуції, коли кожна з них трапляється в такій сукупності контекстів, у якій не трапляється жодна з інших, тобто коли мовні одиниці не трапля­ються в однакових оточеннях. Так, звуки [и] та [і] знаходяться у доповняльній дистрибуції, оскільки [и] на відміну від [і] не може стояти на початку слова і після м'яких приголосних. Якщо ж мовні одиниці перебувають у тих самих оточеннях і при цьому роз­різняють їх значення, то вони знаходяться в контрас­тній дистрибуції. Наприклад, звуки [и], [а], [у], [є] (бик бак бук бек). Коли ж певні мовні одиниці трапляються у тому самому оточенні і при цьому не розрізняють форм слів або значень, то вони знахо­дяться у стані вільного варіювання. Наприклад, пост­фікси -ти і -ть в інфінітиві (любити любить), за­кінчення -ові(-еві), -у(-ю) в давальному і місцевому відмінках іменників другої відміни (батькові батьку, кобзареві кобзарю).

Дистрибутивний аналіз набув широкого застосуван­ня в лінгвістиці. Він може бути використаний для ана­лізу мовних одиниць будь-якого рівня. За його допо­могою можна встановлювати систему фонем і морфем будь-якої мови, значення полісемічних слів, семантич­ну відстань між словами певної лексико-семантичної категорії тощо. Так, для встановлення системи фонем використовують три правила: 1) якщо два звуки ма­ють однакову дистрибуцію і не розрізняють смислу, то вони становлять варіанти однієї фонеми (рос. [г] і [у]; див.: [нлга] і [нлуа], [гьллва] і [уьллва]); 2) якщо два звуки мають однакову дистрибуцію і розрізняють смисл, то вони є різними фонемами (гад, вад, зад, лад, над, рад, сад, чад; кут, кат, кит); 3) якщо ж два звуки ніко­ли не трапляються в одному оточенні, то вони є предс­тавниками однієї фонеми (рос. [м] і [и]). Дистрибутив­ний аналіз для встановлення системи фонем українсь­кої мови використала В. С. Перебийніс [Перебийніс 1970].

Ефективне застосування знайшов дистрибутивний аналіз у лексикології. За його допомогою легко розме­жовують значення полісемічних слів. Так, скажімо, нас

376

Методологія мовознавства

цікавить, в одному чи в двох різних значеннях вжито дієслово грати в реченнях Учень грає на скрипці і Учень грає на нервах. Для того щоб відповісти на це запитання, необхідно поширити обидва речення з ура­хуванням усіх можливих оточень слова грати. Поши­рення за рахунок додатка в давальному відмінку Учень грає на скрипці учителю. Учень грає на нервах учите-лю не виявляє різниці. Однак це ще не всі дистрибу­тивні можливості дієслова грати. Перше речення мож­на поширити ще так: Учень грає на скрипці учителю романс. У другому реченні дієслово грати не може ма­ти поширення за рахунок прямого додатка (грати що). Отже, дієслово грати в наведених реченнях вжите в різних значеннях («виконувати що-небудь на музич­ному інструменті» і «дратувати кого-небудь»), оскіль­ки воно в цих реченнях має різну дистрибуцію. Дані, одержані за допомогою дистрибутивного аналізу, мо­жуть бути інтерпретовані мовою символів. Так, дист­рибутивною формулою дієслова грати в першому зна­ченні буде МпУзРгрІЧ^Ма, а в другому — МпУзРгрї^Ма, де N — іменник, V — дієслово, ргр — прийменник, п, 1, (і, а — відмінки (називний, місцевий, давальний, знахідний), 3 — третя особа. Як правило, багато­значні дієслова диференціюють свої значення уже на найбільш узагальненому синтаксичному рівні: різні значення реалізуються в різних (неоднакових) син­таксичних конструкціях. Пор.: Хлопець несе одеко­лон і Від хлопця несе одеколоном, де значення «до­ставляти щось кудись» дієслова нести реалізується у двоскладному реченні з підметом і прямим додатком (ЛпУ3;№а), а значення «поширюючись повітрям, става­ти відчутним» у безособовому реченні (ргрИ^УзМі). Пор. ще рос: взорваться от чего (от миньї) і взор-ваться чем (яростью), разойтись с кем і разойтись в чем (во взглядах), вспьіхнуть от чего (от огня) і вспьіхнуть как (зло), вертеть что (сигарету) і вер-теть чем (сигаретой).

Отже, дистрибутивний аналіз дає змогу точніше й об'єктивніше вивчати й описувати мовні явища. Оскіль­ки результати цього аналізу можна формалізувати, то во­ни можуть бути інтерпретовані мовою математики.

Практичне застосування дистрибутивний аналіз знайшов не тільки в лінгвістичних дослідженнях, а й у машинному перекладі (перш ніж перекласти речення з багатозначним словом чи омонімами, машина на осно-

Методи дослідження мови

377

ві їх оточення повинна визначити значення цих неод­нозначних форм), а також у методиці викладання мов у вищій і середній школі. Наприклад, відомо, що значні труднощі викликає розрізнення російських прикметни­ків і прислівників у формі вищого ступеня порівняння. Єдиний засіб, який може використати вчитель, — посла­тися на оточення цих форм: якщо аналізована форма відноситься до іменника, то це буде прикметник, якщо до дієслова, то це прислівник (Истина дороже. Ку-пил дороже). Це ж стосується розрізнення омоні­мічних форм англійських іменника, дієприкметни­ка (ргезепі рагіісіріе) і герундія (ТНе геайіпш ізп'і іпіегезііпд, Не І8 геасііпд, І атп іопй о/ геасііпд, І соиШп'і Неір геайіпд), німецьких прикметників і прислівників (Ег ізі 8еНг £ІйскІіск. Ег ІеЬі зіискііск). Дуже важливим є врахування дистрибуції у процесі засвоєння слів іноземної мови, денотативний обсяг яких не збігається з їх перекладними відповідниками. Так, скажімо, значення «огрядний» передається різ­ними словами англійської мови залежно від того, кого стосується ця ознака — дитини, жінки чи чоловіка (зіоиі тап, злеріитр иютап), значення «високий» пе­редається словом Ні§Н, якщо йдеться про неістоту (Ні§Н ігее, кі£к тоипіаіп), і словом іаіі, коли це стосується істоти (іаіі §ігІ, іаіі уоиіН).

Методика безпосередніх складників

Дистрибутивний аналіз перебуває в тісному зв'язку з методикою безпосередніх складників.

Методика безпосередніх складників (БС) — прийом подання сло­вотвірної структури слова і синтаксичної структури словосполучен­ня та речення у вигляді ієрархи складових елементів.

Основні принципи методики БС, як і дистрибутивно­го аналізу, були сформульовані Л. Блумфільдом, а далі розроблені представниками дескриптивної лінгвістики К. Пайком, Ч. Хоккетом, Р. Уеллзом і С. Четменом.

В основу аналізу за БС покладено поступове члену­вання висловлення на бінарні складники, яке про­довжується доти, доки не залишаться неподільні еле­менти (кінцеві складники). Речення (коли йдеться про аналіз за БС на синтаксичному рівні) поступово згорта­ється до «ядерної» одиниці, тобто одиниці, яка лежить в основі його будови. У членуванні речення, як і сло-

378

Методологія мовознавства

восполучення, дотримуються принципу: один із БС по­винен бути ядром членованої конструкції, а інший — периферійним елементом. Так, скажімо, у словосполу­ченні моя книжка слово книжка — ядро, а моя — пе­риферійний (маргінальний) елемент, у словосполучен­ні написати листа дієслово написати — ядро, а лис­та — маргінал.

Аналіз за БС ґрунтується на таких строгих пра­вилах: 1) кожен раз дозволяється зробити тільки одне членування; 2) у процесі поділу не допускається перестановка складників; 3) у кожному членуванні береться до уваги тільки результат останнього чле­нування.

Процес аналізу за БС продемонструємо на реченні Маленька дівчинка їсть велике яблуко. Членування речення починається з виділення найтісніше пов'яза­них між собою складників, тобто з блоків, які ле­жать в основі структурної будови речення. Найтісні­шими блоками тут є маленька дівчинка (перший по­діл) і велике яблуко (другий поділ). Далі виділяємо групу присудка їсть велике яблуко9 тому що на цьо­му етапі членування (третій етап) цей блок є найтісні­шим, адже словосполучення велике яблуко в цілому підпорядковане присудкові — дієслову їсть. Нарешті (четвертий етап) групу підмета об'єднуємо з групою присудка. Результати аналізу за БС прийнято зобра­жати схематично під аналізованою структурою. Гра­фічно аналіз наведеного вище речення матиме такий вигляд:

Маленька дівчинка їсть велике яблуко

ч-1 и=ч

Окремо від аналізованого речення результат аналі­зу зображують у вигляді дерева:

Аналіз за БС перекладу цього речення англійською мовою матиме дещо інший вигляд через наявність тут артикля:

Методи дослідження мови

379

А ІШІе §ігІ еаі8 а Ьі§ арріе

Коли ж усувати складники у послідовності їх виді­лення і залишити останні два складники, то отримає­мо ядерну структуру дівчинка їсть (§ігІ еаіз).

Слід зазначити, що деякі засновки методики БС є надто жорсткими. Тому дотримуватися бінарного поді­лу не завжди можливо. У мові є слова і конструкції, які поділяються не на дві, а на три частини, наприклад: примор'-я, сад і город.

Таким чином, аналіз за БС є основним прийомом сегментації мовного матеріалу і виділення фундамен­тальних одиниць, які конструюють модель мови, а також визначення ієрархії складників у словах, сло­восполученнях і реченнях. Практичне застосування цей аналіз має в системах автоматичного перекладу для синтаксичного аналізу і синтезу речень (згортан­ня і розгортання за БС). Використовують його і в лінгводидактиці. До речі, він і зародився як негатив­на реакція на практикований у школах синтаксич­ний розбір речень. На думку основоположників ме­тодики БС та деяких їхніх послідовників, синтаксич­ний аналіз речення за його членами є недостатньо ефективним. Скажімо, в реченні Життя учителя в селі стало цікавим член в селі можна інтерпретува­ти як обставину, означення і навіть як додаток за­лежно від того, як буде поставлено запитання (життя де, життя яке чи життя в чому?). Саме тому предс­тавники дескриптивізму вважали за необхідне замі­нити традиційний розбір речення за його членами аналізом за БС, який, за їхнім переконанням, розкри­ває послідовність процесу породження речення чи сло­ва й показує внутрішню підпорядкованість їх склад­ників.

Методика аналізу за БС і до її теоретичного обґрун­тування мала стійкі традиції в європейських школах, тільки вона подавалась як структурні схеми складно­го речення і як членування слова на твірну і похідну основу. Так, речення типу Настала довгождана вес-

380

Методологія мовознавства

на, і зацвіли київські каштани, які давно стали сим­волом нашої столиці має таку структурну схему:

Вона читається так: підрядна частина які давно стали символом нашої столиці приєднується до головної за­цвіли київські каштани9 а уже цей цілий блок приєдну­ється сурядним зв'язком до частини настала довго­ждана весна.

Аналіз за БС дає змогу наочно показати послідовні ланки (й етапи) механізму творення слова. Так, слово спіднизу утворене не від с- + піднизу чи спідниз + -у, а з двох частин спід + низу, які в свою чергу також скла­даються з двох морфем:

с п і д н и з[у|

ч=*__ьн

Алгоритм творення російського слова учительство-вать графічно може бути зображений у такий спосіб:

учительствовать

ч^-=4=!_І

Цю схему розшифровують так: від кореня уч- утво­рене слово учить, яке стало твірною основою для по­хідного учитель (учи + тель), від слова учитель за допомогою суфікса -ство утворений дериват учительс­тво, а від нього за допомогою суфікса -ова- та інфінітив­ного постфікса -ть утворене все наведене вище слово.

Незважаючи на ефективність, методика БС має один серйозний недолік: вона не може розв'язати проблеми інваріантності в лінгвістичних досліджен­нях, тобто визначити, які конструкції є тотожними, а які — ні. Так, речення Спів пташок, Вивчення мови і Запрошення кіноактора за методикою БС матимуть однакову структуру, яку формально можна передати, як ІУЛЛ^ (іменник у називному відмінку 4- іменник у

Методи дослідження мови

381

родовому відмінку). Насправді між цими фразами є суттєві відмінності. У першому випадку маємо родо­вий відмінок суб'єкта, у другому — родовий об'єкта, а третя фраза — двозначна (не зрозуміло, хто кого запросив — кіноактор запросив чи запросили кіно­актора).

Трансформаційний аналіз

Пошуки подолання недоліку методики БС зумовили появу трансформаційного аналізу.

Трансформаційний аналіз — експериментальний прийом визна­чення синтаксичних і семантичних подібностей і відмінностей між мовними об'єктами через подібності й відмінності в наборах їх трансформацій.

Методику трансформаційного аналізу опрацювали і ввели в наукову практику на початку 50-х років XX ст. 3. Харріс і Н. Хомський. Суть цієї методики полягає в тому, що в основі класифікації мовних структур лежить їх еквівалентність іншим за будовою структу­рам, тобто можливість однієї структури перетворюва­тися на іншу (наприклад, активна конструкція може трансформуватися в пасивну).

Трансформаційний аналіз ґрунтується на уявленні, що в основі будь-якої складної синтаксичної структури лежить проста, через що за допомогою невеликого набо­ру правил перетворень можна з простих структур вивес­ти складні. Отже, синтаксична система мови має кіль­ка підсистем, з яких одна є вихідною (ядерною), а всі інші — похідними. У ядерну підсистему входять еле­ментарні речення, які позначають найпростіші ситуації. Складні типи речень утворюються з ядерного шляхом різних трансформацій. Представити синтаксичну струк­туру речення — означає визначити ядерні типи, що ле­жать у його основі, і показати, внаслідок яких трансфор­мацій воно виникло.

Для трансформаційної методики дуже важливим є питання, що вважати критерієм еквівалентності транс­формацій, тобто які перетворення можна кваліфікува­ти як трансформації, а які ні. Таким критерієм є від­ношення домінації (підпорядкування) між безпосеред­німи складниками в реченні. Якщо між словами чи у випадку зміни основи слова в процесі трансформації між коренями різних слів у фразі залишаються ті

382

Методологія мовознавства

самі зв'язки, то дані перетворення можна вважати трансформами. Для ілюстрації наведемо чотири фрази і графічно зобразимо зв'язки між їх безпосередніми складниками:

Водій відчиняє двері

І____* і_____*

Двері відчиняються водієм

І___________* і___________*

Відчинення дверей водієм

І ' * т

Відчинення дверей водія

І____Я__*

Усі ці структури, крім останньої, є трансформами першої фрази. Остання фраза не є трансформом пер­шого речення, оскільки тут є безпосередній зв'язок між словами дверей і водія, якого в першому реченні не було. Перетворення в процесі трансформаційного аналізу графічно зображується стрілочкою (-*): Во­дій відчиняє двері > Двері відчиняються водієм. Якщо ліву частину можна перетворити на праву, то можлива й зворотна трансформація. Тоді стрілка матиме два спрямування: Водій відчиняє двері <-> Двері відчиняються водієм. Формально (узагальне­но) наведені вище трансформації можна записати так:

"№* ~ [мкмім} '

де N — іменник, V — дієслово, — віддієслівний іменник, п, £, і — називний, родовий, орудний відмін­ки, раз — пасивна форма дієслова, 1, 2 — порядкові номери іменника згідно з вихідною фразою, У3 — діє­слово в третій особі.

Уважний аналіз виконаних вище трансформацій свідчить про те, що в трансформах вихідної фрази не тільки не змінюються безпосередні зв'язки, а й не змі­нюються основи (корені) лексичних одиниць.

Трансформаційний аналіз долає недоліки аналізу за безпосередніми складниками. Перетворивши формаль­но нерозрізнювані фрази Спів пташок, Вивчення мови,

Методи дослідження мови

383

Запрошення кіноактора в їх трансформи, наочно поба­чимо їх відмінності:

Спів пташок —> Пташки співають

ед, -> мпуг Вивчення мови —> Мова вивчається

**№е -> мпура8 Запрошення кіноактора —> Кіноактор запросив

яН*е -> "пУг Запрошення кіноактора —» Запросили кіноактора

М%Мд->УМд

Як бачимо, відмінності між першою і другою фра­зою формально описуються і неоднозначність третьої фрази знімається трансформаційним аналізом. Таким чином, загальне завдання трансформаційного аналізу полягає в тому, щоб шляхом перетворень описати без­ліч висловлень певної мови як похідних від порівняно невеликої кількості ядерних конструкцій. Тверджен­ня, що в основі багатоманітності синтаксичних типів у природних мовах лежить відносно проста система ядер­них типів, перетворюваних за допомогою невеликого числа трансформаційних правил, стала відправною точкою для розвинутої Н. Хомським концепції поро-джувальної граматики.

Трансформаційний аналіз використовують у лінг­вістичних дослідженнях синтаксису, морфології, словотвору, лексичної семантики. Останнім часом із розширенням трактування трансформацій за раху­нок зняття з визначення трансформації умови не­змінності лексичного складу речення й умови незмін­ності синтаксичних відношень між словами сфера застосування трансформаційного аналізу значно роз­ширилася.

Так, за допомогою трансформаційного аналізу легко розмежовують назви істот і неістот. Пор.: Іван іде з другом -* Друг іде з Іваном і Іван іде з палкою —> *Палка іде з Іваном; Іван убитий ворогом —> Ворог убив Івана і Іван убитий ножем —> *Ніж убив Івана (тут правильною є трансформація X убив Івана но­жем); Стіл накритий офіціантом —> Офіціант на­крив стіл, Стіл накритий скатертиною —> ^Скатер­тина накрила стіл (правильно: X накрив стіл ска­тертиною).

384

Методологія мовознавства

Трансформаційний аналіз часто дає змогу розкри­ти тонкі семантичні відмінності, приховані від дослід­ника в разі використання інших методів. Наприклад, В. Б. Касевич виявив, що висловлення на зразок Птах летить і Камінь летить розрізняються вик­лючно значеннями «контрольованість/неконтрольо-ваність дії» дієслова летіти. Висловлення Птах ле­тить допускає цільову й інфінітивну трансформацію (Птах летить, щоб нагодувати пташенят, Птах ле­тить нагодувати пташенят), чого не допускає фраза Камінь летить (*Камінь летить, щоб ударити хлоп­ця, *Камінь летить ударити хлопця). Дієслівний предикат першого висловлення може мати повну видову парадигму (Птах летить. Птах прилетів тощо) і може утворювати делімітативи (Птах полі­тав), що не характерно для фрази Камінь летить [Касевич 1988: 119]. Різні ядерні конструкції при трансформації завжди дають різні структури. Пор.: Микола працює добре —> Миколі працюється добре. Станок працює добре —» *Станку працюється добре. Микола схопився рукою за стіл, щоб не впасти, *Рука вхопилась за стіл, щоб не впасти [Бацевич, Космеда 1997: 99—100].

Трансформаційна методика знайшла застосування в теорії і практиці машинного перекладу. Опрацьова­ні такі програми, за якими спочатку речення транс­формуються в їх інваріанти (ядерні речення, глибин­ні структури), яких у мові в декілька разів менше, ніж варіативних конструкцій, а вже до ядерних ре­чень даються іншомовні відповідники. Елементи трансформаційного аналізу здавна використовують у шкільному викладанні рідної та іноземної мов. Так, скажімо, учням важко розрізняти додаток і неузго-джене означення. За допомогою простої трансформа­ції іменника в прикметник ці труднощі усуваються: якщо іменник трансформується в прикметник, то це означення, якщо — ні, то це додаток (учитель школи шкільний учитель; прибуття поїзда —> *поїздне прибуття). Можна згадати також широко застосо­вувану в школі трансформацію дієприкметникових і дієприслівникових зворотів у підрядні речення і нав­паки, а також трансформацію різних конструкцій у синонімічні (ііге Ьоок о/ Оге зіийепі —> ііге зіийепі'з Ьоок тощо).

Методи дослідження мови

385

Компонентний аналіз

Для дослідження змістового аспекту значеннєвих оди­ниць мови найефективнішим є компонентний аналіз.

Компонентний аналіз — система прийомів лінгвістичного вивчен­ня значень слів, суть якої полягає в розщепленні значення слова на складові компоненти, які називають семами, семантичними множниками і, зрідка, маркерами.

За цими ознаками (компонентами) лексичні одини­ці різняться між собою або об'єднуються. Виділення в лексичній одиниці складових елементів здійснюється шляхом зіставлення її з іншими одиницями, які ма­ють з нею семантичну спільність.

Зокрема, всі терміни спорідненості описують за допо­могою трьох компонентів: стать (Ч — чоловіча, Ж — жіноча), характер спорідненості (П — пряма, Н — непря­ма), покоління (умовно виділимо п'ять поколінь і позна­чимо їх відповідно цифрами: 1 — покоління, від яко­го ведуть відрахунок, я і представники мого поколін­ня, 2 — покоління батьків, 3 — покоління дідів, -2 — покоління дітей, -3 — покоління онуків). Відповідно слова спорідненості в термінах компонентного аналізу будуть описані так:

батько — ЧП2

мати — ЖП2

дідусь —ЧПЗ

сестра —ЖН1

син — ЧП-2

внучка — ЖП-3

дядько — ЧН2

тітка — ЖН2

племінник —ЧН-2 і т. д.

Основи компонентного аналізу заклали В. Потьє та А. Греймас. Поштовхом для його виникнення послу­жила розроблена М. С. Трубецьким методика опози-тивного аналізу у фонології, за якою шляхом проти­ставлення фонем виділялись їх ознаки. Згодом цю ме­тодику застосував Р. О. Якобсон у граматиці при описі відмінкових значень. Перенесена на вивчення лексич­ної семантики, ця методика отримала назву компонент­ного аналізу, що цілком обґрунтовано, оскільки на лексико-семантичному рівні компонентний аналіз сут­тєво відрізняється від подібного аналізу у фонології: тут кількість диференційних ознак значно більша і во-

386

Методологія мовознавства

ни неоднорідні за ступенем узагальнення (що більш узагальнені ознаки, то менше їх число, що конкретніші семантичні ознаки, то більше їх число).

Перші спроби компонентного аналізу було зроблено на предметно-логічній основі, що з лінгвістичного по­гляду не зовсім коректно. Останнім часом усе більшо­го поширення набув компонентний аналіз на суто лін­гвістичній основі — парадигматичній і синтагматич­ній (дистрибутивній).

Для компонентного аналізу важливим є встановлен­ня не тільки сем, а й їх структурної організації, тобто місця і ваги кожної семи в компонентній (семній) структурі значення, оскільки простий перелік сем не дає вичерпного уявлення про смисловий зміст значен­ня слова, який залежить також від структурної органі­зації сем, їх способу групування, тобто від місця кожної семи в структурі значення, від векторних відношень між ними тощо. Структурна організація компонентів у значенні слова визначається на основі синтактичних властивостей слова (сполучуваності), які є синтагма­тичними експонентами сем, а вага сем у компонентній структурі значення — частотністю слів, які сполуча­ються з аналізованим словом і є експлікантами певних сем. Тому нині компонентний аналіз застосовується не в чистому вигляді, а в поєднанні з дистрибутивно-статис­тичним. У дослідженні семантичних ознак конкретних, логічно зіставлюваних слів невеликих (особливо, закри­тих) лексико-семантичних груп (терміни спорідненості, види транспорту, темпоральна, метеорологічна лексика, дієслова переміщення тощо) доцільним є використан­ня компонентного аналізу опозитивного (бінарного) ти­пу, а у вивченні синонімічних і абстрактних слів ефек­тивнішим є компонентний аналіз, поєднаний з дистри­бутивно-статистичним.

Компонентний аналіз вигідно відрізняється від інших способів опису семантики слова, оскільки він може бути представлений у вигляді таблиць, де по вертикалі розта­шовуються аналізовані слова, а по горизонталі — назви семантичних ознак. На перетині слів і ознак ставить­ся +, якщо ознака наявна, або —, якщо ознаки в значен­ні слова немає. Проілюструємо це на деяких дієсловах зі значенням переміщення (див. таблицю).

Оскільки число компонентів є значно меншим від числа значень слів, то опис лексичних значень за допо­могою компонентного аналізу є економним, компакт-

Методи дослідження мови

387

\. семи

'одно-

'різно-

'інтен-

'перемі-

'повіт-

^ч.

земля

вода

Пд>

спрямо-

спрямо-

сив-

слова ^ч^

Ря

ваність'

ваність'

ність*

йти

+

+

+

ходити

+

+

+

бігти

+

+

+

+

плавати

+

+

+

летіти

+

+

+

ним і зручним. Необмежену кількість словесних зна­чень можна описати і систематизувати у вигляді обме­женого числа тих самих компонентів.

Не всі семи за своєю природою і функціями є одна­ковими. Розрізняють такі види сем: класема, архісе-ма, диференційна, інтегральна, ймовірнісна (потенцій­на), граду альна (їх кількісна і якісна характеристика в різних лінгвістичних джерелах не збігається) семи. Класема — найбільш узагальнена за змістом сема, що відповідає значенню частин мови (предметність, ознака, дія тощо). її ще називають категоріальною се мою, Архісема — сема, спільна для певного лек-сико-семантичного поля чи тематичної групи (час, погода, переміщення, почуття тощо). Диференційна сема — сема, за якою розрізняють значення (дифе-ренційною семою для йти і бігти є інтенсивність, для йти і ходити — односпрямованість/різноспрямова-ність). Інтегральна сема — сема, спільна для двох чи більше значень (так, їхати, ходити, бігти мають інтегральну сему 'місце переміщення — земля', бігти і летіти — 'односпрямованість'; інтегральною завж­ди є архісема). Ймовірнісна, або потенційна сема — сема, яка не характеризує предмет чи взагалі поняття, позначене аналізованим словом, а може виявлятися в певних ситуаціях. Так, психолінгвістичний експери­мент показав, що слово начальник асоціюється з таки­ми ознаками, як «товстий», «злий», «нервовий», профе­сор — «в окулярах», «старий», «розумний», студент — «веселий», «компанійський». Слово собака9 як свідчать певні вирази, має потенційну сему «погане ставлення до неї» (собачий холод, собаче життя), слово осел асоціюється з тупістю (дурний як осел і зослити). Зрозуміло, що не кожен начальник товстий чи злий, не кожен професор старий і ходить в окулярах, не ко-

388

Методологія мовознавства

жен студент компанійський, далеко не до кожного со­баки погано ставляться (переважно буває навпаки) і ніби немає підстав уважати осла тупою твариною, як змію — розумною, однак такі семи в названих словах приховані й інколи дають про себе знати.

Градуальна сема — сема, яка не представляє якоїсь нової ознаки, а лише ступінь вияву, інтенсивність тієї самої ознаки, що є і в інших близьких за значенням словах. Так, скажімо, слова літеплий, теплий, жаркий, гарячий протиставлені між собою градуальною семою: різняться ступенем вияву ознаки тепла.

Методика компонентного аналізу передбачає не тільки розщеплення значень на складники, а й їх синтез.

Компонентний аналіз застосовують не лише в тео­ретичних дослідженнях лексичної семантики. Він ши­роко використовується в лексикографії. Новий тип тлумачних словників, де значення слів тлумачаться в термінах семного (компонентного) аналізу, вигідно від­різняється від традиційних адекватною, об'єктивною і вичерпною семантизацією. У дотеперішніх тлумачних словниках траплялися випадки тлумачення одного не­відомого через інше невідоме (на зразок лінгвістика мовознавство). У словниках, укладених на основі ком­понентного аналізу, кожне значення слова буде тлума­читися як сума його сем. Першою спробою створення такого словника є «Частотний словник семантичних множників російської мови» Ю. М. Караулова, який вийшов у Москві в 1980 р.

Зроблено спроби використати компонентний ана­ліз для комп'ютерного перекладу. У Московському лінгвістичному університеті опрацьована програма, за якою з мови на мову перекладаються лише семи. При введенні слів у комп'ютер їх значення розщеплюють­ся на семи, далі семи однієї мови перекладаються се-мами іншої мови, після чого відбувається синтез пе­рекладених сем.

Елементи компонентного аналізу використовують у методиці викладання мов. У вивченні синонімів часто виникає необхідність виділити в них семантичні нюан­си, якими вони різняться. Найкраще це зробити в тер­мінах компонентного аналізу. Для того, щоб розкрити семантичну неадекватність іншомовного слова та його корелята в рідній мові, найефективнішим також буде виявлення розбіжних сем.

Методи дослідження мови

389

Соціолінгвістичні і психолінгвістичні методи

Методи соціолінгвістики синтез лінгвістичних і соціологічних процедур.

Серед них виділяють методи польового досліджен­ня (методика збирання матеріалу) і методи соціолінг­вістичного аналізу зібраного матеріалу (обробка інфор­мації). До перших належать різні форми опитування (анкетування, інтерв'ювання), а також безпосереднє спостереження, експериментування, вивчення докумен­тальних джерел (матеріалів перепису населення, ста­тистичних та інших довідників). Дослідник повинен прагнути отримати якомога повнішу інформацію про об'єкт дослідження.

Найпоширенішим прийомом збору матеріалу є анке­тування. Анкета повинна мати три частини — вступ­ну, соціологічну і власне лінгвістичну. У вступній час­тині викладають суть і мету опитування. Соціологічна частина анкети містить запитання соціодемографічного і біографічного характеру про інформанта (стать, вік, на­ціонально-мовна належність, професійний статус, куль­турно-освітній рівень тощо). Власне лінгвістична части­на охоплює запитання, на основі яких проводять дослід­ження і роблять узагальнення.

Анкетування необхідно поєднувати зі спостережен­нями. Спостереження допомагають зіставити інформа­цію, яку дає респондент, з об'єктивними фактами. В анкеті, скажімо, дають правильні відповіді про наголо­шування слів, їх граматичні форми, сферу застосування лексичних одиниць тощо, а в мовленні в цих самих ви­падках припускаються помилок. Дослідники давно вже помітили, що в анкетах інформанти намагаються завжди навести нормативні форми, тоді як у спонтанному мов­ленні не так пильно стежать за культурою мовлення і припускаються значно більше помилок, ніж в анкетах.

Однією з форм спостереження є інтерв'ю. Тут поєд­нується опитування і спостереження: слухаючи від­повіді інформанта, інтерв'юер може одночасно спосте­рігати за особливостями його мовлення. Інтерв'ю мо­же бути індивідуальним і груповим, одноразовим і багаторазовим. Особливо цінним інтерв'ю є тоді, коли йдеться про ставлення опитуваного до предмета дослі­дження, оскільки з інтерв'ю можна отримати значно повнішу інформацію, ніж на основі анкет. Тут, у разі необхідності, можна уточнити відповідь і навіть почерп-

390

Методологія мовознавства

нути важливу інформацію із зовнішніх реакцій рес­пондента. Так, скажімо, коли вивчають двомовність якогось індивіда, дослідник може розпитати про чин­ники, які зумовили його білінгвальну поведінку: як він ставиться до кожної з уживаних ним мов, якій мові і саме в якій ситуації надає перевагу і чому; як оцінює естетичний аспект мов, прогнозує подальше фун­кціонування цих мов у певному соціумі в недалекому майбутньому тощо. Усе це дає змогу встановити сту­пінь відвертості, а отже — й об'єктивності відповідей.

Що стосується спостереження у то воно не є однорід­ним. Розрізняють два різновиди спостереження: включе­не і невключене. При включеному спостереженні, яке, по суті, перехрещується з інтерв'ю, дослідник висту­пає як один із безпосередніх учасників бесіди, але й водночас непомітно для всіх контролює хід бесіди. Мовлення учасників комунікативного акту записують на магнітофонну стрічку. Найефективнішим і найре­зультативнішим включене спостереження є у випад­ках, коли інформацію збирають у малих групах лю­дей — у сім'ї, серед друзів, у гуртках за інтересами тощо. У таких невеликих колективах, члени яких об'єднані спільними інтересами, а не формальними зв'язками, можна створити атмосферу невимушеності, що наближує до умов спілкування, характерних для природного мовлення.

При невключеному спостереженні дослідник сте­жить за мовним актом, але сам не бере в ньому участі.

Спостереження над мовленням інформантів треба проводити так, щоб усунути будь-який вплив експери­ментатора на їхню мовленнєву поведінку (для цього в окремих випадках навіть запис на магнітофонну стріч­ку доцільно робити приховано).

Зібраний матеріал опрацьовують і класифікують за наперед продуманою програмою. Великі масиви даних обробляють на комп'ютерах.

Найчастіше в соціолінгвістичних дослідженнях ви­користовують корелятивний аналіз, який допомагає встановити такі взаємозв'язки досліджуваних ознак, де при зміні однієї ознаки змінюється середня величи­на іншої. Як вихідні беруть соціальні явища, а як залежні — мовні. Між ними може бути повна чи не­повна функціональна залежність. Залежності визна­чають для кожної соціальної групи і коментують із соціолінгвістичного погляду. Скажімо, старше поколін-

Методи дослідження мови

391

ня вживає діалектизми більшою мірою, ніж молодше. Звідси констатують такий корелятивний зв'язок: зі зміною віку змінюється чисельність тих, хто користу­ється в мовленні діалектом.

Для об'єктивності спостережень і узагальнень ви­користовують статистичні методи. Оброблені дані представляють у вигляді таблиць і графіків взаємоза-лежностей, що робить результати дослідження конк­ретно наочними. Ступінь зв'язку між показниками таблиць і графіків вимірюється за допомогою різних коефіцієнтів кореляції, які можна відшукати в будь-якому статистичному довіднику [Шумарова 1992].

Суть психолінгвістичного методу полягає в тому, що з його допомогою передбачається обробка й аналіз тих мовних фактів, які можна одержати від інформан­тів у результаті спеціально організованих експеримен­тів. В основі використання психолінгвістичної мето­дики в дослідженні мовних явищ лежить розуміння мови як системи, наявної в свідомості людини, що уможливлює звернення до мовця як експерта, здатного оцінювати мовні факти. У сучасному мовознавстві практикують два різновиди психолінгвістичних дослід­жень: а) дослідження фізіологічних реакцій організму людини у процесі и мовленнєвої діяльності (породжен­ня і сприймання мовлення); б) аналіз мовленнєвих ре­акцій та оцінок мовних явищ інформантами в умовах впливу на них мимовільних або цілеспрямованих мов­леннєвих стимулів.

Суть першої методики полягає в реєстрації фізіо­логічних реакцій людського організму на певні мов­леннєві стимули (судинна реакція, розширення зіниць ока, зміна частоти пульсу тощо). Зокрема, за такою методикою О. Р. Лурія дослідив системну організацію музичної термінології. Декількаразове вимовляння експериментатором одного зі слів цієї тематичної гру­пи (наприклад, скрипка) супроводжувалося подразнен­ням шкіри реципієнта слабким електричним стру­мом. Прилади реєстрували розширення судин. Відтак називались інші слова, семантично пов'язані з лек­семою скрипка (мандоліна, гітара, смичок, струна то­що) і семантично з нею не пов'язані (стіл, книжка та ін.) без їх супроводу електричним струмом. Семан­тично пов'язані зі скрипкою слова також викликали судинну реакцію, тоді як слова з інших тематичних

392

Методологія мовознавства

груп її не викликали. При цьому було відзначено, що чим сильніший семантичний зв'язок між словами, тим сильнішою (чіткішою) була реакція. Це уможли­вило встановлення лексичного обсягу досліджуваної групи слів і визначення ступеня семантичного зв'язку між ними.

Суть другої методики полягає в аналізі асоціацій, які викликають у реципієнта слова-стимули. Це так зва­ні асоціативні експерименти. При вільному асоціатив­ному експерименті реципієнти відповідають на слово-стимул одним словом, яке першим спало на думку, або кількома словами, що виникли в свідомості за певний час (наприклад, за одну хвилину). Слова-реакції підра­ховують, розміщують за спадом частот і таким чином установлюється асоціативне поле слова. За цією мето­дикою укладають словники асоціативних норм певної мови (див.: Бутенко Н. П. Словник асоціативних норм української мови. — Львів, 1979; її ж Словник асоціа­тивних означень іменників в українській мові. — Львів, 1989). Ось який вигляд має стаття літо в «Слов­нику асоціативних норм української мови» Н. П. Бу­тенко:

Літо (967) — тепле 286, жарке 110, тепло 99, сон­це, сухе 47, зима ЗО, гаряче 27, сонячне 26, дощове 19, довге 18, коротке 16, відпочинок, холодне 13, осінь 11, канікули 10, веселе, море, чудове 9, гарне, жара 8, спека 7, жарко 6, добре, квіти, прекрасне, річка, хоро­ше 4, весна, дощ, зелень, красне, пора року 3, бабине, відпустка, довгождане, загоряти, зелене, квітуче, кра­са, купатися, ласкаве, минуле, озеро, палюче, погане, радість, робота, світле, червоне, щасливе, щастя, щед­ре 2, без дощу, біля моря, болото, величне, вирішальне, в Криму, вода, вологе, в розпалі, вудка, город, гриби, день, дружба, запахи, засушливе, зрілість, кінчатися, ко­рабель, красиве, купання, лагідне, лиман, літепло, літ­ній, любов, люди, львівське, минуло, мокре, м'яке, ніж­не, останнє, парасолька, південь, пісня, пляж, повітря, погода, поле, пора, похмуре, праця, приємне, пройдене, радісне, раннє, сад, свіжість, світ, світло, село, сесія, смі­ятися, спрага, спрагле, Сургут, табір, 1974 року, холод, червневе, шкільна бригада, яблука 1.

Вільний асоціативний експеримент із соматичною лексикою засвідчив такі різновиди асоціацій: 1) синтаг­матичні (волосся довге, борода сива, брови гус­ті, вуса козацькі, стирчать, руки робочі); 2) па-

Методи дослідження мови

393

радигматичні (голова шия, груди плечі; 3) тема­тичні (зуби стоматолог); 4) фонетичні (губи тру­би, коса оса); 5) словотвірні (шия нашийник, ру­ки наручники, голова головоломка); 6) граматич­ні (кисті кисть); 7) ремінісцентні (ніс Буратіно, п'яти Ахіллес, вуса Дон-Жуан); 8) фразеологічні (лікоть кусати, вуха лапша, шкіра та кістки); 9) асоціації-персоналії (вуса Шевчеко, ніс Гоголь, брови Брежнєв).

Як бачимо, слова можуть асоціюватися і за змістом, і за формою. Французький мовознавець Ш. Бал лі вста­новив таку закономірність: чим краще відомий реци­пієнтові зміст слова, тим інтенсивніше семантичні (змістові) асоціації відтісняють асоціації, що ґрунту­ються на його звуковій формі [Балли 1955: 52—53].

Цілеспрямований експеримент полягає в тому, що перед реципієнтом ставиться конкретне завдання, наприклад, підібрати означення до слів-стимулів, на­вести синоніми чи антоніми, утворити зі словами-ан-тонімами словосполучення, оцінити в певних балах се­мантичну близькість між словами, вставити пропущені слова, замінити в реченні слово, визначити за контекс­том значення слова, дати малюнкові назву, продовжи­ти (закінчити) речення тощо. Цілеспрямований асоці­ативний експеримент ефективно використовують у дослідженні семантичних зв'язків між словами (сино­німічних, антонімічних, фразеологічних тощо). Сила семантичних зв'язків визначається частотою слів-ре-акцій зі словами-стимулами: чим частіше разом трап­ляються слова, тим сильніший семантичний зв'язок між ними. Так, зокрема, за допомогою цілеспрямова­них психолінгвістичних експериментів М. П. Мура-вицька дослідила семантичні категорії в українській мові. Нею опрацьовано методику розмежування значень полісемічних слів, розмежування полісемії й омонімії, системного опису синонімії й антонімії [Муравицкая 1989]. За допомогою асоціацій можна також визначити семантичний обсяг слова. Чим більше асоціацій має сло­во, тим багатше його змістове наповнення.

Широке застосування в мовознавстві має опрацьо­вана Ч. Осгудом психолінгвістична методика вимі­рювання значень за допомогою семантичного дифе­ренціала. Реципієнти оцінюють значення слів за спеці­ально шкалованими антонімічними осями «гарний — поганий», «сильний — слабкий», «великий — малень-

394

Методологія мовознавства

кий» та ін. Після статистичної обробки оцінок реципі­єнтів виводять середні показники, які й характеризу­ють значення досліджуваного слова. Ці показники дають змогу знайти відстань між значеннями слів і визначити місце кожного значення в лексико-семан-тичному просторі мови.

Подібну методику застосував В. В. Левицький в дос­лідженні звукосимволізму. Звуки багатьох мов (укра­їнської, російської, румунської, німецької, англійсь­кої та ін.) оцінювали за такими ознаками: розмір, сила, тепло, світло, активність, твердість тощо. З'ясувалося, що характеристики звуків у різних реципієнтів пев­ною мірою збігалися. Так, зокрема, серед голосних найбільшим виявився звук [а], найбільш неприємним [у], найшвидшим [и], найхолоднішим [о], найсильні-шим [у], найтемнішим і найтвердішим [а], а наймен­шим, найприємнішим, найповільнішим, найтеплі-шим, найслабкішим, найсвітлішим і найм'якшим звук [і] [Левицкий 1973: 42].

Позитивним у застосуванні психолінгвістичних ме­тодів є те, що за їх допомогою мову вивчають у дії, в динаміці, у зв'язку з мисленням та іншими психічни­ми процесами, з урахуванням імовірнісних відношень та зв'язків мовних фактів.

Застосування математичних методів у мовознавстві

Застосування математичного (точніше, кількісного) критерію в мовознавчих дослідженнях відоме з давніх часів. Такі лінгвістичні поняття, як фонетичний закон, продуктивність морфем, критерій спорідненості мов то­що ґрунтувалися певною мірою на кількісних харак­теристиках. Звукові відповідники, що часто фіксу­ються в мові чи декількох споріднених мовах, є законо­мірними на відміну від аномалій, котрі є рідкісними. Ті морфеми, що часто використовуються для творення нових слів, є продуктивними. Спорідненими мовами є такі, які мають більше спільних рис, ніж неспоріднені. Однак раніше математичний критерій використову­вали стихійно і спорадично. Зараз його застосовують свідомо і цілеспрямовано.

Активне використання математичних методів у ви­вченні мови почалося в середині XX ст. Стимулом для цього послужили перспективи машинного перекладу. У

Методи дослідження мови

395

процесі обробки текстів для їх уведення в машину бу­ло одержано різноманітні кількісні оцінки окремих фактів мови, які згодом виявилися корисними не тіль­ки для створення математичних моделей мови, а й для лінгвістичної теорії. Оскільки мова — це ймовірнісна, а не жорстко детермінована система, то для її пізнання квантитативні методи, пов'язані з дослідженням час­тотних, ймовірнісних, градуальних та інших нелогіч­них характеристик, не тільки бажані, але й необхідні.

Розрізняють кількісні й статистичні методи. Кіль­кісні методи зводяться до простого підрахунку час­тоти вживання мовних одиниць. Статистичні ме­тоди передбачають використання різних формул для виявлення правил розподілу мовних одиниць у мов­ленні, для виміру зв'язків між мовними елементами, для встановлення тенденцій у розвитку та функціону­ванні мови та для встановлення залежності між якіс­ними й кількісними характеристиками мови.

Математичні методи мають самостійну цінність у дослідженні мови і, крім того, можуть входити як складова частина в інші методи. Останнім часом вико­ристання цих методів до вивчення мовного матеріалу значно зросло, і можна говорити, що в математичній лінгвістиці виокремилися два розділи, або напря­ми, — лінгвостатистика і стилостатистика.

Основна увага лінгвостатистики звернена на дос­лідження того, що в мові визначається правом вибору мовця, а що зумовлено її іманентною структурою і як ці два параметри кількісно співвідносяться між собою. Виявляється, що одиниці будь-якого мовного рівня ма­ють сталі для певного періоду кількісні показники їх використання. Подібність між членами одного мовно­го колективу полягає не тільки в тому, які мовні оди­ниці (фонеми, лексеми, граматичні форми і синтаксич­ні конструкції) вони використовують, а й у тому, як часто вони їх уживають. Отже, стає зрозуміло, чому нині такого великого поширення набули так звані частотні словники, у яких слова розташовані не за алфавітом, а за спадом частот, тобто першим іде найбільш частотне слово, за ним слово нижче рангом за частотою від пер­шого і т.д. Відомі такі частотні словники: Уоззеїзоп Н. ТЬе Киззіап \¥оіч1 Соипі апй Ггедиепсу Апаїузіз о£ Огаттаїїсаі СаІе£огіез ої Зіашіагсі Ьііегагу Киззіап. — Беїгоіі, 1953; Штейнфельдт 3. А. Частотньїй словарь современного русского литературного язьїка. — Тал-

396

Методологія мовознавства

линн, 1963 (перевидавався в Москві в 1969 і 1973 рр.); Частотньїй словарь русского язьїка / Под ред. Л. Н. За-сориной. — М., 1977. В Україні в 1981 р. вийшов дво­томний «Частотний словник сучасної української ху­дожньої прози». Частотні словники мають велике практичне значення. На їх основі створюють підруч­ники іноземних мов, тексти яких будуються на най­більш уживаній лексиці, і словники-мінімуми. Якщо зважити на те, що 1100 (за іншими даними — 1000) найбільш частотних слів покриває 80% тексту, то зна­чення частотних словників для лінгводидактики не­оціненне: варто знати 1100 слів і можна розмовляти іноземною мовою, читати й розуміти тексти (значення 20% невідомих слів можна якоюсь мірою визначити за контекстом).

Статистичні закономірності лежать в основі органі­зації словника і тексту будь-якої мови. Американсь­кий дослідник Дж. Ципф дійшов висновку, що існує залежність між числом різних значень одного слова і його відносною частотою вживання. Кількість значен­ня наближається до квадратного кореня від частоти слова: т = V/ » де /п — число значень, а / — відносна частота. Інша закономірність, встановлена Ципфом (у науці вона відома як закон Ципф а), має таке форму­лювання: відношення рангу слова в частотному слов­нику до частотності слова в мові становить постійну величину (константу) г/ = с, де г — ранг слова в час­тотному словнику, / — частота слова, с — постійна ве­личина. Слід зазначити, що тісний зв'язок існує також між частотними характеристиками слова в пам'яті та в словнику [Фрумкина 1971: 14 і наст.].

Статистична організація тексту полягає в тому, що покриття тексту різними словами відповідає такій за­кономірності: на початку тексту різних слів більше, а далі їх менше [Пап 1961: 96—100].

Найширше застосовують статистичні методи для визначення семантичної відстані між словами. Най­частіше з цією метою статистичній обробці піддають слова, які сполучаються з аналізованим словом. Для цього використовують статистичну формулу

р(а.Ь) = 2<л=1М(а)-й(а)]і

де а, & — задані слова, р — відстань, £ — сума чисел, /і — числові значення (див. детальніше: [Плотников 1984: 189]).

Методи дослідження мови

397

Семантичну відстань між словами можна виявити й іншим шляхом. Порівнюючи і зіставляючи сполучу­ваність слів (синонімів чи всієї лексико-семантичної групи або поля), у таблиці ставлять +, якщо слово має таку сполучуваність, і -, якщо не має. Відтак за мето­дикою альтернативних ознак семантичні зв'язки між кожною парою слів установлюють за формулою

_ ай-Ьс

Г~ (а + Ь)(с + Л)(а + с)(Ь + д) '

де а — 4-4-, Ь — Н—, с — —Ь, (і — —. Так, наприклад, було встановлено семантичну відстань між словами на означення неточних (нефіксованих) часових відрізків. Найвищий цифровий показник, а відповідно найтісні­ший семантичний зв'язок виявили слова пора доба, далі в порядку зниження ступеня семантичного зв'язку йдуть час дні, пора година, час пора, пора період, епоха доба «епоха», епоха період, час доба «час», час година «час», пора дні. Найслаб-кіший семантичний зв'язок зафіксовано між словами час мить, час ера, час епоха, дні ера [Ко-черган 1980: 106—108].

На основі статистичних формул, які враховують ви­падки зникнення в мовах слів основного фонду, можна встановити абсолютну хронологію диференціації мов­них сімей (метод глотохронології М. Сводеша, про який уже йшлося).

Стилостатистика — це визначення і характерис­тика стилістичних особливостей окремих творів або авто­рів через кількісні відношення використаних мовних елементів. В основі статистичного підходу до досліджен­ня стилістичних явищ лежить розуміння літературного стилю як індивідуального способу володіння засобами мо­ви. При цьому дослідник абстрагується від питання про якісну значеннєвість обчислюваних мовних елементів, зосереджуючи свою увагу тільки на кількісному аспекті.

Найпростішим різновидом статистичного підходу до вивчення мови письменників або окремих творів є під­рахунок уживаності слів, оскільки багатство словника певним чином характеризує їхню мову. Досить порів­няти такі факти: словниковий запас пересічної людини становить 7—10 тисяч слів, у творах О. Пушкіна вжито 21280 слів, а в російськомовних творах Т. Шевченка — 21548 слів.

398

Методологія мовознавства

Значно більшу вагу для характеристики авторсько­го стилю має встановлення середньої частоти вживан­ня слів, яку вираховують за формулою

- £ґ*1+*2-*/ь> х =<=■---------------------------- ,

Щ

де — середня частота, х\9 х2 — вибіркова частота, щ — число вибірок. Так, наприклад, якщо досліджу­вана одиниця в десяти вибірках траплялася відповід­но 12, 14, 10, 8, 16, 18, 12, 17, 13, 20 разів, то

_ 12 + 14 + 10 + 8 + 16 + 18 + 12 + 17 + 13 + 20 лл

Для кожного письменника, як і будь-якого мовця, характерна своя специфічна частотність мовних елемен­тів, іншими словами, кожному авторові притаманні свої улюблені, а тому й частотні слова, словосполучення, фрази, синтаксичні конструкції тощо. Так, скажімо, 56 найчастотніших слів у творах О. Пушкіна покривають 40 відсотків тексту, 1000 слів — 70 відсотків, 8000 — 95 відсотків, інші 13280 слів — усього лише 5 відсот­ків тексту. Саме тому середня частотність використо­вується також для встановлення справжнього авторст­ва виявлених без зазначення автора творів, а також для датування окремих творів того самого автора на основі попередньо проведеного підрахунку середньої частоти вживання ним слів у різні періоди його твор­чості. Специфічними для кожного автора є й рідко­вживані слова.

Як засіб стильової характеристики використовують критерій стабільності середньої частоти найуживані­ших слів. Доведено, що, незважаючи на різні перипетії сюжету в усіх частинах твору, середня частота вжи­вання слів є стабільною. Звідси випливає такий висно­вок: стиль автора можна охарактеризувати певним співвідношенням змінності середньої частоти вживан­ня слова до загальної для певної мови частоти його вживання.

Якщо ж у творі письменника чи його якійсь части­ні є суттєві відхилення вибіркових частот від харак­терної для нього середньої частоти, то це свідчить про зумисне, цілеспрямоване, зумовлене фабулою викорис­тання чи невикористання певних мовних засобів. Як інструмент для визначення випадковості чи суттєвості

Методи дослідження мови

399

відхилення вибіркової частоти від середньої викорис­товують так званий «хі-квадрат критерій» (%2).

ха. £(*«_-*)2

X

«Хі-квадрат» дорівнює сумі квадратів відхилень від середньої частоти, поділеної на середню частоту. Отрима­ний результат зіставляють з даними таблиці числових значень «хі-квадрата» і таким чином встановлюють, ви­падковим чи суттєвим є відхилення вибіркових частот від середньої. Наприклад, у творі зроблено дві вибірки, які відповідно становлять 270 і 220. їх середнє дорівнює 245. Підставляємо ці цифри у формулу і обчислюємо: