logo search
0525065_0224D_gorbachenko_t_g_analitiko_sinteti

1.1. Поняття про предметизаційний принцип індексування документів

Існує два принципи індексування документів класифіка­ційний і предметизаційний. У модулях 3 та 4 було розглянуто класифікаційний принцип та методику його застосування в ін­дексуванні документів. Він базується на поданні змісту доку­мента у певній класифікаційній системі та застосуванні кла­сифікаційних індексів як термінів індексування.

Предметизаційний принцип індексування документів ґрунтується на поданні змісту документа у понятійній системі певної природної мови і на використанні, як термінів індексу­вання, лексичних одиниць. Термін індексування — це подання поняття як елемента інформаційної мови чи терміна природної мови (переважно іменника чи іменного словосполучення), або класифікаційного індексу. В основі предметизаційного прин­ципу лежить предметизаційна інформаційно-пошукова мова.

Предметизаційний принцип індексування забезпечує можли­вість організації інформаційного пошуку документів за пред­метно-алфавітною ознакою.

Предметизація, як метод, що розкриває зміст кожного доку­мента, має на меті виявити у документі предмет (головну тему), а також установити аспект (аспекти) його характеристики й тих відношень та зв'язків, у яких розглядають предмет у даному до­кументі. Правильне визначення предмета, його аспектів та зв'язків має відображатися у термінологічному й науково точно­му формулюванні предметної рубрики, що відповідає змісту до­кумента. Крім визначення основного предмета документа, при аналізі його змісту доцільним може бути виявлення тем, які так чи інакше пов'язані з основною темою документа. Наприклад, документ стосується автоматизованих систем управління (АСУ) у кольоровій металургії. Тут наявні два предметні поняття: авто­матизовані системи управління та кольорова металургія. Також може бути врахований вид документа тощо.

Отже, предметизація — це предметне індексування доку­мента засобами мови предметних рубрик.

Які ж загальні вимоги до інформаційно-пошукових мов (ІПМ) предметизаційного типу? ІПМ повинна:

допускати внесення змін (доповнень і виправлень);

Лексичний склад мови предметних рубрик передають лек­сичні одиниці, які є заголовками та підзаголовками предмет­них рубрик. Лексична одиниця — позначення окремого понят­тя, що прийняте в системі природної чи штучної мови і далі у цій функції є неподільним. Наприклад:

Християнство Маркшейдерська справа Запорозька Січ

До складу ІПМ предметизаційного типу входить множина лексичних одиниць та граматичних (парадигматичних і син­тагматичних) відношень. Парадигматичні (асоціативні) відно­шення — це позатекстові відношення між ключовими словами та дескрипторами, синтагматичні (контекстуальні) — це відно­шення, що виражають логічні зв'язки між відповідними поняттями у тексті самого документа (наприклад, частина — ціле). Елементи ІПМ можуть бути реалізовані у машиночи-таній, картковій формі, на мікроносіях тощо.