logo
filologi_1_kurs / языкознание / рождственский

Информационные словари

Терминология является инструментом поиска текстов. Поэтому центром работы информационной службы являются особые словари, которые составляет служба информатики. Благодаря этим словарям предметно-логическое содержание источника определяет адрес текста. Словари составляются и используются постоянно. Это объясняется динамикой терминологии в оригинальных текстах.

В отличие от энциклопедий, толковых или отраслевых словарей служба информатики ведет учет всех встретившихся употреблений терминов (каждый текст расписывается с точки зрения содержащихся в нем терминов). Основная трудность здесь сводится к следующему: необходимо установить границы терминов и отличить термины в данном тексте от нетерминов. Во всяком или почти во всяком научном тексте есть новые термины, нередко создаются термины-синонимы, а сложные термины подвергаются метонимическим сокращениям. Сокращенные варианты терминов могут отличаться от общенаучной лексики только характером значения, иногда трудно уловимым. В техническом тексте всегда присутствует много дублетных терминов, что затрудняет их разграничение.

Словник словаря, составленного по текстам, редактируется с точки зрения различения терминов-омонимов и метонимических сокращений и дублетов терминов и пополнения новыми терминами. Каждому термину приписывается индекс, обозначающий текст, где этот термин употреблен. Такой словник является уже инструментом поиска оригинальных текстов. Если термин отражает определенную предметную область знания или деятельности и известен абоненту, то по терминологическому словарю можно найти тексты, в которых употреблен данный термин, включая оригинальные тексты, их рефераты или заголовки. В результате такого поиска будет получен перечень текстов, включающих в себя термин, а значит, описана область знаний, связанная с этим термином.

Если необходимый термин неизвестен абоненту, то вести поиск по словарю, построенному по алфавитному принципу, невозможно. В этом случае необходим словарь, построенный по семантическому принципу. Таким словарем является информационно-поисковый тезаурус, который предназначен для отыскания нужного раздела знания через смысловые характеристики терминов. Термины выстраиваются в тезаурусе по принципу родо-видовой подчиненности и/или ассоциативных смысловых связей.

Например, в "Тезаурусе по теоретической и прикладной лингвистике" (сост. С.Е. Никитина. М., 1978) верхней иерархией являются такие разделы грамматики, как морфология и синтаксис. Далее в каждом разделе термины следуют по алфавиту. Статья может содержать следующие части: 1) заглавное слово-термин, которое далее комментируется; 2) синонимический термин; 3) коррелят (обычно термин-антоним); 4) родовое понятие; 5) видовое понятие; 6) целое, частью которого выступает явление, называемое термином; 7) компоненты, т.е. части, из которых состоят явления, называемые термином...* 11) уровень языка, к которому относится явление, тип единицы, к которой относится явление... 28) ассоциативная связь с другими терминами. Малый объем данного тезауруса дает и малую иерархичность слов и понятий.

*(Перечисляем наиболее важные признаки.)

Как правило, тезаурусы обладают довольно большим числом родо-видовых иерархий. Например, в "Классификаторе промышленной, сельскохозяйственной продукции" (М., 1972) дано пять иерархий: 1) продукция энергетической и нефтяной промышленности; 2) электроэнергия или продукция нефтяной промышленности; 3) электроэнергия, произведенная электростанциями общего пользования и блокстанциями (или то же локального пользования); 4) электроэнергия, произведенная электростанциями общего пользования или блок-станциями общего пользования; 5) электроэнергия, произведенная КЭС, или ТЭЦ, или ГТЭС, или ДЭС, или АЭС, или ГЭС, или нетиповыми электростанциями общего пользования.В каждой иерархии своя рубрикация.

Как видим, та или иная область науки или техники благодаря своей терминологии охватывается тезаурусом, имеющим свои особенности. Например, информационно-поисковый тезаурус по языкознанию имеет следующий тематический охват: "Персоналии языковедов. Общее языкознание. Методы лингвистических исследований. Структурные и математические методы. Классификация языков. Образование и развитие языков. Социолингвистика, психолингвистика. Письменность, фонология, грамматика, лексикология, семантика, стилистика. Прикладное языкознание. Теория сообщений и кодирования в применении к языку. Лингвистические вопросы преподавания языка. Семиотика"*.

*(Аннотированная библиография информационно-поисковых тезаурусов. ГАСНТИ. М., 1980. С 12.)

Различие тезаурусов по их построению достаточно велико. Это связано как с составом терминологии отрасли, так и с подходом к составлению словаря. В любом случае для построения тезауруса необходимо выделить минимум слов, с помощью которых описывается значение терминов и устанавливаются иерархия и ассоциативные отношения. Такие слова называют дескрипторами. Установление дескрипторов зависит от особенностей терминологии и характера тезауруса. Дескрипторы являются основой тезауруса: из них выводится значение основных терминов, они же позволяют определить ассоциативные отношения. Во многих случаях дескрипторы принадлежат к общенаучной лексике.

Построение информационных словарей предполагает достаточно полный учет терминов в их реальном функционировании. Термины в информационно-поисковых словарях отличаются от терминов в отраслевых словарях тем, что лишь отражают текущее состояние терминологии, но не распространяют знания по терминологии. От терминологических стандартов информационно-поисковые словари отличаются тем, что не нормируют терминологию.