logo search
Baranov_A_N_-_Vvedenie_v_prikladnuyu_lingvistik

4.1. Основные понятия информационного поиска

Понятия запроса и документа стоят в центре информационной де­ятельности. В процессе поиска информации происходит сравнение со­держания запроса и документа. Степень соответствия документа запросу задается категорией релевантности. Каждый документ в ИПС получает определенный информационный код — кодируется с помощью инфор­мационно-поискового языка. Этот код называется поисковым образом до­кумента (ПОД). Аналогичное выражение на информационно-поисковом языке — поисковое предписание (ПП) — сопоставляется запросу. Соответ­ствие поискового образа документа поисковому предписания называет­ся формальной релевантностью. Действительное соответствие содержания выданного документа содержанию запроса называется смысловой реле­вантностью. Очевидно, что классификация характеристик информацион­ного поиска в значительной степени связана с возможными ошибками и сложностями, которые могут возникнуть в процессе информационной деятельности. Так, документ, релевантный запросу по смыслу, может оказаться не релевантным с формальной точки зрения и не будет выдан ИПС. С другой стороны, в процессе информационного поиска можно получить в выдаче значительный информационный шум — множество документов, формально релевантных, но не являющихся релевантны­ми по смыслу. Возможен и другой случай, когда пользователь не мо­жет адекватно выразить свою информационную потребность: степень соответствия информационного запроса реальной информационной по­требности называется пертинентностью. Для обеспечения пертинентности запросов разрабатываются специальные методики, включающие исполь­зование информационных словарей, которые позволяют пользователю более точно формулировать свою информационную потребность.

Результаты поиска могут характеризоваться с двух точек зрения: с точки зрения точности и с точки зрения полноты. Полнота поиска определяется соотношением между количеством выданных релевантных (по отношению к данному запросу) документов к общему числу реле­вантных документов, имеющихся в информационной системе. Точность поиска задается отношением между количеством выданных релевантных документов к общему количеству документов в выдаче:

В идеальном случае количественное выражение полного и точного поиска равно единице.