logo
lk_poisk_ex

3.2.1 Алгоритм расширенного булевого поиска

Алгоритм расширенного булевого поиска основан на булевой модели, причем расширением является возможность ранжировать найденные документы по числу терминов запроса, которые в них встречаются. Такую модель поиска можно рассматривать как упрощенную модель поиска в нечетких множествах в противоположность строгим множествам булевого поиска.

Релевантность документа Pi по отношению запросаqрассчитывается как:

P

Представленный алгоритм расширенного булевого поискаиспользует модель не только для данного документа, но и для соседних с ним, учитывая частоту появления в них слов запроса. Такое становится возможным в среде гипертекстовых документов. Предполагается, что если два документа связаны гиперссылкой, то между ними должна существовать и некоторая семантическая (смысловая) связь. Практически это выглядит следующим образом. Если документPiне содержит термина запросаQj , но связан с другими документомPk, в который этот термин входит, то полагают, что документPi содержит терминQj. Однако при этом во время ранжирования документуPi приписывается меньший вес, чем если бы он на самом деле содержал терминQj.

Алгоритм определения релевантности документа Pi и запросаqпринимает вид

Здесь c1 иc2 – положительные константы, причемc1 > c2.