logo
lk_poisk_ex

3.2.2 Алгоритм наибольшего цитирования

Этот алгоритм также использует информацию о гиперссылках между документами. Мера релевантности каждой страницы Pi определяется суммой числа терминов запроса, содержащихся на других страницах, которые имеют ссылку на данную страницу:

Цель данного алгоритма – приписать большие веса тем документам в множестве найденных, которые цитируются (на которые ссылаются другие документы) чаще всего. Аналогичный подход применяется также в ряде других алгоритмов, в частности, в алгоритме PageRank, который используется в информационно-поисковой системе ИнтернетGoogle.