Иркутск 2012 Оглавление
Введение 3
1. Основные принципы технологии поиска информации 4
1.1 Понятия и определения 4
1.2 Информационная потребность пользователя 5
1.3 Релевантность 7
1.4 Общая схема процесса поиска 9
2. Представление информации в ИПС 11
2.1. Индексирование документов 11
2.2. Векторная модель текста 12
2.3. Статистический анализ текстов. Закон Ципфа 13
2.4. Анализ информационных массивов 17
2.4.1. Понятие относительной частоты 17
2.4.2 Распределение частоты встречаемости терминов 18
2.4.3 Определение весов терминов 20
2.4.4 Частотная модель 21
2.4.5 Вероятностная модель 22
2.4.6 Латентно-семантический анализ 23
2.5 Хранение индексированных документов 24
3 Модели поиска информации 27
3.1 Булева модель поиска 28
3.2 Функции подобия "документ-запрос" 31
3.2.1 Алгоритм расширенного булевого поиска 32
3.2.2 Алгоритм наибольшего цитирования 33
3.2.3 Векторный алгоритм поиска 34
3.2.4 Расширенный векторный алгоритм поиска 35
4. Классификация документов 35
4.1. Основные свойства классификации 37
4.2 Формирование рубрик 39
5 Эффективность поисковых систем 41
5.1 Критерии эффективности 41
5.2. Полнота и точность поиска 43
5.3. Недостатки основных характеристик 46
6 Современные информационно-поисковые системы 48
6.1. Словарные информационно-поисковые системы 49
6.2 Классификационные информационно-поисковые системы 52
6.3. Метапоисковые системы 55
Заключение 57
Список рекомендуемой литературы 59
Экзаменационные вопросы 60
- Курс лекций
- Технологии поиска информации
- Иркутск 2012 Оглавление
- Введение
- 1. Основные принципы технологии поиска информации
- 1.1 Понятия и определения
- 1.2 Информационная потребность пользователя
- 1.3 Релевантность
- 1.4 Общая схема процесса поиска
- 2. Представление информации в ипс
- 2.1. Индексирование документов
- 2.2. Векторная модель текста
- 2.3. Статистический анализ текстов. Закон Ципфа
- 2.4. Анализ информационных массивов
- 2.4.1. Понятие относительной частоты
- 2.4.2 Распределение частоты встречаемости терминов
- 2.4.3 Определение весов терминов
- 2.4.4 Частотная модель
- 2.4.5 Вероятностная модель
- 2.4.6 Латентно-семантический анализ
- 2.5 Хранение индексированных документов
- 3 Модели поиска информации
- 3.1 Булева модель поиска
- 3.2 Функции подобия "документ-запрос"
- 3.2.1 Алгоритм расширенного булевого поиска
- 3.2.2 Алгоритм наибольшего цитирования
- 3.2.3 Векторный алгоритм поиска
- 3.2.4 Расширенный векторный алгоритм поиска
- 4. Классификация документов
- 4.1. Основные свойства классификации
- 4.2 Формирование рубрик
- 5 Эффективность поисковых систем
- 5.1 Критерии эффективности
- 5.2. Полнота и точность поиска
- 5.3. Недостатки основных характеристик
- 6 Современные информационно-поисковые системы
- 6.1. Словарные информационно-поисковые системы
- 6.2 Классификационные информационно-поисковые системы
- 6.3. Метапоисковые системы
- Заключение
- Список рекомендуемой литературы
- Экзаменационные вопросы