№ 2. Вероятностно-статистическое изучение языка и речи
Вопросы для обсуждения
1. Статистический подход к исследованию языковых структур.
2. Основания и условия вероятностно-статистического изучения языка и речи
3. Структурно-вероятностные модели языка. Основные области приложения структурно-вероятностной модели языка: компьютерная лингвистика; корпусная лингвистика, авторизация/атрибуция текста.
4. Методика статистического эксперимента (на примере создания частотных словарей и лабораторной работы по статистическому анализу текста):
– формулирование и уточнение в дальнейшем цели исследования;
– определение единицы анализа; аналитическая грамматика частотного словаря;
– методика сбора информации, генеральная и выборочная лингвистические совокупности;
– репрезентативность выборки;
– рациональный объем выборки, определение достаточности объема выборки.
5. Математические методы проверки гипотез. Элементы теории статистических гипотез.
6. Анализ лабораторной работы «Статистический анализ текста».
Рекомендуемая литература
1. Пиотровский Р.Г. и др.Математическая лингвистика. Учебное пособие для пед. ин-тов. -М.: Высшая школа, 1977.
2. Баранов А.Н.Введение в прикладную лингвистику: Учебное пособие. -М.: Эдиториал УРСС, 2001.
3. Марчук Ю.Н.Основы компьютерной лингвистики. Учебное пособие. Издание 2-е дополненное. - М.: Изд-во МПУ «Народный учитель», 2000. - 226 с.
4. Головин Б.Н. Язык и статистика. - М.: Просвещение, 1971.
5. Турыгина Л.А.Моделирование языковых структур средствами вычислительной техники. -М.: Высшая школа, 1988. -(Б-ка филолога).
6. Частотный словарь русского языка. / Под ред. Л.Н. Засориной. – М., 1977.
7. Алексеев П.М.Частотные словари: Учебное пособие. –СПб.: Изд-во С.-Петерб. ун-та, 2001.
8. rusf.ru/books/analysis– лигвоанализатор: первый действующий анализатор индивидуально-стилистических характеристик русских текстов (Д.Хмелев).
9. philol.msu.ru/~lex/corpus– корпус текстов русских газет концаXXвека.
10. philol.msu.ru/~humlang/articles/PolystylCorp.htm– полистилевой корпус текстов современного русского языка.
11. info.ox.ac.uk/bnc – текстовые базы данных: BNC (The British National Corpus).
12. ruscorpora.ru (corpora.yandex.ru)– национальный корпус русского языка.
13. bokrcorpora.narod.ru/frqlist/frqlist.html– частотный словарь современного русского языка.
14. Языкознание. Большой энциклопедический словарь / Гл. ред. В.Н. Ярцева. – 2-е изд. М.: Большая Российская энциклопедия, 1998
- Федеральное агентство по образованию
- I. Пояснительная записка
- 1.1. Цели и задачи дисциплины
- 1.2. Требования к уровню освоения содержания дисциплины
- 1.3. Объем дисциплины и виды учебной работы
- II. Содержание дисциплины
- 2.1. Разделы дисциплины и виды занятий
- Содержание разделов дисциплины
- I модуль. Элементы прикладной лингвистики
- II модуль. Вероятностно-статистическое изучения языка и речи
- 2.3. Практические и семинарские занятия
- № 1. Языкознание и математика. Математическая лингвистика
- № 2. Вероятностно-статистическое изучение языка и речи
- № 3. Контент-анализ
- № 4. Важнейшие применения частотных словарей
- № 5. Семиотика и лингвосемиотические основы переводоведения
- № 6. Современная глоттохронология
- 2.4. Основные понятия дисциплины
- 2.5. Задания для самостоятельной работы
- III. Формы контроля и требования к зачёту по дисциплине
- 3.1. Текущий и итоговый контроль усвоения знаний
- 3.2. Вопросы к зачёту
- IV. Учебно-методическое обеспечение дисциплины
- 4.1. Рекомендуемая литература
- 4.2. Средства обеспечения освоения дисциплины Материально-техническое обеспечение дисциплины
- Современные информационные технологии и мультимедийные продукты
- V. Методические рекомендации по организации изучения дисциплины
- 5.1. Общие рекомендации
- 5.2. Указания по выполнению заданий самостоятельной работы Задание № 1. (Задача а.Б. Долгопольского и а.А. Зализняка)
- Задание № 2. Классификация местоимений русского языка
- Задание № 3. Лабораторная работа № 1 «Статистический анализ рекламных текстов из нкря»
- Изучить информацию о Национальном корпусе русского языка на сайте корпуса: http://ruscorpora.Ru/ (разделы «что такое корпус?», «состав и структура», «статистика», «параметры текстов»).
- Провести статистический анализ рекламных текстов, представленных в Национальном корпусе русского языка
- Задание № 4. Лабораторная работа № 2 «Статистический анализ современного газетного текста»
- Задание № 5. Лабораторная работа № 3 «Контент-анализ литературного текста»
- I. Заполните таблицу
- II. Проведите анализ личностных качеств героев
- I. Заполните таблицу
- II. Проведите анализ личностных качеств героев
- Теоретические основы исследования.
- Требования к оформлению работы (контент-анализ)
- 5.4. Указания для студентов заочной формы обучения
- VI. Приложение задачи по глоттохронологии
- Домашнее задание