logo search
2010_mmla_umk

№ 2. Вероятностно-статистическое изучение языка и речи

Вопросы для обсуждения

1. Статистический подход к исследованию языковых структур.

2. Основания и условия вероятностно-статистического изучения языка и речи

3. Структурно-вероятностные модели языка. Основные области приложения структурно-вероятностной модели языка: компьютерная лингвистика; корпусная лингвистика, авторизация/атрибуция текста.

4. Методика статистического эксперимента (на примере создания частотных словарей и лабораторной работы по статистическому анализу текста):

– формулирование и уточнение в дальнейшем цели исследования;

– определение единицы анализа; аналитическая грамматика частотного словаря;

– методика сбора информации, генеральная и выборочная лингвистические совокупности;

– репрезентативность выборки;

– рациональный объем выборки, определение достаточности объема выборки.

5. Математические методы проверки гипотез. Элементы теории статистических гипотез.

6. Анализ лабораторной работы «Статистический анализ текста».

Рекомендуемая литература

1. Пиотровский Р.Г. и др.Математическая лингвистика. Учебное пособие для пед. ин-тов. -М.: Высшая школа, 1977.

2. Баранов А.Н.Введение в прикладную лингвистику: Учебное пособие. -М.: Эдиториал УРСС, 2001.

3. Марчук Ю.Н.Основы компьютерной лингвистики. Учебное пособие. Издание 2-е дополненное. - М.: Изд-во МПУ «Народный учитель», 2000. - 226 с.

4. Головин Б.Н. Язык и статистика. - М.: Просвещение, 1971.

5. Турыгина Л.А.Моделирование языковых структур средствами вычислительной техники. -М.: Высшая школа, 1988. -(Б-ка филолога).

6. Частотный словарь русского языка. / Под ред. Л.Н. Засориной. – М., 1977.

7. Алексеев П.М.Частотные словари: Учебное пособие. –СПб.: Изд-во С.-Петерб. ун-та, 2001.

8. rusf.ru/books/analysis– лигвоанализатор: первый действующий анализа­тор индивидуально-стилистических характеристик русских текстов (Д.Хмелев).

9. philol.msu.ru/~lex/corpus– корпус текстов русских газет концаXXвека.

10. philol.msu.ru/~humlang/articles/PolystylCorp.htm– полистилевой корпус текстов современного русского языка.

11. info.ox.ac.uk/bnc – текстовые базы данных: BNC (The British National Corpus).

12. ruscorpora.ru (corpora.yandex.ru)– национальный корпус русского языка.

13. bokrcorpora.narod.ru/frqlist/frqlist.html– частотный словарь современного русского языка.

14. Языкознание. Большой энциклопедический словарь / Гл. ред. В.Н. Ярцева. – 2-е изд. М.: Большая Российская энциклопедия, 1998