II модуль. Вероятностно-статистическое изучения языка и речи
Основной целью обучения в рамках данного модуля является усвоение студентами методики и методов структурно-вероятностного моделирование языка и речи, методики контент-анализа, формирование умений применять их при проведении прагмалингвистического анализа; ознакомление студентов с информационными лингвистическими технологиями. Изучение данного модуля позволит студентам усвоить основные области приложения структурно-вероятностной модели языка, освоить основные математические понятия, применяемые в исследовании текста и речи, изучить методику статистического эксперимента и контент-анализа, научиться использовать эти понятия и методы в своей работе, освоить ряд компьютерных технологий, связанных с применением методов статистического моделирования языка и текста, а также сформировать специальные и продолжить формирование общенаучных и общепрофессиональных компетенций, необходимых лингвисту.
Статистический подход к исследованию языковых структур. Основания и условия вероятностно-статистического изучения языка и речи.
Субъективное, статистическое и классическое определение вероятности. Статистический подход к исследованию языковых структур.
Статистические закономерности в языковых структурах. Основания и условия вероятностно-статистического изучения языка и речи (по Б.Н. Головину и современная интерпретация).
Основы построения лингвостатистических моделей. Минимально-необходимые лингвисту статистические инструменты. Компьютерные технологии.
Методика статистического эксперимента. Методика создания выборочной лингвистической совокупности (выборки). Репрезентативность и рациональный объем выборки
Этапы статистического эксперимента.
Формулирование и дальнейшее уточнение цели исследования. Определение единицы анализа.
Генеральная лингвистическая совокупность, выборочный метод. Методика создания выборочной лингвистической совокупности (выборки).
Требования к выборочной лингвистической совокупности – репрезентативность и рациональный объем выборки.
Репрезентативность; приемы, обеспечивающие надежную репрезентативность тематических выборок. Определение минимально достаточного объема выборки в грамматических, фонетико-фонологических и лексикологических исследованиях. Относительная ошибка и надежность.
Корпусная лингвистика. Электронные корпуса текстов.
Языковой материал в лингвистических исследованиях. Корпусная лингвистика как важнейший этап решения задачи автоматизированного построения лингвостатистических моделей.
Исходные понятия корпусной лингвистики: проблемная область, корпус данных, корпус текстов, единица хранения, типы корпусов данных, способы представления и хранения корпуса данных. Требования к корпусу текстов как к выборочной лингвистической совокупности, отражающей проблемную область.
Опыт разработки корпусов текстов. Фундаментальные корпусы (США, Великобритания, Германия, Франция, Россия). Электронные корпуса текстов. Британский национальный корпус. Национальный корпус русского языка. Компьютерный корпус текстов русских газет конца XX-го века.
Частотный словарь как структурно-вероятностная модель языка и речи. Важнейшие применения частотных словарей.
Понятие о частотных словарях и их применении в лингвистических исследованиях. Лексикография и частотные словари.
Частотный словарь как вероятностно-статистическая модель: цель составления словаря; единицы анализа и аналитическая грамматика частотного словаря; лингвистические генеральная и выборочная совокупности; комплектование выборочного корпуса текстов – репрезентативность и объем выборки.
Частотные словари и: а) обучение языку, б) учебная лексикография, в) инженерная лингвистика, г) лингвистическая типология.
Методика, сущность, этапы подготовки и проведения контент-анализа.
Контент-анализ, его методика и сущность с лингвистической точки зрения.
Этапы подготовки и проведения контент-анализа: выбор корпуса языковых данных; выбор концептуальной переменной и определение ее значений; выбор единицы кодирования; отбор кодировщиков и формулировка инструкций по кодированию; кодировка данных; подсчет данных и интерпретация результатов.
Факторы контроля качества эксперимента: надежность (стабильность, повторяемость и тщательность); достоверность/обоснованность (семантическая достоверность, достоверность отбора данных или репрезентативность). Методы достижения репрезентативности в контент-анализе: метод случайной выборки, метод стратификационной выборки, систематический отбор.
Виды контент-анализа. жесткий и мягкий, содержательный и структурный.
Примеры применения методики контент-анализа.
- Федеральное агентство по образованию
- I. Пояснительная записка
- 1.1. Цели и задачи дисциплины
- 1.2. Требования к уровню освоения содержания дисциплины
- 1.3. Объем дисциплины и виды учебной работы
- II. Содержание дисциплины
- 2.1. Разделы дисциплины и виды занятий
- Содержание разделов дисциплины
- I модуль. Элементы прикладной лингвистики
- II модуль. Вероятностно-статистическое изучения языка и речи
- 2.3. Практические и семинарские занятия
- № 1. Языкознание и математика. Математическая лингвистика
- № 2. Вероятностно-статистическое изучение языка и речи
- № 3. Контент-анализ
- № 4. Важнейшие применения частотных словарей
- № 5. Семиотика и лингвосемиотические основы переводоведения
- № 6. Современная глоттохронология
- 2.4. Основные понятия дисциплины
- 2.5. Задания для самостоятельной работы
- III. Формы контроля и требования к зачёту по дисциплине
- 3.1. Текущий и итоговый контроль усвоения знаний
- 3.2. Вопросы к зачёту
- IV. Учебно-методическое обеспечение дисциплины
- 4.1. Рекомендуемая литература
- 4.2. Средства обеспечения освоения дисциплины Материально-техническое обеспечение дисциплины
- Современные информационные технологии и мультимедийные продукты
- V. Методические рекомендации по организации изучения дисциплины
- 5.1. Общие рекомендации
- 5.2. Указания по выполнению заданий самостоятельной работы Задание № 1. (Задача а.Б. Долгопольского и а.А. Зализняка)
- Задание № 2. Классификация местоимений русского языка
- Задание № 3. Лабораторная работа № 1 «Статистический анализ рекламных текстов из нкря»
- Изучить информацию о Национальном корпусе русского языка на сайте корпуса: http://ruscorpora.Ru/ (разделы «что такое корпус?», «состав и структура», «статистика», «параметры текстов»).
- Провести статистический анализ рекламных текстов, представленных в Национальном корпусе русского языка
- Задание № 4. Лабораторная работа № 2 «Статистический анализ современного газетного текста»
- Задание № 5. Лабораторная работа № 3 «Контент-анализ литературного текста»
- I. Заполните таблицу
- II. Проведите анализ личностных качеств героев
- I. Заполните таблицу
- II. Проведите анализ личностных качеств героев
- Теоретические основы исследования.
- Требования к оформлению работы (контент-анализ)
- 5.4. Указания для студентов заочной формы обучения
- VI. Приложение задачи по глоттохронологии
- Домашнее задание