logo
09_Mathem-UMK-ForLang_CO

Задание № 3. Лабораторная работа «Статистический анализ текста»

Работа заключается в проведении статистического анализа литературного текста по грамматическим категориям и должна быть сдана преподавателю для проверки не позднее, чем на 4-ом практическом занятии. Текстом служит предисловие к роману М.Ю. Лермонтова «Герой нашего времени».

Текст

«Во всякой книге предисловие есть первая и вместе с тем последняя вещь; оно или служит объяснением цели сочинения, или оправданием и ответом на критики. Но обыкновенно читателям дела нет до нравственной цели и до журнальных нападок, и потому они не читают предисловий. А жаль, что это так, особенно у нас. Наша публика так еще молода и простодушна, что не понимает басни, если в конце её не находит нравоучения. Она не угадывает шутки, не чувствует иронии; она просто дурно воспитана. Она еще не знает, что в порядочном обществе и в порядочной книге явная брань не может иметь места; что современная образованность изобрела орудие более острое, почти невидимое и тем не менее смертельное, которое, под одеждою лести, наносит неотразимый и верный удар. Наша публика похожа на провинциала, который, подслушав разговор двух дипломатов, принадлежащих к враждебным дворам, остался бы уверен, что каждый из них обманывает свое правительство в пользу взаимной, нежнейшей дружбы.

Эта книга испытала на себе еще недавно несчастную доверчивость некоторых читателей и даже журналов к буквальному значению слов. Иные ужасно обиделись, и не шутя, что им ставят в пример такого безнравственного человека, как Герой Нашего Времени; другие же очень тонко замечали, что сочинитель нарисовал свой портрет и портреты своих знакомых... Старая и жалкая шутка! Но, видно, Русь так уж сотворена, что все в ней обновляется, кроме подобных нелепостей. Самая волшебная из волшебных сказок у нас едва ли избегнет упрека в покушении на оскорбление личности!

Герой Нашего Времени, милостивые государи мои, точно портрет, но не одного человека: это портрет, составленный из пороков всего нашего поколения, в полном их развитии. Вы мне опять скажете, что человек не может быть так дурен, а я вам скажу, что ежели вы верили возможности существования всех трагических и романтических злодеев, отчего же вы не веруете в действительность Печорина? Если вы любовались вымыслами гораздо более ужасными и уродливыми, отчего же этот характер, даже как вымысел, не находит у вас пощады? Уж не оттого ли, что в нем больше правды, нежели бы вы того желали?..

Вы скажете, что нравственность от этого не выигрывает? Извините. Довольно людей кормили сластями; у них от этого испортился желудок: нужны горькие лекарства, едкие истины. Но не думайте, однако, после этого, чтоб автор этой книги имел когда-нибудь гордую мечту сделаться исправителем людских пороков. Боже его избави от такого невежества! Ему просто было весело рисовать современного человека, каким он его понимает и, к его и вашему несчастью, слишком часто встречал. Будет и того, что болезнь указана, а как её излечить – это уж Бог знает!»

Анализ

1 этап. Используя раздел «Аналитическая грамматика словаря» из «Частотного словаря русского языка» под ред. Засориной [5-доп.], справочную литературу по грамматике (в т.ч. и словари), определите для каждой единицы анализа её грамматическую категорию и заполните таблицу. В строке «Остальные» значение абсолютной частоты F не должно превышать 3-4.

Грамматические категории

Абсолютная частота (F)

Относительная частота (f)

Существительное

Глагол

Прилагательное

Наречие

Числительное

Местоимение

Союз

Предлог

Частица

Причастие

Остальные

Итого (общая сумма)

2 этап. Проведите анализ распределения частот грамматических категорий слов, сравнив полученные данные с данными таблицы 4, приведенной в приложении 4 частотного словаря русского языка под редакцией Засориной:

– проанализируйте расхождения и совпадения относительных частот грамматических категорий слов, полученных Вами, со средними «по Засориной» значениями для всех функциональных стилей (жанров); укажите возможные на Ваш взгляд причины этих расхождений и совпадений;

– определите функциональный стиль, к которому «тяготеет» этот отрывок и можно ли однозначно ответить на этот вопрос;

– какие типы текстов могут давать похожие таблицы;

– можно ли «догадаться», и каким образом о формальном содержании текста только по таблице частот.