Анализ. 768. Теория измерений и анализ данных. 4 Всеросс. социолог. Статистическое имитационное моделирование случайных процессов методика и конкретная реализация
Скачать 1.45 Mb.
|
Библиографический список 1. АР. Бахтизин. Агент-ориентированные модели экономики. М Экономика, 2008. 2. Ю.М. Бородай. К вопросу о социально-психологических аспектах происхождения и первобытнородовой общины. Принцип историзма в познании социальных явлений. М Наука, 1972. 3. В.Л. Макаров, АР. Бахтизин, С.С. Сулакшин. Применение вычислимых моделей в государственном управлении. М Научный эксперт. Г. Спенсер. Научные основания нравственности. М УРСС, 2007 (факсимиле с издания 1892 г 5. В. П. Эфроимсон. Родословная альтруизма. Новый мир, №10, 1971. Секция 4. Математическое моделирование и анализ данных в социологии 2871 Орлов АИ, Москва Теория измерений и методы анализа 1 Предварительно обосновав необходимость развития научной специальности Математические и инструментальные методы в социологии, рассматриваем роль теории измерений при выборе методов сбора и анализа социологической информации. Математические и инструментальные методы в социологии Статья относится к достаточно самостоятельной области – математическим методам анализа социологических данных. Основной интерес в ней – к математическим вопросам, социологические постановки служат для постановки математических задач. Эта область относится к математической социологии – научной дисциплине, аналогичной математической экономике, математической физике и др. Классификация наук закреплена формальными решениями. Например, в нашей стране утвержден список специальностей научных работников. Однако формальные решения могут быть модернизированы. Время от времени это происходит. Например, около 20 лет назад появились новые группы специальностей – социологические и политологические. Однако недостатки действующей системы очевидны. Приведем четыре примера. Пример 1. Продолжает использоваться термин «физико-математи- ческие науки, хотя его нелепость ясна всем специалистам. Математика относится к формальным наукам, изучает конструкции, созданные мыслью, те. находящиеся не в реальном мире, а в идеальном (по Платону. Математика может быть применена в любой сфере деятельности, в любой отрасли народного хозяйства. Например, широко распространен термин «экономико-математические методы и модели, очевидно, относящийся к применению математики в экономике. В тоже время физика – одна из областей естествознания, наука, изучающая наиболее общие и фундаментальные закономерности, определяющие структуру и эволюцию материаль- 1 Работа выполнена при поддержке Министерства образования и науки РФ в рамках Постановления Правительства РФ № 218. Секция 4. Математическое моделирование и анализ данных в социологии 2872 ного мира. Термин «физико-математические науки не более обоснован, чем, например, термины «химико-математические науки или даже «вете- ринарно-социологические науки». Пример 2. Как известно, статистические методы применялись на практике (и, следовательно, были теоретически разработаны) с древних времен. В Библии Ветхий завет начинается с Пятикнижия Моисеева, и четвертая книга Пятикнижия называется Числа. Она начинается с описания проведенной под руководством Моисея переписи военнообязанных. Со времен библейского Моисея статистика получила значительное развитие. В США число статистических кафедр в университетах превышает число математических, соответственно и число статистиков больше числа математиков (примерно вдвое) [1]. Следовательно, в США статистика воспринимается одной из больших наук математика, физика, статистика, химия, биология Совсем не так в нашей стране. В официальной структуре науки статистика упоминается дважды, и оба раза на вторых ролях. Во-первых, как одна из экономических наук (специальность 08.00.12 Бухгалтерский учет, статистика, присуждаются ученые степени по экономическим наукам. Во-вторых, в названии математической специальности 01.01.05 теория вероятностей и математическая дисциплина (присуждаются ученые степени по физико-математическим наукам. Все остальные применения статистических методов, в частности, в социологических исследованиях, остаются вне официальной структуры науки. Пример 3. На знамени научного прогресса второй половины ХХ в. начертано Кибернетика. Однако нет в нашей стране докторов и кандидатов кибернетических наук (есть, правда, математическая специальность Дискретная математика и математическая кибернетика, при защите присуждается ученая степень по физико-математическим наукам). Пример 4. Очевидно, что менеджмент (управление людьми) – более широкая сфера деятельности, чем экономика. Управленческие решения необходимо принимать на основе все совокупности социальных, технологических, экологических, экономических, политических факторов [2]. Между тем в действующей официальной номенклатуре специальностей научных работников (в редакции Приказа Минобрнауки РФ от 11.08.2009 N 294) менеджмент находится внутри экономической специальности Экономика и управление народным хозяйством. При этом есть целый ряд технических специальностей, включающих в себя термин управление, среди которых выделяется специальность 05.13.10 Управление в социальных и экономических системах (присуждаются ученые степени по техническим (!) наукам. Приведенные примеры показывают, что действующая официальная номенклатура специальностей научных работников нуждается в модернизации Секция 4. Математическое моделирование и анализ данных в социологии 2873 К социологическим наукам близки экономические. Вплоть до того, что на включение в свою сферу маркетинга (изучения предпочтений потребителей) претендуют и те, и другие. Однако у экономистов есть специальность Математические и инструментальные методы в экономике, ау социологов нет аналогичной специальности, математическая социология не выделена среди социологических наук. К чему это приводит В частности, к отсутствию должного внимания к развитию математических методов в социологии, к их вытеснению из перечней секций социологических конференций и конгрессов. В результате падает квалификационный уровень работ. На заседании секции Измерение в социологии VI научно-практической конференции памяти первого декана факультета социологии Александра Олеговича Крыштановского Современная социология — современной России (1–3 февраля 2012 года) пришлось урезонивать воинствующего невежду, который пытался навязать докладчику свое неправильное понимание проверки значимости при проверке статистических гипотез. Впрочем, и докладчик продемонстрировал непонимание необходимости обязательной проверки значимости различия долей тех или иных значений признаков при сравнения совокупностей, сказавши: В журнале «Социология-4М» нас заставили проверить значимость различия долей. К необходимости повышения качества математической составляющей социологических исследований мы старались привлечь внимание в работе Мы считаем необходимым усилить внимание к проблемам развития и применения математических методов анализа социологических данных, математического моделирования социальных процессов, корочек математической социологии. Целесообразно в рамках социологической науки создать специальность Математические и инструментальные методы в социологии, аналогичную экономической специальности Математические и инструментальные методы в экономике. К математическим методам в социологии относим нет только методы анализа числовых и нечисловых социологических данных, но и методы математического моделирования социальных процессов [4, 5]. Под инструментальными методами понимаем прежде всего методы, нацеленные на развитие и применение информационных технологий, включая сетевые (в том числе модели распространения нововведений в сфере информационных и телекоммуникационных технологий [6] и онлайн исследования [7]). О развитии математической социологии в нашей стране Много интересных работ, относящихся к математической социологии, было выполнено в нашей стране в е годы ХХ в. Назовем только некоторые из них. В 1977 г. Институт социологических исследований выпустил сборники [8, 9]. На основе материалов Всесоюзной научной конферен- Секция 4. Математическое моделирование и анализ данных в социологии 2874 ции Проблемы применения математических методов в социологическом исследовании издательство Наука опубликовала солидный сборник [10]. Хотя прошло уже 30 лет, материалы этих сборников по-прежнему актуальны. Квалифицированные работы не устаревают. И даже необходимо отметить методологическую несостоятельность современных публикаций Росстата по переписям населения по сравнению с книгой Числа Ветхого Завета, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея. Посей день наиболее многоплановой публикаций по методам анализа нечисловых данных является сборник [11], подготовленный совместно академическим Институтом социологии и комиссией Статистика объектов нечисловой природы Научного Совета АН СССР по комплексной проблеме Кибернетика. В настоящее время анализу нечисловых данных посвящены обширные разделы в учебниках по прикладной статистике [12], есть и специальные учебники по нечисловой статистике [13], но сборник [11] по-прежнему актуален и необходим тем, кто хочет разобраться в методах анализа нечисловой (те. качественной) информации в социологических исследованиях. Отметим, что именно практические запросы социологов (и специалистов по экспертным оценкам) послужили стимулом для разработки нечисловой статистики В дальнейшем появились адресованные студентам-социологам учебники и учебные пособия, в частности, книги ЮН. Толстовой [14- 16] и Г.Г. Татаровой [17, 18]. С 1991 г. выпускается журнал Социология методология, методы, математическое моделирование (сокращенно «Социология-4М»). Развитию математических и статистических методов в российской социологии посвящены обзорные работы [19, Казалось бы, все хорошо в области математической социологии. Однако всё заметнее проявляются отрицательные тенденции. Большинство социологов остаются невежественными в области методов анализа данных. Проявляется это, например, в преклонении перед давно устаревшим западным статистическим пакетом SPSS (анализу статистических пакетов посвящена статья [21]). Полученные еще в е годы ХХ в. научные результаты остаются неизвестными, а потому, естественно, не применяются. Научный инструментарий социолога зачастую соответствует уровню XIX в. В последнее время даже номинальное признание важности математической социологии в виде организации отдельных секций на социологических конгрессах и конференциях постепенно сходит на нет. Подробнее эти мысли развиты в нашем выступлении [22] в Дискуссии о социологии на сайте Российского общества социологов. О теории измерений Согласно теории измерений все реальные данные измерены в той или иной шкале [12-14]. Обычно выделяют шесть основных шкал – наименований (номинальную, порядковую, интервальную, отношений, раз Секция 4. Математическое моделирование и анализ данных в социологии 2875 ностей, абсолютную. Первые две – шкалы качественных признаков, остальные четыре – шкалы количественных признаков. Только абсолютная шкала не накладывает никаких ограничений на математические методы анализа данных. Группы допустимых преобразований – вот что интересует нас в шкалах измерения, поскольку именно они задают ограничения на методы обработки данных, измеренных в соответствующих шкалах. На основе анализа реальной ситуации выясняем шкалу измерения интересующих нас данных, те. ее группу допустимых преобразований. Методы анализа данных должны быть инвариантны относительно этой группы. Возникает целый ряд задач является ли инвариантным конкретный метод анализа данных найти хотя бы один конкретный метод анализа данных, решающий поставленную задачу найти все инвариантные методы из некоторого заранее определенного класса для каких шкал инвариантен заданный метод найти все шкалы, относительно которых инвариантен определенный метод найти все методы, выводы с помощью которых инвариантны с вероятностью, стремящейся к 1 (здесь своя достаточно обширная система постановок исследовательских задачи т. д. Перейдем к более подробному изложению. Выяснение типов используемых шкал необходимо для адекватного выбора методов анализа данных. Основополагающим требованием является независимость выводов оттого, какой именно шкалой измерения воспользовался исследователь среди всех шкал, переходящих друг в друга при допустимых преобразованиях. Например, если речь о длинах, то выводы не должны зависеть оттого, измерены ли длины в метрах, аршинах, саженях, футах или дюймах. Другими словами, выводы должны быть инвариантны относительно группы допустимых преобразований шкалы измерения. Только тогда их можно назвать адекватными, те. избавленными от субъективизма исследователя, выбирающего определенную шкалу из множества шкал заданного типа, связанных допустимыми преобразованиями. Требование инвариантности выводов накладывает ограничения на множество возможных алгоритмов анализа данных. В качестве примера рассмотрим порядковую шкалу. Одни алгоритмы анализа данных позволяют получать адекватные выводы, другие - нет. Например, в задаче проверки однородности двух независимых выборок алгоритмы ранговой статистики (те. использующие только ранги результатов измерений) дают адекватные выводы, а статистики Крамера-Уэлча и Стьюдента - нет. Значит, для обработки данных, измеренных в порядковой шкале, критерии Смирнова и Вилкоксона можно использовать, а критерии Крамера-Уэлча и Стьюдента - нет Секция 4. Математическое моделирование и анализ данных в социологии 2876 Выбор вида средних величин на основе условия устойчивости результата сравнения средних Оказывается, требование инвариантности является достаточно сильным. Из многих алгоритмов анализа статистических данных ему удовлетворяют лишь некоторые. Покажем это на примере сравнения средних величин. Пусть Х , Х ,…, Х - выборка объема n. Наиболееобщее понятие средней величины введено французским математиком первой половины ХIХ в. академиком О. Коши. Средней величиной (по Коши) является любая функция f(X 1 , X 2 ,...,X n ) такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел X 1 , X 2 ,...,X n , и не больше, чем максимальное из этих чисел. Средними по Коши являются среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое, среднее квадратическое. Средние величины используются обычно для того, чтобы заменить совокупность чисел (выборку) одним числом, а затем сравнивать совокупности с помощью средних. Пусть, например, Y 1 , Y 2 ,...,Y n - совокупность оценок экспертов, выставленных одному объекту экспертизы, Z 1 , Z 2 ,...,Z n - второму. Как сравнивать эти совокупности Очевидно, самый простой способ - по средним значениям. При допустимом преобразовании шкалы значение средней величины, очевидно, меняется. Но выводы о том, для какой совокупности среднее больше, а для какой - меньше, не должны меняться (в соответствии с требованием инвариантности выводов, принятом как основное требование в теории измерений. Сформулируем соответствующую математическую задачу поиска вида средних величин, результат сравнения которых устойчив относительно допустимых преобразований шкалы. Пусть f(X 1 , X 2 ,...,X n ) - среднее по Коши. Пусть среднее по первой совокупности меньше среднего по второй совокупности, Y 2 ,...,Y n ) < f(Z 1 , Тогда согласно теории измерений для устойчивости результата сравнения средних необходимо, чтобы для любого допустимого преобразования g из группы допустимых преобразований в соответствующей шкале) было справедливо также неравенство f(g(Y 1 ), g(Y 2 ),...,g(Y n )) < f(g(Z 1 ), те. среднее преобразованных значений из первой совокупности также было меньше среднего преобразованных значений для второй совокупности. Причем сформулированное условие должно быть выполнено для любых двух совокупностей Y 1 , Y 2 ,...,Y n и Z 1 , Z 2 ,...,Z n. И, напомним, для любого допустимого преобразования. Средние величины, удовлетворяющие сформулированному условию, назовем допустимыми (в соответству- Секция 4. Математическое моделирование и анализ данных в социологии 2877 ющей шкале. Согласно теории измерений только допустимыми средними величинами можно пользоваться при анализе мнений экспертов и иных данных, измеренных в рассматриваемой шкале. С помощью математической теории, развитой в монографии [23], удается описать вид допустимых средних величин в основных шкалах. Рассмотрим обработку, для определенности, мнений респондентов или экспертов, измеренных в порядковой шкале. Справедливо следующее утверждение. Теорема 1. Из всех средних по Коши допустимыми средними в порядковой шкале являются только члены вариационного ряда (порядковые стати- стики). Теорема 1 справедлива при условии, что среднее f(X 1 , X 2 ,...,X n ) является непрерывной (по совокупности переменных) и симметрической функцией. Последнее означает, что при перестановке аргументов значение функции f(X 1 , не меняется. Это условие является вполне естественным, ибо среднюю величину находим для совокупности (множества)чисел, а не для последовательности. Множество не меняется в зависимости оттого, в какой последовательности мы перечисляем его элементы. Согласно теореме 1 в качестве среднего для данных, измеренных в порядковой шкале, можно использовать, в частности, медиану (при нечетном объеме выборки. При четном же объеме следует применять один из двух центральных членов вариационного ряда - каких иногда называют, левую медиану или правую медиану. Моду тоже можно использовать - она всегда является членом вариационного ряда. Можно применять выборочные квартили, минимум и максимум, децили и т. п. Но никогда нельзя рассчитывать среднее арифметическое, среднее геометрическое и т. д. Естественная система аксиом (требований к средним величинам) приводит к так называемым ассоциативным средним. Их общий вид нашел в 1930 г. А.Н.Колмогоров [24]. Теперь их называют средними по Колмогорову. Для чисел X 1 , X 2 ,...,X n средним по Колмогорову является G{(F(X 1 ) + F(X 2 ) +...+ где F - строго монотонная функция (те. строго возрастающая или строго убывающая, G - функция, обратная к F. Среди средних по Колмогорову - много хорошо известных персонажей. Так, если F(x) = x, то среднее по Колмогорову - это среднее арифметическое, если F(x) = ln x, то среднее геометрическое, если F(x) = 1/x, то среднее гармоническое, если F(x) = x 2 , то среднее квадратическое, и т. д. (в последних трех случаях усредняются положительные величины. Среднее по Колмогорову - частный случай среднего по Коши. С другой стороны, такие популярные средние, как медиана и мода, нельзя представить в виде средних по Колмогорову. Справедливы следующие утверждения. |