Анализ. 768. Теория измерений и анализ данных. 4 Всеросс. социолог. Статистическое имитационное моделирование случайных процессов методика и конкретная реализация
Скачать 1.45 Mb.
|
Теорема 2. В шкале интервалов из всех средних по Колмогорову допустимым является только среднее арифметическое Секция 4. Математическое моделирование и анализ данных в социологии 2878 Таким образом, среднее геометрическое или среднее квадратическое температур (в шкале Цельсия, потенциальных энергий или координат точек не имеют смысла. В качестве среднего надо применять среднее арифметическое. А также можно использовать медиану или моду. Теорема 3. В шкале отношений из всех средних по Колмогорову допустимыми являются только степенные средние с F(x) = си среднее гео- метрическое. Есть ли средние по Колмогорову, которыми нельзя пользоваться в шкале отношений Конечно, есть. Например, с F(x) = e x . Среднее геометрическое является пределом степенных средних при 0 → ñ . Теоремы 2 и 3 справедливы при выполнении некоторых внутриматематических условий регулярности. На наш взгляд, теоремы 1-3 должны быть известны всем студентам- социологам. (Как и все специалисты, я не могу претендовать на полное знание литературы. Буду благодарен за указание учебников для социологов, в которых приведены теоремы Аналогично средним величинам могут быть изучены и другие статистические характеристики - показатели разброса, связи, расстояния и др. Нетрудно показать, например, что коэффициент корреляции не меняется при любом допустимом преобразовании в шкале интервалов, как и отношение дисперсий. Дисперсия не меняется в шкале разностей, коэффициент вариации - в шкале отношений, и т. д. К сожалению, достаточно систематическому изучению подверглись лишь средние величины (см. выше) и расстояния ( см. [14, 25] и другие работы ЮН. Толстовой). Отметим, что исходные работы х годов по средним величинам породили достаточно обширное множество следующих работ (обзор дан в [26]), к сожалению, ничего существенно не добавивших к полученному вначале. По нашему мнению [23, 27], необходимо развивать теорию на стыке математической статистики и теории измерений. Это – призыв к математикам. А социологов надо призвать к использованию полученных результатов. Например, для усреднения порядковых данных использовать не среднее арифметическое, а медиану. Как показали многочисленные опыты, человек более правильно и с меньшими затруднениями) отвечает на вопросы качественного, например- сравнительного характера, чем количественного [28]. В очередной раз мы убедились в этом в 2011-2012 гг., проводя опросы летного состава авиакомпании «Волга-Днепр» входе разработки автоматизированной системы прогнозирования и предотвращения авиационных происшествий. Пилоты достаточно уверенно отвечали на вопросы о том, какое из предшествующих событий сильнее влияет на последующее, без труда ранжировали предшествующие события. Измерения в порядковой шкале не представляли для них сложности. При этом на вопросы типа В скольких случаях на 1000 полетов осуществится определенное событие отвечали с трудом или Секция 4. Математическое моделирование и анализ данных в социологии 2879 вообще отказывались отвечать. Поэтому пришлось отказаться от измерений в количественных шкалах и ограничиться порядковыми, с соответствующими ограничениями на методы обработки данных. Библиографический список 1. Налимов В.В. О преподавании математики экспериментаторам // О преподавании математической статистики экспериментаторам. Препринт Межфакультетской лаборатории статистических методов №17. – М Изд-во Московского университета им. МВ. Ломоносова, 1971. – С 2. Орлов АИ. Менеджмент организационно-экономическое моделирование. Учебное пособие для вузов. Ростов-на-Дону: Феникс, 2009. 3. 3. Орлов АИ. Об оценке качества процедур анализа данных // Социологические методы в современной исследовательской практике Сборник статей, посвященный памяти первого декана факультета социологии НИУ ВШЭ АО. Крыштановского / Отв. ред. и вступит. ст. О.А. Оберемко; НИУ ВШЭ, ИС РАН, РОС. М НИУ ВШЭ, 2011. - С 4. Математическое моделирование социальных процессов. Вып. 10: сб. ст. / Под ред. А.П. Михайлова. М КДУ, 2009. 5. Шведовский В.А. Особенности социолого-математического моделирования в исследовании социальных процессов. – М АПКиППРО,2009. 6. Делицын Л.Л. Количественные модели распространения нововведений в сфере информационных и телекоммуникационных технологий. М МГУКИ, 2009. 7. Онлайн исследования в России 2.0 / Под ред. Шашкина А.В., Девятко И.Ф., Давыдова С.Г. – М РИЦ «Северо-Восток», 2010. 8. Методы современной математики и логики в социологических исследованиях Под ред. Э.П.Андреева. М Институт социологических исследований АН СССР, 1977. 9. Математические методы и модели в социологии. / Под ред. В.Н. Варыгина. М Институт социологических исследований АН СССР, 1977. 10. Математические методы в социологическом исследовании. / Под ред. Т.В. Рябушкина и др. М Наука, 1981. 11. Анализ нечисловой информации в социологических исследованиях. / Под ред. В.Г. Андреенкова, А.И.Орлова, ЮН. Толстовой. М Наука, 1985. 12. Орлов АИ. Прикладная статистика. М Экзамен, 2006. Секция 4. Математическое моделирование и анализ данных в социологии 13. Орлов АИ. Организационно-экономическое моделирование учебник в 3 ч. Часть 1: Нечисловая статистика. М Изд-во МГТУ им. Н.Э. Баумана. 2009. 14. Толстова ЮН. Измерение в социологии. М Инфра-М, 1998. 15. Толстова ЮН. Анализ социологических данных методология, дескриптивная статистика, изучение связей между номинальными признаками. М Научный мир, 2000. 16. Толстова ЮН. Основы многомерного шкалирования. Учебное пособие для вузов. М Издательство КДУ, 2006. 17. Татарова Г.Г. Методология анализа данных в социологии (введение. Учебник для вузов. М NOTA BENE, 1999. 18. Татарова Г.Г. Основы типологического анализа в социологических исследованиях. М Издательский Дом Высшее образование и наука, 2007. 19. Толстова ЮН. Математические методы в социологии. / Социология в России. Под ред. В.А. Ядова. - е изд, перераб. и дополн. - М Издательство Института социологии РАН, 1998. С, 98-103. 20. Орлов АИ. Статистические методы в российской социологии (тридцать лет спустя. - Журнал Социология методология, методы, математические модели. 2005. No.20. С. Орлов АИ. Статистические пакеты – инструменты исследователя. - Журнал Заводская лаборатория. 2008. Т. No.5. С. Орлов АИ. Черная дыра отечественной социологии. - Выступление 09-01-2011 в Дискуссии о социологии на сайте Российского общества социологов URL: http://www.ssa-rss.ru/index.php?page_id=19&id=456. 23. Орлов АИ. Устойчивость в социально-экономических моделях. М Наука, 1979. 24. Колмогоров АН. Избранные труды. Математика и механика. М Наука, 1985. С. 136–138. 25. Толстова ЮН. Адекватность функции расстояния в алгоритмах автоматической классификации. – В сб.: Исследования по вероятностно- статистическому моделированию реальных систем. М ЦЭМИ АН СССР, 1977. С. Барский Б. В, Соколов МВ. Средние величины, инвариантные относительно допустимых преобразований шкалы измерения. – Журнал Заводская лаборатория. 2006. №1. С. Орлов АИ. Связь между средними величинами и допустимыми преобразованиями шкалы. – Журнал Математические заметки. 1981. Т. 30. No.4. С. 561-568. 28. Тюрин ЮН, Литвак Б.Г., Орлов АИ, Сатаров ГА, Шмерлинг Д.С. Анализ нечисловой информации (препринт. М Научный Совет АН СССР по комплексной проблеме Кибернетика, 1981. Секция 4. Математическое моделирование и анализ данных в социологии 2881 Сороко ЕЛ, Москва Новые функции Базы данных демографических показателей по регионам России и странам мира Аннотация В статье рассматриваются некоторые новые функции Базы данных демографических показателей по регионам России и странам мира. Предложена постановка задачи гармонизации единиц измерения показателя в различных информационных массивах, рассмотрены возможные подходы к ее решению. Ключевые слова база данных, демографический показатель, единица измерения, информационный массив, регионы России, страны мира Постановка задачи В настоящее время в Национальном исследовательском университете Высшая школа экономики по проекту «Учитель-ученики» Научного Фонда НИУ ВШЭ №11-04-0039 разрабатывается База данных демографических показателей по регионам России и странам мира [1,2]. База данных содержит несколько сот информационных массивов, при работе с которыми возник ряд новых достаточно интересных задач, требующих решения. В данной статье предполагается рассмотреть следующие две. Первая связана с единицей измерения демографического показателя. Опыт работы с Базой данных показал, что число различных единиц измерения, использующихся в информационных массивах демографических показателей из различных источников, превысил уже полсотни. Возникает вопрос о том, каким образом и на какой стадии работы в базе данных должны быть учтены различия в единицах измерения одного итого же показателя в информационных массивах, полученных из разных источников. Вторая проблема связана с необходимостью логического контроля значений демографического показателя, загружаемого в Базу данных. Здесь альтернативами может служить два подхода забраковать ошибочные значения на этапе форматирования входных информационных массивов, либо отсекать их налету на этапе формирования результата запроса к Базе данных. Предполагается обсудить достоинства и недостатки каждого из подходов. Секция 4. Математическое моделирование и анализ данных в социологии 2882 Единицы измерения демографических показателей Важнейшей компонентой описания информационного массива демографического показателя является единица измерения. Это связано стем, что разные показатели могут иметь различную размерность и поэтому измеряться в различных единицах, а один и тот же показатель в массивах из разных источников может измеряться различными единицами, отличающимися масштабом. Простейшим примером может служить единица измерения такого показателя как численность населения. В ряде источников она может представляться числом лиц (людей, в других даваться в тысячах или миллионах человек. Демографические коэффициенты могут быть измерены в расчете на 1000 населения, нов других случаях используется единица измерения %. Коэффициенты смертности могут быть измерены в расчете на тысячу жителей, а в других случаях – на 100.000 населения. Если рассмотреть один конкретный показатель, то для его корректного хранения в базе данных требуется решение задачи, которую можно было бы назвать задачей гармонизации или задачей стандартизации единицы измерения. То есть, во всех информационных массивах, содержащих значения данного показателя должна быть использована одна и та же единица измерения. Как может быть решена эта задача На первый взгляд может показаться, что существует только один единственно правильный способ ее решения. Он состоит в том, что для данного показателя выбирается утверждается) одна правильная, стандартная единица измерения. Все информационные массивы, в которых единица измерения совпадает со стандартной, значения показателя сохраняются в неизменном виде. В тех же информационных массивах, где она отличается от стандарта, все значения в них пересчитываются с использованием коэффициента, равного соотношению единицы измерения в исходном массиве и стандарте. Однако это не совсем так, поскольку может быть реализован и альтернативный подход. Он состоит в том, что все исходные информационные массивы, содержащий данный демографический показатель, оставляются неизменными независимо от использованных в них единицах измерения. Пересчет жена стандартную единицу измерения производится налету только в процессе формирования запроса к Базе данных. Данный метод может оказаться более подходящим для новых показателей, у которых еще нет устоявшегося стандарта единицы измерения, в случае неожиданной смены стандарта, различных стандартах для разных стран мира. Реализация данной функции предполагается в разрабатываемой базе данных Секция 4. Математическое моделирование и анализ данных в социологии 2883 Контроль значений демографических показателей Важнейшим критерием качества базы данных является хранение в ней логически корректных, правильных значений показателя, которые не противоречат данным статистики и его содержательному смыслу. Возникает естественный вопрос, как обеспечить высокое качество базы данных поданному критерию. То есть избавить ее от значений, которые противоречат мировой демографической статистике и науке. Например, было бы невозможно пользоваться такими значениями показателей, как нулевая смертность, общий коэффициент брачности населения в 500 промилле в год или коэффициент суммарной рождаемости в 48 детей на 1 женщину. Подобно первой проблеме, здесь также на первый взгляд может показаться, что существует единственно правильный способ ее решения. И состоит в том, что значения данного показателя должны быть проверены перед загрузкой в базу данных на соответствие существующей науке и статистике. Для всех значений, которые им не соответствуют, должен быть установлен барьер для загрузки в базу данных, они не должны в нее попасть. Значения же, которые не противоречат им, могут быть загружены. Но и для решения данной задачи может быть также реализован альтернативный подход. Он состоит в том, что все исходные информационные массивы, оставляются неизменными и загружаются в базу независимо от их значений. Проверка жена допустимость их значений производится налету только в процессе формирования запроса к Базе данных. Такой метод может оказаться более подходящим для показателей, у которых имеется значительный тренд в динамике для развитых стран мира или при появлении новых научных знаний. В этом случае решение о том, является ли значение показателя корректным, может быть пересмотрено с использованием гибкой коррекции границ допустимых значений конкретного показателя. Реализация данной функции также предполагается при разработке данной базы Секция 4. Математическое моделирование и анализ данных в социологии 2884 Библиографический список 1. Сороко ЕЛ. База данных демографических показателей по регионам России и странам мира принципы построения // Инновационное развитие экономики России институциональная среда Четвертая Международная научная конференция, Москва, МГУ, Экономический факультет 20–22 апреля 2011 г. Сборник статей Том 4 / Под ред. В.П.Колесова, Л.А. Тутова. – М, МАКС Пресс, 2011, с. 1077-1085. (URL: http://db.demoscope.ru/doc/soroko_lomonosov_2011.doc ). 2. Сороко ЕЛ. База данных демографических показателей по регионам России и странам мира основные компоненты / XIII Апрельская международная научная конференция по проблемам развития экономики и общества НИУ ВШЭ, 3–5 апреля 2012 г. (URL: http://regconf.hse.ru/uploads/ 604e4a2edd2abe0d64d5dd50de 29e1c49c0b1007.doc - текст доклада Секция 4. Математическое моделирование и анализ данных в социологии 2885 Сушко ЕД, Москва Имитация поведения человека-работника и его взаимодействия с внешней средой в мультиагентной региональной модели Аннотация В статье представлена агент-ориентированная модель, имитирующая социально-экономическое состояние региона на основе реконструкции его внутренней структуры и деятельности включенных в него экономических агентов разных типов. Основное внимание уделено модели личности агентов-людей и поведению таких агентов в качестве участников производства. Ключевые слова агент-ориентированное моделирование, структура личности, трудовой потенциал, поведенческая экономика, апробация региональной политики Постановка задачи Целью настоящей работы являлось создание достаточно реалистичной компьютерной модели, имитирующей поведение региона на основе реконструкции его внутренней структуры, а также структуры и поведения действующих на его территории самостоятельных экономических субъектов. В последнее время для моделирования подобных активных систем [1] все шире применяется особый вид имитационного моделирования, а именно – агент-ориентированное [2, 3]. Агент-ориентированная (мульти- агентная) модель представляет собой искусственное общество, состоящее из взаимодействующих между собой самостоятельных агентов, каждый из которых обладает заданным набором личностных характеристик (ресурсов, целевой функцией (интересами) и подчиняется правилам поведения, предопределяющим его реакцию в различных ситуациях, затрагивающих сферу его интересов. Важной особенностью агент-ориентированных моделей является то, что конкретные значения характеристик агентов могут различаться. Именно эта особенность позволяет использовать муль- тиагентные модели для воссоздания внутренней структуры больших соци- ально-экономических систем, и тогда полученное искусственное общество Секция 4. Математическое моделирование и анализ данных в социологии 2886 состоит не из неких усредненных типичных представителей сообщества моделируемого, а из множества самых разнообразных его представителей, встречающихся действительности. Реальное общество неоднородно, и изменения макроэкономических параметров, также, как и изменения социальной и/или экономической политики властей, по-разному влияет на состояние и поведение различных экономических субъектов, а также их групп, действующих на территории региона. И это представляется существенным при моделировании поведения региона как сложного экономического субъекта в нестабильной среде, а также при разработке и апробации методов регулирования экономики с учетом человеческого фактора. Очевидно, что самым важным из таких экономических субъектов является человек, живущий на территории региона, участвующий в производстве, производящий и потребляющий общественные блага. Важным – потому, что, с одной стороны, улучшение качества жизни и повышение удовлетворенности ею людей является критерием успешности региональной политики, ас другой стороны, именно трудовая деятельность людей является ресурсом для экономических объектов других уровней и служит средством реализации любой политики. Конструкция модели В разработанной региональной модели [4] присутствуют агенты, соответствующие основным типам экономических акторов, которые образуют следующую иерархию агенты-люди → агенты-организации, в которых люди трудятся, → агенты-муниципальные районы, на территории которых находятся организации и проживают люди, → регион-субъект Российской Федерации, к которому относятся муниципальные районы. Каждый тип агентов обладает определенным набором характеристик, обуславливающих его ценность сточки зрения предназначенной ему в модели роли в общественном производстве, причем часть из этих характеристик сохраняют постоянное значение, а часть – изменяются во времени и/или вследствие каких-либо процессов, происходящих в модели. Агрегирование частных характеристик позволяет оценить общую полезность каждого отдельного агента, которая в модели для агентов-людей соответствует их трудовому потенциалу, а для агентов следующих уровней является функцией от суммарного трудового потенциала включенных в них агентов-людей. Объемы производства агентов-предприятий реального сектора облагаются налогами и служат источником доходов регионального бюджета и бюджетов муниципальных районов, также, как и доходы работающих агентов-людей. Далее поступившие в бюджет средства распределяются в соответствие с заданными нормативами между государственным управлением, образованием, здравоохранением, наукой и культурой, а оставшиеся средства могут быть направлены на развитие других отраслей. Таким образом, деятельность агентов-людей трудоспособного возраста, реализующих свой трудовой потенциал, служит в модели основой всей экономической жизни региона Секция 4. Математическое моделирование и анализ данных в социологии 2887 Кроме того, каждый тип агентов обладает системой ценностей предпочтений) и способен оценивать доступную ему информацию о характеристиках внешней среды и своем положении в ней, на основе чего имитируется активность агентов, их поведение как целенаправленное изменение собственных характеристик для максимизации своей функции полезности. На каждом шаге работы модели (один шаг соответствует одному году в реальной действительности) агенты, занятые в производстве, анализируют доступную им информацию о характеристиках среды и собственном положении в ней, ив соответствии со своей системой ценностей переходят в то или иное состояние нормальное (стартовое, недовольство и критическое (необходимость срочных действий. Если состояние какого-либо агента отлично от нормального, то это побуждает его к реакции, причем, эта реакция будет зависеть не только от значений собственных характеристик агента, но и от возможностей, которые предоставляет ему внешняя среда. Таким образом, поведение агентов является функцией структуры их личности и характеристик внешней среды, что для агентов-людей согласуется с теорией личности Р. Кеттела [5]. Роль внешней для агентов среды играют агенты вышестоящих уровней иерархии (агенты одного уровняв модели напрямую не контактируют друг с другом. Так, для агентов-людей ими являются агенты-организа- ции, агенты-муниципальные районы и регион в целом, то есть, в соответствии с общепринятой терминологией [6], описываемая модель относится к классу моделей (Social Norm Promotion with n Influential Groups) – агент-ориентированных моделей поощрения социальных норм с n группами влияния, где n=3. Модель человека Рассмотрим конструкцию трудового потенциала, реализованную в модели, а также внешние условия, определяющие успех функционирования агентов-людей. Агенты–жители региона обладают следующим набором характеристик, обуславливающих их ценность сточки зрения участия в общественном производстве • Психофизиологические возраст, пол, состояние здоровья, уровень способностей, темперамент. Так как темперамент – это характеристика индивида со стороны его динамических особенностей интенсивности, скорости, темпа, ритма психических процессов и состояний [7], то ив модели наделение агента определенным типом темперамента (флегматик, меланхолик, холерик или сангвиник) определяет такие его свойства, как активность, скорость реакции и способность к адаптации в изменяющихся условиях внешней среды Профессиональные образование, сфера деятельности, опыт работы Секция 4. Математическое моделирование и анализ данных в социологии Личностные отношение к труду, личностная направленность агента на внешний или жена внутренний мир (экстраверсия – интровер- сия. Такие характеристики как здоровье, способности, активность, отношение к труду измеряются по шкале уровней, где 1 означает низкий уровень, 2 – нормальный, а 3 – высокий. Интегральной характеристикой агента является Трудовой потенциал, который принимает значение от 0 дои определяется двумя группами характеристик агента 1. Характеристики энергетического потенциала, к которым относятся здоровье, способности, способность к творчеству и активность. 2. Характеристики социального потенциала, к которым относятся квалификация (состоящая из образования и трудового стажа) и отношение к труду. Каждый показатель группы переводится в шкалу от 0 до где x – исходное значение показателя у агента, x’ – нормированное, а X множество всех возможных значений данного показателя. По каждой из групп показателей определяется соответствующий потенциал как среднее арифметическое нормированных значений показателей группы, а интегральное значение трудового потенциала определяется как среднее геометрическое из двух полученных групповых потенциалов. Данная процедура развивает подход, предложенный в Система ценностей приоритетность основных жизненных устремлений и соответствующих критериев оценки удовлетворенности своим положением. В модели предусмотрены такие критерии как уровень дохода, уверенность в завтрашнем дне (стабильность, карьерный рост и самореализация, а система ценностей представляет собой массив четырех чисел, каждое из которых определяет значимость (вес) соответствующего критерия в сумме веса составляют единицу). |