Анализ. 768. Теория измерений и анализ данных. 4 Всеросс. социолог. Статистическое имитационное моделирование случайных процессов методика и конкретная реализация
Скачать 1.45 Mb.
|
Построение топологической марковской цепи.2907 Вывод расч ё тных формул для двойной цепи Маркова на базе ТМЦ Ключевым в методологии построения двойной ТМЦ являются три момента 1. Определение индикаторной функции – b j (d t ) – вероятность в j м состоянии иметь наблюдаемое свойство d t в момент времени t, связы- t, связы- , связывающей сферы жизни с предметом исследования, например, с уровнем религиозности. Генерирование разных моделей образования вероятностей в матрице переходных вероятностей, в которой учитывается индикаторная функция 3. Повторная перенормировка переходной матрицы вероятностей с учётом индикаторной функции. В качестве первого примера приводится Смена ценностных ориентаций женщин России фертильного возраста, выявленной входе социологического опроса [2]. Среди множества вопросов анкеты имеется такой критериальный вопрос (см. таблицу 1). Таблица Ответы (по годам) матерей девочек - подростков на вопрос с чем связываете будущее своей дочери, % 1990 1995 2001 2002 2005 С удачным замужеством (ψ) 64 46 27 26 27 С хорошей работой (φ) 19 36 64 62 62 В качестве второго примера приводится Общемировая закономерность спада степени распространённости религиозности по мере роста уровня образованности населения, например, горожане Санкт-Петербурга верующими себя считают среди лиц, имеющих высшее инв образование – 52%, среди лиц со средним образованием – 67%, с неполным средним – 88%. Для целей формирования индикаторной функции к данным [3] при- менён закон Ципфа (5) (см. таблицу 2). Таблица 2 Распределение занятости мужчин по уровню полученного образования в областях РФ Ярославская область Воронежская область Башкортостк 1 2 3 Рабочие (Р 56 ИТР 38 Интеллигенция (И 3 6 (i) = C(i) / r α (i) C(1) = 0.38; α (1) = 0.6 ; r - ранг группы (Опираясь на этот закон, определена степень религиозности занятого населения в Северо-Западном федеральном округе, и для него посчитан среднесрочный прогноз этой степени. Уточнение: исследователи [3] отмечают существенную разницу между кругом респондентов, относящих себя к той или иной конфессии, например, православной, и кругом тех, кто отнёс себя к верующим в Бога. На наш взгляд, самоидентификацию с православием осуществляют не только «воцерковленные» верующие, но и широкий круг респондентов - приверженцев православной культуры. Например, имеет распространение такая самоидентификация как православный атеист». На наш взгляд, такое положение вещей связано стем, что церковь является всего лишь одним из депозитариев информационно-культурных кодов, социокультурной генетики данного социума [12], наряду с другими воплощениями его социальных институтов, например, семьёй. Влияет на динамику приверженцев религии и половая принадлежность. Так в те же е годы, когда стабилизировалась численность верующих, чаще называют себя православными женщины их число составило 66%, мужчин – 43%» В итоге в современной социологии религии уживаются следующие оценки степени религиозности [3]: 1) по самооценке 2) по статистике ответивших о частоте соблюдения религиозных ритуалов 3) по конфессиональной самоидентификации. В данной работе, с учётом этих сложностей, решено измерять степень религиозности по двухбалльной шкале (верующий, неверующий. К неверующим отнесены ответившие нет ответа, не знаю и т. па также сомневающиеся. Основной формулой, позволяющей вычислять вероятность нахождения наблюдаемых свойств, те. данных D при условии модели λ = (А, В, π), является формула, в которой учитываются скрытые состояния, те. переменные Q [5]: p(D │λ ) = ∑ Q p(D │ Q, λ ) p(Q │λ), (где p(Q│λ) – вероятность последовательности Q = q 1 q 2 … q T при условии выбранной модели λ= (А, В, π) – см.выше Рис, те. выбрав в качестве первого элемента последовательности q 1 , перейдём в состояние q 2 и т. д. до состояния q T . Каждая такая последовательность считается как отдельное событие и необходимо просуммировать по всем таким событиям для изучаемой типичной личности с учётом вероятности иметь искомое свойство в каждом из состояний последовательности) = ∑ Q p(D │ Q, λ ) p(Q │λ ) = ∑ q 1 q 2 … q T bq 1 (d 1 )… Т Та … аq Т-1 Т Секция 4. Математическое моделирование и анализ данных в социологии 2909 При расчёте p(D │λ ) возникает несколько проблем, в частности 1. выбора модели - см. выше рис, 2. выбора начального состояния, те. сферы q 1 из набора сфер Т, Б, К, СО, П 3. определения последовательностей состояний q 1 q 2 … В соответствии с постановкой задачи независимо от выбранной для описания движения фокуса активности внутри жизненного пространства типичной личности марковской модели λ i , где i = 2, 3, 4, 5 и 6 итоговая марковская цепь описывается матрицей «2 х 2», те. выглядит как модель λ 2 . Таким образом, итоговая матрица переходных вероятностей, в общем виде, выглядит: Удобство этой матрицы для марковских цепей заключается в том, что в случае, когда р + р < 1, то вычисление часто необходимое для получения прогноза через n – временных интервалов сводится к , что легко считается для n →∞ как Р → x (Используя полученное выражение и формулу, определяющую текущее значение Р , можно получить оценку второй систематической ошибки метода, а сравнив её с ошибкой измерений δ ij , можно получить n: n = log (max δ ij )/ log (р + р -1)/ (2- р - р) (В случае, когда условие р + р < 1 не выполняется, и известно лишь, что 0 < р , р < 1, то можно вывести другое выражение для Р Из формул (10), (12) вытекает, что в пределе для n → ∞ стабилизированная положительно определённая матрица переходных вероятностей приобретает в качестве своих одинаковых строк компоненты вектора стационарного распределения, независящего от вектора начального распределения вероятностей. Эта матрица, полученная из формулы (10) тождественна матрице, получающейся изв силу того, что 0< р, р <1, для этого достаточно вспомнить, что 1- р р, ар р Секция 4. Математическое моделирование и анализ данных в социологии 2910 Классификация типичных цепочек сфер образа жизни в жизненном пространстве личности Для использования индикаторных функций, формирующихся, в том числе, и на основе таблиц 2 и 3, приведём классификацию типов личностей. Ниже в таблице 4 представлены приведённые ранее цепочки с.о.ж., соотнес нные с известными из ранее проведённых социологических исследований типами трудового поведения. Таблица Варианты цепочек сфер образа жизни в жизненном пространстве личности (фрагмент) Социальные портреты типичных личностей Трудоголики Высокая оплата – высокий мотиватор труда (Невысокая, но постоянная зарплата, - мотиватор монотонного труда Не интегрированные в сферу труда (4) Распространённость - sd 10 46 34 Траектория цикла 1 ТБТСТБТКБ – ж � БТСБТКБТ - с ТБТСТБТБ (в основном мужчины) БТБСТСБ (в основном женщины) БСТСБ Траектория цикла учащийся) ОБОСОБОКБ Траектория цикла учащийся, с укор. рабочим днём) ОБОСТБОБ Пример построения расч ётного алгоритма Предполагается, что приведённый набор последовательностей вместе с близкими к каждой из х групп, те. образующей в совокупности долю sd(i), образует всё пространство событий. На основании приведённых выше формула также Таблиц 2-4 выводится алгоритм расчёта вероятностей р и р, где р – вероятность иметь признаки религиозности, р - вероятность не иметь признаки религиозности: р 00 = sd(1)* p 1 (D│λ) + sd(2)* p 2 (D│λ) + sd(3)* p 3 (D│λ) + sd(4)* p 4 (D│λ) = sd(1)* Т (fr(1))… Б (Б) Та ТТаТБаБТ … а КБ а ББ + … sd(4)* О (ОБ (Б Б (Б) Б) а ОО а ОБ а ББ а БО а ОО а ОС а СС а ББ (13). 1 Близость определяется количеством символов, отличающих эталонную последовательность Табл) от иной учтённой. Секция 4. Математическое моделирование и анализ данных в социологии 2911 Аналогично р вычисляется р 11 : Р 11 = sd(1)* p 1 (D 1 │λ) + sd(2)* p 2 (D 1 │λ) + sd(3)* p 3 (D 1 │λ) + sd(4)* p 4 (D 1 │λ) Последовательности задают отсутствие наличие религиозности. Стабилизировавшуюся матрицу переходных вероятностей получаем (15) согласно формуле (где P - стабилизированная матрица переходов однородной простой эргодической цепи Маркова Вычислительные эксперименты с двойными цепями Маркова и обсуждение результатов Сначала рассматривался вариант образа жизни с двумя сферами жизнедеятельности (труда и быта) (см. рис. Рис. Первый фрагмент рабочего поля с итоговым результатом прогноза религиозности в России (С-ЗФО) Результат, представленный на Рис, полученный с использованием методики двойной ТМЦ, нашёл своё подтверждение в выводе Европейского социального исследования о стабильном сосуществовании в ближайшей перспективе 49% от всего населения России последователей религий с 48% нерелигиозного населения [6]. Аналогичный результат получается и для других стартовых значений переходных вероятностей, в частности, если 17 - процент «воцерковленных», те. активных верующих, и 22 - процент атеистов, те. активных неверующих поданным опроса Аналитического центра Юрия Левады - Росбалт, 08/09/2011) , тов перспективе - вектор стационарного распределения на полюсах степеней религиозности «воцерковленных» - 19%; атеистов – 19%. Секция 4. Математическое моделирование и анализ данных в социологии 2912 Расч ё т тестового примера В основе расчёта положена упрощённая модель российского социума занятого (работающего и рабочего) населения в конкретном регионе, описанная в Таблице 4, нос учётом в нём долей женщин – 0,61 и мужчин. При использовании массовых цепочек в Табл (БТБТБ, БТБСТСБ, …) при вычислении вероятностей согласно формулам (13), (14) обнаруживается, что итоговые величины много меньше 1, те. чем сложнее цепочки, тем меньше их вклад в итоговых выражениях для рассчитываемых оценок. Аналогично в качестве тестовых были получены оценки усреднённой степени религиозности для Приволжского и Северо-Западного округов РФ. Показатель Pver = 0.402 характеризует асимптотику доли воцерковленного населения при неизменной структуре социума. Показатель Punver = 0.598 характеризует асимптотику суммарной доли неверующих и колеблющихся в вере. К примеру – в такой области, как Нижегородская, на 1995-96 гг доля населения, вовлечённого в религиозную жизнь, те. имеющего дома иконы и т. п. культовые предметы, составило 39.2% [20], что близко к полученной оценке. Выводы и заключение 1. В работе поставлена, теоретически обоснована, математически формализована и решена задача расчёта регулярных социальных прогнозов на скрытых топологических однородных марковских цепях 2. Эффективность работы представленного метода на примере расчёта прогноза степени религиозности российского социума подтверждена в аналогичном прогнозе Европейской комиссии социологов 3. Точками роста развиваемого метода являются 1) его обобщение с матрицы переходах на матрицы перехода «n x n», где n = 3 - 6. 4. Обобщение метода для однородной матрицы вероятностей перехода на неоднородную матрицу. Библиографический список 1. Алексеев В.М., Якобсон МВ. Символическая динамика и гиперболические динамические системы – Добавление в книге Р.Боуэна Методы символической динамики, серия Математика - Новое в зарубежной науке 13, Мир, М, 1979. 2. Вовк Е. Гендерная асимметрия и женские роли в современной России / Е. Вовк // Социальная реальность. - 2006. - N 3. - С. 61-73. Секция 4. Математическое моделирование и анализ данных в социологии 3. Кублицкая Е.А. Особенности религиозности в современной России // Социс. 2009, №4 . - С. 96-108. 4. Луман Н. Теория общества // Теория общества (фундаментальные проблемы Под ред. А.Ф.Филиппова.- М «КАНОН-пресс-Ц», «Кучково поле, 1999. С 5. Николенко СИ. Скрытые марковские модели, Академический университет, С.-Пб.,2011 - URL: logic.pdmi.ras.ru/sergey/teaching/ mlaptu11/06-hmm.pdf. 6. Кофанова Е. и М.Мчедлова М. Религиозность россиян и европейцев // Перспективы, 2010-05-20.htm. 7. Цеханская КВ. Россия тенденции религиозности в ХХ веке (некоторые статистические данные) // Исторический вестник, 2000, № 5. 8. Шведовский В.А. О гипотезе ограничения рождаемости в основных этнических группах иммигрантов Москвы, Научно-практический журнал Человеческий капитал, № 9 (21), - М Союз, 2010, С. 24-29. 9. Шведовский В.А., Шведовский О.В. Тополого-сетевая модель жизненного пространства личности как обобщение гипотезы К.Левина // Математическое моделирование социальных процессов, МГУ Социологический ф-т, вып, М.,УНИВЕРСИТЕТ – Книжный дом, 2010. 10. Шведовский В.А. Информационный критерий в обобщении уравнения Н.Д.Кондратьева для современной социально-экономической ситуации в России // Математическое моделирование социальных процессов, МГУ Социологический ф-т, вып, М.,УНИВЕРСИТЕТ – Книжный дом, 2007. С. 73. 11. Шведовский ВАК построению модели комплекса факторов воспитания личности в трудовом коллективе // Роль трудовых коллективов в формировании активной жизненной позиции, Институт социологических исследований АН СССР, - МС. Шведовский В.А. Проблемы московской самобытности // Социология, Журнал Российской социологической ассоциации № 3. МС. Широкалова ГС. Сравнительные характеристики верующих и неверующих нижегородцев // Социол. исслед. 2001.№ 7. С |