Главная страница
Навигация по странице:

  • Причины возникновения пропусков Вероятность неответа на вопрос: Степень случайности, пропусков

  • Критерий демократичности президентских выборов Аннотация

  • Таблица Эмпирические данные и прогноз результатов президентских выборов 1996 г. Рейтинг Кандидаты Результаты голосования

  • Таблица Эмпирические данные и прогноз результатов президентских выборов 2000 г.

  • Таблица Эмпирические данные и прогноз результатов президентских выборов 2004 г. Рейтинг Кандидаты Результаты голосования (xi) в Прогноз

  • (pi) в Отклонение σ = ± Наиболее вероятное отклонение

  • Анализ. 768. Теория измерений и анализ данных. 4 Всеросс. социолог. Статистическое имитационное моделирование случайных процессов методика и конкретная реализация


    Скачать 1.45 Mb.
    НазваниеСтатистическое имитационное моделирование случайных процессов методика и конкретная реализация
    АнкорАнализ
    Дата07.10.2019
    Размер1.45 Mb.
    Формат файлаpdf
    Имя файла768. Теория измерений и анализ данных. 4 Всеросс. социолог.конгр.pdf
    ТипДокументы
    #88890
    страница6 из 13
    1   2   3   4   5   6   7   8   9   ...   13
    Таблица Связь между причинами возникновения пропусков, их типами и допустимыми способами корректировки после сбора данных
    Причины возникновения
    пропусков
    Вероятность
    неответа на вопрос:
    Степень случайности,
    пропусков
    Допустимый способ корректировки после сбора
    данных
    Не зависит от возможного ответа
    Полностью случайные (MCAR)
    Удаление
    Взвешивание
    Заполнение
    Случайные (Зависит от возможного ответа
    Неслучайные Не поддаются
    *Для случайных пропусков перед взвешиванием и заполнением необходимо разбиение выборки на части, внутри которых пропуски полностью случайны.
    Выше было отмечено, что между общими типами причини степенью случайности порождаемых ими пропусков установить однозначное соответствие нельзя. Но можно утверждать следующее. Для обоснования допустимости корректировки после сбора данных (удаления, взвешивания выборки или заполнения пропусков) пропусков в ответах на определенный вопрос необходимо определить возможные причины возникновения последних и проанализировать связь между этими причинами и вероятностью неответа. Неслучайные пропуски, исключающие возможность их ликвидации после сбора данных, возникают под влиянием социальных, психологических или методических причин, только если последние ставят вероятность неответа на вопрос в зависимость от самого возможного истинного ответа (значения характеристики, измеряемой данным вопросом, которое было бы получено в случае ответа. Поэтому, если у исследователя действительно есть основания полагать, что может иметь место ситуация возникновения неслучайных пропусков, похожая на одну из описанных выше, корректировка пропусков должна заключаться в максимальном устранении причин, породивших эту неслучайность. Заполнять неслучайные пропуски даже с помощью самых сложных алгоритмов некорректно, так как при заполнении пропусков алгоритмы, так или иначе, используют имеющиеся данные. Нов случае неслучайных пропусков, респонденты, не ответившие на вопрос, отличаются от ответивших как по значениям рассматриваемого признака, таки по значениям других признаков. Поэтому, некорректно при заполнении неслучайных пропусков использовать имеющиеся данные с совершенно другим распределением.
    Секция 4. Математическое моделирование и анализ данных в социологии
    2836
    Еще одна практическая рекомендация, которую можно сделать, основываясь на приведенных выше размышлениях и примерах, касается ситуации, когда исследователь имеет дело со случайными пропусками. При случайных пропусках, когда вероятность неответа зависит от значений другого признака, внутри групп выделенных по значениям этого другого признака присутствует свое распределение вероятности неответа на вопрос. Поэтому заполнением пропусков необходимо разбить совокупность на группы, внутри которых пропуски поданной переменной полностью случайны (случайная величина «ответ-неответ» имеет одинаковое распределение внутри группы, и заполнять пропуски внутри каждой группы в отдельности. При работе со случайными пропусками возникает проблема поиска признаков определяющих случайность пропусков. Определить эти признаки необходимо для того, чтобы разбив по их значениям выборку, добиться в каждой подвыборке полной случайности пропусков. В первую очередь, в качестве таковых признаков имеет смысл рассматривать объективные характеристики респондентов, смысл которых очевиден, понятен и слабо зависит от способа измерения. И, здесь важно понимать, что зафиксировать абсолютно все признаки, определяющие именно случайность пропусков по некоторой переменной нельзя, потому что круг имеющихся потенциальных признаков – факторов случайности ограничен только признаками, изучаемыми в данном исследовании. И, может сложиться ситуация, что относительно изучаемых в исследовании признаков пропуски могут быть полностью случайными, а относительно не рассматриваемых в нем признаков - случайными. То есть, выводы о полной случайности и случайности пропусков, и соответственно допустимости их заполнения, могут быть справедливы только с точностью до признаков, изучаемых в рамках данного конкретного исследования. Когда пропуски полностью случайны ив совокупности имеет место одно распределение случайной величины «ответ-неответ» заполнение пропусков правомочно в полной мере, так как респонденты, не ответившие на вопрос, не отличаются от ответивших ни по значениям рассматриваемого признака ни по значениям других признаков, и использование при заполнении пропусков имеющихся данных при корректной реализации не внесет в структуру данных и результаты их анализа специфических смещений. Библиографический список 1. Бутенко И.А. Нет ответа. Анализ методической ситуации на страницах журнала «Public Opinion Quarterly» // Социологические исследования. С 2. Зангиева ИК. Проблема пропусков в социологических данных смысли подходы к решению // Социология М (методология, методы, математические модели. 2011. № 33. С.
    Секция 4. Математическое моделирование и анализ данных в социологии 3. Хайкин С.Р., Павлов Э.П. Как помочь интервьюеру (из опыта методических исследований) // Социологические исследования. 1992. №4. С 4. Чурилов Н.Н. Труднодоступные единицы исследования – источник систематических ошибок // Социологические исследования. 1986. № 1. С 5. Adamek J. Fusion: Combining data from separate sources // Marketing
    Research: A Magazine of Management and Applications. 1994. Vol.6. No.
    3. P.48-56.
    6. D.de Leeuw E., Hox J., Huisman M. Prevention and Treatment of Item
    Nonresponse // Journal of Official Statistics. 2003. Vol. 19. No.2. P.155-156.
    7. Ferber R. Item Nonresponse in a Consumer Survey // Public Opinion
    Quarterly. 1966. Vol. 30. No. 3. P. 399-415.
    8. Ineke A.L.S. The Hunt for the Last Respondent. Nonresponse in sample surveys. Hague: Social and Cultural Planning Office of the Netherlands, 2005.
    P.18-35.
    9. Rubin D.B. Multiple Imputation for Nonresponse in Surveys. New York:
    Willey, 1987. P. 64-69.
    10. Sande I. Imputation in Surveys: Coping with Reality // The American
    Statistican.1982. Vol.36. No.3. P.145-152.
    11. Wagner K., Wedel M. Factor Analysis and Missing Data // Journal of
    Marketing Research. 2000. No.11. P. 490-498.
    12. Wagner K., Wedel M. Statistical Data Fusion for Cross – Tabulation //
    Journal of Marketing Research. 1997. No.11. P. 485-497.
    Секция 4. Математическое моделирование и анализ данных в социологии
    2838
    Лукичев П. Н, Ростов-на-Дону
    Критерий демократичности президентских выборов
    Аннотация
    Принципы демократии – равное для всех избирательное право, свободное волеизъявление граждан, тайное голосование обусловливают стохастический характер процесса выборов, что определяет возможность построения вероятностной модели его результатов.
    Ключевые слова закон биноминального распределения вероятностей электоральные предпочтения моделирование выборов достоверность итогов голосования
    На протяжении ряда лет мною публиковались стати, связанные с отработкой методики прогнозирования президентских выборов и верификации легитимности их проведения [1; 2; 3; 4]. Вернуться к этой теме необходимо по причине уточнения нюансов модели и успешности ее апробирования за рубежом, в частности, во Франции на президентских выборах
    2012 г, хотя нас, конечно, в первую очередь интересует свой собственный опыт, который и будет рассматриваться ниже.
    Демократически осуществляемая процедура выборов является стохастическим процессом, в котором каждый из кандидатов, выражающий интересы и волю какой-либо социальной группы, имеет все основания рассчитывать на свою победу. Это позволяет расценивать шансы на успех каждого из претендентов как теоретически равные, что соответствует принципу равных прав граждан демократического государства избирать и быть избранным. C другой стороны, равное и прямое избирательное право при свободном и тайном голосовании означает, что каждый из избирателей при отсутствии иных побудительных мотивов с равной долей вероятности может отдать свой голос любому из кандидатов, а значит, исходные вероятности мы должны принять как равные и считать m
    1
    p =
    (где р – исходная вероятность, m – число кандидатов, зарегистрированных избирательной комиссией. Однако, чтобы сами претенденты о себе и своих шансах ни думали, в действительности вероятность победы на выборах задана неко-
    Секция 4. Математическое моделирование и анализ данных в социологии
    2839
    торой суммой факторов, которые к моменту объявления о регистрации кандидатов в президенты уже вполне проявили свое действие и определили их рейтинг в общественном мнении.
    Этот рейтинг входе предварительного социологического опроса населения высвечивается стой степенью надежности, с которой такое исследование является репрезентативным, валидным и корректным. Следствием наличия рейтинговой оценки кандидатов является изменение исходно равных вероятностей на отличающиеся и весьма существенно. Данное отличие наиболее полно отражает закон биноминального распределения вероятностей m
    i j
    i j
    i m
    ij где i – номер строки j – номер столбца, m – число претендентов на президентское кресло.
    Матрица вероятностей перехода каждого из претендентов в президентское кресло будет иметь вид 0
    P
    P
    0
    P
    P
    P
    P
    22 12 11 02 01 Причем, по сути, в действительности нас интересуют только две первые строки матрицы, из которых первая характеризует вероятности рассматриваемого события с участием действующего президента, который переизбирается наследующий срок, те. пытается сохранить президентское кресло за собой (вероятность Р, а вторая – вероятности при участии в выборах претендентов, не занимавших никогда раньше пост президента страны.
    Например. Первый этап президентских выборов 1996 года изначально предполагал, что будет и второй этап, так как ни один из претендентов не мог бы сразу набрать 50% + 1 голос. Считая, что кандидатов было
    11, включая кандидата против всех и действующего президента, который именно в силу данного обстоятельства имел возможность занимать любую из последующих нулевой рейтинговых позиций на правах участника в выборах в качестве кандидата, получаем исходную вероятность р
    0.091, и искомые переходные вероятности:
    Это практически совпадает с реальным распределением голосов, поскольку процентная (Р) оценка вероятности есть в тоже время прогноз результатов выборов в процентном же выражении вне зависимости от численности электората и количества участвовавших в выборах
    Секция 4. Математическое моделирование и анализ данных в социологии
    2840
    Данный пример, кстати, показывает, что претенденты, находящиеся за пределом пятой рейтинговой позиции, имеют шансы перемещения в президентское кресло, близкие к нулю, что согласуется со сделанным ранее выводом о поглощающем состоянии при общем числе позиций m
    = 5.56 [5, с.190-207].
    Имея эмпирические данные и предполагая в соответствии с высказанными основаниями, что закон распределения вероятностей задан расчетными значениями р i
    (4-ый столбец Таблицы 1), мы можем определить дисперсию и среднее квадратическое отклонение σ
    . При этом будем исходить из того, что имеем дело с дискретными, случайными и взаимно независимыми величинами и используем классическую формулу для расчета дисперсии через математическое ожидание, отталкиваясь от эмпирических величин результатов голосования (х Но можем подойти и с другой стороны. Поскольку речь идет ома- тематической модели, призванной дать прогноз результатов выборов, то допустим, что эмпирическое значение случайных величин – число голосов избирателей, поданных за каждого из кандидатов (х i
    ) – нам неизвестно, и будем исходить только из расчетных величин, считая, что x i
    = p i
    . В этом случае
    Как видим, разница между двумя вариантами расчета дисперсии не столь существенна, и теоретическое значение среднего квадратического отклонения смело можно использовать для прогностического моделирования, получая практически 100%-ную надежность. Однако с увеличением надежности точность прогноза в этом случае страдает, так как разброс ожидаемых значений величин оказывается очень большим, ноне большим их эмпирических значений. В связи с этим примем без доказательств наличие интервала наиболее вероятных значений эмпирических величин х в пределах m
    p x
    i i
    σ
    ±
    =
    . В последнем случае мы, конечно, сужаем интервал, увеличивая точность прогноза в ущерб его надежности
    Секция 4. Математическое моделирование и анализ данных в социологии
    2841
    Таблица Эмпирические данные и прогноз результатов президентских выборов 1996 г.
    Рейтинг
    Кандидаты
    Результаты
    голосования
    в (х) Прогноз в (pi) Отклонение
    σ = ± Наиболее вероятное
    отклонение
    0-позиция
    Ельцин
    35,28 от 24.90 до от 30.67 до 39,75 1
    Зюганов
    32,03 от 28,40 до от 34,01 до 43,09 Лебедь от 9,13 до от 14,74 до 23,82 3
    Явлинский
    7,34 от 0 до от 1,24 до 10,32 4
    Жириновский
    5,7 от 0 до от 0 до 5,70 5
    Ельцин
    0,16 Против всех от 0 до от 0 до 4,56 Федоров от 0 до от 0 до 4,54 8
    Горбачев
    0,51
    » 0 9
    Шаккум
    0,37
    » 0 10
    Власов
    0,20
    » 0 11
    Брынцалов
    0,16
    » Эмпирические данные множества избирательных кампаний, не только президентских и не только в России, позволяют утверждать, что эта величина является наиболее часто встречающимся отклонением эмпирических данных от расчетного значения числа голосов в их процентном представлении, поданных за того или другого кандидата. Причем, как правило, она характерна для х i
    , соответствующего рейтинговой позиции ниже ой. С другой стороны, именно в силу малой вероятности победы на выборах в отношении кандидатов, находящихся на данных рейтинговых позициях, в наименьшей степени вероятно осуществление подтасовок и искажений результатов голосования. Это позволяет утверждать, что в случае отклонения значения эмпирической величины хот расчетного значения p i
    (обе величины представляются или в процентах или в долях от «1») более чем на
    5
    σ
    , мы вправе ставить вопрос о сомнении в достоверности результатов голосования в отношении данного кандидата. Если величинах, мы можем подозревать наличие нарушений в пользу данного кандидата.
    Секция 4. Математическое моделирование и анализ данных в социологии
    2842
    Если величинах, мы можем ставить вопрос о нарушениях, совершенных против данного кандидата. Так, в рассмотренном случае выборов
    1996 года, когда отмечались массовые нарушения входе избирательной кампании, они, очевидно, были направлены против двух кандидатов, занимавших первую и вторую рейтинговые позиции – Зюганова и Лебедя.
    Характерно, что на втором этапе выборов Б.Н.Ельцин прибавил к своему административному ресурсу большую часть электората второй, третьей, четвертой и пятой позиций, голосовавшую не за, а против самой возможности коммунистической реставрации, получив окончательно
    53,82% при минимально возможных Р + Р + P
    03
    + Р + Р –
    σ
    = 51,11% или при другом варианте без голосов яблочников: Р + Р + Р + Р –
    5
    σ
    = 51,11%). Его главный конкурент, Г.А.Зюганов, сохранив первое место в рейтинге, проиграл выборы (Впрочем, по большому счету, выход за интервал наиболее вероятных значений процента голосов, поданных за того или иного кандидата, означает, что в действие демократических норм, процедур и принципов осуществляется вмешательство сторонних факторов, отнюдь необязательно в виде откровенного искажения воли избирателей. Сторонние факторы могут влиять на свободный выбор даже не только посредством прямых угроз, давления и запугивания электората. Это может быть весьма тонкая и расчетливая психологическая игра общественным мнением, манипулирование сознанием людей, искажающее их собственную волю и подменяющее их истинные ценности и интересы скорректированными установками. Формально демократические процедуры могут и не нарушаться, но по существу вести к фальсификации самой природы демократии.
    На президентских выборах 2000 года было двенадцать кандидатов, включая кандидата против всех. В.В.Путин к этому времени уже имел имидж известного политика, поскольку занимал пост премьер-министра, являлся официальным преемником Б.Н.Ельцина и исполнял обязанности президента страны, впрочем, в общественном мнении он занимал тогда вторую рейтинговую позицию, уступая Г.А.Зюганову в популярности. Поэтому прогноз тогда строился по нулевой строке матрицы с объединением Р + Р
    Секция 4. Математическое моделирование и анализ данных в социологии
    2843
    Таблица Эмпирические данные и прогноз результатов президентских выборов
    2000 г.
    Рейтинг
    Кандидаты
    Результаты голосования
    (xi) в Прогноз
    (pi) в Отклонение
    σ = ± Наиболее вероятное отклонение
    0-позиция
    Путин
    52,99 от 44.24 до от 49,86 до 58,94 1
    Зюганов
    29,24 от 28,24 до от 33,86 до 42,94 2
    Путин
    19,20 3
    Явлинский
    5,8 от 0 до от 1,28 до 10,36 4
    Тулеев
    2,98 от 0 до от 0 до 5,73 5
    Жириновский
    2,7 от 0 до от 0 до 4,7 Против всех от 0 до от 0 до 4,56 7
    Титов
    1,47
    » от 0 до от 0 до 4,54 8
    Памфилова
    1,01
    » 0 9
    Говорухин
    0,44
    » 0 10
    Скуратов
    0,43
    » 0 11
    Подберезкин
    0,13
    » 0 12
    Джбраилов
    0,10
    » Водном случаев данной таблице x i
    лежит не в интервале p i
    ±
    5
    σ
    – это первая рейтинговая позиция, в отношении к которой мы можем выразить сомнение о достоверности результатов, однако мы не можем сомневаться в самих результатах президентских выборов.
    На президентских выборах 2004 года В.В.Путин переизбирался на второй сроки прогноз результатов снова строился по нулевой строке матрицы. Кандидатов тогда было семь, если считать также и кандидата против всех
    Секция 4. Математическое моделирование и анализ данных в социологии
    2844
    Таблица Эмпирические данные и прогноз результатов президентских выборов
    2004 г.
    Рейтинг
    Кандидаты
    Результаты голосования
    (xi) в Прогноз
    (pi) в Отклонение
    σ = ± Наиболее вероятное
    отклонение
    0-позиция
    Путин
    71,31 от 63,43 до 83,87
    Р00+Р01 = от 69,08 до 78,22 1
    Путин
    39,66 Харитонов от 9,61 до от 15,26 до 24,4 3
    Глазьев
    4,1 от 0 до от 0,94 до 10,08 4
    Хакамада
    3,84 от 0 до от 0 до 5,49 Против всех от 0 до от 0 до 4,66 6
    Малышкин
    2,02 от 0 до от 0 до 4,59 Миронов от 0 до от 0 до Процентное количество голосов, полученных стоящим в общественном мнении на второй рейтинговой позиции Харитоновым, находится в пределах теоретического отклонения, но заграницами интервала p i
    ±
    5
    σ
    , что позволяет подозревать наличие нарушений входе избирательной кампании, направленных против второго кандидата. Однако в целом на результатах выборов это никоим образом не отразилось, и, откровенно говоря, если нарушения и имели место, будучи направленными против Харитонова, то смысла в них не было никакого, поскольку результат был предопределен.
    В этом плане теоретический интерес представляют президентские выборы 2008 года, когда Д.А.Медведев должен был идти в качестве кандидата, первый раз участвующего в избирательной кампании, а значит, прогноз ее результатов необходимо было бы проводить по первой строке матрицы. Однако манипулирование общественным мнением было осуществлено чрезвычайно искусно. Медведев был преподнесен в качестве
    alter ego Путина, и занял не только его первую рейтинговую позицию в общественном мнении, но и стал преемником его административного ресурса, что перевело модель выборов на нулевую строку матрицы
    Секция 4. Математическое моделирование и анализ данных в социологии
    2845
    1   2   3   4   5   6   7   8   9   ...   13


    написать администратору сайта