Математико-статист модели в социологии. Учебное пособие оглавление введение. В основная цель курса, адресат
Скачать 2.75 Mb.
|
ТЕМА 14Однофакторный дисперсионный анализ. 14.1. Однофакторный дисперсионный анализ как метод анализа результатов эксперимента при изучении причинно-следственных отношенийПерейдем к рассмотрению того, что дает дисперсионный анализ исследователю, желающему изучать каузальные отношения на базе осуществления эксперимента. Рассмотрим следующую задачу. Предположим, что некоторый вуз имеет возможность использовать разные формы обучения, и мы хотим изучить, зависит ли качество усвоения студентом некоторой учебной программы от того, по какой форме этот студент обучается. Другими словами, мы хотим понять, влияет ли форма обучения на качество последнего, обусловливает ли его причинно. Обозначим через Х номинальный признак “форма обучения” (принимающий три значения). Заметим, что в действительности признак Х может быть получен по шкале более высокого типа, чем номинальная, но в дисперсионном анализе мы его используем как номинальный. Таковым мы и будем его считать. Опр. Признак Х, обозначающий потенциальную причину, называется фактором (или независимым признаком). Если фактор один, то дисперсионный анализ назвается однофакторным. Через Y , как и выше (и как это принято в литературе), обозначим признак, описывающий главное интересующее социолога явление. Для нас таким признаком является качество обучения. Будем полагать, что он измеряется с помощью ответов респондентов на вопросы некоторого теста (мы сейчас отвлекаемся от того, как именно “устроен” этот тест). В дисперсионном анализе требуется, чтобы уровень измерения Y был не ниже интервального (этого требует вычисление средних арифметических значений и дисперсий признака Y).. Опр. Признак Y, обозначающий потенциальное следствие, называется зависимым. Для решения поставленной задачи проводим эксперимент. Разделяем всех студентов на три группы и, скажем, в течение года используем свою форму обучения для каждой. Через год тестируем всех студентов. По результатам этого тестирования мы и должны понять, обусловливает ли форма обучения качество знания. Организуем информацию по тому же принципу, какой был использован в параграфе, посвященном корреляционному отношению. Группы (или, как говорят в дисперсионном анализе – ячейки) определяются значениями независимого номинального признака (здесь – формой обучения), или фактора Х. В ячейку помещаются значения основного интересующего нас признака Y (в нашем случае – теста, используемого для оценки качества обучения), вычисленные для попавших в эту ячейку респондентов. Пусть наша таблица примет вид 14.1. Таблица 14.1. Гипотетический пример данных для однофакторного дисперсионного анализа.
(Х – форма обучения; Y – результаты тестирования) Итак, наша основная задача состоит в том, чтобы на основе данных этой таблицы выявить, зависят ли значения признака Y от значений фактора Х (т.е. зависит ли качество обучения от формы последнего). При решении подобных задач искомая зависимость часто ассоциируется с причинно-следственной. И мы будем иногда говорить о том, что фактор обусловливает Y, влияет на него, служит причиной того, что Y принял то или иное значение. Однако в этой связи следует напомнить, что дисперсионный анализ, как и любой другой математико-статистический метод, в принципе не может доказать наличие причинно-следственных отношений между рассматриваемыми признаками. И когда мы ниже будем говорить о том, что фактор детерминирует, причинно обусловливает рассматриваемый признак, следует иметь в виду, что подобные выражения могут быть приняты лишь условно. Подчеркнем, что на вопрос о существовании зависимости уровня Y от значений фактора, невозможно ответить без использования разработанной в математической статистике логики переноса результатов с выборки на генеральную совокупность, точнее, без проверки статистической гипотезы. «На глаз» сравнить совокупности чисел, стоящих в разных ячейках, невозможно. Можно обратиться к средним, но то, что, скажем, среднее первой группы больше средней второй, будет говорить не вообще о влиянии фактора на уровень среднего (в нашем случае – о том, что первая форма обучения более эффективна, чем вторая), а о том, что указанное соотношение между средними верно только для данной конкретной выборки и, может быть, обусловлено лишь какими-то случайными обстоятельствами, а не влиянием фактора. Однако прежде, чем перейти к четкой формулировке проверяемой статистической гипотезы, вспомним еще один факт. 14.2. Модель однофакторного дисперсионного анализаПрежде, чем говорить о строгом способе решения поставленной задачи, необходимо четко описать ту модель, которая лежит в основе всех формальных построений. Модель кажется очень простой. Но далее, перейдя к рассмотрению двухфакторного дисперсионного анализа, мы увидим, что подобные модели могут быть гораздо более сложными и неочевидными. Научиться же строить подобные модели надо. Причин тому, по крайней мере, две. Во-первых, подобного рода модели используются очень часто: в регрессионном, логлинейном и других видах анализа данных. И их смысл надо хорошо понять, чтобы иметь возможность читать соответствующую литературу. Во-вторых, хорошее понимание смысла подобных моделей, на наш взгляд, может способствовать усвоению очень актуального методологического принципа - прежде, чем собирать данные, необходимо сформировать систему «аксиом», четко обрисовывающих априорное представление социолога о том, что он изучает. При всей своей очевидности это положение на практике часто не выполняется. В результате используются анкеты, в которые включены вопросы, не имеющие отношения к делу, не включены необходимые вопросы и т.д. Все методы анализа данных опираются на такие априорные аксиомы. Они и составляют суть модели, заложенной в том или ином методе. Привычка пользоваться методами, как нам представляется, должна способствовать выработке состоятельного с методологической точки зрения подхода к планированию социологического исследования. Или, коротко говоря, – математика может научить социолога методологической грамотности. В данном случае имеется в виду одна «аксиома» – четкая формулировка того, отчего зависит основной интересующий исследователя признак Y. Предположение о том, из чего для каждого конкретного респондента формируется уровень признака Y, выглядит следующим образом: , где - некий средний уровень, на фоне которого изучается действие фактора Х на признак Y; - это вклад в формирование значения зависимого признака j - го уровня фактора Х ; - добавка, отражающая специфические характеристики именно того (неповторимого) респондента, который включен в j-ю ячейку и имеет в ней номер i. Сделаем несколько замечаний по поводу отдельных членов модели. Сущность поясним на примере: наверное, этот уровень будет один для выпускников московских школ, другой – для выпускников деревенских школ Иркутской области и третий – для молодежи Центрально-африканской республики. Модель действительна на генеральной совокупности. Выборочной оценкой среднего уровня служит . По поводу можно сказать, что это – главный интересующий нас элемент, центральное звено модели. Размер именно этой величины и говорит о том, насколько j-я форма обучения детерминирует уровень полученных студентом знаний. Выборочной оценкой этого показателя служит разность . - это некоторый поправочный элемент, корректирующий основную часть модели, выраженную суммой ( + ). Коррекция требуется потому, что, как бы хорошо ни моделировалась величина этой суммой (а мы ищем именно такой фактор, чтобы равенство = ( + ) по возможности отражало реальность), последняя никогда не сможет учесть все специфические особенности отдельных людей. Точным равенство = ( + ) не будет никогда. Но мы все же будем считать его приемлемым, если величины в среднем равны нулю, независимы и как бы погашают друг друга. К примеру, если у i-го респондента из j-й группы окажется большим по абсолютной величине и отрицательным (из-за того, что этот респондент, к примеру, много болел в течение того года, когда проводился эксперимент; это привело к тому, что успехи студента оказались ниже, чем следовало бы ожидать при рассматриваемом среднем уровне и воздействии соответствующей формы обучения), то в той же группе найдется такой k –й респондент, у которого будет примерно таким же по модулю, но положительным (из-за того, скажем, что этот респондент весь год усиленно занимался дополнительно с преподавателем). Обычно предполагается, что величины имеют нормальное распределение с нулевым математическим ожиданием. Если же окажется, что довольно велики и практически у всех респондентов положительны, - значит, мы не учли действие какого-то общего для всех респондентов фактора. И нам надо или заменить фактор Х другим, или перейти к двухфакторному дисперсионному анализу. Величины называются остатками, и математическая статистика обычно представляет исследователю средства проанализироваать эти остатки (это имеет место не только для дисперсионного анализа). Выборочной оценкой величины служит разность . Все три элемента модели могут быть расценены как вклады в вариацию признака Y, как источники такой вариации. 14.3. Однофакторный дисперсионный анализ как проверка статистической гипотезыВзглянем на дисперсионный анализ с другой стороны. Будем проверять гипотезу о равенстве средних для рассматриваемых групп. В данном случае: Н0: 1 = 2 = 3 (точнее, следовало бы писать: Н0: 1 = 2 = 3) Заметим, что Н1 здесь формулируется достаточно неопределенно – Н1: не все средние равны. Для того, чтобы выяснить, какие именно из средних можно считать неравными, нало использовать специальную технику – методы множественного сравнения. Об этом мы пока не говорим. Вернемся к этому при обсуждении следующей темы. Проверка гипотезы осуществляется знакомым нам образом. Чтобы реализовать соответствующую логику, надо знать критериальную статистику и закон ее распределения. Используем введенные выше обозначения: SSb = SSмежду - межгрупповая сумма квадратов; SSw = SSвнутри – внутригрупповая сумма квадратов; SSt = SSобщ – общая сумма квадратов; n – объем выборки, J – число ячеек. Каждой сумме квадратов отвечает свое число степеней свободы: df b = J-1; df w = Jn – J; df t = Jn – 1. Заметим, что df b + df w = df t. Введем еще два обозначения: MSb = SSb / df b ; MSw = SSw/ df w. Это так называемые средние квадраты. Искомая статистика имеет вид: . Чтобы пояснить тот содержательный смысл, который заложен в этом критерии, вспомним, как выглядит кривая F – распределения. Напомним, что эта кривая имеет два «хвоста» и, соответственно, могут быть найдены два табличных значения: . Как правило, рассматриваемый критерий имеет смысл считать двусторонним (логика рассуждений, использующихся при выборе числа «сторон» критерия – та же, которая была использована нами при обсуждении аналогичного вопроса в случае проверки гипотезы о равенстве двух средних). Для определенности (и в соответствии с традицией), положим, что первое значение ограничивает правый «хвост», а второе – левый. Гипотеза будет отвергнута в двух случаях. Во-первых, если значение критерия достаточно велико. А это будет иметь место, когда числитель дроби MSb / MSw велик, а знаменатель мал. Другими словами, критерий «зашкалит» за правое табличное значение, если наши средние далеко отстоят друг от друга, а внутри каждой группы имеется однородность (т.е. каждое среднее действительно репрезентирует соответствующую группу). Хотелось бы, чтобы читатель понял, что это вполне отвечает здравому смыслу. Заметим, что аналогичные критерии используются во многих алгоритмах классификации. Мы имеем в виду критерии, позволяющие судить о качестве разбиения. Эти критерии говорят о хорошем качестве, если внутри классов объектам «тесно», а сами классы расположены «просторно», между ними большие расстояния. Таким образом, можно сказать, что дисперсионный анализ не только выводит нас на причинно-следственные отношения, но и позволяет оценить качество классификации, состоящей в распределении объектов по ячейкам. Во-вторых, гипотеза о равенстве средних будет отвергнута, если значение критерия достаточно мало. Смысл этого труднее понять. Однако и здесь обычные житейские рассуждения приходят на помощь. Итак, пусть дробь MSb / MSw очень мала. Грубо говоря, это означает, что либо средние, вычисленные по отдельным классам, очень близки друг к другу, либо разброс значений внутри классов в среднем очень велик. Нетрудно увидеть, что и в том, и в другом случае нет абсолютно никаких оснований отвергать гипотезу, т.е. полагать, что у нас имеются различные средние, хорошо репрезентирующие свои группы. Этого нельзя сказать ни в том случае, если средние «слиплись» (раз они мало отличаются, то вряд ли можно говорить о том, что уровень Y определяется значением X), ни в том, если средние (даже если они разные) не надежны, не отражают ситуацию в группе. Подчеркнем, что мы не доказываем, что средние равны, мы просто полагаем, что выборка не дает нам оснований сомневаться в этом, не дает оснований отвергнуть нуль-гипотезу. Можно показать, что гипотеза Н0: 1 = 2 =… = J (14.1) эквивалентна гипотезе Н0: . (14.2) Обычно считаются выполненными условия: 99 (14.3). Если же это учесть, то гипотеза (14.1) оказывается эквивалентной гипотезе Н0: и, следовательно, гипотезе Н0: . 14.4. О понимании термина «влияет» (или что значит доказать наличие причинно-следственного отношения с помощью дисперсионного анализа) Итак, приняв гипотезу (14.1), мы полагаем, что фактор Х не влияет на Y. Другими словами, форма обучения не обусловливает (в причинном смысле) уровень усвоения знаний студентами. Отвергнув же названную гипотезу, мы, напротив, полагаем, что уровень знаний студентов причинно обусловлен тем, по какой системе обучаются эти студенты. Хотелось бы, чтобы читатель понимал содержательную значимость подобных выводов. Термины «причинно обусловлен», «влияет» и т.д. здесь употребляются весьма условно. Точно так же мы говорили бы, если бы, скажем, составили частотную таблицу для наших двух признаков (предварительно, конечно, разбив диапазон изменения признака Y на интервалы и начав рассматривать этот признак как номинальный) и рассчитали, к примеру, критерий “Хи-квадрат”. Ответ на вопрос о наличии (отсутствии) связи между признаками мы тоже могли бы интерпретировать как наличие, либо отсутствие соответствующих причинно-следственных отношений. И вывод этот совсем не обязательно совпал бы с выводом, сделанным на основе дисперсионного анализа. Таким образом, исследователь должен четко понимать, что каждый математический метод дает нам лишь некоторый срез с того явления реальности, который мы назвали причинно-следственным отношением. 14.5. Метод множественных сравнений для однофакторного дисперсионного анализа. Метод множественных сравнений рассмотрим только для однофакторного дисперсионного анализа. Предположим, что, применив однофакторный дисперсионный анализ, мы обнаружили, что проверяемая гипотеза (напомним, что это – гипотеза о равенстве средних всех рассматриваемых ячеек) должна быть отвергнута. Это означает отрицание выражения «средние всех ячеек равны», т.е. утверждение того, что среди средних имеются хотя бы два неравных. Естественно, что подобное утверждение малоинформативно для исследователя. Возникает ряд вопросов: какие именно средние не равны, в каком смысле не равны: может быть, первое – в пять раз больше второго? или же третье равно среднему арифметическому двух первых? и т.д. Найти некоторый (хотя снова не достаточно полный) ответ на эти вопросы и помогает найти метод множественных сравнений. Из двух известных подходов рассмотрим один – т.н. S-метод, связываемый обычно с именем Шеффе100. Метод позволяет проверить справедливость некоторой заранее заданной зависимости между генеральными математическими ожиданиями рассматриваемых ячеек. Зависимость эта выражается в определенном виде. Проверка ее справедливости снова происходит на статистическом языке: речь идет о проверке математико-статистической гипотезы о наличии определенного рода связей между изучаемыми средними. Чтобы описать, какого рода связь между средними мы имеем возможность проверить, введем новое определение. Пусть 1 , 2,, ... , J – рассматриваемые групповые средние, т.е. те самые средние ячеек, гипотезу о равенстве которых мы отвергли в результате применения однофакторного дисперсионного анализа. Опр. Назовем контрастом средних 1 , 2,, ... , J выражение вида = с11 + с 2 2, + ... + сJ J, где с1, с 2 , ... сJ - произвольные действительные числа, удовлетворяющие условию: с1 + с 2 + ... + сJ = 0. Смысл введения понятия контраста станет ясным, если мы скажем, что, оказывается, математическая статистика представляет нам средства для проверки гипотез вида: Н0 : = 0 (для любого контраста ). Чтобы привести примеры контрастов, предположим, что у нас имеется четыре средних 1, 2, 3, J. Рассмотрим следующие гипотезы и коэффициенты отвечающих им контрастов:
Если будет принята первая гипотеза, это будет означать, что первое и второе средние равны. Значит, неравенство следует искать в отличии третьего или четвертого среднего от первых двух. Принятие второй гипотезы означает, что первое среднее можно считать равным среднему арифметическому значению второго и третьего. Принятие третьей гипотезы заставит нас полагать, что среднее первых двух средних равно среднему последних двух средних. Примеры задач1. Для изучения влияния семейного окружения на развитие ребенка были протестированы дети, растущие в разных условиях. Использовался специальный тест, позволяющий оценить уровень развития опрашиваемого (в качестве приписываемых каждому респонденту значений фигурировали целые числа от 0 до 10). Результаты опроса приведены в следующей таблице.
Можно ли сказать, что семейное окружение действительно влияет на развитие ребенка? 2. С помощью однофакторного дисперсионного анализа выявлялось, зависит ли успеваемость студента ГУ-ВШЭ от того, какую школу он окончил. Было изучено три группы студентов-первокурсников, окончивших школу, соответственно, при ГУ-ВШЭ (группа 1), другую среднюю школу в Москве (группа 2), среднюю школу на периферии (группа 3). Успеваемость измерялась с помощью некоторого теста. Гипотеза о равенстве средних была отвергнута. Можно ли каким-нибудь образом проверить гипотезу исследователей о том, что спецшкола при ГУ-ВШЭ дает лучшие знания, чем две другие школы, и что периферийная школа дает более слабые знания, чем каждая из московских. Если можно, то сделать это, воспользовавшись следующими статистическими данными:
Добавочную литературу см. после главы 15. |