Математико-статист модели в социологии. Учебное пособие оглавление введение. В основная цель курса, адресат
Скачать 2.75 Mb.
|
ТЕМА 15Двухфакторный дисперсионный анализ. 15.1. Двухфакторный дисперсионный анализ как метод анализа результатов эксперимента при изучении причинно-следственных отношений Предположим, что решая рассмотренную выше задачу - выявление зависимости (независимости) успехов студентов от формы обучения, мы пришли к выводу о неполноте такой постановки задачи: к примеру, поняли, что эффективность формы обучения зависит от пола студента. Исходная матрица ячеек становится двумерной. Покажем, как она строится. Пусть величина Yijk означает значение главного интересующего нас признака Y, вычисленное для i-го по счету (счет ведется внутри ячейки) объекта, помещенного в ячейку с номером ( j, k), где j – отвечающее рассматриваемой ячейке значение первого фактора X1 , а k – отвечающее той же ячейке значение второго фактора X2 . Будем рассматривать упрощенный случай, когда число объектов во всех ячейках одинаково и равно n (в приведенной ниже таблице n = 3). Фактор X1 - значения 1, 2, …, J (в примере J=2), а фактор X2 принимает значения 1, 2, …, K (в нашем примере K = 3) .
Модель двухфакторного дисперсионного анализа Общая модель двухфакторного дисперсионного анализа имеет вид: , где - - значение зависимого признака для конкретного респондента, помещенного в ячейку, отвечающую j – му уровню первого фактора и k – му уровню второго фактора (скажем, обучающемуся по второй форме юноши, тогда j=2, k=1), имеющему номер i в соответствующей ячейке; - - вклад j-го уровня (нижний индекс) первого фактора (верхний индекс) X1 в формирование значения Y (в нашем примере первый фактор – форма обучения; упомянутый вклад определяется тем, что студент обучался либо по первой форме обучения (j=1), либо по второй (j=2), либо по третьей (j=3)); - - вклад k-го уровня второго фактора X2 в формирование значения Y (в нашем примере второй фактор – пол студента; соответствующий вклад определяется тем, является ли студент юношей или девушкой); - - вклад, определяющийся взаимодействием i-го уровня первого фактора и j-го уровня второго; I j k – поправочный коэффициент (остаточный член), говорящий о различии между реальным значением Y-ка для рассматриваемого респондента и тем его значением, которое должно получиться для любого респондента, вошедшего в рассматриваемую ячейку (с номером (j,k)) в соответствии с нашей моделью. Особое внимание стоит уделить понятию взаимодействия. Именно наличием этого элемента принципиально отличается двухфакторный дисперсионный анализ от однофакторного. Наличие взаимодействия двух признаков (в отношении некоторого зависимого признака Y) говорит о том, что вид связи первого признака с Y зависит от того, какое значение принимает второй признак. К примеру, по отдельности и форма обучения, и пол могут в среднем (статистически) не влиять на качество обучения, но, скажем, вторая форма обучения применительно к девушкам при этом может давать очень высокий положительный эффект. Другими словами, действие формы обучения зависит от того, для девушек или для юношей она используется. Когда в принципе уровень Y-ка зависит от сочетаний конкретных значений X1 и X2 , говорят о наличии взаимодействия между рассматриваемыми факторами. Иногда в том же смысле говорят о синергетическом эффекте, вызванном сочетанием значений факторов. В том же смысле ведут речь о нелинейности воздействия факторов на зависимую переменную. Иногда взаимодействием называют само сочетание значений факторов, обусловливающее некий конкретный уровень Y-ка.101 Выборочные оценки всех формирующих модель составляющих вычисляются аналогично тому, как это делалось для однофакторного дисперсионного анализа.
Определенную сложность представляет лишь оценка взаимодействия. Зададимся вопросом о том, каким образом можно оценить наличие (или отсутствие) взаимодействия в конкретной ячейке с номером (j,k). Наличие некоего среднего уровня, совокупное воздействие j-го уровня фактора X1 и k-го уровня фактора X2 в отдельности вкупе с взаимодействием указанных уровней приводят к тому, что средний уровень успеваемости для объектов рассматриваемой ячейки оказывается равным jk. Он состоит из общего среднего уровня , вклада j-го уровня первого фактора ( j - ), вклада k-го уровня второго фактора ( k - ) и вклада упомянутого взаимодействия. Как же получить оценку последнего. Естественно, путем «вытаскивания» из среднего уровня, типичного для рассматриваемой ячейки, названных вкладов. Другими словами, выборочная оценка взаимодействия равна jk- ( j - ) - ( k - ) = jk - j - k + . (15.1) Аналогичные рассуждения справедливы и для генеральной совокупности. Этим мы воспользуемся в следующем параграфе при обсуждении вида гипотез, проверяемых в двухфакторном дисперсионном анализе. 15.3. Двухфакторный дисперсионный анализ как проверка статистических гипотез |