мат мет-лекции-ИНТЕРНЕТ. Математические методы в психологии
Скачать 2.19 Mb.
|
Сравнение эмпирических распределенийВо время проведения социологического опроса, людям было предложено ответить, какой из трех каналов кабельного телевидения они предпочитают. Среди опрошенных были взрослые мужчины и женщины. Данные сведены в таблицу кросс-табуляции размером 2 х 3. Можно ли сказать, что предпочтение того или иного канала как-то связано с гендерным фактором?
Вообще-то визуальный анализ таблицы позволяет предположить, что мужчины больше любят смотреть канал TV 1, а женщины - TV 3. Но как это доказать с помощью результатов статистической обработки? Для этого надо сравнить мужское и женское распределения предпочтений телеканалов. Доказательство строится по следующему алгоритму. Формулируются статистические гипотезы. Н0: распределения предпочтений каналов TV у мужчин и у женщин значимо не отличаются от случайных. Н1: распределения предпочтений каналов TV у мужчин и у женщин значимо отличаются от случайных. В таблице подсчитываются суммы частот по строкам и по столбцам.
Составляется таблица вычисления эмпирического значения 2 . В первый столбец (fэ) заносятся значения эмпирических частот из предыдущей таблицы. Во втором столбце (fт) – произведения суммы строк на сумму столбцов для соответствующей ячейки деленные на общую сумму частот (в нашем случае – 65). Это так называемые теоретические частоты, то есть, значения, которые могли получиться, если бы не было значимых предпочтений в выборе канала (если бы различия были чисто случайными). Третий столбец содержит результаты вычисления выражений предыдущего столбца. Четвертый - разница эмпирической и теоретической частот. Затем полученные разницы возводятся в квадрат, делятся на значения теоретических частот и суммируются.
Как и в предыдущем случае, эмпирический показатель рассчитывается по формуле: 4. Определяется степень свободы. Для таблицы кросс-табуляции с числом строк равным двум и более формула выглядит несколько иначе, чем в предыдущем случае: df = (с – 1) * (l – 1) , где с – количество столюцов, а l – количество строк В нашем случае df= (2-1) * (3-1) = 1 * 2 = 2. При помощи таблицы критических значений сравниваем полученное эмпирическое значение с критическими.
Эмпирическое значение (2 эмп = 10,22) в требуемой строке находится между 9,211 и 13,817. То есть, р-уровень лежит в диапазоне между р = 0,01 и р = 0,001. Таким образом, эмпирическое значение превышает критическое при уровне p ≤ 0,01 (высокая статистическая значимость): 2эмп > 2кр (p ≤ 0,01) H0, Н1! выс. ст. зн. Мы доказали зависимость предпочтения определенных каналов от пола респондента на уровне высокой статистической значимости. Действительно, представители разных полов статистически значимо чаще смотрят разные каналы. |