непараметрические тесты для независимых выборок. Тесты для сравнения двух независимых выборок. Uкритерий МаннаУитни Курдюкова Е. В. Сафу, вшитас
Скачать 0.86 Mb.
|
Непараметрические тесты для сравнения двух независимых выборок. U-критерий Манна-Уитни Курдюкова Е.В. САФУ, ВШИТАС U-критерий Манна-Уитни – непараметрический статистический критерий, используемый для сравнения двух независимых выборок по уровню какого-либо признака. Метод основан на определении того, достаточно ли мала зона перекрещивающихся значений между двумя вариационными рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). U-критерий Манна-Уитни является непараметрическим критерием, поэтому, в отличие от t-критерия Стьюдента, не требует наличия нормального распределения сравниваемых совокупностей. U-критерий подходит для сравнения малых выборок: в каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было 2 значения, но во второй тогда должно быть не менее пяти. Условием для применения U-критерия Манна-Уитни является отсутствие в сравниваемых группах совпадающих значений признака (все числа – разные) или очень малое число таких совпадений. U-критерий Манна-Уитни подсчитывается по формуле: Uэмп = n1 * n2 + (nx * (nx +1)/2) - tx , где n1 и n2 – это объемы выборок, nx – объем выборок с наибольшей ранговой суммой tx Задача 1. Студенты физического и психологического факультетов Ленинградского университета были обследованы с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. Показатели невербального интеллекта сформированы в таблицу 2. Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?
Решение. Выдвигаем гипотезы: H0 – выборки значимо не различаются по уровню невербального интеллекта H1 – выборки значимо различаются по уровню невербального интеллекта Распределим данные таблицы по рангам, также подсчитаем сумму рангов по каждой выборке.
t2 > t1, следовательно для подсчета мы будем использовать t2. Uэмп = 12 * 12 + (12 * (12 +1) /2) – 162,5 = 144 + 78 – 162,5 = 222 – 162,5 = 59,5 Обратимся к таблице критических значений критерия Манна Уитни. В нашем случае (n1 = 12 и n2 = 12) Uкрит = 37. Uэмп > Uкрит, следовательно мы принимаем гипотезу h0. Выборки значимо не различаются по уровню невербального интеллекта. Следовательно, мы не можем утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта. Теперь решим задачу при помощи программы IBM SPSS.
Рисунок 1 – Переменные В графе «Значения» для переменной «Студенты» проставим метки и соответствующие им значения. В нашем случае значению 1 соответствуют «физики», а значению 2 – «психологи» (рисунок 2). Рисунок 2 – Метки значений
В столбце переменной «Студенты» распределяем выборки по группам (физики или психологи): 1 или 2. Рисунок 3 – Данные
Рисунок 4 – Путь в программе В «Список проверяемых переменных» вносим переменную «Невербальный интеллект», переменную «Студенты» перетягиваем в поле «Группировать по» (рисунок 5). Оставляем галочку рядом с критерием Манна-Уитни. Рисунок 5 – Критерии для двух независимых выборок Задаем группы (рисунок 6). Рисунок 6 – Задать группы
0,469 > α0,05, следовательно мы принимаем гипотезу h0 - – выборки значимо не различаются по уровню невербального интеллекта. Рисунок 7 – Выводы Задача 2. Утомленная изучением статистики студентка Катя посетила несколько магазинов, чтобы определить, действительно ли цены на простоквашу значительно различаются в зависимости от сорта. Ее наблюдения приводятся ниже. Может ли Катя сделать вывод, что цены на простоквашу зависят от сорта?
Решение. Гипотеза h0 – сорт простокваши значимо не влияет на ее цену. Гипотеза h1 – сорт простокваши влияет на цену. В задаче 4 независимых выборки, поэтому используем H-тест Крускала-Уоллиса. Этот тест является модификацией U-теста Манна и Уитни на случай для более двух независимых выборок. Он также базируется на общей ранговой последовательности значений всех выборок. Воспользуемся программой IBM SPSS.
Рисунок 8 - Переменные В графе «Значения» для переменной «Сорт» проставим метки и соответствующие им значения (рисунок 9). В нашем случае значению 1 соответствуют «Сорт А», а значению 2 – «Сорт B», 3 - «Сорт C», 4 – «Coрт D». Рисунок 9 – Метки значений
Рисунок 10 – Данные
Рисунок 11 – Путь в программе В диалоговом окне «Критерии для нескольких независимых выборок» в «Список проверяемых переменных» вносим переменную «Цена». Группирующей переменной будет «Сорт» (рисунок 12). Рисунок 12 – Критерии для нескольких независимых выборок Так как у нас четыре независимых выборки, то правильно указываем диапазон для группирующей переменной: от 1 до 4 (рисунок 13). Рисунок 13 – Диапазон
Рисунок 14 – Окно выводов Так как наше исследование проводится для 4 групп, а не для 3, мы используем не специальную таблицу для теста Крускала-Уоллиса, а таблицу для определения критических значений критерия Χ2 .Учитываем, что количество степеней свободы в нашем случае равно 3. При p ≤ 0,01 Χ2кр = 11,345, при p ≤ 0,05 Χ2 кр = 7,815. Согласно окну выводов, Hэмп = 13,233. Hэмп ≥ Χ2кр, следовательно мы принимаем гипотезу h1 – сорт простокваши влияет на цену. 5. Так как мы отклонили гипотезу h0, то должны провести апостериорные попарные сравнения. Для этого воспользуемся U-критерием Манна-Уитни. Выбираем путь: Анализ – Непараметрические критерии – Устаревшие диалоговые окна – Для двух независимых выборок. В диалоговом окне «Критерии для двух независимых выборок» задаем проверяемую переменную («Цена») и группирующую переменную («Сорт»). В первом случае мы будем сравнивать простоквашу сортов A и B, поэтому правильно задаем группы: в графе «Группа 1» ставим 1, а в графе «Группа 2» – 2. Рисунок 15 – Критерии для двух независимых выборок
Рисунок 16 – Сорт А и B 7. Аналогично сравниваем другие сорта простокваши. Для сортов B и С в окне выводов мы видим, что P = 0,028 (рисунок 17). Рисунок 17 – Сорта B и С Для сортов C и D в окне выводов мы видим, что P = 0,020 (рисунок 18). Рисунок 18 – C и D Для сортов A и C P = 0,020 (рисунок 19). Рисунок 19 – A и С Для сортов A и D P = 0,021 (рисунок 20). Рисунок 20 – A и D Для сортов B и D P = 0,021 (рисунок 21). Рисунок 21 – В и D Таким образом, цены значимо не различаются только в случае сортов A и B, так как P > α0,05. В остальных случаях гипотеза h0 отвергается и цены значимо различаются (P < α0,05). U-критерий Манна-Уитни очень удобен для сравнения двух независимых выборок по уровню какого-либо признака. Для большего количества используется H-тест Крускала-Уоллиса. |