Лекция 4. Ранговая корреляция
Скачать 4.92 Mb.
|
Ранговая корреляция До сих пор был анализ зависимости между количественными переменными с известным законом распределения, над которыми можно было совершать арифметические операции. Рассмотрим корреляцию порядковых переменных. Если по некоторой дисциплине два студента имеют оценки «отлично» и удовлетворительно, то можно лишь сказать, что уровень подготовки первого студента выше, чем второго. Но нельзя сказать во сколько раз. Объекты анализа упорядочиваем в порядке увеличения или порядке уменьшения степени выраженности исследуемого признака (ранжируем) и каждому объекту присваивается ранг. Если объекты ранжированы по двум признакам, то имеется возможность оценить тесноту связи между признаками, основываясь на рангах, то есть тесноту ранговой корреляции. Если будет высокая ранговая корреляция между признаками, то достаточно контролировать состояние объекта только по двум признакам. Рассмотрим выборку объема n, объекты которого имеют два признака А и В. В дальнейшем считаем, что n<=30 Критерий Спирмена Случай 1. Все объекты имеют разное качество по каждому признаку (несвязанные ранги) Расположим объекты выборки в порядке улучшения качества по признаку А:
Присвоим объектам порядковые номера – ранги – по признаку А: a i i . Ранжируем объекты по признаку В, присваивая порядковые номера – ранги i b , при этом индекс i равен рангу по признаку А. Составим две последовательности соответствующих друг другу рангов:
Коэффициентом ранговой корреляции Спирмана называется число: Значение rc является выборочной оценкой коэффициента ранговой корреляции генеральной совокупности. Рассматриваем при уровне значимости а проверку гипотезы: H0 : в 0 (связь между признаками нет) H1 : в 0 Алгоритм проверки значимости коэффициента корреляции Спирмена Расчитать По таблице для распределения Стьюдента по уровню значимости а и числу степеней свободы k=n=2 найти tкритич Если |tв| Tкрит , то принимаем гипотезу H0 и ранговая корреляция не значима; Если |в| = Tкрит , то принимаем гипотезу H1 и ранговая корреляция значима. Зависимость tв объема выборки приводит к тому, что чем больше объем выборки, тем меньше величине коэффициента корреляции оказывается достаточно, чтобы корреляция была признана значимой. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется незначимой. В то же время при больших объемах выборки даже слабая корреляция может оказаться значимой. Пример 1 Два эксперта на конкурсе красоты: мужчина и женщина оценивают моделей и для этого проставили места для каждой модели
Расположим объекты выборки в порядке ухудшения качества по оценкам экспертов-мужчин и расставим ранги]6 которые равны самим экспертным оценкам:
Сумма di^2= 74 Следовательно связь в выборке на среднем уровне, если она значима Проверка значимости: Открываем распределение Стьюдента Пример 2 Анализирую связь между результатами экзаменов по статистике и по психологии (по 100 бальной системе). В выборке результаты экзаменов 8 студентов.
Расположим объекты выборки в порядке ухудшения качества оценки по психологии и расставим ранги.
Вычислим разность рангов
Проверка значимости: Если число встречается всего один раз, то ранг совпадает с числом, а если число встречается два раза, то мы должны сложить порядковые номера и поделить на 2 |