Учебное пособие управляющего типа Агарков В. И., Бутева Л. В. Грищенко С. В. Донецк Донгму, 2006. 277 с
Скачать 3.03 Mb.
|
Схема оценки коэффициента корреляции
Таким образом, корреляционные коэффициенты своей величиной и знаком показывают степень или силу связи и ее направление. Необходимо помнить о том, что вычисление коэффициентов корреляции целесообразно лишь в том случае, если специалисты, изучающие сущность какой-либо проблемы предполагают наличие связи между явлениями. А сама по себе статистика не решает вопрос о том, возможна ли связь между явлениями или нет. МЕТОДИКА ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТА ЛИНЕЙНОЙ КОРРЕЛЯЦИИ Для его вычисления следует пользоваться алгоритмом, приведенным в табл. 4 и правилами, перечисленными ниже. Таблица 4 Алгоритмы расчета коэффициента линейной корреляции (rху), его ошибки (mr) и коэффициента достоверности (tr)
Записать исходные данные в виде двух вариационных рядов (графы 1 и 2) Найти суммы вариант в каждом вариационном ряду (х и у) и определить средние арифметические величины (Мх и Му) – графы 1 и 2. Найти dx и dу – отклонения каждой варианты от средних величин (графы 3 и 4). Полученные отклонения перемножить попарно (dх × dу) и найти сумму полученных произведений (dх × dу) – графа 5. Каждое отклонение в обоих рядах возвести в квадрат и определить сумму квадратов отклонений ряда Vх (графа 6) и ряда Vу (графа 7). Определить произведение d²х × d²у и из произведения извлечь квадратный корень d²х × d²у Подставить полученные данные в формулу и рассчитать коэффициент корреляции (Rху) – графа 8. Подставить необходимые данные в формулу и рассчитать среднюю ошибку (mr) коэффициента корреляции – графа 8. Подставить необходимые данные в формулу и рассчитать коэффициент достоверности (tr) – графа 8. При наличии вычислительной техники расчет коэффициента линейной корреляции производится по следующей схеме (табл.5.) Таблица 5 Алгоритм расчета (на ЭВМ) коэффициента корреляции (Rху)
Для примера вычислим коэффициент корреляции между температурой тела и частотой пульса в минуту у 5 больных (табл. 6). Для этого воспользуемся алгоритмами, приведенными в табл. 4 и 5. Таблица 6 Пример определения rху между температурой тела и частотой пульса в минуту
Подставим полученные данные в формулу и рассчитаем коэффициент корреляции: Рассчитаем среднюю ошибку (mr) коэффициента достоверности: Рассчитаем коэффициент достоверности tr: Оценим критерий tr по специальным таблицам (табл. 7 и 8), в которой слева показано число наблюдений (n), а сверху – степень вероятности безошибочного прогноза (р). Таблица 7 Значение критерия tr для трех степеней вероятности (по Н.А. Плохинскому)
Таблица 8 Стандартные коэффициенты корреляции, которые считаются достоверными (по Л.С. Каменскому)
Вывод. Коэффициент корреляции, равный 0,949, достоверен с вероятностью безошибочного прогноза р>95%, так как при n=3 (5 – 2) полученный нами критерий t будет больше tтабл.=3,2 (р=95%) и меньше tтабл.=5,8 (р=99%). Материалы выборочного исследования позволяют утверждать, что в генеральной совокупности существует сильная прямая связь между температурой тела и частотой пульса. Оценка достоверности коэффициента корреляции может осуществляется по специальной таблице (при малых выборках) без предварительных расчетов m и t. Необходимо лишь сравнить rху со стандартным коэффициентом корреляции, рассчитанным и представленным в таблице для различной степени вероятности и различного числа наблюдений (см. табл. 8). По данным оценки достоверности полученного коэффициента корреляции с помощью приведенной выше таблицы можно говорить о том, что коэффициент, равный 0,949, достоверен с вероятностью безошибочного прогноза р>98%, так как при n=3, он больше 0,934 и меньше 0,959. При наличии вычислительной техники расчет коэффициента корреляции производится по следующей схеме (табл. 9) Таблица 9 Пример определения rху (с помощью вычислительной техники) между температурой тела и частотой пульса в минуту
Вывод. Между температурой тела и частотой пульса имеется прямая и сильная связь. МЕТОДИКА ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТА РАНГОВОЙ КОРРЕЛЯЦИИ Последовательность расчета коэффициента ранговой корреляции отражена в табл. 10 и правилах, перечисленных после алгоритма. Таблица 10 Алгоритм расчета коэффициента ранговой корреляции (р), его ошибки (mp) и коэффициента достоверности (tp)
Составить ряды из парных признаков (графы 1 и 2). Каждую величину признака заменить ранговым (порядковым) номером – х′ и у′. (в тех случаях, когда имеется несколько одинаковых по величине чисел, порядковый номер обозначают средним числом из суммы очередных порядковых их номеров). Ранжировать значения обоих рядов в строго определенном направлении от меньшей величины к большей или от большей к меньшей (графы 3 и 4). Определить разность между рангами для каждой пары членов ряда (по каждой строке) – графа 5. Возвести в квадрат каждое из полученных значений разности между рангами и определить сумму квадратов разности рангов (d²) – графа 6. Подставить полученные данные в формулу и рассчитать коэффициент корреляции рангов – графа 7. Подставить необходимые данные в формулу и рассчитать среднюю ошибку (mp) коэффициента ранговой корреляции – графа 7. Подставить необходимые данные в формулу и рассчитать коэффициент достоверности (tp) – графа 7. Методику расчета и оценки коэффициента корреляции рангов разберем на следующем примере (см. табл. 11). Таблица 11 Данные о заболеваемости дифтерией жителей городов Н-ской области и о выполнении плана профилактических прививок в отчетном году
Подставим полученные данные в формулу и рассчитываем коэффициент ранговой корреляции: Рассчитаем среднюю ошибку (mp): Рассчитаем коэффициент достоверности: Условием достоверности коэффициента корреляции рангов, как, впрочем, и всех остальных коэффициентов корреляционной зависимости, является превышение коэффициента своей утроенной ошибки: Таким образом, –0,833×0,197 или –0,83>0,591 т.е. полученные результаты достоверны. Вывод. Полученный коэффициент корреляции рангов статистически достоверен. Следовательно, можно говорить о сильной, обратной связи между заболеваемостью дифтерией и процентом выполнения плана профилактических прививок. Заболеваемость выше в тех городах, где план профилактических прививок выполнен недостаточно. При вычислении коэффициента корреляции по методу рангов бывают случаи, когда отдельные показатели ряда встречаются несколько раз. В этом случае порядковый номер каждого из них (ранг) определяется как средняя из сумм очередных порядковых номеров. Например, надо поставить порядковые номера (ранги) показателей возраста 10 студентов:
Ранги по величине показателей возраста проставляются следующим образом: возраст 21 год, его порядковый номер = 1. возраст 22 года встречается дважды, занимая по своей величине 2-е и 3-е места, поэтому порядковые номера в данном случае будут равны полусумме занимаемых этим возрастом мест – (2+3):2=2,5, т.е. против каждого показателя возраста 22 года будет поставлен порядковый номер (ранг) 2,5. возраст 23 года встречается 3 раза, занимая 4-е, 5-е и 6-е места соответственно, т.к. 2-е и 3-е места использованы для возраста 22 года. Ранги для возраста 23 года будут равны – (4+5+6):3=5, т.е. против каждого возраста 23 года необходимо поставить порядковый номер (ранг) 5. в целом ранги показателей возраста у студентов будут следующие:
МЕТОДИКА ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТА АССОЦИАЦИИ Последовательность расчета коэффициента ассоциации отражена ниже. Алгоритм расчета коэффициента ассоциации (Q), его ошибки (ma) и коэффициента достоверности (ta). Построить четырехпольную таблицу. В первом столбце этой таблицы наносят обе разновидности одного явления – Х1 и Х2, а в первой строке – обе разновидности второго – У1 и У2.При этом Х1 и У2 обозначают положительные разновидности (например, выздоровевшие, иммунизированные и т. д.), а Х2 и У2 – отрицательные (например, не выздоровевшие, не иммунизированные). Обозначить через буквы а, в, с, d четыре поля, в которые внести исходные данные:
2. Вычислить произведения аd и вс. 3. Подставить полученные данные в формулу и рассчитать коэффициент ассоциации. П одставить необходимые данные в формулу и рассчитать среднюю ошибку коэффициента ассоциации. Подставить необходимые данные в формулу и рассчитать коэффициент достоверности. Методику расчета и оценки коэффициента ассоциации разберем на следующем примере. Необходимо определить, влияет ли вакцинация против гриппа на заболеваемость от этой инфекции. Известно, что на промышленном предприятии с общей численностью в 2000 человек 1200 рабочим были сделаны прививки против гриппа, а 800 рабочих остались не привитыми. Заболело из привитых 240 человек, а из непривитых – 320. Данные о заболевших и не заболевших среди привитых и не привитых приведены в табл. 12. Таблица 12 Распределение заболевших и не заболевших среди привитых на промышленном предприятии
Вычислим произведения аd и вс: a×d=240×480=11520 b×c=960×320=307200 Подставим полученные данные в формулу и рассчитаем коэффициент ассоциации: Рассчитаем среднюю ошибку (mQ): Рассчитаем коэффициент достоверности: Таким образом, –0,453×0,0740,222. Коэффициент статистически достоверен, что означает, что существует обратная, средней силы связи между заболеваемостью гриппом и вакцинацией против него. Задания для коррекции умений Изучив теоретические вопросы темы, приступайте к решению задач, которые помогут Вам в отработке умений, первая из которых направлена на решение вопроса о возможности наличия связи между явлениями. |