Озз. Занятие 1. Корреляционный анализ (1). Корреляционный анализ
Скачать 37.7 Kb.
|
Корреляционный анализ В результате изучения темы студент должен: знать - формы (виды) связей между процессами и явлениями в природе и обществе; - сущность корреляционной связи, её виды по направлению и силе; - методику вычисления коэффициента корреляции по методу квадратов (Пирсона) и рангов (Спирмена), ошибки и достоверности коэффициентов корреляции; уметь - рассчитать коэффициент корреляции по методу квадратов (Пирсона); - рассчитать коэффициент корреляции по методу рангов (Спирмена); - определить направление и силу корреляционной связи; - рассчитать ошибку и достоверность коэффициента корреляции. Контрольные вопросы 1. Какие формы (виды) связей между процессами и явлениями существуют в природе и обществе? 2. Что такое функциональная связь, и для каких явлений она характерна? 3. Что такое корреляционная связь, и для каких явлений она характерна? 4. Что понимается под прямой и обратной корреляционной связью? 5. Каким образом оценивается сила корреляционной связи между явлениями? 6. Какие существуют методы вычисления коэффициента корреляции? Логическая структура темы: Корреляционный анализ (приложение 7). Задача-эталон Исходные данные Таблица 1 Температура тела и частота пульса
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Решение 1. Метод квадратов (Пирсона) Таблица 2
1) определяем средние величины (средние арифметические) для двух вариационных рядов (температуры тела и частоты пульса) – графы 1 и 2: 226 465 Mx = ------- = 37,7 My = ------- = 77,5 6 6 2) находим d – отклонение каждой варианты от средней величины для ряда x (dx = x – Mx) и для ряда y (dy = y – My). Полученные результаты заносим в таблицу 2 (графы 3 и 4). 3) вычисляем произведение отклонений каждой варианты от средней величины (dx dy) и его суммируем ( dxdy ); полученные результаты заносим в таблицу 2 (графа 5). 4) каждое отклонение (dx и dy) возводим в квадрат и суммируем по ряду x – dx2 и по ряду y – dy2. Полученные результаты заносим в таблицу (графы 6 и 7). 5) рассчитываем коэффициент корреляции (rxy) по формуле: dх х dy rxy = ------------------, подставив в неё полученные результаты из таблицы 2: dx2 x dy2 dxxdy 145,0 145,03 145,03 rxy = ----------------- = ---------------------- = ------------- = ------------ = +0,96 dx2xdy2 19,34 х 1187,5 22966,25 151,55 6) рассчитываем ошибку коэффициента корреляции (mrxy) по формуле: 1- rxy2 1 – 0,962 1 – 0,92 0,08 mrxy = ---------- = ------------ = ------------ = -------- = 0,04 √ n – 1 √ 6 – 1 √ 5 2,24 7) рассчитываем достоверность коэффициента корреляции (t) по формуле: rxy 0,96 t = ------ = --------- = 24,0 mr 0,04 Вывод Между температурой тела и частотой пульса существует прямая и сильная корреляционная связь, так как коэффициент корреляции равен +0,96. Коэффициент корреляции достоверен (р > 99 %), так как утроенная ошибка, равная 0,04, меньше коэффициента корреляции.* *С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трёх своих ошибок (r xy 3mr). 2. Метод рангов (Спирмена) Таблица 3
1. Для рассчёта коэффициента методом рангов определяем порядковый номер (ранг) вариант, который cоответствует каждому значению температуры тела и частоты пульса (таблица 3). При обозначении ранга (порядкового номера) варианты, ранжировать начинают с её меньшего значения в обоих рядах (графы 3 и 4). Если варианты имеют одинаковое значение (температура тела 36o и 40o), то ранги распределяются следующим образом: температура тела 36o встречается трижды, занимая 1-е, 2-е и 3-е места, следовательно, порядковые номера в этом случае будут равны средней арифметической, занимаемых этими значениями температуры мест (1+2+3) / 3 = 2, т.е. против каждого показателя температуры 36o будет проставлен ранг 2. Для температуры тела 38о ранг равен – 4. Ранги для температуры тела 40o будут равны (5+6) / 2 = 5,5. 2. Определяем разность между рангами (d) по каждой строке – графа 5, возводим её в квадрат (d2) и находим сумму () – графа 6. 3. Коэффициент ранговой корреляции определяем по формуле: 6 х d2 ху = 1 – ----------- , подставив в неё полученные результаты из таблицы 3: n(n2–1) 6 х 2,5 15 15 ху= 1 – ----------- = 1 – ----------- = 1 – --------- = 1 – 0,07 = +0,93 6(62- 1) 6(36-1) 210 4. Рассчитываем ошибку коэффициента корреляции (mху) по формуле: 1-ху2 1 – 0,932 1 – 0,86 0,14 0,14 mху = --------- = ------------ = ----------- = --------- = ----------- = 0,063 √ n – 1 √6 – 1 √ 5 √ 5 2,24 5. Рассчитываем достоверность коэффициента корреляции (t) по формуле: xy 0,93 t = ------ = --------- = 14,8 mху 0,063 Вывод Коэффициент корреляции равный + 0,93 позволяет заключить о наличии прямой и сильной связи между температурой тела и частотой пульса. Утроенная ошибка, равная 0,063 меньше коэффициента корреляции, следовательно коэффициент корреляции достоверен (р > 99%). Задачи для самостоятельного решения Задачи для студентов, обучающихся по программам специалитета 31.05.01 Лечебное дело, 31.05.02 Педиатрия, 31.05.03 Стоматология, программе бакалавриата 34.03.01 Сестринское дело Задача 1 Исходные данные Уровень молочной кислоты в крови и длительность охлаждения организма
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 2 Исходные данные Средняя температура сезона и заболеваемость дизентерией
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 3 Исходные данные Уровни систолического и диастолического давления (в мм рт. ст.) у 9 здоровых юношей в возрасте 18 лет
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 4 Исходные данные Результаты измерения длины и массы тела студентов в возрасте 20 лет
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 5 Исходные данные Частота пульса у студентов до и после экзаменов
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 6 Исходные данные Возраст матери и количество грудного молока
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 7 Исходные данные Длина и масса тела у девочек в возрасте 5 лет
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 8 Исходные данные Частота раннего прикорма и желудочно-кишечных инфекций у детей в возрасте до 1 года
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 9 Исходные данные Длина и масса тела у новорожденных детей
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 10 Исходные данные Длина и масса тела девочек в возрасте 6 лет
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 11 Исходные данные Длина и масса тела у 9 девочек в возрасте 8 лет
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задача 12 Исходные данные Активность щелочной фосфатазы лейкоцитов (ФАЛ) и день начала острого нарушения коронарного кровообращения
Задание На основании исходных данных: 1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена); 2) определить направление и силу связи; 3) рассчитать ошибку коэффициента корреляции; 4) рассчитать достоверность коэффициента корреляции. Задания в тестовой форме: Выберите один или несколько правильных ответов. Вариант 1 1. Функциональная связь характеризуются тем, что 1) значению одного признака соответствует несколько значений другого признака 2) каждому значению одного признака соответствует строго определённое значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определённое изменение величины другого признака 3) каждому значению одного признака соответствует строго определённое значение другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности 4) значению одного признака соответствует несколько значений другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности 2. Корреляционная связь характерна 1) для социально-гигиенических процессов 2) для физико-химических процессов 3) для медико-биологических процессов 4) для медико-статистических процессов 3. Коэффициент корреляции позволяет оценить 1) значимость взаимосвязи между изучаемыми признаками 2) направление взаимосвязи между изучаемыми признаками 3) силу взаимосвязи между изучаемыми признаками 4) достоверность взаимосвязи между изучаемыми признаками 4. В зависимости от численного выражения коэффициента корреляции различают связь 1) слабую 2) среднюю 3) сильную 4) очень сильную 5. Слабой корреляционной связи соответствует величина коэффициента корреляции 1) от 0,0 до 0,2 2) от 0,0 до 0,3 3) от 0,1 до 0,4 4) от 0,1 до 0,3 6. Достоверность коэффициента корреляции определяется 1) величиной ошибки коэффициента корреляции 2) величиной коэффициента вариации 3) доверительным интервалом соответствия 4) доверительным коэффициентом 7. Для вычисления коэффициента корреляции по методу Спирмена используется формула
8. Ошибка коэффициента корреляции, вычисленного по методу квадратов определяется по формуле
9. С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине 1) двух своих ошибок (r xy 2mr) 2) трёх своих ошибок (r xy 3mr) 3) четырёх своих ошибок (r xy 4mr) 4) пяти своих ошибок (r xy 5mr) 10. При большом числе наблюдений (более 30 единиц) для вычисления коэффициента корреляции целесообразно применять 1) метод корреляционной решётки 2) метод квадратов или метод Пирсона 3) метод рангов или метод Спирмена 4) метод множественной корреляции Вариант 2 1. Формами проявления количественных связей являются 1) статистическая 2) функциональная 3) медико-статистическая 4) корреляционная 2. Корреляционная связь характеризуются тем, что 1) значению одного признака соответствует несколько значений другого признака 2) каждому значению одного признака соответствует строго определённое значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определённое изменение величины другого признака 3) каждому значению одного признака соответствует строго определённое значение другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности 4) значению одного признака соответствует несколько значений другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности 3. Функциональная связь характерна 1) для социально-гигиенических процессов 2) для физико-химических процессов 3) для медико-биологических процессов 4) для медико-статистических процессов 4. По направлению корреляционная связь между явлениями может быть 1) прямой 2) сопряжённой 3) обратной 4) динамичной 5. Средней корреляционной связи соответствует величина коэффициента корреляции 1) от 0,2 до 0,6 2) от 0,3 до 0,6 3) от 0,3 до 0,7 4) от 0,3 до 0,8 6. Для вычисления коэффициента корреляции используются 1) метод квадратов или метод Пирсона 2) метод рангов или метод Спирмена 3) метод соответствия или метод Фишера 4) метод корреляционной решётки 5) метод множественной корреляции 7. Для вычисления коэффициента корреляции по методу Пирсона используется формула
8. Метод рангов применяется в тех случаях, когда 1) число наблюдений меньше 30 2) число наблюдений больше 30 3) признаки имеют не только количественное, но качественное выражение 4) ряды распределения имеют открытые варианты 9. Ошибка коэффициента корреляции, вычисленного по методу рангов определяется по формуле
10. При определении взаимосвязи одновременно между 3 и более признаками для вычисления коэффициента корреляции целесообразно применять 1) метод корреляционной решётки 2) метод квадратов или метод Пирсона 3) метод рангов или метод Спирмена 4) метод множественной корреляции |