Главная страница
Навигация по странице:

  • Логическая структура темы: Корреляционный анализ

  • Решение

  • 2. Метод рангов (Спирмена)

  • Задачи для самостоятельного решения

  • Задача 2 Исходные данные

  • Задача 3 Исходные данные

  • Задача 4 Исходные данные

  • Задача 5 Исходные данные

  • Задача 6 Исходные данные

  • Задача 7 Исходные данные

  • Задача 8 Исходные данные

  • Задача 9 Исходные данные

  • Задача 10 Исходные данные

  • Задача 11 Исходные данные

  • Задача 12 Исходные данные

  • Задания в тестовой форме

  • Озз. Занятие 1. Корреляционный анализ (1). Корреляционный анализ


    Скачать 37.7 Kb.
    НазваниеКорреляционный анализ
    Дата15.05.2023
    Размер37.7 Kb.
    Формат файлаdocx
    Имя файлаЗанятие 1. Корреляционный анализ (1).docx
    ТипКонтрольные вопросы
    #1130644

    Корреляционный анализ
    В результате изучения темы студент должен:

    знать

    - формы (виды) связей между процессами и явлениями в природе и обществе;

    - сущность корреляционной связи, её виды по направлению и силе;

    - методику вычисления коэффициента корреляции по методу квадратов (Пирсона) и рангов (Спирмена), ошибки и достоверности коэффициентов корреляции;

    уметь

    - рассчитать коэффициент корреляции по методу квадратов (Пирсона);

    - рассчитать коэффициент корреляции по методу рангов (Спирмена);

    - определить направление и силу корреляционной связи;

    - рассчитать ошибку и достоверность коэффициента корреляции.
    Контрольные вопросы

    1. Какие формы (виды) связей между процессами и явлениями существуют в природе и обществе?

    2. Что такое функциональная связь, и для каких явлений она характерна?

    3. Что такое корреляционная связь, и для каких явлений она характерна?

    4. Что понимается под прямой и обратной корреляционной связью?

    5. Каким образом оценивается сила корреляционной связи между явлениями?

    6. Какие существуют методы вычисления коэффициента корреляции?
    Логическая структура темы: Корреляционный анализ (приложение 7).
    Задача-эталон

    Исходные данные

    Таблица 1

    Температура тела и частота пульса







    t тела (x)

    Частота пульса (y)

    36

    60

    36

    65

    36

    70

    38

    80

    40

    90

    40

    100


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.


    Решение
    1. Метод квадратов (Пирсона)

    Таблица 2


    t тела (x)

    Частота пульса (y)

    dx

    dy

    dxdy

    dx2

    dy2

    1.

    2.

    3.

    4.

    5.

    6.

    7.

    36

    60

    –1,7

    –17,5

    29,75

    2,89

    306,25

    36

    65

    –1,7

    –12,5

    21,25

    2,89

    156,25

    36

    70

    –1,7

    –7,5

    12,75

    2,89

    56,25

    38

    80

    +0,3

    +2,5

    0,75

    0,09

    6,25

    40

    90

    +2,3

    +12,5

    28,75

    5,29

    156,25

    40

    100

    +2,3

    +22,5

    51,75

    5,29

    506,25

    x = 226

    Mx=37,67

    y = 465

    My=77,5







     = 145,0

     = 19,34

     = 1187,5



    1) определяем средние величины (средние арифметические) для двух вариационных рядов (температуры тела и частоты пульса) – графы 1 и 2:

    226 465

    Mx = ------- = 37,7 My = ------- = 77,5

    6 6

    2) находим d – отклонение каждой варианты от средней величины для ряда x (dx = x – Mx) и для ряда y (dy = y – My). Полученные результаты заносим в таблицу 2 (графы 3 и 4).

    3) вычисляем произведение отклонений каждой варианты от средней величины (dx  dy) и его суммируем ( dxdy ); полученные результаты заносим в таблицу 2 (графа 5).

    4) каждое отклонение (dx и dy) возводим в квадрат и суммируем по ряду x – dx2 и по ряду y – dy2. Полученные результаты заносим в таблицу (графы 6 и 7).

    5) рассчитываем коэффициент корреляции (rxy) по формуле:

    dх х dy

    rxy = ------------------, подставив в неё полученные результаты из таблицы 2:

     dx2 x dy2
     dxxdy 145,0 145,03 145,03

    rxy = ----------------- = ---------------------- = ------------- = ------------ = +0,96

    dx2xdy2 19,34 х 1187,5 22966,25 151,55
    6) рассчитываем ошибку коэффициента корреляции (mrxy) по формуле:
    1- rxy2 1 – 0,962 1 – 0,92 0,08

    mrxy = ---------- = ------------ = ------------ = -------- = 0,04

    √ n – 1 √ 6 – 1 √ 5 2,24
    7) рассчитываем достоверность коэффициента корреляции (t) по формуле:

    rxy 0,96

    t = ------ = --------- = 24,0

    mr 0,04


    Вывод

    Между температурой тела и частотой пульса существует прямая и сильная корреляционная связь, так как коэффициент корреляции равен +0,96. Коэффициент корреляции достоверен (р > 99 %), так как утроенная ошибка, равная 0,04, меньше коэффициента корреляции.*
    *С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трёх своих ошибок (r xy  3mr).
    2. Метод рангов (Спирмена)

    Таблица 3


    to тела (х)

    Частота пульса (у)

    Порядковый номер – ранги

    Разность рангов (d)


    d2

    х

    у

    1.

    2.

    3.

    4.

    5.

    6.

    36

    60

    2

    1

    +1

    1

    36

    65

    2

    2

    0

    0

    36

    70

    2

    3

    -1

    1

    38

    80

    4

    4

    0

    0

    40

    90

    5,5

    5

    +0,5

    0,25

    40

    100

    5,5

    6

    -0,5

    0,25
















     = 2,5


    1. Для рассчёта коэффициента методом рангов определяем порядковый номер (ранг) вариант, который cоответствует каждому значению температуры тела и частоты пульса (таблица 3).

    При обозначении ранга (порядкового номера) варианты, ранжировать начинают с её меньшего значения в обоих рядах (графы 3 и 4).

    Если варианты имеют одинаковое значение (температура тела 36o и 40o), то ранги распределяются следующим образом: температура тела 36o встречается трижды, занимая 1-е, 2-е и 3-е места, следовательно, порядковые номера в этом случае будут равны средней арифметической, занимаемых этими значениями температуры мест (1+2+3) / 3 = 2, т.е. против каждого показателя температуры 36o будет проставлен ранг 2. Для температуры тела 38о ранг равен – 4. Ранги для температуры тела 40o будут равны (5+6) / 2 = 5,5.
    2. Определяем разность между рангами (d) по каждой строке – графа 5, возводим её в квадрат (d2) и находим сумму () – графа 6.
    3. Коэффициент ранговой корреляции определяем по формуле:

    6 х d2

    ху = 1 – ----------- , подставив в неё полученные результаты из таблицы 3:

    n(n2–1)

    6 х 2,5 15 15

    ху= 1 – ----------- = 1 – ----------- = 1 – --------- = 1 – 0,07 = +0,93

    6(62- 1) 6(36-1) 210
    4. Рассчитываем ошибку коэффициента корреляции (mху) по формуле:

    1-ху2 1 – 0,932 1 – 0,86 0,14 0,14

    mху =  --------- =  ------------ = ----------- = --------- = ----------- = 0,063

    √ n – 1 √6 – 1 √ 5 √ 5 2,24

    5. Рассчитываем достоверность коэффициента корреляции (t) по формуле:

    xy 0,93

    t = ------ = --------- = 14,8

    mху 0,063



    Вывод

    Коэффициент корреляции равный + 0,93 позволяет заключить о наличии прямой и сильной связи между температурой тела и частотой пульса. Утроенная ошибка, равная  0,063 меньше коэффициента корреляции, следовательно коэффициент корреляции достоверен (р > 99%).
    Задачи для самостоятельного решения
    Задачи для студентов, обучающихся по программам специалитета 31.05.01 Лечебное дело, 31.05.02 Педиатрия, 31.05.03 Стоматология, программе бакалавриата 34.03.01 Сестринское дело
    Задача 1

    Исходные данные
    Уровень молочной кислоты в крови и длительность охлаждения организма

    Дни охлаждения (х)

    Молочная кислота, в мг% (у)

    1

    7,0

    2

    7,0

    3

    7,2

    4

    7,1

    5

    8,5

    6

    8,9

    7

    8,7

    8

    9,0

    9

    9,5

    10

    9,3


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 2

    Исходные данные
    Средняя температура сезона и заболеваемость дизентерией

    Годы

    Средняя температура сезона, С о (х)

    Заболеваемость дизентерией в условн. ед. (у)

    2009

    14,3

    88

    2010

    15,0

    77

    2011

    14,6

    60

    2012

    13,2

    67

    2013

    15,2

    117

    2014

    15,0

    67

    2015

    14,1

    68

    2016

    13,2

    59

    2017

    17,7

    31

    2018

    14,8

    70

    2019

    17,8

    75


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 3

    Исходные данные
    Уровни систолического и диастолического давления (в мм рт. ст.) у 9 здоровых юношей в возрасте 18 лет

    Систолическое давление (х)

    Диастолическое давление (у)

    105

    65

    115

    70

    115

    65

    110

    65

    110

    70

    120

    75

    120

    75

    120

    70

    125

    75


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 4

    Исходные данные
    Результаты измерения длины и массы тела студентов в возрасте 20 лет

    Длина тела, см (х)

    Масса тела, кг (у)

    157

    56

    158

    55

    160

    57

    165

    57

    167

    58

    162

    60

    171

    63

    174

    65

    168

    67

    176

    72

    170

    79

    180

    82


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.

    Задача 5

    Исходные данные
    Частота пульса у студентов до и после экзаменов

    Порядковый номер студента

    Частота пульса до экзаменов (х)

    Частота пульса после экзаменов (у)

    1

    96

    80

    2

    104

    88

    3

    76

    56

    4

    108

    106

    5

    88

    76

    6

    98

    90

    7

    100

    92

    8

    105

    95


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 6

    Исходные данные
    Возраст матери и количество грудного молока

    Возраст матери, годы (х)

    Количество молока, г (у)

    15

    110

    18

    110

    21

    115

    24

    110

    27

    105

    30

    90

    33

    95

    39

    90

    39

    85

    42

    80


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 7

    Исходные данные
    Длина и масса тела у девочек в возрасте 5 лет

    Длина тела, см (х)

    Масса тела, кг (у)

    87

    13

    95

    14

    115

    20

    89

    12

    90

    14

    90

    15

    101

    17

    95

    15

    110

    18

    110

    21

    88

    14

    93

    16


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.

    Задача 8

    Исходные данные
    Частота раннего прикорма и желудочно-кишечных инфекций у детей в возрасте до 1 года

    Районы

    Частота раннего прикорма (на 100 детей до 1 года)

    Заболеваемость желудочно-кишечными инфекциями (на 100 детей до 1 года)

    А

    8,0

    15,0

    Б

    12,0

    20,0

    В

    16,0

    30,0

    Г

    20,0

    25,0

    Д

    25,0

    35,0

    Е

    24,0

    34,0

    Ж

    24,0

    35,0

    З

    28,0

    38,0


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 9

    Исходные данные
    Длина и масса тела у новорожденных детей

    Длина тела, см (х)

    Масса тела, кг (у)

    35

    4,5

    48

    3,6

    52

    4,1

    50

    4,0

    47

    3,2

    53

    3,8

    52

    3,9

    50

    3,9

    51

    4,0

    54

    4,3


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 10

    Исходные данные
    Длина и масса тела девочек в возрасте 6 лет

    Длина тела, см (х)

    Масса тела, кг (у)

    95

    15

    93

    14

    98

    15

    108

    19

    106

    16

    101

    15

    110

    16

    105

    15

    107

    17

    112

    21


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 11

    Исходные данные
    Длина и масса тела у 9 девочек в возрасте 8 лет

    Длина тела, см (х)

    Масса тела, кг (у)

    106

    18

    110

    19

    114

    21

    120

    22

    122

    22

    126

    24

    127

    24

    128

    25

    128

    25


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.
    Задача 12

    Исходные данные
    Активность щелочной фосфатазы лейкоцитов (ФАЛ) и день начала острого нарушения коронарного кровообращения

    ФАЛ в услов. ед. (х)

    Дни от начала приступа (у)

    100

    1

    125

    2

    125

    3

    160

    4

    200

    5

    215

    6

    215

    7


    Задание

    На основании исходных данных:

    1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

    2) определить направление и силу связи;

    3) рассчитать ошибку коэффициента корреляции;

    4) рассчитать достоверность коэффициента корреляции.

    Задания в тестовой форме:

    Выберите один или несколько правильных ответов.
    Вариант 1

    1. Функциональная связь характеризуются тем, что

    1) значению одного признака соответствует несколько значений другого признака

    2) каждому значению одного признака соответствует строго определённое значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определённое изменение величины другого признака

    3) каждому значению одного признака соответствует строго определённое значение другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности

    4) значению одного признака соответствует несколько значений другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности
    2. Корреляционная связь характерна

    1) для социально-гигиенических процессов

    2) для физико-химических процессов

    3) для медико-биологических процессов

    4) для медико-статистических процессов
    3. Коэффициент корреляции позволяет оценить

    1) значимость взаимосвязи между изучаемыми признаками

    2) направление взаимосвязи между изучаемыми признаками

    3) силу взаимосвязи между изучаемыми признаками

    4) достоверность взаимосвязи между изучаемыми признаками
    4. В зависимости от численного выражения коэффициента корреляции различают связь

    1) слабую

    2) среднюю

    3) сильную

    4) очень сильную
    5. Слабой корреляционной связи соответствует величина коэффициента корреляции

    1) от 0,0 до 0,2

    2) от 0,0 до 0,3

    3) от 0,1 до 0,4

    4) от 0,1 до 0,3
    6. Достоверность коэффициента корреляции определяется

    1) величиной ошибки коэффициента корреляции

    2) величиной коэффициента вариации

    3) доверительным интервалом соответствия

    4) доверительным коэффициентом
    7. Для вычисления коэффициента корреляции по методу Спирмена используется формула

    1) 6 х ∑d²

    ρ = ----------

    n(n² - 1)

    2) 6 х ∑d

    ρ = 1 ̶ ----------

    n(n² - 1)

    3) 6 х ∑d²

    ρ = 1 ̶ ----------

    n(n² - 1)

    4) 6 х ∑d²

    ρ = ----------

    (n² - 1)



    8. Ошибка коэффициента корреляции, вычисленного по методу квадратов определяется по формуле

    1) 1 – r

    mr= ± -----------

    √n – 1


    2) 1 – r²

    mr= ± -----------

    √n + 1


    3) 1 – r²

    mr= ± -----------

    √n² – 1


    4) 1 – r²

    mr= ± -----------

    √n – 1


    9. С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине

    1) двух своих ошибок (r xy  2mr)

    2) трёх своих ошибок (r xy  3mr)

    3) четырёх своих ошибок (r xy  4mr)

    4) пяти своих ошибок (r xy  5mr)
    10. При большом числе наблюдений (более 30 единиц) для вычисления коэффициента корреляции целесообразно применять

    1) метод корреляционной решётки

    2) метод квадратов или метод Пирсона

    3) метод рангов или метод Спирмена

    4) метод множественной корреляции
    Вариант 2

    1. Формами проявления количественных связей являются

    1) статистическая

    2) функциональная

    3) медико-статистическая

    4) корреляционная
    2. Корреляционная связь характеризуются тем, что

    1) значению одного признака соответствует несколько значений другого признака

    2) каждому значению одного признака соответствует строго определённое значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определённое изменение величины другого признака

    3) каждому значению одного признака соответствует строго определённое значение другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности

    4) значению одного признака соответствует несколько значений другого признака и проявляется она при массовом сопоставлении признаков в качественно однородной совокупности
    3. Функциональная связь характерна

    1) для социально-гигиенических процессов

    2) для физико-химических процессов

    3) для медико-биологических процессов

    4) для медико-статистических процессов
    4. По направлению корреляционная связь между явлениями может быть

    1) прямой

    2) сопряжённой

    3) обратной

    4) динамичной
    5. Средней корреляционной связи соответствует величина коэффициента корреляции

    1) от 0,2 до 0,6

    2) от 0,3 до 0,6

    3) от 0,3 до 0,7

    4) от 0,3 до 0,8
    6. Для вычисления коэффициента корреляции используются

    1) метод квадратов или метод Пирсона

    2) метод рангов или метод Спирмена

    3) метод соответствия или метод Фишера

    4) метод корреляционной решётки

    5) метод множественной корреляции
    7. Для вычисления коэффициента корреляции по методу Пирсона используется формула

    1) ∑dх х dу

    r = -------------

    √ dх² х dу²

    2) 6 х ∑d

    r = 1 ̶ ----------

    n(n² - 1)

    3) ∑dх х dу

    r = -------------

    √ dх х dу


    4) 6 х ∑d²

    ρ = ----------

    (n² - 1)



    8. Метод рангов применяется в тех случаях, когда

    1) число наблюдений меньше 30

    2) число наблюдений больше 30

    3) признаки имеют не только количественное, но качественное выражение

    4) ряды распределения имеют открытые варианты
    9. Ошибка коэффициента корреляции, вычисленного по методу рангов определяется по формуле

    1) 1 – ρ

    mρ= ± -----------

    √n – 1


    2) 1 – ρ²

    mρ= ± -----------

    √n + 1


    3) 1 – ρ²

    mρ= ± -----------

    √n² – 1


    4) 1 – ρ²

    mρ= ± -----------

    √n – 1



    10. При определении взаимосвязи одновременно между 3 и более признаками для вычисления коэффициента корреляции целесообразно применять

    1) метод корреляционной решётки

    2) метод квадратов или метод Пирсона

    3) метод рангов или метод Спирмена

    4) метод множественной корреляции


    написать администратору сайта