Главная страница

алгебра. Ознакомление с представлением числовых данных и их характеристик. Купности и их обработки. Такие вопросы рассматриваются в мате матической статистике


Скачать 0.62 Mb.
НазваниеКупности и их обработки. Такие вопросы рассматриваются в мате матической статистике
Анкоралгебра
Дата16.04.2023
Размер0.62 Mb.
Формат файлаdoc
Имя файлаОзнакомление с представлением числовых данных и их характеристик.doc
ТипЗакон
#1065819
страница4 из 4
1   2   3   4
§ 3.4. Корреляционная зависимость. Уравнения регрессии

Функциональные зависимости достаточно хорошо знакомы чи­тателю. Часто эти зависимости можно выразить аналитически. Например, площадь круга зависит от радиуса (S = r2), ускорение тела — от силы и массы (а = F/m0) и т. д.

При изучении объектов в биологии и медицине приходится иметь дело с функциональными связями другого рода. При этом определенному значению одного признака соответствует не одно значение другого, а целое распределение значений. Такая связь называется корреляционной связью, или просто корреляцией. Корреляционная связь, например, между возрастом и ростом де­тей выражается в том, что каждому значению возраста соответст­вует определенное распределение роста (а не одно единственное значение). При этом с увеличением возраста (до определенных пределов) возрастает и среднее значение роста.

Количественную характеристику взаимосвязи изучаемых при­знаков можно дать на основании вычисления показателя силы связи между ними (коэффициента корреляции) и определения за­висимости одного признака от изменений другого (уравнения рег­рессии). Коэффициент корреляции определяет не только степень, но и направление связей между величинами. Если отсутствие функциональной зависимости между величинами условно соот­ветствует нулевой корреляции, а полная функциональная зависи­мость — корреляции, равной единице, то сила корреляционной связи, вообще говоря, измеряется промежуточными значениями (от 0 до +1). При этом при положительном коэффициенте корре­ляции с увеличением одной величины возрастает и другая. Если же коэффициент корреляции отрицателен, то возрастание одного параметра сопровождается уменьшением другого.

В простом случае при линейной зависимости между исследуе­мыми параметрами используют коэффициент корреляции Бравэ — Пирсона, вычисляемый по формуле:

(3.32)

Здесь п — количество пар анализируемых признаков,выборочные средние значения в распределениях соответствую­щих параметров, — средние квадратические отклонения. Рассчитанный по формуле (3.32) коэффициент корреляции сравнивают с теоретическим, который находят в специальной таблице с учетом определенного уровня значимости и объема выборки (см. табл. 12). Входными значениями таблицы являются число пар ис­следуемых признаков (п) и уровень значимости (0,05 или 0,01). При этом нулевая гипотеза заключается в том, что корреляцион­ной связи между исследуемыми параметрами не существует. Если получают значения коэффициента корреляции больше таблично­го, с определенной степенью вероятности полагают, что корреля­ция в генеральной совокупности отличается от нуля.

Таблица 12.Критические значения выборочного коэффициента корреляции г для двух уровней значимости

п

0,05

0,01

п

0,05

0,01

п

0,01

0,01

п

0,05

0,01

4

950

990

15

514

641

26

388

496

80

219

288

5

878

959

16

497

623

27

381

487

90

206

272

6

811

917

17

482

66

28

371

478

100

196

258

7

754

874

18

468

590

29

367

470

125

175

230

8

707

834

19

456

575

33

361

463

150

163

210

9

666

798

20

444

561

35

332

435

200

138

182

10

632

765

21

433

549

40

310

407

250

142

163

11

602

735

22

423

537

45

292

384

300

113

148

12

576

708

23

413

523

50

277

364

400

098

128

13

553

684

24

404

515

60

253

333

500

088

115

14

532

661

25

396

505

70

234

308

1000

062

081

Примечание. Нуль целых и запятая в значениях rопущены. Ну­левая гипотеза отбрасывается при r > r0 с данным уровнем значимости (0,05 или 0,01).

Покажем на примере, как рассчитывают коэффициент корре­ляции Бравэ—Пирсона.

*Оценить взаимосвязь частоты пульса Xи максимального артериаль­ного давления Y у детей:

Х (удары/мин) 121,8 119,2 111,3 113,3 98,3 93,8

Y(мм.рт.ст) 99,5 103,0 103,1 106,8 99,1 99,2

Согласно нулевой гипотезе, корреляционной связи между изучае­мыми параметрами нет. Рассчитаем выборочные средние значения и средние квадратичные отклонения для приведенных выше выборок ис­следуемых параметров: = 109,6; = 101,8; х= 10,29 и у= 2,81. По формуле (3.32) рассчитываем коэффициент корреляции r= 0,44. Затем обращаемся к таблице 12 и находим для шести пар признаков (п = 6), те­оретическое значение коэффициента корреляции 0,811 при уровне значимости 0,05 и 0,917 при уровне значимости 0,01. В том и другом случае нулевая гипотеза оказывается справедливой и корреляционной связи между анализируемыми признаками не существует с вероятностью 0,95 и 0,99.

Количественное представление зависимости изменений одного признака от изменений другого позволяет получить показатели регрессии. Как правило, анализ регрессии начинают с графиче­ского изображения данных. При большом числе исходных дан­ных для выявления общей закономерности вычисляются средние значения одного признака (у) в группах (классах), соответствую­щих определенному интервалу значений другого признака (х). При построении графика по усредненным данным точки на гра­фике располагаются вдоль так называемой эмпирической линии регрессии. Затем проводят подбор и составление уравнения рег­рессии. С помощью такого уравнения можно теоретически рас­считать значения, которые должен принимать один признак при определенных значениях другого (уравнение прогноза).

Если предполагается существование линейной зависимости между исследуемыми признаками (линейная регрессия), то про­водить регрессионный анализ наиболее просто. Часто при этом применяют графический метод. Для проведения линии регрессии используют прозрачную линейку, придавая ей такое положение, чтобы выше и ниже предполагаемой линии регрессии оказалось приблизительно одинаковое число эмпирических точек. На полу­ченной прямой определяют координаты двух наиболее отдален­ных точек x1, ylи х2, у2. Затем составляют систему двух уравне­ний:



Из полученной системы уравнений определяют неизвестные а и Наконец, при известных коэффициентах а и bзаписывают уравнение прогноза, на основании которого можно рассчитать значение параметра у при известном значении х.

В настоящее время при статистическом анализе эксперимен­тальных данных ироко используются компьютерные вычисли­тельные программы, позволяющие проводить корреляционный и регрессионный анализ. Более подробно практическое применение этого вида анализа рассматривается в курсе социальной гигиены и организации здравоохранения.
1   2   3   4


написать администратору сайта