Главная страница

реферат. МОРОЗ В Г. Современные проблемы системного анализа и управления курсовая работа аналитическая деятельность по сбору и обработке статистических данных о чрезвыча


Скачать 232.49 Kb.
НазваниеСовременные проблемы системного анализа и управления курсовая работа аналитическая деятельность по сбору и обработке статистических данных о чрезвыча
Анкорреферат
Дата11.05.2023
Размер232.49 Kb.
Формат файлаdocx
Имя файлаМОРОЗ В Г .docx
ТипКурсовая
#1122699
страница2 из 3
1   2   3

2. Оценка уравнения регрессии по статистическим данным исследования

I. Постановка задачи.

Имеются: сведения о происшествиях и чрезвычайных ситуациях на объектах производства и количестве погибших за период с 2013 г. по 2019 г., отражённые в Таблице 5:

Таблица 5.

Год

x
(количество происшествий (ЧС) на объектах производства)

y
(количество погибших на происшествиях и

ЧС)

2015

6

2

2016

6

1

2017

10

2

2018

6

4

2019

9

3

2020

8

4

2021

5

2


Требуется: дать оценку уравнения регрессии по представленным статистическим данным.

II. Составление уравнения регрессии и оценка его значимости.

а) Построение уравнения регрессии.

Для составления уравнения регрессии выполним необходимые расчеты и приведём их в Таблице 6:

Таблица 6.

Годы

x
(количество СЗП (ЧС) на транспорте)

y
(количество погибших в СЗП (ЧС)

ух

x2

y2

x

(y-y̅ )2

(ŷx-ŷx ср)2

(y-ŷx)2

(x-x̅)2

2015

9

6

54

81

36

5

3,44898

4,87148

1

4,591837

2016

11

8

88

121

64

7,06

0,020408

0,021651

0,8836

0,020408

2017

14

10

140

196

100

10,15

4,591837

8,660408

0,0225

8,163265

2018

11

8

88

121

64

7,06

0,020408

0,021651

0,8836

0,020408

2019

14

11

154

196

121

10,15

9,877551

8,660408

0,7225

8,163265

2020

11

8

88

121

64

7,06

0,020408

0,021651

0,8836

0,020408

2021

8

4

32

64

16

3,97

14,87755

10,47909

0,0009

9,877551

Σ

78

55

644

900

465

50,45

32,85714

32,73634

4,3967

30,85714

Ср. знач.

11,14286

7,857143

92

128,5714

66,42857

7,207143

4,693878

4,67662

0,6281

4,408163


Исходя из данных, приведенных в таблице 6, найдем коэффициенты a и b формулы (2) и (3), и построим уравнение регрессии (1).

(1)

(2)

(3)
Среднее значение x и yопределим по формулам (4) и (5) при п=7:

(4)

(5)

Рассчитаем значения дисперсии и СКО по формулам (6) и (7):




(6)






(7)












Тогда в соответствии с формулами (2) и (3) находим коэффициенты:

, и уравнение регрессии будет иметь вид:



Коэффициент линейной парной регрессии может быть рассчитан через коэффициент уравнения регрессии b:



Получив значение коэффициента выяснили, что качественная характеристика силы связи весьма высокая.

На Рисунке 1 представлено графическое представление уравнение регрессии.



Рисунок 1

б) Проверим значимость построенного уравнения по F-критерию, вычислив коэффициент детерминации.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равны нулю) на уровне значимости .

H0: , то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: , то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

Значимость уравнения регрессии проверяется на основе F – теста, который заключается в проверке гипотезы Н0 о статистической не значимости показателя тесноты связи. Для этого определяется факторная Dфакт (8) и остаточнаяDост(9) дисперсии, рассчитанные на одну степень свободы вариации. Расчет производится по следующим формулам:




(8),


1 – число степеней свободы.



(9)


(n2)– число степеней свободы вариации или число свободно варьирующих элементов совокупности.

Получаем:

общая сумма квадратов отклонений: S(y-y̅ )2 =

факторная сумма квадратов:

остаточная сумма квадратов:

,96

Как видно из полученных результатов, разница между факторной дисперсией и остаточной значительна, следовательно, фактор оказывает существенное влияние на Х.

Расчетную величину F–критерия Фишера получим, сопоставив факторную и остаточную дисперсии (10):



(10)

Если вычисленное значение F-критерия Фишера оказывается больше табличного значения F, то нулевая гипотеза Н0 об отсутствии связи между признаками отклоняется и делается вывод о существенности связи между признаками. Если же расчетная величина F–критерия окажется меньше Fтабл., уравнение регрессии считается статистически незначимым.

Для проверки расчетного значения F-критерия, воспользуемся Таблицей 7, при где:

m1 - число степеней свободы факторной дисперсии (m1 =1);

m2 – число степеней свободы остаточной дисперсии, (m2 =5).

Таблица 7.

F–распределение: критические значения с m1 и m1 степенями свободы






1

2

3

4

5

6

7

8

9

10






1

161,4

199,5

215,7

224,6

230,2

234,0

236,8

238,9

240,5

241,9

2

18,51

19,00

19,16

19,25

19,30

19,33

19,35

19,37

19,38

19,40

3

10,13

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

4

7,71

6,94

6,59

6,39

6,26

6,16

6.09

6.04

6,00

5,96

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,14

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

2,98


Поскольку Fтабл. < Fфакт. (6,61 < 110,213) при 5% уровне значимости, то можно сделать вывод о значимости уравнения регрессии.

Рассчитаем коэффициент детерминации для оценки качества подбора уравнения регрессии (11):



(11)

Из полученного результата видно, что уравнение регрессии объясняет 98% дисперсии результативного признака, т.е. в 97% случаев изменения х приводят к изменению y, а на долю случайных факторов приходится 3% от ее значения.

Оценка значимости уравнения регрессии приведена в Таблице 8.

Таблица 8

Источники вариации

Число степеней свободы

Сумма квадратов отклонений

F–отношение

фактическое

табличное

при a = 0,05

Общая

6

32,86

-

-

Объясненная

1

31,431

31,431

110,213

Остаточная

5

1,43

0,29

1


в) Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента путем сопоставления их значений с величиной случайной ошибки, рассчитанной для каждого параметра.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвинем гипотезу H0 о случайной природе показателей, т.е. незначительном их отклонении от нуля. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную.

H0: , то есть линейной взаимосвязи между переменными x и y в генеральной совокупности нет;

H1: , есть линейная взаимосвязь между переменными.

Найденное по данным наблюдениям значение t-критерия сравнивается с табличным (критическим) значением, определенным по таблице распределения Стьюдента. Табличное значение определяется в зависимости от уровня значимости и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n – число наблюдений.

Если |tнабл| > tкрит, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза Н0, утверждающая равенство нулю коэффициента корреляции, отвергается).

Если |tнабл| < tкрит, то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости .





где m=1 – количество объясняющих переменных.

Поскольку > , то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.

Проверим гипотезу H0: гетероскедастичность отсутствует.

Поскольку 3.163 > 1.38, то гипотеза об отсутствии гетероскедастичности принимается.

Оценка значимости коэффициентов регрессии и корреляции с помощью t–критерия Стьюдента проводится ещё и путем сопоставления их значений с величиной случайной ошибки, рассчитываемой для каждого параметра (12):



(12)



Случайные ошибки параметров линейной регрессии a (13) и b(14), а также коэффициента корреляции r (15) определяются по формулам:


(13)


(14)


(15)

Связь между F–критерием Фишера и t–критерием Стьюдента можно выразить равенством tr= tb=






Поскольку (10,5 > ), как и (81,7 > ) при 5% уровне значимости, то статистическая значимость коэффициента регрессии b и коэффициента корреляции r подтверждается (отвергаем гипотезу о равенстве нулю этих коэффициентов).



Поскольку (-2,84 < ) при 5% уровне значимости можно отбросить гипотезу о существенности коэффициента регрессии a, (принимаем гипотезу о равенстве нулю этого коэффициента), что означает возможность пренебречь в данном случае коэффициентом a.

г) Оценка доверительных интервалов коэффициентов регрессии.

Определим доверительные интервалы коэффициентов регрессии (16):



(16)



Значение доверительного интервала для коэффициента регрессии b:





Значение доверительного интервала для коэффициента регрессии :





С вероятностью 95% можно утверждать, что значения данных параметров будут лежать в найденном интервале.

Проведеная проверка статистической значимости коэффициента регрессии, которая показала, что коэффициент b- статистически значим, в то время как значимость коэффициента регрессии a несущественна.
1   2   3


написать администратору сайта