Главная страница

Статистика. Домашнее задание. Вариант 3. Домашнее задание по курсу Статистика


Скачать 358.5 Kb.
НазваниеДомашнее задание по курсу Статистика
АнкорСтатистика. Домашнее задание. Вариант 3.doc
Дата16.09.2018
Размер358.5 Kb.
Формат файлаdoc
Имя файлаСтатистика. Домашнее задание. Вариант 3.doc
ТипДокументы
#24672
КатегорияЭкономика. Финансы
страница4 из 4
1   2   3   4

Таблица 4.6.


Расчет внутригрупповой дисперсии по пятой группе.

Валовая продукция в марте, x

Число предприятий

f


x * f

_

x – x1

_

(x – x1)2*f

116,4

1

116,4

-9,5

89,44

116,7

1

116,7

-9,2

83,85

119,4

1

119,4

-6,5

41,69

120,0

1

120

-5,9

34,31

120,8

1

120,8

-5,1

25,57

143,1

1

143,1

17,2

297,32

144,6

1

144,6

18,7

351,29

Итого:

7

881

 

923,48

_

х 5 = 125,86  2 5 = 131,92

Таблица 4.7.


Расчет внутригрупповой дисперсии по шестой группе.

Валовая продукция в марте, x

Число предприятий

f


x * f

_

x – x1

_

(x – x1)2*f

145,0

1

145

-0,7

0,49

146,4

1

146,4

0,7

0,49

Итого:

2

291,4

 

0,98


_

х 6 = 145,70  2 6 = 0,49
Средняя внутригрупповая дисперсия характеризует случайную вариацию результативного признака, возникающих под влиянием других, неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она определяется по формуле:


_

2 = (34,49*7 + 80,75*5 + 25,43*5 + 40,92*4 + 131,92*7+ 0,49*2 ) / 30 =62,01

Межгрупповая дисперсия отражает систематическую вариацию результативного признака, т.е. те различия, которые возникают под влиянием фактора, положенного в основу группировки. Она определяется по формуле:



= ((43,06– 86,7) 2 * 7 + (63– 86,7) 2 * 5 + (82,56 – 86,7) 2 * 5 + (99,83– 86,7) 2 * 4 + (125,86– 86,7) 2 * 7+ (145,70– 86,7) 2 * 2) / 30 =1153,71

Правило сложения дисперсий:



1215,72 =1153,71+ 62,01 – выполняется

Вывод: правило сложения дисперсий выполняется.

5. Анализ зависимости затрат на содержание оборудования от объема выработанной валовой продукции по отчетным данным предприятий за март. Анализ выполняется в следующей последовательности:

  1. проверка первичной информации по факторному признаку на однородность и нормальность распределения (используя правило «трех сигм»);

  2. исключается резко выделяющиеся предприятия по величине факторного признака из массы первичной информации;

  3. устанавливается факт наличия корреляционной зависимости и ее направление, прилагается графическое изображение связи;

  4. измерение степень тесноты связи с помощью линейного коэффициента корреляции и корреляционного отношения; проверка возможность использования линейной функции в качестве модели уравнения;

5. определяется модель парной зависимости, оценка её достоверности..


    1. Результативный признак (y) - затраты на содержание оборудования.

Факторный признак (x) - объем выработанной валовой продукции за март.

Таблица 5.1.

Вспомогательная таблица для расчета σx.

Номер предприятия

Выпуск валовой продукции в марте (в действующих ценах), млн. руб., x

Затраты на содержание оборудования в марте, млн. руб., y

_

(x-x)²

1

33,6

2,6

2819,6

2

93,0

6,8

39,7

3

106,8

7,8

404,0

4

146,4

10,9

3564,1

5

42,6

3,1

1944,8

6

77,1

5,9

92,2

7

84,6

6,8

4,4

8

120,0

9,2

1108,9

9

60,0

4,6

712,9

10

93,9

7,4

51,8

11

54,0

4,5

1069,3

12

143,1

10,1

3181,0

13

52,5

4,2

1169,6

14

119,4

8,4

1069,3

15

37,4

2,6

2430,5

16

42,0

3,3

1998,1

17

76,5

6,3

104,0

18

145,0

9,6

3398,9

19

89,7

7,4

9,0

20

105,6

7,6

357,2

21

45,3

3,5

1714,0

22

84,9

7,2

3,2

23

116,4

8,7

882,1

24

74,1

6,1

158,8

25

120,8

8,3

1162,8

26

144,6

9,1

3352,4

27

116,7

8,6

900,0

28

73,2

5,8

182,3

29

48,0

4,2

1497,7

30

53,7

4,6

1089,0

Итого:

2600,9

198,2

36471,5


Первичная информация проверяется на однородность по признаку – фактору с помощью коэффициента вариации.

_ _

(/ x )* 100%. X = ∑x / n = 86,7
____________

   (x - xср)2 / n =34,87; V x = 40,22%
Совокупность неоднородная, так как показатель вариации больше 33%.
Проверка первичной информации на нормальность распределения с помощью правила «трех сигм». _ _ _

Интервалы для значения признака - фактора: (x ± σ); (x ± 2σ); (x ± 3σ)., т.е.

(86,7–34,87) - (86,7+34,87);(86,7-2*34,87) - (86,7+2*34,87);(86,7-3*34,87) - (86,7+3*34,87).

(51,83 – 121,57); (16,96 – 156,44); ( - 17,91 –191,31).

Таблица 5.2.


Интервалы значений признака x, млн. руб

Число единиц входящих в интервал

Удельный вес числа единиц, входящих в интервал, в общем их числе, %

Удельный вес числа единиц, входящих в интервал, при нормальном распределении, %

51,83 -121,57

20

66,7

68,3

16,96 -156,44

30

100

95,4

-17,91 -191,31

30

100

99,7


Первичная информация по признаку-фактору не подчиняется закону нормального распределения, однако это не является основанием для отказа от использования корреляционно-регрессионного анализа.
2. Исключение из первичной информации резко выделяющихся единиц, которые по признаку-фактору не попадают в интервал.

_ _

x - 3σ ≤ xi ≤ x+ 3σ

- 17,91 ≤ xi ≤ 191,31

Резко выделяющихся единиц в первичной информации нет.
3. Для установления факта наличия связи производится аналитическая группировка по признаку-фактору. Группировка выполняется при равных интервалах и числе групп 4. Величина интервала определяется по формуле: i = ( xmax - xmin)/m , где m - число групп. i = (146,4- 33,6)/4 = 28,2 ≈ 29.
Таблица 5.3.

Вспомогательная таблица для заполнения групповой таблицы.

Выпуск валовой продукции в марте (в действующих ценах), млн. руб.

33,6 - 52,5

52,5-74,1

74,1-89,7

89,7-106,8

106,8-144,6

144,6-146,4

Номер предприятия

1,15,16,5,21,29,13

30,11,9,28,24

17,6,7,22,19

2,10,20,3

23,27,14,8,25,12,26

18,4

Затраты на содержание оборудования в марте, млн. руб.

2,6;2,6;3,3;3,1;3,5;4,2;4,2

4,6;4,5;4,6;5,8;6,1

6,3;5,9;6,8;7,2;7,4

6,8;7,4;7,6;7,8

8,7;8,6;8,4;9,2;8,3;10,1;9,1

9,6;10,9



Таблица 5.4.

Зависимость затрат на содержание оборудования от объема выработанной валовой продукции.

Выпуск валовой продукции в марте (в действующих ценах), млн. руб.

Число предприятий,ni

yi

Средняя величина затрат на содержание оборудования в марте, млн. руб., yср i

33,6 - 52,5

7

23,5

3,36

52,5-74,1

5

25,6

5,12

74,1-89,7

5

33,6

6,72

89,7-106,8

4

29,6

7,40

106,8-144,6

7

62,4

8,91

144,6-146,4

2

20,5

10,25

Итого:

30

195,2

 


Как видно из данных групповой таблицы с увеличением выпуска валовой продукции в марте увеличивается средняя величина затрат на содержание оборудования в марте.
4. Для измерения степени тесноты связи используется линейный коэффициент корреляции:

________________________ _________

r = (Σxy-(Σx·Σy)/n)/ √[Σx² - ((Σx)²/n)][Σy²-(Σy)²/n]; r = (19303,37- 16923,19)/√[ 261960,9- 225489,36][ 1431,4-1270,10]=0,98
Для расчета r использована следующая вспомогательная таблица (табл. 5.5).

Таблица 5.5

Вспомогательная таблица для расчета линейного коэффициента корреляции и уравнения связи

Номер предприятия

Выпуск валовой продукции в марте (в действующих ценах), млн. руб., x

Затраты на содержание оборудования в марте, млн. руб., y





xy

ŷ

y-ŷ

(y-ŷ)²

1

33,6

2,6

1129,0

6,8

87,36

3,316

-0,716

0,513

2

93,0

6,8

8649,0

46,2

632,4

6,88

-0,080

0,006

3

106,8

7,8

11406,2

60,8

833,04

7,708

0,092

0,008

4

146,4

10,9

21433,0

118,8

1595,76

10,084

0,816

0,666

5

42,6

3,1

1814,8

9,6

132,06

3,856

-0,756

0,572

6

77,1

5,9

5944,4

34,8

454,89

5,926

-0,026

0,001

7

84,6

6,8

7157,2

46,2

575,28

6,376

0,424

0,180

8

120,0

9,2

14400,0

84,6

1104

8,5

0,700

0,490

9

60,0

4,6

3600,0

21,2

276

4,9

-0,300

0,090

10

93,9

7,4

8817,2

54,8

694,86

6,934

0,466

0,217

11

54,0

4,5

2916,0

20,3

243

4,54

-0,040

0,002

12

143,1

10,1

20477,6

102,0

1445,31

9,886

0,214

0,046

13

52,5

4,2

2756,3

17,6

220,5

4,45

-0,250

0,063

14

119,4

8,4

14256,4

70,6

1002,96

8,464

-0,064

0,004

15

37,4

2,6

1398,8

6,8

97,24

3,544

-0,944

0,891

16

42,0

3,3

1764,0

10,9

138,6

3,82

-0,520

0,270

17

76,5

6,3

5852,3

39,7

481,95

5,89

0,410

0,168

18

145,0

9,6

21025,0

92,2

1392

10

-0,400

0,160

19

89,7

7,4

8046,1

54,8

663,78

6,682

0,718

0,516

20

105,6

7,6

11151,4

57,8

802,56

7,636

-0,036

0,001

21

45,3

3,5

2052,1

12,3

158,55

4,018

-0,518

0,268

22

84,9

7,2

7208,0

51,8

611,28

6,394

0,806

0,650

23

116,4

8,7

13549,0

75,7

1012,68

8,284

0,416

0,173

24

74,1

6,1

5490,8

37,2

452,01

5,746

0,354

0,125

25

120,8

8,3

14592,6

68,9

1002,64

8,548

-0,248

0,062

26

144,6

9,1

20909,2

82,8

1315,86

9,976

-0,876

0,767

27

116,7

8,6

13618,9

74,0

1003,62

8,302

0,298

0,089

28

73,2

5,8

5358,2

33,6

424,56

5,692

0,108

0,012

29

48,0

4,2

2304,0

17,6

201,6

4,18

0,020

0,000

30

53,7

4,6

2883,7

21,2

247,02

4,522

0,078

0,006

Итого:

2600,9

195,2

261960,9

1431,4

19303,37

195,054

0,146

7,015


Значение линейного коэффициента корреляции (r = 0,98) свидетельствует о наличии прямой и очень тесной связи.

Средняя квадратическая ошибка коэффициента корреляции

___ ___

σr = (√1-r²)/(√n-2) =0,04

|r|/σr = 24,5
По таблице 1 определяется t – критерий Стьюдента при Р = 0,95 и к = 30 – 2;

tтабл = 2,048

| r | / r > tтабл - критерия (24,5 > 2,048)
Следовательно, можно утверждать существенность коэффициента корреляции.
Определяется модель связи. График линии средних показывает наличие линейной связи, поэтому используется функция ŷ = a + bx.

_ _ _

b = (Σxy-nx·y)/(Σx²-n(x)²) = (19303,37- 30*86,7*6,5)/( 261960,9- 30*7516,89) = 2396,87/36454,2 = 0,06

_ _

(x = (2600,9/30) = 86,7; y = (195,2/30) = 6,5)

_ _

a = y - bx = 6,5 - 5,202 = 1,3
Модель связи следующая: ŷ = 1,3 + 0,06x
Для возможности использования линейной функции определяется величина

ω² = (η²-r²)/(m-2)÷(1-η²)/(n-m), которая сравнивается с F-критерием.

_____ _ _

Для расчета ω² исчисляется корреляционное отношение η = √δ²/σ²y; δ² = ∑((yi-yo)²∙ni)/∑ni.

Для расчета используются данные таблицы 5.4.
δ² =((3,36 - 6,5)²∙7 + (5,12 - 6,5)²∙5 + (6,72 - 6,5)²∙5 + (7,40 - 6,5)²∙4+ (8,91 - 6,5)²∙7+ (10,25 - 6,5)²∙2) / 30 = 5,03

σ²y = ∑d²y /n=∑(y-y)²/n = ((2,6-6,5)²+(6,8-6,5)²+(7,8-6,5)²+(10,9-6,5)²+(3,1-6,5)²+(5,9-6,5)²+(6,8-6,5)²+(9,2-6,5)²+(4,6-6,5)²+(7,4-6,5)²+(4,5-6,5)²+(10,1-6,5)²+(4,2-6,5)²+(8,4-6,5)²+(2,6-6,5)²+(3,3-6,5)²+(6,3-6,5)²+(9,6-6,5)²+(7,4-6,5)²+(7,6-6,5)²+(3,5-6,5)²+(7,2-6,5)²+(8,7-6,5)²+(6,1-6,5)²+(8,3-6,5)²+(9,1-6,5)²+(8,6-6,5)²+(5,8-6,5)²+(4,2-6,5)²+(4,6-6,5)²)/30 = 188,7/30 = 6,3

_____

η = √5,03/6,3 =0,89

Следовательно, корреляционное отношение показывает наличие очень тесной связи.
ω² = -(0,08415/0,007425) = - 11,3
При вероятности P = 0,95 (α = 0,05) k1= m -2 = 2 и k2=n-m=26; Fтабл=3,37 2. Так как ω² меньше Fтабл, то возможность использования линейной функции не опровергается.

Средняя квадратическая ошибка уравнения

_________ ______

Se = √∑(y-ŷ)²/n-l =√ 7,015/28 = 0,25

_

(Se/y)*100 = 3,8%.

Полученное отношение значительно меньше 15%, поэтому уравнение достаточно хорошо отображает взаимосвязь двух признаков и может быть использовано в практической работе.

6. Предприятия, по которым приведены отчетные данные, представляют собой двадцати процентную выборку из числа предприятий данной отрасли в регионе. Требуется определить:

а) среднюю стоимость основных фондов предприятия отрасли в регионе, гарантируя результат с вероятностью 0,997;

б) вероятность того, что среднее значение стоимости основных фондов отличается от полученной по выборке величине не более, чем на 1,5 млн. руб.

Расчет всех необходимых показателей по выборочным данным произвести на основе группировки предприятий по стоимости основных фондов, приняв равные интервалы группировки при числе групп 5.


количество групп:




n=5




размах колебаний:

R=Xmax - Xmin=33,0 - 10,8=22,2




интервал распределения:

i=(33 - 10,8)/5=4,5







i=5






Таблица 6.1


Средняя стоимость основных фондов в марте, млн. руб.

Середина интервала, x'

(x'-x)²·f x = 21

Частота (количество предприятий в группе), f

10,8 - 16,5

13,6

547,6

10

16,5 - 21,0

18,7

37,03

7

21,0 - 25,5

23,2

19,36

4

25,5 - 29,1

27,3

198,45

5

29,1 - 33,0

31,0

400

4

Итого:

 

1202,44

30



а) Доверительный интервал для генеральной средней с вероятностью Р определяются по формуле:

_ _

х - х  x х +  y

х – средний уровень признака по выборке:
x = ∑x'f/∑f = 620,2/30 = 21
= ∑(x'-x)²·f /∑f = 1202,44/30 = 40,08
Величина xназывается предельной ошибкой выборки и определяется по формуле:

xt*x

где x- величина средней квадратической стандартной ошибки

t - коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки. При вероятности 0, 997 t = 2,98 3.

___________ _______________

μx = √(S²/n)*(1-n/N) = √(1606,4064/30)*(1-0,2) =6,54
x  6,54*2,98 = 19,5.
Доверительные интервалы для генеральной средней с вероятностью Р = 0,997:

_

21 – 19,5≤ x ≤ 21 + 19,5
б) Для решения 2-ого задания известна допустимая ошибка ∆x = 1,5.
tф = ∆x/μx = 1,5/ 6,64 = 0,22
μx = 6,64 (из п. 1)
По таблице на основе значения t определяется вероятность того, что ошибка не превысит заданной величины 4.

При t = 0,22 вероятность Р = 0,1741.

Список используемой литературы:

  1. Практикум по общей теории статистики (М.Р. Ефимова, О.И. Ганченко, Е.В. Петрова).

  2. Учебник- Общая теория статистики (М.Р. Ефимова, В.М. Рябцев).

Сноски:

1 Приложение 6

2 Приложение 5

3 Приложение 3

4 Приложение 3

1   2   3   4


написать администратору сайта