Главная страница

математическая статисика Методичка для расчетов. Методические указания к выполнению индивидуальных типовых расчетов по математической статистике


Скачать 421.46 Kb.
НазваниеМетодические указания к выполнению индивидуальных типовых расчетов по математической статистике
Дата01.12.2022
Размер421.46 Kb.
Формат файлаdocx
Имя файламатематическая статисика Методичка для расчетов.docx
ТипМетодические указания
#823449
страница1 из 2
  1   2


Методические указания к выполнению индивидуальных типовых расчетов по математической статистике

(электронная версия)

На конкретном примере (выборочные данные) дана методика выполнения типовых расчетов по темам:

  1. Построения интервального статистического ряда распределения (типовой расчет №1).

  2. Вычисление выборочных характеристик ряда распределения (типовой расчет №2).

  3. Графическое изображение рядов распределения (типовой расчет №3).

  4. Расчет теоретической нормальной кривой распределения (типовой расчет №4).

  5. Проверка гипотеза о нормальном законе распределения по критерию согласия Пирсона χ2 (типовой расчет №5).

Задание.

По выборочным данным, представленным в таблице №11-38, требуется выполнить типовые расчеты:

Типовой расчет №1:

Построить интервальный статистический ряд распределения.

Типовой расчет №2:

Вычислить выборочные характеристики статистического ряда: начальные моменты , среднюю арифметическую , центральные моменты , дисперсию , среднее квадратическое отклонение S , коэффициенты ассиметрии и эксцесса , медиану , моду , коэффициент вариации .

Дать экономическую интерпретацию выборочным числовым характеристикам.

Типовой расчет №3:

Построить гистограмму, полигон, кумуляту, огиву.

Сделать вывод о форме ряда распределения по виду гистограммы и полигона, а также по значениям коэффицицентов и .

Типовой расчет №4:

Рассчитать теоретическую нормальную кривую распределения и построить ее на эмпирическом графике.

Сделать вывод о согласовании между теоретическим и эмпирическим распределениями.

Типовой расчет №5:

Проверить гипотезу о нормальном законе распределения по критерию согласия Пирсона ( ) на заданном уровне значимости α = 0,05.
Типовой расчет №1

Построение интервального статистического (вариационного) ряда распределения.

Дана выборка обследования 100 однотипных предприятий получены данные объема основных фондов (табл.1.1).

Таблица I.I

Объем основных фондов 100 (млн. руб.) предприятий легкой промышленности

5,56

5,43

5,47

5,47

5,33

5,37

5,43

5,54

5,61

5,33

5,43

5,61

5,11

5,43

5,33

5,54

5,33

5,11

5.54

5,43

5,33

5,54

5,43

5,43

5,43

5,33

5,11

5,43

5,43

5,33

5,43

5,40

5,43

5,47

5,68

5,47

5,43

5,68

5,21

5,33

5,58

5,47

5,47

5,21

5,,54

5,64

5,47

5,27

5.27

5,37

5,33

5,47

5,47

5,54

5,40

5,58

5,47

5,27

5,05

5,79

5,79

5,64

5,64

5,71

5,85

5,47

5,47

5,43

5,47

5,54

5,64

5,64

5,79

5,93

5,33

5.68

5,43

5,61

5,54

5,64

5,54

5,39

5,33

5,21

5.68

5,54

5,33

5,21

5,21

5,81

5,27

5,64

5,27

5,27

5,33

5,37

5,27

5,54

5,54

5,47



























Этапы построения интервального статистического (вариационного) ряда распределения.

1. Определение среди имеющихся наблюдений (табл.1.1) минималь­ного Хmin. и максимального Хmах значения признака. В данном примере это будут =5,03 и =5,85.


  1. Определение размаха варьирования признака


R = - = 5,85 - 5,03 = 0,82


  1. Определение длины интервала по формуле



h = , где n - объем выборки.


В данном примере h = 0.82/1+3.32 lg100=0.11


  1. Определение граничных значений интервалов ( ).


Так, как и являются случайными величинами, рекомен­дуется отступить влево от нижнего предела варьирования ( ).

За нижнюю границу первого интервала предлагается принимать величину, равную =h/2.

Если оказывается, что < 0 , хотя по смыслу величина не отрицательная, то можно принять = 0.

Верхняя граница первого интервала = +h. Тогда, если – верхняя граница i-го интервала (причем = ), то = +h, = +h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интерва­ла не будет равным или больше .

В примере граничные значения составят:

=5.03-0.11/2=4.97; =4.97+0.11=5.08; =5.08; =5.08+0.11=5.19 и т.д.

Границы последовательных интервалов записывают в графе I

табли­цы 1.2.

  1. Группировка результатов наблюдения.

Просматриваем статистические данные в том порядке, в каком они записаны в таблице I.I, и значения признака разносим по соответствующим интервалам, обозначая их так: (по одному штриху для каждого наблюдения). Так как граничные значения признака могут совпадать с границами интервалов, то условимся в каждый интер­вал включать варианты, большие, чем нижняя граница интервала ( > ), и меньшие или равные верхней границе ( < ). Общее количество штрихов, отмеченных в интервале (табл.1.2, графа 2) даст его частоту (табл. 1.2, графа 3). В результате получим интервальный статистический ряд распределения частот (табл.1.2 графа I и 3).

Примечание. Число интервалов обычно берут равным от 7 до 11 в зависимости от числа наблюдений и точности измерений с таким расчё­том, чтобы интервалы были достаточно наполнены частотами. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервала (особенно в середине интервального ряда).
Таблица 1.2
Интервальный ряд распределения объемов основных фондов 100 предприятий

Интервалы

Подсчет частот


Час-тота



Накопленная частота mHi

1

2

3

4

4,97 - 5,08

5,08 - 5,19

3,19 - 5,30

5,30 - 5,41

5,41- 5,52

5,52 - 5,63

5,63 - 5,74

5,74 - 5,85

●●

●●●

●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●

●●●●

2

3

12

19

29

18

13

4

2

5

17

36

65

83

96

100






100




Соответствие между 1 и 3 столбцами является интервальным вариационным рядом абсолютных частот.

Вопросы для самопроверки

  1. В чем отличие генеральной совокупности от выборочной совокупности?

  2. Что называется статистическим (вариационным) рядом распределения?

  3. Виды рядов распределения?

  4. Простой ряд и по сгруппированным данным?

  5. Как перейти от интервального вариационного ряда к дискретному ряду?

  6. В чем отличие абсолютной частоты от относительной частоты?

  7. Какие задачи решает теория вероятностей и математическая статистика?

Типовой расчет №2

Вычисление выборочных характеристик статистического ряда распределения

Для вычисления средней арифметической, дисперсии, коэффициентов асимметрии и эксцесса рекомендуется следующий порядок вычислений.

Заменяем интервальный ряд дискретным для чего, все значения признака в пределах интервала приравниваем к его срединному значе­нию, и считаем, что частота относится к середине интервала. Значе­ния середин интервалов равны =( + )/2.

Для удобства вычислений целесообразно составить вспомогательную таблицу 1.3. Значения середин интервалов заносят в графу I, соот­ветствующие частоты в графу 2 и т.д.

В таблице ∆i = ( )

Пользуясь таблицей 1.3, вычислим выборочную среднюю арифметическую:

= .

В нашем примере = 5,4656 млн.руб. и характеризует среднее положение наблюдаемых значений.

Выборочный центральный момент k-го порядка равен:
.

Таблица 1.3

Вспомогательная таблица для вычисления выборочных характеристик

















1

2

3

4

5

6

7

8

5.03

5.14

5.25

5.36

5.47

5.58

5.69

5.80

2

3

12

19

29

18

13

4

10.06

15.42

63.00

101.84

58.63

100.44

73.97

23.20

-0,4356

-0,3256

-0,2156

-0,1056

0,0044

0,1144

0,2244

0,3344

-0.8712

-0.9768

-2.5872

-2.0064

0.1276

2.0592

2.9172

1.3376

0,37949

0,31805

0.55780

0,21188

0,00056

0,44729

0,65462

0,23557

-0,1653

-0,10356

-0,12026

-0,02237

0.00000

0,02695

0,14690

0.14957

0,07201

0,03372

0,025928

0,00236

0,00000

0,00308

0,03296

0,05002




100

546.56

-0,4048

0

2,80526

0,08800

0,22008


Для проверки правильности вычисления должно выполняться равенство:



В нашем примере тождество выполняется. В итоговой строке столбца 4 табл.1.3 имеем 0

В данном примере =0,028, =-0,00088, = 0,0022.

Выборочная дисперсия равна центральному моменту второго порядка:

=

В нашем примере = 0,028. а выборочное среднее квадратическое отклонение S= = 0,167 млн.руб.

Выборочные коэффициенты асимметрии и эксцесса опре­деляются по формулам

= ;

= ;



Медиана - значение признака x , приходящееся на середину ранжированного ряда наблюдений (n=2l-1). При четном числе наблюдений (n=2l) медианой является средняя арифмети­ческая двух значений, расположенных в середине ранжированного ряда:

=
Если ранжировать значения, попавшие в медианные интервал [5,41;5,52], – интервал, в котором накопленная частота впервые превышает половину объема выборки =50, – до значение и ,получим



Следовательно, = (млн.руб.).

Если исходить из интервального ряда, то медиану следует вычислять по формуле



где означает номер медианного интервала, ( -1) - интерва­ла, предшествующего медианному.

В нашем примере = 5,41+ = 5,41+0,0531=5,46 млн.руб.
Мода для совокупности наблюдений равна тому значению признака (табл.1.1), которому соответствует наибольшая частота.

У нас вариант 5,43 имеет наибольшую частоту (m=15). Это оз­начает, что =5,43 млн.руб.

Для одномодального интервального ряда вычисление моды можно производить по формуле:

=
Где означает номер модального интервала (интервала с наиболь­шей частотой), -1 и +1 – номера предшествующего модальному и следующего за ним интервалов. В нашем примере
= 5,41 +

Так как , и почти не отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным.

Коэффициент вариации:
= 100%=3,06%.
Коэффициент вариации используют для характеристики того, насколько средняя арифметическая хорошо представляет статистический ряд распределения. Если ряды имеют одинаковые средние, то средняя арифметическая ряда с меньшим коэффициентом вариации более предпочтительна. Будучи безразмерным, удобен для сравнений рядов распределения.
Типовой расчет №3

Графическое изображение вариационных рядов
Для визуального подбора теоретического распределения, а также выявления положения среднего значения ( ) и характера рассеива­ния ( и S) вариационные ряды изображают графически.

Полигон и кумулята применяются для изображения как дискретных, так и интервальных рядов, гистограмма - для изображения только ин­тервальных рядов. Для построения этих графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот

(частостей) = , накопленных относительных частот и найдем отношение /h заполнив таблицу 1.4.

Таблица 1.4

Статистический ряд распределения объемов основных фондов 100 предприятий.

Интервалы









/ h

1

2

3

4

5

4,97 - 5,08

5,08 - 5,19

3,19 - 5,30

5,30 - 5,41

5,41 - 5,52

5,52 - 5,63

5r63 -5,74

5,74 - 5,85

5,03

5,14

5,25

5,36

5,47

5,58

5,69

5,80

0,02

0,03

0,12

0,19

0,29

0,18

0,13

0,04

0,02

0,05

0,17

0,36

0,65

0,83

0,96

1,00

0,18

1,73

2,64

1,18

0.36

0,27

1,09

1,64






1,00






Для построения гистограммы относительных частот (частностей) на оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте данного i-ого интервала. Тогда высота элементарного прямо­угольника должна быть равна /h, где в нашем примере h= 0,11(рис.1.1). Следовательно, площадь под гистограммой равна сумме всех относительных частот, т.е. Единице.

(Примечание: На рис.1.1 помимо гистограммы изображен график теоретической нормальной кривой f(x). Построение этого графика будет описано на стр. 9 данной методички)

Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезка­ми прямой (рис.1.2).

Гистограмма и полигон являются аппроксимациями кривой плотнос­ти (дифференциальной функции) теоретического распределения (гене­ральной совокупности). Поэтому по их виду можно судить о гипотети­ческом законе распределения.

Для построения кумуляты дискретного ряда по оси абсцисс откла­дывают значения признака , а по оси ординат - накопленные от­носительные частота . Для интервального ряда по оси абсцисс откладывают интервалы (рис.1.3).

С кумулятой сопоставляется график интегральной функции расп­ределения F(х).

В нашем примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля. Коэффициент асимметрии оказался отрицательным

( = - 0,188), что свидетельствует о небольшой левосторонней асим­метрии данного распределения. Эксцесс оказался также отрицательным ( = -0,203). Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальной, имеет несколько более плоскую вершину. Гистограмма и полигон напоминают кривую нормального распределения (рис.1.1.и 1.2).Все это дает возможность выдвинуть гипотезу о том, что распределение объемов фондов является нормаль­ным.

Рис. I.I. Гистограмма относительных частот ин­тервального ряда распределения.


Рис.1.2. Полигон относительных частот интервального ряда расп­ределения.


Рис. 1.3 Кумулятивная кривая.

Типовой расчет №4

Расчет теоретической нормальной кривой распределения
Приведем один из способов расчета теоретического нормального распределения по двум найденным выборочным характеристикам и S эмпирического ряда.
При расчете теоретических частот за оценку математичес­кого ожидания и среднего квадратического отклонения нор­мального закона распределения принимают значения соответствующих вы­борочных характеристик и S , т.е = 5,466; S =0,167.

Теоретические частоты находят по формуле =n ;

где n - объем выборки;

- вероятность попадания значения нормально распределенной случайной величины в i -й интервал.
Вероятность определяется по формуле

= < )=1/2

где Ф(t)= = - интегральная функция Лапласа - находится по таблице для

= , =

Для вычисления вероятности и теоретических частот составим
таблицу 1.5.


Таблица 1.5

Расчет теоретической нормальной кривой распределения


Интервалы









1/2Ф( )

1/2Ф( )



n



/h

4,97-5,08

5.08-5,19

5,19-5,3

5,30-5,41

5,41-5,52

5,52-5,63

5,63-5,74

5,7.4-5,85

2

3

12

19

29

18

13

4



-2,39

-1,71

-1,03

-0,35

0,33

1,02

1,70

-2,39

-1,71

-1,03

-0,35

0,33

1,02

1,70



-0,5

-0,4913

-0,4564

-0,3485

-0,1368

0,1233

0,3461

0,4554

-0.4913

-0,4564

-0,3485

-0,1368

0,1293

0,3461

0,4554

0,5000

0,0087

0,0349

0,1079

0,2117

0,2661

0,2228

0,1093

0,0446

0,87

3,49

10,9

21,17

26,61

22,28

10,98

4,46

1

3

11

21

27

22

11

4

0,09

0,27

1,00

1,91

3,45

2,00

1,00

0,36




100









1,0000



100




Построим теоретическую нормальную кривую f(x) на рис.1.1. Для этого из середины частных интервалов восстановим перпендикуляры высотой /h (табл.1.5, графа 10), где = /n. На рис.1.1 концы этих перпендикуляров отмечены точками. Полученные точки соединены плавной кривой.


Рис. I.I. Гистограмма относительных частот ин­тервального ряда распределения.

Сравнение гистограммы и теоретической нормальной кривой наглядно показывает согласованность между теоретическим и эмпирическим распределениями.

Типовой расчет №5

Проверка гипотезы о нормальном законе распределения

Примечание. При использовании критерия согласия Пирсона общее число
наблюдений должно быть достаточно большим (
n>50) и интервалы должны быть достаточно заполнены частотами. Если отдельные теоретические частоты на концах распределения окажутся малыми ( <5),
то при вычислении необходимо объединить такие интервалы, сложив соответствующие частоты.


Частоты для проверки соответствия эмпирического ряда распреде­ления нормальному закону используют критерий , основанный на сравнении эмпирических частот с теоретическими , которые можно ожидать при принятии определенной нулевой гипотезы.

Значение - наблюдаемое значение критерия, полученное по результатам наблюдений, равно
=

где к - число интервалов (после объединения), теорети­ческие частоты. Все вспомогательные расчеты, необходимые для вычис­ления , сведем в таблицу 1.6.
  1   2


написать администратору сайта