Задача 2.10. Путем опроса получены следующие данные (n=80):
1 4 1 4 8 8 8 1 0 6
| 1 2 8 5 1 4 8 8 5 1
| 5 2 4 8 2 2 8 8 1 8
| 2 8 1 1 4 8 1 4 8 1
| 6 4 8 4 2 8 2 8 8 1
| 4 6 1 4 5 8 4 2 4 5
| 2 6 4 1 8 8 4 1 8 1
| 0 1 4 6 4 7 4 1 8 5
|
| Выполнить задания:
а) получить дискретный вариационный ряд и статистическое распределение выборки;
б) построить полигон частот;
в) составить ряд распределения относительных частот;
г) составить эмпирическую функцию распределения;
д) построить график эмпирической функции распределения;
е) найти основные числовые характеристики вариационного ряда (по возможности использовать упрощающие формулы для их нахождения):
1) выборочное среднее ;
2) выборочную дисперсию D(X);
1) выборочное среднее квадратическое отклонение ;
4) коэффициент вариации V;
5) интерпретировать полученные результаты.
Решение.
а) Для составления дискретного вариационного ряда отсортируем данные опроса по величине и расположим их в порядке возрастания:
0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 7 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8.
Статистическое распределение выборки представлено в таблице 6.1, в которой первая строка – варианты (наблюдаемые значение), вторая строка – частоты появления этих вариант).
Таблица 6.1. Варианты и их частоты xi
| 0
| 1
| 2
| 4
| 5
| 6
| 7
| 8
| ni
| 2
| 18
| 9
| 17
| 6
| 5
| 1
| 22
|
б) Для построения полигона частот найдем относительные частоты ( , где , где m – число различных значений признака X ( ) и в данном примере m=8), которые будем вычислять с одинаковой точностью. Полигон частот – ломаная линия, соединяющая точки с координатами (Рис. 6.1). Расчеты запишем в табл. 6.2.
Таблица 6.2. Относительные частоты и накопленные частоты xi
| ni
| Относительные частоты ![](64102_html_5c2b2cd6.gif)
| Накопленные частоты
| 0
| 2
| 0,025
| 0,025
| 1
| 18
| 0,225
| 0,25
| 2
| 9
| 0,1125
| 0,3625
| 4
| 17
| 0,2125
| 0,575
| 5
| 6
| 0,075
| 0,65
| 6
| 5
| 0,0625
| 0,7125
| 7
| 1
| 0,0125
| 0,725
| 8
| 22
| 0,275
| 1
| Сумма
| 80
| 1
|
|
Рис. 6.1. Полигон частот вариационного ряда
в) Запишем ряд распределения (табл. 6.1) относительных частот в виде таблицы 1, в которой первая строка – варианты (изучаемый признак), вторая строка – относительные частоты (частости).
Таблица 6.1. Распределение относительных частот появления признака xi
| 0
| 1
| 2
| 4
| 5
| 6
| 7
| 8
| ni
| 0,025
| 0,225
| 0,1125
| 0,2125
| 0,075
| 0,0625
| 0,0125
| 0,275
| г) Эмпирическую функцию распределения найдем, используя накопленные частоты (табл. 6.1, столбик 4) и формулу (4.1):
![](64102_html_8aee5e3.gif)
д) Построим график эмпирической функции распределения (рис. 6.2), используя значения, полученные в пункте г). Рис. 6.2. График эмпирической функции распределения
е) Для вычисления выборочного среднего и выборочной дисперсии с использованием приведенных выше формул, удобно составлять расчетную таблицу 6.2:
Таблица 6.2. Расчетная таблица для вычисления выборочных величин xi
| ni
| xini
|
![](64102_html_6c51e88.gif)
|
ni
| 0
| 2
| 0
| 18,8139
| 37,6278
| 1
| 18
| 18
| 11,1389
| 200,5003
| 2
| 9
| 18
| 5,4639
| 49,1752
| 4
| 17
| 68
| 0,1139
| 1,9364
| 5
| 6
| 30
| 0,4389
| 2,6334
| 6
| 5
| 30
| 2,7639
| 13,8195
| 7
| 1
| 7
| 7,0889
| 7,0889
| 8
| 22
| 176
| 13,4139
| 295,1059
| Сумма
| 80
| 347
|
| 607,8875
|
Используя суммы, полученные в табл. 6.2, определим искомые величины.
1) Выборочную среднюю
2) Выборочную дисперсию
3) Выборочное среднее квадратическое отклонение
![](64102_html_m3348d45d.gif)
4) Коэффициент вариации
5) Интерпретация полученных результатов:
величина характеризует среднее значение признака X;
среднее квадратическое отклонение описывает абсолютный разброс значений показателя X относительно среднего значения и в данном случае составляет ;
коэффициент вариации V характеризует относительную изменчивость показателя X, то есть относительный разброс вокруг его среднего значения , и в данном случае составляет .
Ответ: ; ; ; ![](64102_html_1abb7bc4.gif)
Исходные данные для задания 2 варианта 2.10
17,57
| 17,74
| 17,45
| 17,42
| 17,29
| 17,78
| 17,45
| 17,50
| 17,55
| 17,77
| 17,72
| 17,69
| 17,46
| 17,72
| 17,72
| 17,48
| 17,29
| 17,25
| 17,44
| 17,60
| 17,47
| 17,51
| 17,47
| 17,78
| 17,24
| 17,28
| 17,58
| 17,71
| 17,71
| 17,45
| 17,47
| 17,44
| 17,74
| 17,49
| 17,50
| 17,78
| 17,48
| 17,47
| 17,77
| 17,29
| 17,54
| 17,77
| 17,76
| 17,46
| 17,27
| 17,44
| 17,78
| 17,27
| 17,66
| 17,26
| 17,40
| 17,52
| 17,59
| 17,48
| 17,46
| 17,40
| 17,47
| 17,26
| 17,50
| 17,78
| 17,47
| 17,74
| 17,41
| 17,24
| 17,42
| 17,55
| 17,77
| 17,41
| 17,78
| 17,14
| 17,42
| 17,52
| 17,78
| 17,54
| 17,70
| 17,18
| 17,72
| 17,46
| 17,79
| 17,75
| 17,74
| 17,77
| 17,50
| 17,61
| 17,42
| 17,72
| 17,75
| 17,40
| 17,57
| 17,71
| 17,40
| 17,76
| 17,28
| 17,58
| 17,58
| 17,78
| 17,72
| 17,20
| 17,47
| 17,74
| Алгоритм выполнения задания по проверке статистической гипотезы о виде распределения1
Определить размах выборки: R=XMax XMin.
![](64102_html_m5e69ba4d.gif)
Назначить число карманов, m=8.
Найти среднее значение (М) и стандартное отклонение ().
![](64102_html_md6ac7c4.gif)
![](64102_html_m6ad78cc2.gif)
Найти левые и правые границы для карманов, пронумерованных от 0 до m. При этом для кармана № 0 правая граница равна минимуму, для кармана № 1 правая граница равна минимальному значению плюс длина кармана, и т.д. Интервал
|
![](64102_html_m3dc34abe.gif)
|
![](64102_html_m7ca1ebda.gif)
| 17,14-17,221
| 3
| 0,03
| 17,221-17,303
| 12
| 0,12
| 17,303-17,383
| 0
| 0
| 17,383-17,465
| 20
| 0,2
| 17,465-17,546
| 20
| 0,2
| 17,546-17,628
| 10
| 0,1
| 17,628-17,709
| 3
| 0,03
| 17,709-17,79
| 32
| 0,32
| итого
|
![](64102_html_50d43c92.gif)
|
![](64102_html_7e6bd313.gif)
| Построить гистограмму и выдвинуть гипотезу о виде распределения.
![](64102_html_m49ba5001.png)
Предполагаем равномерное распределение.
Найти значения предполагаемой ФР на границах карманов:
Так, для нормального распределения существует встроенная функция НОРМРАСПР(), где в качестве последнего аргумента печатаем ИСТИНА.
Найти теоретические вероятности попадания в карман (разность ФР по границам карманов).
При равномерном распределении вероятность попадания в карман 1/8=0,125.
Найти теоретические частоты (произведение теоретических вероятностей попадания в карман на объем выборки).
При равномерном распределении теоретические частоты 100*0,125=12,5.
Вычислить столбец величин:
(выборочная частотатеоретическая частота)^2 / теоретическая частота.
Сумма этих величин является значением выборочного 2выб критерия.
Интервал
|
![](64102_html_m3dc34abe.gif)
|
![](64102_html_b53347b.gif)
|
![](64102_html_bb52d03.gif)
|
![](64102_html_m7a1a7b2c.gif)
| 17,14-17,221
| 3
| 0,125
| 12,5
| 7,22
| 17,221-17,303
| 12
| 0,125
| 12,5
| 0,02
| 17,303-17,383
| 0
| 0,125
| 12,5
| 12,5
| 17,383-17,465
| 20
| 0,125
| 12,5
| 4,5
| 17,465-17,546
| 20
| 0,125
| 12,5
| 4,5
| 17,546-17,628
| 10
| 0,125
| 12,5
| 0,5
| 17,628-17,709
| 3
| 0,125
| 12,5
| 7,22
| 17,709-17,79
| 32
| 0,125
| 12,5
| 30,42
| итого
|
![](64102_html_50d43c92.gif)
| 1
| 100
| 66,88
| Найти значение теоретического критерия согласия 2теор при заданном уровне значимости (у нас 0.05) можно по формуле ХИ2ОБР (вероятность; число степеней свободы), где число степеней свободы k=m1r, например, r=2 для нормального распределения, r=0 для равномерного распределения.
![](64102_html_m7fb88ccd.gif)
Сравниваем 2выб с 2теор, делаем вывод: если 2выб < 2теор, то нет оснований отвергать основную гипотезу, в противном случае основная гипотеза не принимается.
![](64102_html_4a9202a5.gif)
следует гипотезу о равномерном распределении не принимаем.
1 Рекомендуется выполнять в пакетах Excel или MathCad, здесь указаны встроенные функции Excel.
|