Тогда
правило
проверки
гипотезы
H
0
можно
сформулировать следующим образом: Если для данной выборки Х
значение статистики
T
X
T
, то в предположении справедливости гипотезы H
0
произошло маловероятное событие и гипотеза должна быть отвергнута как противоречащая статистическим данным. В противном случае нет основания отказываться от принятия гипотезы
H
0
. На языке критериев это можно записать так:
,
H
,
H
1 0
T
\
T
X
T
2.2 Критерий Смирнова для проверки гипотезы о виде
распределения
Имеется выборка
n
2
,
1
X
,
,
X
X
X
из некоторого распределения F . Проверяется простая гипотеза
1 0
F
F
H
против сложной альтернативы
1 1
F
F
H
. В том случае, когда распределение
1
F имеет непрерывную функцию распределения
1
F , для проверки гипотезы можно воспользоваться критерием
Смирнова.
Пусть
x
F
n
- эмпирическая функция распределения.
Рассмотрим статистику
X
F
F
max n
x
F
sup n
i
1
i n
n x
n i
Теорема 4.1 В случае справедливости гипотезы
0
H
при
n
статистика n
T имеет распределение Смирнова:
68
x
S
x lim n
n
, здесь
2
x
2
e
1
x
S
- функция Смирнова.
Зададим некоторый уровень значимости q и найдем пороговое значение статистики q
C из условия
q
1
C
S
q
. Построим критерий
Смирнова для проверки гипотезы о виде распределения:
,
H
,
H
1 0
q n
q n
C
X
,
C
Приведем пример применения этого критерия. Пусть в результате эксперимента получена выборка объема N=200 из распределения некоторой случайной величины. Проверим гипотезу о том, что эта случайная величина имеет стандартное нормальное распределение. Текст программы, реализующий проверку данной гипотезы с помощью критерия Смирнова, приведен на рисунке 2.1.
Рисунок 2.1. Проверка гипотезы о распределении случайной величины по нормальному закону
1
,
0
N
с помощью критерия
69
Смирнова.
2.3 Задание к лабораторной работе
В файле smirn-V.txt (V - номер вашего варианта) задана выборка из некоторого распределения. Задав некоторый уровень значимости q , c помощью критерия Смирнова проверить следующие гипотезы:
Варианты заданий
1. а)
}
N
=
{F
=
H
1,2 0
против
}
N
{F
=
H
1;2 1
; б)
}
E
=
{F
=
H
3 0
против
}
E
{F
=
H
3 1
; в)
}
F
=
{F
=
H
3,5 0
против
}
F
{F
=
H
3,5 1
2. а)
}
U
=
{F
=
H
2,4 0
против
}
U
{F
=
H
2,4 1
; б)
}
K
=
{F
=
H
0,1 0
против
}
K
{F
=
H
0,1 1
; в)
}
Г
=
{F
=
H
2,2 0
против
}
Г
{F
=
H
2,2 1
3. а)
}
=
{F
=
H
3,2 0
против
}
{F
=
H
3,2 1
; б)
}
K
=
{F
=
H
1,1 0
против
}
K
{F
=
H
1,1 1
; в)
}
E
=
{F
=
H
4 0
против
}
E
{F
=
H
4 1
4. а)
}
=
{F
=
H
3,4 0
против
}
{F
=
H
3,4 1
; б)
}
F
=
{F
=
H
5 5,
0
против
}
F
{F
=
H
5,5 1
; в)
}
U
=
{F
=
H
1,1
-
0
против
}
U
{F
=
H
1,1
-
1
5. а)
}
K
=
{F
=
H
2,4 0
против
}
K
{F
=
H
2,4 1
; б) H
0
= {F = N
2
,
4
} против H
1
= {F
N
2
,
4
}; в)
}
U
=
{F
=
H
0,1 0
против
}
U
{F
=
H
0,1 1
6. а)
}
=
{F
=
H
5,4 0
против
}
{F
=
H
5,4 1
; б)
}
F
=
{F
=
H
2,4 0
против
}
F
{F
=
H
2,4 1
; в)
}
E
=
{F
=
H
3 0
против
}
E
{F
=
H
3 2
7. а)
}
U
=
{F
=
H
3,6 0
против
}
U
{F
=
H
3,6 1
; б)
}
K
=
{F
=
H
1,1 0
против
}
K
{F
=
H
1,1 1
; в)
}
Г
=
{F
=
H
2,3 0
против
}
Г
{F
=
H
2,3 1
70 8. а)
}
N
=
{F
=
H
1,3
-
0
против
};
N
{F
=
H
1,3
-
1
б)
}
E
=
{F
=
H
1.5 0
против
}
E
{F
=
H
1.5 1
; в)
}
=
{F
=
H
3,5 0
против
}
{F
=
H
3,5 1
9. а)
}
F
=
{F
=
H
2,3 0
против
}
F
{F
=
H
2,3 1
; б)
}
K
=
{F
=
H
0,2 0
против
}
K
{F
=
H
0,2 1
; в)
}
Г
=
{F
=
H
2,2 0
против
}
Г
{F
=
H
2,2 1
10. а)
}
=
{F
=
H
3,4 0
против
}
{F
=
H
3,4 1
; б)
}
E
=
{F
=
H
5 0
против
}
E
{F
=
H
5 1
; в)
}
U
=
{F
=
H
0,5 0
против
}
U
{F
=
H
0,5 1
11. а)
}
Г
=
{F
=
H
4,4 0
против
}
Г
{F
=
H
4,4 1
; б)
}
F
=
{F
=
H
2,4 0
против
}
F
{F
=
H
2,4 1
; в)
}
E
=
{F
=
H
3 0
против
}
E
{F
=
H
3 1
12. а)
}
N
=
{F
=
H
5,1 0
против
}
N
{F
=
H
5,1 1
; б)
}
E
=
{F
=
H
2.5 0
против
}
E
{F
=
H
2.5 1
; в)
}
U
=
{F
=
H
3,5 0
против
}
U
{F
=
H
3,5 1
13. а)
}
=
{F
=
H
3,2 0
против
3,2}
{F
=
H
1
; б)
}
K
=
{F
=
H
0,1 0
против
}
K
{F
=
H
0,1 1
; в)
}
E
=
{F
=
H
2 0
против
}
E
{F
=
H
2 1
14. а)
}
U
=
{F
=
H
0,2 0
против
}
U
{F
=
H
0,2 1
; б)
}
Г
=
{F
=
H
3,3 0
против
}
Г
{F
=
H
3,3 1
; в)
}
K
=
{F
=
H
2,1 0
против
}
K
{F
=
H
2,1 1
15. а)
}
F
=
{F
=
H
5,3 0
против
}
F
{F
=
H
5,3 1
; б)
}
E
=
{F
=
H
2 0
против
}
E
{F
=
H
2 1
; в)
}
Г
=
{F
=
H
2,4 0
против
}
Г
{F
=
H
2,4 1
16. а)
}
N
=
{F
=
H
0,4 0
против
}
N
{F
=
H
0,4 1
; б)
}
E
=
{F
=
H
3.5 0
против
}
E
{F
=
H
3.5 1
; в)
}
F
=
{F
=
H
4,5 0
против
}
F
{F
=
H
4,5 1
71 17. а)
}
Г
=
{F
=
H
4,2 0
против
}
Г
{F
=
H
4,2 1
; б)
}
E
=
{F
=
H
5 0
против
}
E
{F
=
H
5 1
; в)
}
U
=
{F
=
H
2,2
-
0
против
}
U
{F
=
H
2,2
-
1
18. а)
}
=
{F
=
H
3,6 0
против
}
{F
=
H
3,6 1
; б)
}
F
=
{F
=
H
2,2 0
против
}
F
{F
=
H
2,2 1
; в)
}
E
=
{F
=
H
4.5 0
против
}
E
{F
=
H
4.5 1
19. а)
}
F
=
{F
=
H
3,4 0
против
}
F
{F
=
H
3,4 1
; б)
}
N
=
{F
=
H
5,5 0
против
}
N
{F
=
H
5,5 1
; в)
}
U
=
{F
=
H
1,0
-
0
против
}
U
{F
=
H
1,0
-
1
20. а)
}
K
=
{F
=
H
2,3 0
против
}
K
{F
=
H
2,3 1
; б)
}
E
=
{F
=
H
1.5 0
против
}
E
{F
=
H
1.5 1
; в)
}
U
=
{F
=
H
0,6 0
против
}
U
{F
=
H
0,6 1
72
Лабораторная работа №3. Проверка параметрической гипотезы о виде распределения с помощью критерия согласия χ2 Пирсона 3.1 Критерий согласия Пирсона Пусть имеется выборка
n
2
,
1
X
,
,
X
X
X
из некоторого распределения
F
. Будем проверять гипотезу о принадлежности, наблюдаемой в опыте случайной величины некоторому семейству распределений. То есть будем проверять сложную гипотезу
F
F
H
0
против сложной альтернативы
F
F
H
1
Чтобы воспользоваться критерием Пирсона, выборочные данные предварительно группируют. Разделим область выборочных данных на интервалы k
2 1
,
,
,
. Обозначим за
k
,
2
,
1
j v
j
число элементов выборки, попавших в интервал
n v
v k
1
j
. Эмпирические вероятности попадания элементов выборки в j
обозначим j
q
: k
,...,
1
j
,
n v
q j
j
За
j p
обозначим теоретические вероятности попадания значения случайной величины в интервал группировки j
в случае, если выполняется гипотеза H
0
Составим статистику, характеризующую отклонение выборочных данных (т.е. вероятностей j
q ) от соответствующих гипотетических значений (
j p
):
n
1
j j
2
j j
2
n
2
n p
p q
n
Непосредственно использовать эту статистику для построения критерия нельзя - для начала надо исключить неопределенность, связанную с неизвестным параметром . Для этого поступают следующим образом - заменяют некоторой оценкой
n n
найденной по выборке
X
73
n
1
j n
j
2
n j
j n
2
n
2
n
p
p q
n
Такую статистику уже можно однозначно вычислить для каждой заданной реализации выборки
X
Теорема 3.1 Если верна гипотеза H
0
и l - размерность векторного параметра , то при фиксированном k и при
n
то
2
n
,
где случайная величина
имеет распределение
2
с
1 1
k
степенями свободы.
Приведем схему использования критерия согласия
2
:
1.
По заданной выборке X найти оценку векторного параметра .
2.
Найти теоретические вероятности попадания значений случайной величины в интервалы группировки j
3.
Вычислить значение статистики
2
n
(см. Приложение Б, таблица 3).
4.
По заданному уровню значимости q найти пороговое значение статистики q
C
из условия
q
1
C
q
2 1
l k
5.
Если q
2
n
C
то гипотезу H
0
принимаем, в противном случае отклоняем.
Замечание: Малочисленные частоты (
5
v j
), следует объединить, объединив соответствующие интервалы группировки.
Теоретические частоты следует вычислять уже после объединения интервалов. При определении числа степеней свободы в этом случае вместо k следует взять число интервалов, получившихся после объединения.
Приведем пример использования критерия
2
для проверки параметрической гипотезы о виде распределения.
Пусть имеется выборка объема n = 500 из некоторого распределения F. Требуется проверить гипотезу
,
1 0
F
H
. На рис. 3.1 приведен текст программы для проверки этой гипотезы с
74 помощью критерия
2
. Обратите внимание на то, что так как один из
параметров гамма- распределения уже задан, то по выборке оценивается только параметр .
Рисунок 3.1. Проверка гипотезы о том, что случайная величина имеет гамма-распределение
,
1
75
3.2 Задание к лабораторной работе Варианты заданий
1. а) В ходе испытания 400 ламп накаливания была получена выборка, элементы которой - длительности их горения (в часах).
Данные приведены в файле pearson-1a.txt. С помощью критерия
Пирсона проверить гипотезу о распределении времени горения ламп по показательному закону с уровнем значимости
05 0
q
б) В течение 3 месяцев (90 дней) в супермаркете вели статистику о количестве проданных за день буханок белого хлеба.
Полученная выборка приведена в файле pearson-1b.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества проданных в день буханок по закону Пуассона с уровнем значимости
05 0
q
2. а) В тепличном хозяйстве проводился контроль урожайности томатов некоторого сорта. Было измерено, сколько килограммов томатов было собрано за сезон с каждого из 100 выбранных кустов. Полученные данные приведены в файле pearson-
2a.txt. С помощью критерия Пирсона проверить гипотезу о равномерном распределении урожайности томатов с уровнем значимости
02 0
q
б) В результате испытаний 300 дискет на количество циклов перезаписывания, которые дискета выдерживает без выхода из строя, была получена выборка случайной величины, значение которой - количество циклов, выдержанных дискетой до поломки.
Выборка приведена в файле pearson-2b.txt c помощью критерия
Пирсона проверить гипотезу о распределении этой случайной величины по закону Пуассона с уровнем значимости
02 0
q
3. а) В некоторой местности в течение 300 суток регистрировалась среднесуточная температура воздуха (в градусах
Цельсия). В результате была получена выборка, приведенная в файле pearson-3a.txt. С помощью критерия Пирсона проверить гипотезу о равномерном распределении температуры воздуха с уровнем значимости
03 0
q
б) Для проверки качества работы заводского оборудования было
подсчитано количество нестандартных деталей, изготовленных каждым из 200 станков за неделю. Полученная выборка приведена в файле pearson- 3b.txt. С помощью критерия
76
Пирсона проверить гипотезу о распределении количества нестандартных изделий по закону Пуассона с уровнем значимости
05 0
q
4. а) В ходе школьного медицинского осмотра был измерен рост 100 первоклассников. Полученные данные приведены в файле pearson-4a.txt. С помощью критерия согласия Пирсона проверить гипотезу о распределении роста учеников по нормальному закону с уровнем значимости
05 0
q
б) Опыт, состоящий в одновременном подбрасывании 5 игральных костей, повторили 150 раз. Событие A в единичном испытании состоит в том, что на кости выпало не более двух очков.
Данные о том, сколько раз при каждом из 150 подбрасываний повторилось событие А приведены в файле pearson-4b.txt. С помощью критерия Пирсона проверить гипотезу о распределении исследуемой случайной величины по биномиальному закону с уровнем значимости
05 0
q
5. а) В результате испытания 300 батареек на длительность их работы (в часах) была получена выборка, приведенная в файле pearson-5a.txt. С помощью критерия Пирсона проверить гипотезу о распределении длительности работы батареек по показательному закону с уровнем значимости
03 0
q
б) Опыт состоял в том, что человек одновременно вытягивал из
3-х карточных колод по 1 карте и складывал их обратно. Опыт было повторен 200 раз и каждый раз подсчитывалось сколько вынималось карт пиковой масти. Данные приведены в файле pearson-5b.txt. С помощью критерия Пирсона проверить гипотезу о распределении исследуемой случайной величины по биномиальному закону с уровнем значимости
04 0
q
6. а) В результате взвешивания 500 бильярдных шаров была получена выборка, представленная в файле pearson-6a.txt (вес задан в граммах). С помощью критерия Пирсона проверить гипотезу о равномерном распределении веса шаров с уровнем значимости
01 0
q
б) После поступления на склад 200 коробок стеклянных елочных игрушек кладовщик проверил, сколько игрушек в каждой коробке было повреждено в результате транспортировки.
Результаты его проверки приведены в файле pearson-6b.txt. C помощью критерия Пирсона проверить гипотезу распределении
77 количества поврежденных игрушек в 1 коробке по закону Пуассона с уровнем значимости
03 0
q
7. а) По 100 магазинам города был проведен мониторинг цен на красную икру. В файле pearson-7a.txt приведены цены за 100 граммов икры в каждом из магазинов (в рублях). С помощью критерия Пирсона проверить гипотезу о нормальном распределении цен на икру с уровнем значимости
01 0
q
б) Среди студентов третьего курса (250 человек) был
проведен тест по теории вероятностей, состоявший из 20 вопросов. Случайная величина ξ - количество вопросов, на которые каждый студент ответил верно. В итоге была получена выборка из распределения случайной величины ξ, которая приведена в файле pearson-7b.txt. С помощью критерия согласия Пирсона проверить гипотезу о распределении случайной величины ξ по биномиальному закону с уровнем значимости
02 0
q
(параметр p биномиального закона оценить по выборке).
8. а) Работники рыбного хозяйства выясняли пригодность некоторого озера для разведения карпов, запустив в это озеро 200 меченых мальков и отследив продолжительность их жизни.
Длительность жизни карпов (в месяцах) приведена в файле pearson-
8a.txt. C помощью критерия Пирсона проверить гипотезу о распределении продолжительность жизни карпов по показательному закону с уровнем значимости
05 0
q
б) Опыт, состоящий в одновременном подбрасывании 4 монет, повторили 200 раз. Данные о том, сколько "гербов" выпало при каждом из повторений опыта, приведены в файле pearson-8b.txt. С помощью критерия Пирсона проверить гипотезу о распределении числа одновременно выпадающих "гербов" по биномиальному закону с уровнем значимости
03 0
q
9. а) Производителем компьютерной техники проводился эксперимент по выявлению длительности безотказной работы жестких дисков. Было исследовано 300 жестких дисков, результаты эксперимента представлены в файле pearson-9a.txt. С помощью критерия Пирсона проверить гипотезу о распределении длительности безотказной работы дисков по показательному закону с уровнем значимости
02 0
q
б) В обувном магазине решили выявить наиболее ходовой размер женской обуви. Для этого продавцы фиксировали размер
78 каждой проданной пары обуви. Данные приведены в файле pearson-
9b.txt. С помощью критерия Пирсона проверить гипотезу о распределении предпочтений покупателей относительно размера обуви по закону Пуассона с уровнем значимости
04 0
q
10. а) Была собрана статистика о продолжительности жизни жителей Красноярска. Данные о продолжительности жизни 1000 человек приведены в файле pearson-10a.txt. С помощью критерия
Пирсона проверить гипотезу о распределении продолжительности жизни красноярцев по нормальному закону с уровнем значимости
2 0
q
б) Среди семян ржи имеется некоторое количество семян сорняков. В 300 пакетах семян по 500 штук посчитали количество семян сорняков. Данные приведены в файле pearson-10b.txt. С помощью критерия Пирсона проверить гипотезу о распределении предпочтений покупателей относительно размера обуви по биномиальному закону с уровнем значимости
05 0
q
(параметр p оценить по выборке).
11. а) В одном из родильных домов была собрана статистика о весе новорожденных мальчиков, родившихся в течение года.
Данные о весе 500 детей приведены в файле pearson-11a.txt. С помощью критерия Пирсона проверить гипотезу о равномерном распределении веса новорожденных мальчиков с уровнем значимости
01 0
q
б) Оператор сотовой связи ведет учет количества смс, отправленных за день ее абонентами. Данные о количестве смс, отправленных 600 абонентами за 1 день приведены в файле pearson-
11b.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества отправленных смс по закону Пуассона с уровнем значимости
01 0
q
12. а) Имеются данные о количестве электроэнергии, потребленной за 1 месяц жителями 500 квартир. Данные приведены в файле pearson- 12a.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества потребленной энергии по равномерному закону с уровнем значимости
05 0
q
б) Любительница бразильских сериалов стала записывать, сколько серий продолжался каждый из просмотренных ею фильмов.
Данные о количестве серий в 120 сериалах приведены в файле pearson-12b.txt. С помощью критерия Пирсона проверить гипотезу о
79 распределении количества серий в сериалах по биномиальному закону с уровнем значимости
05 0
q
13. а) На молочной ферме в течении недели регистрировали удои коров. В файле pearson-13a.txt приведены средние удои за неделю 120коров. С помощью критерия Пирсона проверить гипотезу о нормальном распределении удоев коров на молочной ферме с уровнем значимости
04 0
q
б) Студентами 1 курса (400) человек была написана контрольная по русскому языку. Результаты контрольной (по 100 бальной шкале) приведены в файле pearson-13b.txt. С помощью критерия Пирсона проверить гипотезу о распределении баллов студентов по биномиальному закону с уровнем значимости
02 0
q
14. а) На некотором месторождении было взято 100 проб руды на содержание железа. Данные о процентном содержании железа в каждой пробе приведены в файле pearson-14a.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества потребленной энергии по равномерному закону с уровнем значимости
05 0
q
б) Данные о количестве заказных писем, отправленных через некоторое почтовое отделение за 1 день в течение последних 3 месяцев (90 дней) приведены в файле pearson-14b.txt. С помощью критерия Пирсона проверить гипотезу о распределении числа отправляемых в день писем по закону Пуассона с уровнем значимости
05 0
q
15. а) На мелькомбинате было переработано 800 тонн зерна, данные о количестве муки, получившейся из каждой тонны зерна, приведены в файле pearson-15a.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества полученного при переработке зерна муки по равномерному закону с уровнем значимости
02 0
q
б) На автозаправочной станции 5 суток регистрировали количество автомобилей, заправившихся на бензоколонке в течение каждого часа. Данные приведены в файле pearson-15b.txt. С помощью критерия Пирсона проверить гипотезу о распределении количества заправляющихся на бензоколонке автомобилей в течение
80 часа по биномиальному закону с уровнем значимости
05 0
q
16. а) Таксист в течение 3 месяцев (90 дней) измерял расход бензина на своей машине (в литрах на 100 километров). Данные его измеренийприведенывфайлеpearson-
16a.txt.СпомощьюкритерияПирсона проверить гипотезу о распределении количества потребляемого топлива по нормальному закону с уровнем значимости
05 0
q
б) В библиотеке проверили 400 книг на наличие недостающих страниц. В файле pearson-16b.txt приведены данные о том, сколько страниц не доставало в каждой книге. С помощью критерия Пирсона проверить гипотезу о распределении числа недостающих в книгах страниц по закону Пуассона с уровнем значимости
01 0
q
17. а) Интернет-провайдер ведет статистику интернет- трафика для каждого абонента. В файле pearson-17a.txt приведен объем входящего трафика (в мегабайтах) для каждого из 500 абонентов сети за 1 неделю. С помощью критерия Пирсона проверить гипотезу о распределении количества потребленной энергии по показательному закону с уровнем значимости
05 0
q
б)
В файле pearson-17b.txt приведены результаты социологического опроса о том, сколько книг за год прочитал каждый из опрошенных (всего 1000 человек). С помощью критерия
Пирсона проверить гипотезу o распределении числа недостающих в книгах страниц по закону Пуассона с уровнем значимости
02 0
q
18. а) Оператор сотовой связи ведет учет времени разговоров своих абонентов по исходящей связи. Данные о количестве минут, которые каждый из 500 абонентов проговорил по исходящей связи за 1 сутки, приведены в файле pearson-18a.txt. С помощью критерия
Пирсона проверить гипотезу о длительности разговоров абонентов по исходящей связи по показательному закону с уровнем значимости
03 0
q
б) В файле pearson-18b.txt. приведены данные о том, сколько ограблений совершалось ежедневно за последние полгода (180 дней) в городе N. С помощью критерия Пирсона проверить гипотезу о распределении числа ограблений, совершаемых за одни сутки по биномиальному закону с уровнем значимости
04 0
q
19. а) В файле pearson-19a.txt приведены данные о курсе некоторой валюты (в рублях) за последние полгода (180 дней). С помощью критерия Пирсона проверить гипотезу о распределении
81 стоимости этой валюты по нормальному закону с уровнем значимости
05 0
q
б) На консультации перед экзаменом преподаватель решил выяснить степень готовности студентов. Он спросил каждого о том, сколько вопросов студент уже подготовил (всего на экзамен вынесено 40 вопросов). Данные о готовности 120 студентов приведены в файле pearson- 19a.txt. С помощью критерия Пирсона проверить гипотезу о распре-делении числа подготовленных студентами вопросов по биномиальному закону с уровнем значимости
05 0
q
20. а) В файле pearson-20a.txt приведена стоимость 1 килограмма говядины в 150 магазинах города. С помощью критерия
Пирсона проверить гипотезу о распределении стоимости говядины по нормальному закону с уровнем значимости
04 0
q
б) Среди студентов университета (300 человек) был проведен опрос о количестве фильмов, просмотренных ими в кинотеатрах.
Данные опроса приведены в файле pearson-20b.txt. С помощью критерия Пирсона проверить гипотезу о распределении числа просмотренных в кинотеатрах фильмов по закону Пуассона с уровнем значимости
03 0
q