2 Статистические методы анализа и обработки экспери-
ментальных данных
2.1 Интервальная оценка параметров
2.1.1 Приближенные методы построения доверительных интерва-
лов
В ряде задач требуется не только найти для параметра a подходящее численное значение, но и оценить его точность и надежность. Требуется знать – к каким ошибкам может привести замена неизвестного параметра a его точечной оценкой a
(точечная оценка - оценка, которая определяется од- ним числом) и с какой степенью уверенности можно ожидать, что эти ошиб- ки не выйдут за известные пределы.
Такого рода задачи особенно актуальны при малом числе наблюде- ний, когда точечная оценка
a
в значительной мере случайна и приближенная замена
a на a
может привести к серьезным ошибкам.
Чтобы дать представление о точности и надежности оценки a
, в ма- тематической статистике пользуются так называемыми
доверительными ин-
тервалами и доверительными вероятностями.
Интервальной называют оценку, которая определяется двумя числами
– концами интервала.
Все оценки параметров распределения выборки носят случайный ха- рактер и от параметров генеральной совокупности могут сильно отличаться.
Нас интересует интервал
J
)
,
(
ε
ε
+
− a
a
, который с заданной надежностью
β
накрывал бы неслучайное значение параметра генеральной совокупности
a , такой интервал называется доверительным. Понятия надежность и дове- рительная вероятность равнозначны. Обычно величину доверительной веро- ятности принимают в пределах от 0.95 до 0.99.
Нахождение доверительных интервалов основано на том, что матема- тическое ожидание, дисперсия и сама оценка распределена по нормальному закону. Как при заданной надежности
β
(доверительной вероятности) найти интервал
J
)
,
(
ε
ε
+
− a
a
, чтобы этим интервалом накрыть оценку параметра
a ? В данном случае
ε
– выступает как мера точности. Приближенный ме- тод нахождения интервала заключается в том, что в выражении для
ε
неиз- вестные параметры заменяют их точечными оценками. При сравнительно большом числе опытов n (порядка 20-30) этот прием обычно дает удовлетво- рительные по точности результаты.
Вероятность того, что оценка не превысит интервал
ε
– подчиняется нормальному закону:
(
)
β
σ
ε
ε
=
⋅
=
≤
−
2
а
Ф
а
а
Р
,
24
отсюда получим следующее выражение:
( )
β
σ
ε
1
2
−
=
⋅
Ф
а
, где
ε
– точность оценки;
( )
β
1
−
Ф
– функция Лапласа.
Это выражение позволит рассчитать точность оценки
а
t
σ
β
ε
⋅
=
, где
а
σ
– среднеквадратичное отклонение оценки параметра
a ;
β
t – распределение Лапласа (определяется в зависимо- сти от величины доверительной вероятности
β
(таблица 2.1)).
Таблица 2.1 – Распределение Лапласа
β
t
β
0,9 0,95 0,975 0,99
β
t
1,643 1,960 2,247 2,576
В качестве примера рассмотрим задачу о доверительном интервале для математического ожидания.
Точность оценки определим по формуле:
β
σ
ε
t
x
m
⋅
=
, с другой стороны среднеквадратическое отклонение оценки математического ожидания равно
β
ε
σ
σ
t
n
x
m
=
=
, отсюда получим количество опытов
2
⋅
=
ε
σ
β
t
n
25
Пример
№ 1. В результате равноточных измерений получили ошибку измерения
0 3
′′
=
σ
, а
5 1
′′
=
x
m
σ
. Сколько необходимо произвести опытов, что- бы обеспечить заданную точность и надежность?
Зададим величину доверительной вероятности
,
9
,
0
=
β
тогда
643
,
1
=
β
t
Если выбрать доверительный интервал 5′′ секунд, то по формуле по- лучим:
97 5
643
,
1 30 2
=
⋅
=
n
опытов.
Если выбрать доверительный интервал 5 1 ′′ секунд, то по формуле получим:
11 15 643
,
1 30 2
=
⋅
=
n
опытов.
Вывод: С увеличением доверительного интервала, количество опы- тов уменьшается, чтобы интервалом накрыть нашу оценку.
Пример
№ 2. Построить доверительный интервал
J
(
)
ε
ε
+
− a
a
,
при доверительной вероятности
9
,
0 1
=
β
и 99
,
0 2
=
β
, если
2
,
6553
=
m
м, а
7
,
16
=
x
m
σ
м.
Из таблицы 2.1 643
,
1 1
=
β
t
и 576
,
2 2
=
β
t
;
x
m
t
1 1
σ
ε
β
⋅
=
; 44
,
27 643
,
1 7
,
16 1
=
⋅
=
ε
м;
x
m
t
2 2
σ
ε
β
⋅
=
;
02
,
43 576
,
2 7
,
16 2
=
⋅
=
ε
м;
J
(
)
44
,
27 2
,
6553
;
44
,
27 2
,
65532
+
−
,
J
(
)
02
,
43 2
,
6553
;
02
,
43 2
,
65532
+
−
2.1.2 Точные методы построения доверительных интервалов
(применительно к математическому ожиданию и дисперсии)
До сих пор при определении доверительных интервалов пользова- лись статистикой нормального закона распределения.
(
)
(
)
⋅
=
=
<
−
2
x
m
x
x
Ф
m
m
Р
σ
ε
β
ε
26
Нормальный закон дает хорошие результаты при большом количестве выборки n. При малом количестве выборки n лучше пользоваться статисти- кой Стьюдента.
Формула Стьюдента очень сложная и имеет вид:
(
)
2 2
1 1
1 2
1 1
2
n
n
n
t
n
Г
n
n
Г
S
t
−
−
−
+
−
⋅
−
=
=
π
, где
( )
du
u
e
n
Г
n
u
∫
⋅
=
∞
−
−
0 1
– Гамма функция.
Для удобства работы с функцией Стьюдента вводится новая пере- менная
1
−
∈
−
=
n
x
x
S
n
m
m
T
D
, где
1
−
n
S
– распределение по закону Стьюдента (представлен- ное в виде таблицы приложения Г);
x
m
– оценка математического ожидания;
Д
– оценка дисперсии распределения.
Тогда в новых переменных функцию распределения запишем в виде:
( )
β
ε
β
ε
1
−
=
=
=
<
−
S
n
S
n
n
m
m
Р
x
x
Д
Д
Д
, отсюда
( )
β
σ
ε
1
2
−
=
⋅
S
x
m
, и ошибка будет равна
( )
1
β
ε
−
=
S
n
Д
27
Точный метод основан на использовании закона распределения Стью- дента.
Пример № 3. Имеем выборку.
Таблица 2.2
N
1 2 3 4 5 6 7 8 9 10
x
∆
-10 0 10 10 -5 50 -10 50 5 10
Определить положение центра группирования
x
m
и доверительный интервал
J
с надежностью
β
1 Определим оценку математического ожидания
10
1
1
=
∑
→
∆
=
=
x
i
x
m
x
n
m
n
i
м.
2 Оценка среднего квадратического отклонения
(
)
2
,
22
1 1
1 2
=
∑
−
−
=
=
n
i
x
i
x
m
x
n
σ
м.
3
Оценка среднего квадратического отклонение математического ожидания
01
,
7
=
=
n
x
x
m
σ
σ
м.
4
Доверительный интервал определяется с помощью таблиц распре- деления Стьюдента по формуле:
( )
β
σ
ε
1
−
⋅
=
S
x
m
5
Число степеней свободы равно n-1=9. Из таблицы Стьюдента опре- деляем:
( )
( )
,
25
,
3 99
,
0
,
833
,
1 9
,
0 1
1
=
→
=
=
→
=
−
−
β
β
β
β
S
S
тогда 849
,
12 1
=
ε
, а 78
,
22 2
=
ε
, то есть при
9
,
0
=
β
оценка
x
m
попадает в ин- тервал,
J
1
(
)
,
869
,
19
;
839
,
5
−
=
а с надежностью 99
,
0
=
β
имеем интервал
J
2
(
)
78
,
32
;
75
,
12
−
=
Если оценку проводить не по закону Стьюдента, а по нормальному закону то получим следующие результаты.
28
При
9
,
0
=
β
tβ
=1,643, при 99
,
0
=
β
tβ
=2,576.
Ошибка в определении интервала
ε
при
9
,
0
=
β
11.26/12.89 состав- ляет 13 %, при 99
,
0
=
β
18,06/22,79 составляет 12 %.
2.2 Статистическая проверка гипотез С теорией статистического оценивания параметров тесно связана проверка статистических гипотез. Она используется всякий раз, когда необ- ходим обоснованный вывод о преимуществах того или иного способа инве- стиций, измерений, стрельбы, технологического прогресса, об эффективно- сти нового метода обучения, управления, о пользе вносимого удобрения, лекарства, об уровне доходности ценных бумаг, о значимости математиче- ской модели и т.д.
Определение.Статистической гипотезой называется любое пред- положение о виде или параметрах неизвестного закона распределения.
Различают
простую и
сложную статистические гипотезы. При про- стых гипотезах обязательно известен закон распределения исследуемой случайной величины и оценка математического ожидания строго равна таб- личному значению. При проверке сложных гипотез не известен
закон рас- пределения случайной величины, и нет строгого равенства между таблич- ным значением и оценкой математического ожидания.
Проверяемую гипотезу обычно называют
нулевой (или основной) и обозначают
0
HНаряду с нулевой гипотезой
0
Hрассматривают
альтерна-тивную, или
конкурирующую, гипотезу
1
H, являющуюся логическим отри- цанием
0
H. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Правило, по которому гипотеза
0
Hотвергается или принимается, называется
статистическим критерием или статистическим тестом.
Все проверки гипотез дают ответ с определенной степенью надеж- ности. Для этого задается уровень значимости.
Определение. Вероятность
α
допустить ошибку 1-го рода, то есть отвергнуть гипотезу
0
H, когда она верна, называется
уровнем значимости критерия. Вероятность допустить ошибку 2-го рода, то есть принять гипотезу
0
H, когда она неверна, обычно обозначают
β
Определение. Вероятность
(
)
β
−
1
не допустить ошибку 2-го рода, то есть отвергнуть гипотезу
0
H, когда она неверна, называется
мощностью (или функцией мощности) критерия. Различают
двусторонний критерий и
односторонний. При двусто- роннем критерии назначается доверительная вероятность, и отсекаются
«хвосты» нормального распределения, то есть они для нас незначимы.
29
Если рассматриваем статистику
2
χ
(хи-квадрат), то тоже имеем два
«хвоста», которые для нас незначимы (рисунки 2.1, 2.2).
Если изменение физической величины происходит только в одну сторону, то необходимо рассматривать односторонний критерий (рисунок
2.3).
Уровень значимости
α
это число, дополняющее доверительную ве- роятность
β
до единицы. Доверительная вероятность, это синоним надеж- ности, или по-другому степень уверенности.
Значимость с точки зрения проверки гипотезы означает принять ги- потезу с определенной уверенностью или отвернуть ее, если оценка попада- ет в интервал не принятия гипотезы.
Для проверки гипотез вводится случайная величина, для которой обязательно известен закон распределения. Эта случайная величина прак- тически реализуется на интервале, который мы будем разделять на зону принятия и не принятия гипотезы. Чтобы указать эту зону не принятия ги- потезы, задаем уровень значимости
α
. При этом если критерий односто- ронний, то
)
(
кр
x
x
p
>
=
α
x
Рисунок 2.1 – Нормальный закон
Рисунок 2.2 – Двустороннее распределение
2
χ
x
f(x)
α
/2
α
/2
x
β
2
χ
α
/2
α
/2
β
Рисунок 2.3 – Одностороннее распределение
2
χ
2
χ
α
β
x
30
Для двустороннего критерия имеем:
=
−
<
=
>
2
)
(
2
)
(
α
α
кр
кр
x
x
p
x
x
p
Если результат оценки параметра попадает в область
2
/
α
, то гипотеза отвергается, если нет, то гипотеза принимается с надежностью
α
β
−
=
1
Данный подход широко используется при оценке качества продук- ции. Так если по выборке из партии оценка результата попадает в интервал
α
, то партия бракуется. Уровень значимости назначают от 1
% до 10%, то есть от величины
α
зависит величина заслона некачественной продукции.
Не случайно для продукции, которая выпускается на экспорт уровень зна- чимости
α
– очень велик. Если уровень значимости
α
низкий, то вероят- ность пропустить некачественную продукцию увеличивается.
Однако, при оценке продукции можно забраковать хорошую партию изделий из-за некачественной выборки. Это и есть ошибка второго рода.
Ошибка второго рода рассматривается, когда вводится конкури- рующая гипотеза.
1 1
0
:
:
x
x
x
x
m
m
H
m
m
H
=
=
Графически гипотезы представим на рисунке 2.4
На рисунке 2.4 мы видим, что
α
– это риск поставщика, вероятность забраковать качественную продукцию (отвергнуть гипотезу
Н
0
).
0
H
таб
x
m
α
x
β
1
x
m
1
H
1
-
β
Рисунок 2.4 – Конкурирующие гипотезы
– табличное
31
β
– это риск заказчика, вероятность принятия неверной гипотезы.
1
–
β
– вероятность отвергнуть неверную гипотезу (функция мощности критерия).
Если
α
уменьшать, то
β
будет увеличиваться, то есть если риск по- ставщика уменьшить, то риск заказчика будет увеличиваться.
Функция мощности критерия в зависимости от
β
приведена в табли- це 2.3.
Таблица 2.3 – Функция мощности критерия
α
1
% 2,5
% 5
% 10
%
1
–
β
0,627 0,728 0,800 0,867
β
0,373 0,272 0,200 0,133
Мощность критерия подчиняется статистике
2
χ
:
∫
⋅
=
−
−
−
2 2
1 2
2 1
1
x
x
m
x
x
σ
σ
π
β
l
Итак, допустим, полученное математическое ожидание
m
x1
отлича- ется от табличного значения. Приняли гипотезу в виде закона распределе- ния случайной величины
m
x1
. Значения
α
и
β
назначили. Необходимо опре- делить количество опытов, чтобы удовлетворить заданным
α
и
β
Имея уровень доверительной вероятности
α
для нормального закона, запишем:
(
)
dy
dx
H
x
x
p
x
x
кр
m
x
y
кр
x
x
x
m
x
x
кр
⋅
⋅
=
⋅
⋅
⋅
=
>
=
∫
∫
∞
−
−
∞
−
−
σ
π
σ
π
α
σ
2 2
2 2
2 1
2 1
/
)
(
2 0
l l
;
– для гипотезы
0
Н
:
(
)
( )
dx
H
x
x
p
кр
x
x
x
m
x
x
кр
⋅
∫
⋅
⋅
=
>
=
−
∞
−
−
2 2
1 2
1 2
1
/
1
σ
σ
π
β
l
;
– для новой гипотезы
H
1
:
y
кр
α
=(х
кр
-m
х
)/
σ
х
,
где
m
x
– табличное значение.
32
y
кр
1-
β
=(х
кр
-m
х1
)/
σ
х
,
где
m
x1
– конкурирующее значение.
Произведем замену переменных
x
кр
M
x
=
,
x
M
– случайная величина (оценка), имеет отклонение
n
x
x
M
σ
σ
=
, тогда
;
n
m
M
y
x
x
x
кр
σ
α
−
=
1 1
n
m
M
y
x
x
x
кр
σ
β
−
=
−
Выразим из формулы
x
M
и вычтем уравнения
;
1 1
x
x
кр
x
кр
m
n
y
M
m
n
y
M
x
x
x
+
=
−
+
=
−
σ
σ
β
α
(
)
x
x
x
кр
кр
m
m
n
y
y
−
−
⋅
−
=
−
1 1
0
σ
β
α
, отсюда число опытов при заданных
α
и
β
x
x
x
кр
кр
m
m
y
y
n
σ
β
α
⋅
−
−
=
−
1 1
33
Общая схема проверки статистических гипотез.
1 Выдвигаются две гипотенузы
Н
0
и её альтернатива
Н
1
2 Выбирается критерий или статистика, по которой будут проверяться гипотезы.
3 Назначается уровень значимости, то есть ошибка1-го рода:
(
)
(
)
2
/
α
α
=
>
=
>
кр
кр
x
x
p
x
x
p
если критерий двусторонний –
α
делится на две области.
По величине
α
устанавливаем границу
х
кр.
4 Правило принятия решения.
Если опытное значение критерия оказалось в критической области, то есть в
α
,
гипотеза
Н
0
– отвергается.
Если статистика попала в область, определенную 1
–
α
то, следова- тельно, делается вывод – опытные данные не противоречат гипотезе
Н
0
5 Проверка уровня мощности критерия 1
–
β
.
По 1
–
β
находится риск заказчика
β
, и только проанализировав его, принимается решение провести дополнительные исследования или принять гипотезу.
Пример
№ 4.
Стреляют три гаубицы по три выстрела каждая. Обна- ружено отклонение центра группирования от табличного.
Ошибка дальномера при определении дальности
σ
2
= 16 м,
m
x
= 20 м
– табличное значение,
m
x1
= 22 м – опытное значение.
Необходимо принять решение, что математическое ожидание
m
x
= 20 м, а
m
x1
= 22 м – это следствие ограниченной выборки.
Выдвигаем гипотезы
22
:
;
20
:
1 1
0
м
m
H
м
m
H
x
x
=
=
Выбираем статистику – нормальный закон распределения, так как математическое ожидание распределено по нормальному закону. В качест- ве статистического критерия выбираем оценку математического ожидания.
,
/
;
,
/
1 1
0
n
H
m
N
n
H
m
N
x
x
x
x
σ
σ
- односторонний критерий;
- двусторонний критерий,
34
По условиям задачи выбираем односторонний критерий. Назначим
α
=0,05. По
α
надо определить
х
кр.
(критическое).
3 4
;
2 1
05
,
0
2
2 2
20
=
⋅
∫
⋅
⋅
=
=
∞
−
−
n
m
d
n
x
кр
x
x
кр
x
m
кр
x
m
кр
x
m
σ
σ
π
α
σ
l
;
3 4
2 1
05
,
0
2 2
3 4
2 20
кр
x
m
m
d
кр
x
m
кр
x
⋅
∫
⋅
=
∞
−
−
l
π
Производим замену переменных
y
m
кр
x
=
−
3 4
20
;
;
-
05 0
3 4
20
2 1
2 1
2 1
3 4
20
2 0
2 2
2
,
m
Ф
dy
dx
кр
x
y
x
кр
x
m
x
=
−
=
⋅
∫
⋅
=
⋅
∫
⋅
=
∞
−
−
−
l l
π
π
α
;
45
,
0 3
4 20
=
−
кр
x
m
Ф
м
m
m
кр
x
кр
x
2
,
22
65
,
1 3
4 20
=
→
=
−
То есть мы попали не в критическую область, но находимся очень близко к ней.
35
Рисунок 2.5 – Конкурирующие гипотезы
Следовательно, m
x1
не принадлежит критической области, поэтому гипотезу Н
0
отвергнуть нельзя. Так как m
x1
близко расположена к критиче- ской области, то произведем оценку риска заказчика 1 –
β
.
Оценим риск заказчика: вычислим площадь 1 –
β
конкурирующей альтернативы
=
⋅
∫
⋅
⋅
=
−
∞
−
−
кр
x
m
x
m
d
n
кр
x
2 1
1 2
,
22 2
3 4
2 2
22
l
σ
π
β
=
=
⋅
∫
⋅
=
∞
−
3 4
22 2
22 2
1 2
1 2
,
22 2
2
-
,
Ф
dy
y
-
l
π
(
)
4404 0
0596 0
5 0
15 0
2 1
,
,
,
,
-Ф
=
−
=
=
то есть
5596
,
0
=
β
Риск заказчика очень велик. Теперь попробуем изменить α и по- смотрим, что будет с нашими гипотезами. Увеличим уровень значимости с
0,05 до 0,1.
0
H
20 0
/
=
H
x
m
α
2
,
22
=
кр
x
m
m
x
β
22 1
/
=
H
x
m
1
H
1-
β
36
кр
x
x
m
d
n
кр
x
m
кр
x
m
2 1
1
,
0 2
3 4
2 2
20
⋅
∫
⋅
⋅
=
∞
−
−
l
σ
π
По другому уровню находим новое
кр
x
m
1
,
0 20
2 1
=
−
3
4
-
кр
x
m
Ф
;
4
,
0 20
=
−
3
4
кр
x
m
Ф
;
7
,
21 7
,
1 20
28
,
1 20
=
+
=
→
=
−
кр
x
кр
x
m
m
3
4
;
22 1
=
H
m
x
То есть наша оценка при уровне значимости 0,1 попала в критиче- скую область. Гипотезу Н
0
– отвергаем.
Теперь “подвигаем” гипотезу. Выберем
α
– старое (
α
= 0,05), а опытное значение оценки математического ожидания получили не 22 м, а
24 м.
То есть
24 1
=
H
m
x
,
=
⋅
∫
⋅
⋅
=
−
∞
−
−
кр
x
x
m
d
n
кр
x
m
кр
x
m
2 1
1
2 3
4 2
2 24
l
σ
π
β
37
( )
9115
,
0 35
,
1 2
1 3
4 24 2
22 2
1
=
+
=
=
Ф
-
,
Ф
-
, следовательно 0885
,
0
=
β
То есть, если опытное значение равно 24 гипотеза Н
0
отвергается и при этом риск заказчика очень маленький.
Сколько же необходимо сделать опытов, чтобы при заданных α и β решить вопрос о преемственности (приеме) выборки.
Не известно n и не известно
кр
x
m
, задано
α
= 0,05 – 5 % и β = 0,1 –
10 %. Какую выборку нужно сделать?
;
4 2
1 05
,
0
2 4
2 2
20
кр
x
m
d
n
кр
x
m
n
кр
x
m
⋅
∫
⋅
⋅
=
=
∞
−
−
l
π
α
;
4 20
2 1
05
,
0
−
−
=
n
m
Ф
кр
x
=
⋅
∫
⋅
⋅
=
=
−
∞
−
−
кр
x
m
d
n
кр
x
m
n
кр
x
m
4 2
1 9
,
0 1
2 4
2 2
22
l
π
β
;
4 22
2 1
9
,
0
=
=
n
m
Ф
кр
x
-
-
38
=
−
→
−
=
=
→
=
.,n-m,n-m,n-m,n-mкрxкрxкрxкрxФФ28 1
4 22
4 0
4 22
65 1
4 20
45 0
4 20
Решая данную систему уравнений, получим количество опытов не- обходимое для удовлетворения заданных
α
и
β равное
n = 35. При
n = 35 получаем, что
126
,
21
=
крxm. То есть гипотеза
Н0 отвергается, поскольку
22
0
=
xm (наша оценка) попадает в критическую область.
Если в результате 35 опытов среднее значение
0
xm окажется меньше
126
,
21
=
крxm, то мы будем обязаны принять гипотезу
Н0