2.3 Проверка гипотезы о равенстве среднеквадратичной оценки
выборочной оценки самой среднеквадратичной генеральной совокупно-
сти
Имеем выборку объёма n из генеральной совокупности
n
x
x
x
...,
,
,
2 1
, тогда оценка:
(
)
∑
−
−
=
2
1 1
x
i
m
x
n
σ
Известно
Г
σ
генеральной совокупности. Необходимо проверить ги- потезу
Г
H
σ
σ
=
:
0
. Для оценки гипотезы вводим статистику V . Считаем, что переменная V принадлежит
2
χ
(хи-квадрат) распределению с n – 1 степенью свободы
(
)
2 1
2 2
1
−
∈
−
⋅
=
n
Г
n
V
χ
σ
σ
Проверка гипотезы осуществляется в следующем порядке.
Берется односторонний критерий и по заданной доверительной ве- роятности
α
и n по таблице
χ
2
определяется
ρ
к
V .
39
Затем сравнивается опытное значение
кр
оп
V
с
V
. Если
оп
V
попало в критическую область, то гипотезу Н
0
отвергаем. Если
кр
оп
V
V
<
(попали в левую часть характеристики), то делают вывод: опытные данные не проти- воречат гипотезе Н
0
Если нет конкурирующей гипотезы, то гипотеза просто принимается.
2.4 Оценка равенства дисперсий двух выборок
Имеем две выборки объёмом n и m.
;
2 21 1
11
m
n
x
x
m
II
x
x
n
I
K
K
K
K
−
−
Оценки дисперсий будут иметь вид
(
)
∑
−
−
=
∑
−
−
=
=
=
m
j
n
i
x
j
x
i
m
x
m
m
x
n
1 1
1 1
;
1 1
2 2
2 2
2 2
1 1
2 1
σ
σ
Выдвигается гипотеза о равенстве дисперсий
2 2
2 1
0
:
σ
σ
=
H
Вводим статистику
(
)
(
)
2 1
2 2
2 2
;
2 1
2 2
1 1
1
1
−
−
∈
−
⋅
=
∈
−
⋅
=
m
Г
n
Г
m
V
и
n
V
χ
σ
σ
χ
σ
σ
x
2
α
= p (V>V
кр
)
V
β
Рисунок 2.6 – Распределение
2
χ
40
Рассмотрим отношение
(
)
1
,
1
1 1
2 2
2 1
2 1
−
−
∈
=
−
−
=
m
n
F
m
V
n
V
F
σ
σ
Данное отношение дисперсии принадлежит распределению Фишера со степенями свободы n – 1 и m – 1. Рассмотрим на примере односторонний критерий.
Пример № 5. Имеем две выборки n
1
= 11 и n
2
= 14. Найденные оцен- ки дисперсии равны 76
,
0
2 1
=
σ
и 38
,
0
2 2
=
σ
. Необходимо при уровне значимости α = 0,05 проверить гипотезу
:
;
:
2 2
2 1
1 2
2 2
1 0
σ
σ
σ
σ
>
=
H
H
По заданному
α
найдем F критическое для n – 1 и m – 1. Из таблицы
Фишера F
кр
(10,13) = 2,67 определяем:
2 38
,
0 76
,
0
2 2
2 1
=
=
=
σ
σ
F
, следовательно
кр
оп
F
F
<
, поэтому опытные данные не противоречат гипо- тезе Н
0
. Возьмем уровень доверительной вероятности
α
= 0,1. По таблице
Фишера (приложение В) F (10, 13) = 2,14. Следовательно, гипотеза Н
0
при- нимается (рисунок 2.7).
Рисунок 2.7 – Распределение Фишера для одностороннего критерия
H
0
2, 67
F
2 2,14
41
Рассмотрим двусторонний критерий. Для этого α = 0,1 делим пополам. Для двустороннего критерия выдвигаем две гипотезы
:
;
:
2 2
2 1
2 2
2 1
1 0
σ
σ
σ
σ
≠
=
H
H
Если оценка попадает внутрь интервала, то исходные данные не про- тиворечат гипотезе Н
0
Для двустороннего критерия мы имеем следующую статистику Фи- шера.
Рисунок 2.8 – Распределение Фишера для двустороннего критерия
2
α
=
<
кр
F
F
P
По таблице Фишера определим:
05
,
0 2
1
=
=
<
α
кр
F
F
P
,
Поэтому
2 1
1 1
α
=
>
кр
F
F
P
,
37
,
0 67
,
2 1
;
67
,
2 1
1 1
=
=
=
кр
кр
F
F
– левый интервал.
Получили двусторонний интервал меньше 0,37 и больше 2,67. Наша оценка находится в интервале принятия решения.
H
0
α
/2
F
2
F
1кр
0,37
F
2кр
2,67
α
/2
42
2.5 Оценка однородности дисперсии Оценка однородности дисперсии это оценка принадлежности дис- персии одной генеральной совокупности. Данная оценка производится по критерию Кохрена. Имеется
К выборок
2 2
2 2
1
...,
,
,
kσ
σ
σ
. Несмотря на то, что все дисперсии различны, они все из одной выборки. Необходимо оценить однородность дисперсий. Кохрен ввел статистику
G. { }
∑
=
=
kiiiG0 2
2
max
σ
σ
Величина
G - имеет распределение Кохрена (приложение A). Для применения распределения Кохрена необходимо, чтобы выборки по всем дисперсиям были одинаковы.
По заданному уровню значимости находим
Gкр.
Рассчитываем
опG опытное значение. Если
кропGG>
- то гипотеза отвергается.
Пример № 6. Имеем четыре независимых выборки (объемом
n = 17) из нормальной совокупности
40
,
0
;
34
,
0
;
25
,
0
;
21
,
0
:
2
σ
При доверительной вероятности
05
,
0
=
α
проверить гипотезу однородности дисперсии
{ }
3 1
20
,
1 40
,
0
max
1 2
2
=
=
∑
=
=
kiiiопGσ
σ
По таблице Кохрена для числа степеней свободы
n = 17 – 1 = 16 и количества в выборке
N = 4 дисперсий находим
Gкр = 0,4366. Так как,
кропGG<
, то гипотеза об однородности принимается.
2.6 Оценка сомнительных результатов Допустим, получили результаты из одной генеральной совокупно- сти, для которой некоторые результаты выборки вызывают сомнение. Воз- никает вопрос: какие наблюдения оставить в выборке, а какие выбросить?
Для решения данной задачи существует ряд критериев. Рассмотрим их на примерах.
1
Провели пять выстрелов из гаубицы, имеем следующий ряд точек попадания снарядов по дальности [M]
L: 3200; 3225; 3230; 3245; 3600.
Подозрительным является результат 3600 м. Если данный результат находится в пределах
σ
3 для нормального распределения, то мы имеем
3300
=
xmм, а
5
,
168
=
xσ
м. Если результат 3600 исключить из выборки как
43
аномальный, то получим следующие оценки: 2580
=
x
m
м, а
6
,
12
=
x
σ
м. Как видим, среднее квадратичное (сигма) отличается на порядок.
1 Критерий об оценке сомнительных результатов предполагает, что
Г
σ
- генеральной совокупности известная величина. Вводится статистика
Г
x
m
x
t
σ
max
−
=
Данная статистика распределена не по нормальному закону, но по- хожа на нормальный закон (рисунок 2.9).
1
;
0
;
1
,
0
max
n
n
m
n
n
N
m
x
t
t
t
Г
x
−
=
=
−
∈
−
=
σ
σ
Нормируем случайную величину
( )
1
,
0 1
N
n
n
t
Z
∈
−
=
Запишем через нормальный закон распределения вероятность попа- дания в критическую область
dz
l
z
кр
z
⋅
∫
−
=
−
2 2
0 2
1 2
1 2
π
α
Рисунок 2.9 – Нормальный закон распределения
α
/2
α
/2
z
Z
кр
По заданному уровню значимости находим
крz (смотреть приложение
Д). Рассчитываем
опt опытное значение. Если
кропtt>
, то сомнительный ре- зультат отбрасывается
2 Если
xσ
генеральной совокупности неизвестно, то в этом случае вводим статистику, которая принадлежит критерию Смирнова – Гребса
xxmxtσ
max
−
=
Распределение Смирнова – Гребса имеет оценку
(
)
∑
−
=
=
nixixmxn1 2
1
σ
В таблице имеем такую оценку
(
)
∑
=
−
−
=
nixixmxn1 2
1 1
σ
Для перехода к распределению Смирнова – Гребса все результаты на- до увеличить на
1
−
nn . Для нашего примера:
78
,
1 5
,
168 3300 3600
=
−
=
опt, табличное критическое значение равно
2
,
2
=
крtПолучили
опытное значение меньше критического, значит, подозри- тельный результат следует оставить в выборке.
3 Распределение Смирнова – Гребса по одному выбросу.
Вводится статистика Гребса
(
)
(
)
∑
∑
=
−
=
−
−
=
ninixiiопmxxxG1 1
1 2
2 1
, где
∑
=
=
niixxnm1 1
– среднее по всей выборке;
∑
−
=
−
=
1 1
1 1
1
niixnx – среднее по выборки без сомнительного результата.
46
45
Если
оп
G попадает в критическую область, то аномальный результат отбрасываем.
4 Статистика Титьена – Мура позволяет проводить оценку сразу не- скольких выбросов. Определяется опытное значение:
(
)
(
)
,
1 1
2 2
∑
∑
=
−
=
−
−
=
n
i
k
n
i
x
i
xk
i
оп
m
x
m
x
Z
где
∑
=
=
n
i
i
x
x
n
m
1 1
– среднее по всей выборке;
∑
−
=
−
=
k
n
i
i
xk
x
k
n
m
1 1
– среднее по выборке без к выборочных сомни- тельных результатов.
Оценка Титьена-Мура имеет большое распределение, входом в табли- цу является
α
, количество выбросов k и объем выборки n.
Пример № 6. Имеются данные – временные затраты на выполнение однотипных работ для десяти человек (таблица 2.4).
Таблица 2.4
Количество человек
1 3 2 2 1 1
Время вы- полнения
11 12 13 14 15 18
Нет информации о значениях математического ожидания
x
m
и дис- персии
2
x
σ
. Есть ли основание для исключения последнего результата из вы- борки. Проведем оценки по следующим критериям:
1
По критерию Смирнова определяем опытные значения
29
,
2 01
,
2 4
,
13 18
;
max
=
−
=
−
=
оп
x
x
оп
t
m
x
t
σ
Если выбрать
%
5
,
2
=
α
, то по таблице Смирнова (приложение З)
3
,
2
=
кр
t
Вывод: Результат 18
=
t
– проходит с малой надежностью.
2
По критерию Гребса имеем
( )
(
)
( ) ( )
( )
( )
( )
( ) ( )
( )
( )
( ) ( )
=
+
+
⋅
+
⋅
+
⋅
+
+
⋅
+
⋅
+
⋅
+
=
−
−
=
∑
∑
=
−
=
2 2
2 2
2 2
2 2
2 2
2 2
2 1
6
,
4 6
,
1 2
6
,
0 2
4
,
0 3
4
,
1 4
,
2 2
,
2 2
2
,
1 2
2
,
0 3
8
,
0 8
,
1
1 1
1
n
i
n
i
x
i
i
оп
m
x
x
x
G
46 356
,
0 4
,
36 96
,
12
=
=
, где
4
,
13
;
8
,
12
1
=
=
x
m
x
При уровне значимости 025
,
0
=
α
по таблице Гребса (приложение Е) определяем критическую область 3526
,
0
=
кр
G
. Функция Гребса представлена на рисунке 2.10.
Рисунок 2.10 – Функция Гребса
По критерию Гребса результат также проходит с малой надежностью.
3
По критерию Титьена-Мура проверим следующие результаты: а)
если выбросить последний результат 18
=
t
, то получим 356
,
0
=
оп
Z
По таблице Титьена-Мура (приложение Ж) при
05
,
0
=
α
находим кри- тическое значение 418
,
0
=
кр
Z
следовательно, результат необходимо выбро- сить, а при 01
,
0
=
α
получаем 28
,
0
=
кр
Z
, поэтому результат нужно оставить. б)
Определим опытное значение статистики Титьена-Мура
(
)
(
)
216
,
0 4
,
36 875
,
7 4
,
36 78
,
3 28
,
0 17
,
1 64
,
2
1 2
1 2
2 2
=
=
+
+
+
=
−
−
=
∑
∑
=
−
=
−
n
i
n
i
x
i
n
i
оп
m
x
x
x
Z
, где
6
,
12 8
2
=
=
−
x
x
n
Из таблицы для количества выбросов
2
=
k
определяем критические значения статистики для различных уровней значимости
α
При 287
,
0
,
1
,
0
=
=
кр
Z
α
; при
233
,
0
,
05
,
0
=
=
кр
Z
α
; при
142
,
0
,
01
,
0
=
=
кр
Z
α
Вывод: при
%
10
=
α
и
%
5
=
α
– результат 15 и 18 необходимо выбро- сить из выборки. Если
%
1
=
α
, то результаты 15 и 18 необходимо оставить.
0,356 1
G
G
кр
47
3 Обработка результатов эксперимента методом регресси-онного анализа 3.1 Зависимость между случайными величинами При изучении процессов функционирования сложных систем прихо- дится иметь дело с целым рядом одновременно действующих случайных вели- чин. Для уяснения механизма явлений, причинно-следственных связей между элементами системы и т.д., по полученным наблюдениям мы пытаемся устано- вить взаимоотношения этих величин.
В
математическом анализе зависимость, например, между двумя вели- чинами выражается понятием функции
y=f(x), где каждому значению одной переменной соответствует только одно значение другой. Такая зависимость носит название
функциональной.
Гораздо сложнее обстоит дело с понятием зависимости случайных ве- личин. Как правило, между случайными величинами (случайными факторами), определяющими процесс функционирования сложных систем, обычно сущест- вует такая связь, при которой с изменением одной величины меняется распре- деление другой. Такая связь называется
стохастической, или
вероятностной.
При этом величину изменения случайного фактора
Y, соответствующую изме- нению величины
Х, можно разбить на два компонента. Первый связан с зави- симостью
Y от
X, а второй с влиянием "собственных" случайных составляю- щих величин
Y и
X. Если первый компонент отсутствует, то случайные вели- чины
Y и
X являются независимыми. Если отсутствует второй компонент, то
Y и
X зависят функционально. При наличии обоих компонент соотношение меж- ду ними определяет силу или тесноту связи между случайными величинами
Y и
X.
Существуют различные показатели, которые характеризуют те или иные стороны стохастической связи. Так, линейную зависимость между слу- чайными величинами
X и
Y определяет коэффициент корреляции.
yxyxaYaXMrσ
σ
⋅
−
−
=
)]
)(
[(
,
(3.1) где
yxaa ,
– математические ожидания случайных величин X и
Y.
yxσ
σ
,
– средние квадратические отклонения случайных вели- чин
X и
Y.
48
Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенден- цию возрастать (или убывать) по линейному закону. Если случайные величины
X и Y связаны строгой линейной функциональной зависимостью, например,
y=b
0
+b
1
x
1
,
то коэффициент корреляции будет равен
1
±
=
r
; причем знак соответствует знаку коэффициента b
1
.Если величины X и Y связаны произвольной стохасти- ческой зависимостью, то коэффициент корреляции будет изменяться в преде- лах
1 1
+
<
<
−
r
Следует подчеркнуть, что для независимых случайных величин коэф- фициент корреляции равен нулю. Однако коэффициент корреляции как пока- затель зависимости между случайными величинами обладает серьезными не- достатками. Во-первых, из равенства r = 0 не следует независимость случай- ных величин X и Y (за исключением случайных величин, подчиненных нор- мальному закону распределения, для которых r = 0 означает одновременно и отсутствие всякой зависимости). Во- вторых, крайние значения
1
±
=
r
также не очень полезны, так как соответствуют не всякой функциональной зависимости, а только строго линейной.
Полное описание зависимости Y от X , и притом выраженное в точных функциональных соотношениях, можно получить, зная условную функцию распределения
[
]
x
X
Y
F
= .
Следует отметить, что при этом одна из наблюдаемых переменных ве- личин считается неслучайной. Фиксируя одновременно значения двух случай- ных величин X и Y, мы при сопоставлении их значений можем отнести все ошибки лишь к величине Y. Таким образом, ошибка наблюдения
y
∆
будет складываться из собственной случайной ошибки величины Y и из ошибки со- поставления, возникающей из-за того, что с величиной Y сопоставляется не со- всем то значение X, которое имело место на самом деле.
Однако отыскание условной функции распределения, как правило, ока- зывается весьма сложной задачей. Наиболее просто исследовать зависимость между Х и Y при нормальном распределении Y, так как оно полностью опреде- ляется математическим ожиданием и дисперсией. В этом случае для описания зависимости Y от X не нужно строить условную функцию распределения, а достаточно лишь указать, как при изменении параметра X изменяются матема- тическое ожидание и дисперсия величины Y.
Таким образом, мы приходим к необходимости отыскания только двух функций:
).
(
]
/
[
D
);
(
]
/
[
*
2
/
/
x
x
X
Y
x
a
x
X
Y
M
x
y
x
y
ϕ
σ
ϕ
=
=
=
=
=
=
(3.2)
49
Зависимость условной дисперсии
D [Y/X=x] от параметра
Х носит на- звание
сходастической зависимости. Она характеризует изменение точности методики наблюдений при изменении параметра и используется достаточно редко.
Зависимость условного математического ожидания
M[Y/x=x] от
X носит название
регрессии, она дает истинную зависимость величин
Х и
У, лишенную всех случайных наслоений. Поэтому идеальной целью всяких исследований зависимых величин является отыскание уравнения регрессии, а дисперсия ис- пользуется лишь для оценки точности полученного результата.