Главная страница

Лекции по теории вероятности. Лекции Тер. Вер.. Лекция 1 Случайные события


Скачать 1.66 Mb.
НазваниеЛекция 1 Случайные события
АнкорЛекции по теории вероятности
Дата13.04.2022
Размер1.66 Mb.
Формат файлаpdf
Имя файлаЛекции Тер. Вер..pdf
ТипЛекция
#470380
страница20 из 21
1   ...   13   14   15   16   17   18   19   20   21

n
) и (Y
1
; . . . ; Y
m
) объемов n и m из генераль-
ных совокупностей независимых случайных величин X ∼ N (µ
1
, σ
2 1
) и Y ∼ N (µ
2
, σ
2 2
) соответственно.
Рассмотрим следующие задачи проверки сложных гипотез относительно параметров µ
1
, µ
2
в слу- чае, когда дисперсии σ
2 1
, σ
2 2
известны:
H
0
: µ
1
= µ
2
,
H
1
: µ
1
> µ
2
;
(17.15)
H
0
: µ
1
= µ
2
,
H
1
: µ
1
< µ
2
;
(17.16)
H
0
: µ
1
= µ
2
,
H
1
: µ
1
6= µ
2
.
(17.17)
Разность выборочных средних X − Y имеет нормальное распределение с математическим ожида- нием µ
1
− µ
2
и дисперсией σ
2 1
/n + σ
2 2
/m. Отсюда следует, что при справедливости основной гипотезы,
т.е. при µ
1
= µ
2
, статистика
X − Y
r
σ
2 1
n
+
σ
2 2
m
(17.18)
имеет стандартное нормальное распределение. Исходя из этого, заключаем, что критерии размера
α для указанных задач задаются критическими множествами
x − y
r
σ
2 1
n
+
σ
2 2
m
> u
1−α
;
x − y
r
σ
2 1
n
+
σ
2 2
m
6 −u
1−α
;
|x − y|
r
σ
2 1
n
+
σ
2 2
m
> u
1−α/2
. #
Рассмотрим также задачу проверки гипотез (17.15)–(17.16) о равенстве средних двух нормаль- ных распределений в предположении, что их дисперсии не известны, но равны между собой:
σ
1
= σ
2
= σ. Обозначим через
S
2
(


X
n
) =
1
n − 1
n
X
i=1
(X
i
− X)
2
,
S
2
(
Y
m
) =
1
m − 1
m
X
i=1
(Y
i
− Y )
2
соответствующие исправленные оценки дисперсии. Статистики (n − 1)S
2
(
X
n
)
2
и (m −
1)S
2
(
Y
m
)
2
имеют χ
2
-распределения с n − 1 и m − 1 степенями свободы. Тем самым статистика
(n − 1)S
2
(
X
n
)
σ
2
+
(m − 1)S
2
(
Y
m
)
σ
2 84
имеет также χ
2
-распределение с n + m − 2 степенями свободы . Учитывая, что случайная величина
(17.18) при µ
1
= µ
2
имеет стандартное нормальное распределение, получаем, что статистика e
T (
X
n
,
Y
m
) =
(X − Y )

n + m − 2
q
1
n
+
1
m
q
(n − 1)S
2
(
X
n
) + (m − 1)S
2
(
Y
m
)
имеет распределение Стьюдента с n + m − 2 степенями свободы . Поэтому критерии размера α
для проверки гипотез (17.15)–(17.16) задаются с помощью критических множеств, определяемых следующими неравенствами:
e
T (x
n
,y
m
) > t
1−α
(n + m − 2),
(17.19)
e
T (x
n
,y
m
) 6 −t
1−α
(n + m − 2),
(17.20)
¯
¯ e
T (x
n
,y
m
)
¯
¯ > t
1−α/2
(n + m − 2).
(17.21)
85

Лекция 18
Проверка непараметрических гипотез
Критерий согласия χ
2
. Простая гипотеза
Пусть наблюдается дискретная случайная величина X, принимающая r различных значений u
1
, . . . ,
u
r
с положительными вероятностями p
1
, . . . , p
r
:
P {X = u
k
} = p
k
,
k = 1, r,
r
X
k=1
p
k
= 1.
Допустим, что в выборке x
n
= (x
1
; . . . ; x
n
) число u
k
встретилось n
k
(x
n
) раз, k = 1, r. Отметим,
что
r
P
k=1
n
k
(x
n
) = n, т.е. случайные величины n
1
(
X
n
), . . . , n
r
(
X
n
) зависимы.
Теорема 18.1 (теорема Пирсона) Распределение случайной величины
r
X
k=1
(n
k
(
X
n
) − np
k
)
2
np
k
при n → ∞ сходится к χ
2
-распределению с r − 1 степенями свободы. #
Этой теоремой можно воспользоваться для проверки простой гипотезы
H
0
: p
1
= p
10
, . . . , p
r
= p
r0
,
(18.1)
где p
10
, . . . , p
r0
— известные величины, против альтернативной гипотезы
H
1
: существуют такие k, что p
k
6= p
k0
, k = 1, r.
(18.2)
Если истинной является гипотеза H
0
, то по закону больших чисел
n
k
(
X
n
)
n
− p
k0
0,
k = 1, r,
а если верна H
1
, то
n
k
(
X
n
)
n
− p
k0
→ p
k
− p
k0
6= 0,
для некоторых k = 1, r.
Поэтому при H
1
случайная величина
χ
2
(
X
n
) =
r
X
k=1
(n
k
(
X
n
) − np
k0
)
2
np
k0
= n
r
X
k=1
³
n
k
(
X
n
)
n
− p
k0
´
2
p
k0
(18.3)
стремится к бесконечности и, следовательно, в эксперименте, как правило,принимает б´ольшие зна- чения, чем при H
0
, когда ее распределение стремится к распределению χ
2
с r − 1 степенями свободы.
Таким образом, становится естественным следующее определение критерия согласия χ
2
(хи- вадрат). Этот критерий при больших n на уровне значимости α отклоняет гипотезу H
0
в пользу альтернативной гипотезы H
1
, если
χ
2
(x
n
) > χ
2 1−α
(r − 1),
где χ
2 1−α
(r − 1) — квантиль уровня 1 − α χ
2
-распределения с r − 1 степенями свободы, а χ
2
(x
n
) —
реализация случайной величины (18.3).
86

Если же
χ
2
(x
n
) 6 χ
2 1−α
(r − 1),
то делается вывод о том, что гипотеза H
0
не противоречит статистическим данным и ее следует принять.
Критерием χ
2
при небольших объемах выборки n пользоваться нельзя. На практике при неболь- ших r необходимо, чтобы выполнялись условия np
k
> 10, k = 1, r, а если r велико (r > 20), достаточно,
чтобы было np
k
> 5, k = 1, r.
Критерий χ
2
можно использовать и тогда, когда случайная величина X непрерывна или дискрет- на, но принимает счетное множество значений с положительными вероятностями. В этом случае множество M возможных значений X разбивают на r непересекающихся подмножеств M
k
, k = 1, r,
таким образом, чтобы вероятность p
k
, k = 1, r, попадания случайной величины X в k подмноже- ство M
k
удовлетворяла условию np
k
> 5 или np
k
> 10, k = 1, r. Если X непрерывная случайная величина, то в качестве M
k
, k = 1, r, обычно берут множества вида
(−∞, s
1
),
[s
1
, s
2
),
. . . ,
[s
r−2
, s
r−1
),
[s
r−1
, ∞),
где s
1
< s
2
< · · · < s
r−1
, s
k
R, k = 1, r−1.
Определим дискретную случайную величину X
0
, принимающую значение k тогда и только тогда,
когда X ∈ M
k
, k = 1, r. В этом случае исходная задача проверки статистических гипотез сводится к проверке основной гипотезы (18.1) при альтернативной гипотезе (18.2), где в случае непрерывности случайной величины X
p
k0
=
Z
M
k
p
0
(t) dt
вероятность попадания случайной величины X в множество M
k
, а p
0
(t) — плотность X при H
0
Если X — дискретная случайная величина, имеющая счетное множество возможных значений
z
1
, z
2
, . . . , и P {X = z
j
} = q
j
> 0, j = 1, 2, . . . , то вместо проверки гипотезы
H
0
: q
j
= q
j0
,
j = 1, 2, . . . ,
где q
j0
, j = 1, 2, . . . , — известные числа, при альтернативной гипотезе
H
1
: существуют такие j, что q
j
6= q
j0
,
j = 1, 2, . . . ,
проверяют гипотезу (18.1) при альтернативной гипотезе (18.2), где вероятности p
k0
, k = 1, r, вычис- ляют по формулам
p
k0
=
X
z
j
∈M
k
q
j0
,
k = 1, r.
Далее для выборки x
n
находят число n
k
(x
n
) ее элементов, принадлежащих множеству M
k
, k =
1, r. Затем, подставляя x
n
вместо
X
n
в формулу (18.3), определяют реализацию χ
2
(x
n
) случайной величины χ
2
(
X
n
). Гипотеза H
0
отклоняется в пользу гипотезы H
1
, если χ
2
(x
n
) > χ
2 1−α
(r − 1) и принимается в противном случае.
Недостатком использования критерия χ
2
для случайных величин, принимающих бесконечное множество значений, является некоторая потеря информации при переходе от X к случайной ве- личине X
0
с конечным числом значений.
Пример 18.1 При 4040 бросаниях монеты французский естествоиспытатель Ж.Л.Л. Бюффон
(1707–1788) получил 2048 выпадений “герба” и 1992 выпадений “решки”. Совместимо ли это с ги- потезой о том, что вероятность выпадения “герба” при одном бросании равна 1/2?
Здесь n = 4040, r = 2, n
1
(x
n
) = 2048, n
2
(x
n
) = 1992, p
10
= p
20
= 0,5, число степеней свободы r − 1 =
1, и при α = 0,05 находим χ
2 0,95
(1) = 3,841.
Проверим гипотезу H
0
о том, что вероятности p
1
и p
2
выпадения “герба” и “решки” равны 1/2.
На основании (18.3) получаем
χ
2
(x
n
) =
(2048 4040 · 0,5)
2 4040 · 0,5
+
(1992 4040 · 0,5)
2 4040 · 0,5
= 0,776.
Так как 0,776 < 3,841, то статистические данные не противоречат гипотезе H
0 87

Критерий χ
2
для сложной гипотезы
Пусть функция распределения дискретной случайной величины X, принимающей конечное множе- ство значений u
1
, . . . , u
r
, зависит от неизвестного d-мерного вектора параметров θ. Тогда вероят- ность p
k
того, что X примет возможное значение u
k
, зависит от θ, т.е. p
k
= p
k
(θ), k = 1, r. А так как вероятности p
1
(θ), . . . , p
r
(θ) полностью определяют функцию распределения случайной величины
X, то в рассматриваемом случае основная гипотеза принимает следующий вид:
H
0
: P {X = u
k
} = p
k
(θ),
k = 1, r,
θ ∈ Θ R
d
.
Эту сложную гипотезу можно проверить при помощи модификации критерия χ
2
Пирсона.
Пусть b
θ(x
n
) — значение оценки b
θ(
X
n
) максимального правдоподобия для θ, а n
k
(x
n
) — количе- ство элементов выборки x
n
, равных u
k
, k = 1, r. Оценку b
θ(
X
n
) получают в результате минимизации логарифма функции правдоподобия
L
¡

X
n
; θ
¢
=
n!
n
1
! . . . n
r
!
r
Y
k=1
p
n
k
(
X
n
)
i
(θ),
r
X
i=1
n
i
(
X
n
) = n,
как решение системы уравнений
r
X
k=1
n
k
(
X
n
)
p
k
(θ)
∂p
k
(θ)
∂θ
j
= 0,
j = 1, d.
Можно показать, что при некоторых предположениях о гладкости функций p
k
(θ), k = 1, r, распре- деление случайной величины при n → ∞
χ
2
(
X
n
) =
r
X
i=1
¡
n
i
(
X
n
) − np
i
(b
θ(
X
n
))
¢
2
np
i
(b
θ(
X
n
))
сходится к χ
2
-распределению с r − d − 1 степенями свободы.
Если X — непрерывная случайная величина с функцией распределения F (t), то, разбивая мно- жество возможных значений X на конечное число непересекающихся подмножеств и переходя к дискретной случайной величине X
0
, можно проверить сложную гипотезу
H
0
: F (t)
©
F
¡
t; θ
¢
, θ ∈ Θ R
d
ª
.
Необходимо только помнить, что оценку максимального правдоподобия b
θ(
X
n
) следует строить не по наблюдениям X
1
, . . . , X
n
случайной величины X, а по значениям частот n
1
(x
0
n
), . . . , n
r
(x
0
n
)
случайной величины X
0
, что, как правило, гораздо труднее. Построение такой оценки для наибо- лее распространенных параметрических семейств распределений (нормального, экспоненциального,
пуассоновского и т.д.) можно найти в специальной литературе (См. Г. Крамер ).
Критерий независимости, основанный на выборочном коэффициенте кор- реляции
Пусть (X
i
, Y
i
), i = 1, n — выборка из распределения нормального случайного вектора (X, Y ). Обо- значим b
ρ(
X
n
,
Y
n
) =
n
P
i=1
(X
i
− X)(Y
i
− Y )
s
n
P
i=1
(X
i
− X)
2
s
n
P
i=1
(Y
i
− Y )
2
выборочный коэффициент корреляции.
При проверке статистической гипотезы H
0
: ρ = 0 (т.е. гипотезы о том, что нормально распреде- ленные случайные величины независимы) используют статистику
1   ...   13   14   15   16   17   18   19   20   21


написать администратору сайта