Главная страница

Математическая статистика. Основные определения. Воспросы. 1. выборка. Выборкой


Скачать 368.88 Kb.
Название1. выборка. Выборкой
АнкорМатематическая статистика. Основные определения
Дата03.06.2022
Размер368.88 Kb.
Формат файлаpdf
Имя файлаВоспросы.pdf
ТипДокументы
#567333

1. ВЫБОРКА. Выборкой


𝑋 = (𝑋
1
, ..., 𝑋
𝑛
)
объема 𝑛 из распределения F
называется набор из 𝑛 независимых и одинакого распределенных слу- чайных величин, имеющих распределение F.
2. ВАРИАЦИОННЫЙ РЯД. Если элементы выборки


𝑋 = (𝑋
1
, ..., 𝑋
𝑛
)
упорядочить по возрастанию на каждом элементарном исходе, получит- ся новый набор СВ, называемый вариационным рядом
𝑋
1
≤ 𝑋
(2)
≤ ... ≤ 𝑋
(𝑛)
Элемент 𝑋
(𝑘)
называется 𝑘 членом вариационного ряда или порядковой статистикой.
3. СТАТИСТИКА (ОЦЕНКА). Статистика - любая измеримая функ- ция от выборки. Оценка - статистика, которая в том или ином смысле приближает оцениваемый параметр.
4. НЕСМЕЩЕННАЯ ОЦЕНКА. 𝜃
*
- несмещенная оценка для 𝜃, если
E𝜃
*
= 𝜃.
5. СОСТОЯТЕЛЬНАЯ ОЦЕНКА. 𝜃
*
- состоятельная оценка для 𝜃, ес- ли 𝜃
*
𝑝
→ 𝜃.
6. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ. Эмпирическая функция распределения, построенная по выборке


𝑋 = (𝑋
1
, ..., 𝑋
𝑛
)
объе- ма 𝑛 называется случайная функция
𝐹
*
𝑛
=
1
𝑛
𝑛
∑︁
𝑖=1
𝐼{𝑋
𝑖
< 𝑡}
7. ВЫБОРОЧНЫЕ МОМЕНТЫ. Выборочный первый момент (выбороч- ное среднее):
𝑋 =
1
𝑛
𝑛
∑︁
𝑖=1
𝑋
𝑖
=
𝑋
1
+ 𝑋
2
+ ...𝑋
𝑛
𝑛
Выборочный 𝑘−ый момент:
𝑋
𝑘
=
1
𝑛
𝑛
∑︁
𝑖=1
𝑋
𝑘
𝑖
=
𝑋
𝑘
1
+ 𝑋
𝑘
2
+ ... + 𝑋
𝑘
𝑛
𝑛
8. ВЫБОРОЧНАЯ ДИСПЕРСИЯ. Смещенная:
𝑆
2
=
1
𝑛
𝑛
∑︁
𝑖=1
(𝑋
𝑖
− 𝑋)
2
= 𝑋
2
− (𝑋)
2
Несмещенная
𝑆
2 0
=
𝑛
𝑛 − 1
𝑆
2
=
1
𝑛 − 1
𝑛
∑︁
𝑖=1
(𝑋
𝑖
− 𝑋)
2 1

9.
𝑋
пн

𝑛→∞
𝐸𝑋
1
по УЗБЧ
𝑋
2
пн

𝑛→∞
𝐸𝑋
2 1
S
2
p

𝑛→∞
𝐷𝑋
1
𝑆
2 0
p

𝑛→∞
𝐷𝑋
1
𝐹
*
𝑛
(𝑡)
пн

𝑛→∞
𝐹 (𝑡)
10.
𝐸𝑋 = 𝐸𝑋
1
𝐸𝑋
2
= 𝐸𝑋
2 1
𝐸𝑆
2
=
𝑛 − 1
𝑛
𝐷𝑋
1
=
𝑛 − 1
𝑛
𝜎
2
𝐸𝑆
2 0
= 𝐷𝑋
1
= 𝜎
2
𝐸𝐹
*
𝑛
(𝑡) = 𝐹 (𝑡)
𝐷𝐹
*
𝑛
(𝑡) =
𝐹 (𝑡)(1 − 𝐹 (𝑡))
𝑛
11. ТЕОРЕМА ГЛИВЕНКО-КАНТЕЛЛИ Пусть дана выборка из рас- пределения с функцияей распределения 𝐹 и пусть 𝐹
*
𝑛
- эмпирическая функция распределения, построенная по этой выборке, тогда для любой фиксированной точки 𝑦 выполнено sup
𝑦∈R
|𝐹
*
𝑛
(𝑦) − 𝐹 (𝑦)|
𝑝
→ 0, 𝑛 → ∞.
12. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ. Пусть 𝑋
1
, .., 𝑋
𝑛
- выборка объе- ма 𝑛 из распределения ℱ
𝜃
с параметром 𝜃 ∈ 𝑅. Пусть задано число
0 < 𝜀 < 1
Интервал (𝜃

, 𝜃
+
)
, границы которого зависят от заданного 𝜀 и от вы- борки 𝑋
1
, ...𝑋
𝑛
,
называется доверительным интервалом для параметра
𝜃
уровня доверия 1 − 𝜀, если при любом возможном значении 𝜃
𝑃 (𝜃
*
≤ 𝜃 ≤ 𝜃
+
) = 1 − 𝜀.
Асимптотически доверительным, если
𝑃 (𝜃
*
≤ 𝜃 ≤ 𝜃
+
) → 1 − 𝜀, 𝑛 → ∞.
2

13. СХЕМА ПОСТРОЕНИЯ ДИ. Точного ДИ:
I. Найти функцию 𝐺(


𝑋 , 𝜃)
, распределение которой 𝜚 не зависит от па- раметра 𝜃.
II. Найти числа 𝑡
1
, 𝑡
2
- квантили распределения 𝜚, для которых
𝑃 (𝑡
1
< 𝐺(


𝑋 , 𝜃) < 𝑡
2
) = 1 − 𝜀
III. Разрешить неравенство
𝑡
1
< 𝐺(


𝑋 , 𝜃) < 𝑡
2
Асимптотических ДИ:
I. Найти функцию 𝐺(


𝑋 , 𝜃)
, распределение которой 𝜚 не зависит от па- раметра 𝜃.
II. Найти числа 𝑡
1
, 𝑡
2
- квантили распределения 𝜚, для которых
𝑃 (𝑡
1
< 𝐺(


𝑋 , 𝜃) < 𝑡
2
) → 1 − 𝜀, 𝑛 → ∞
III. Разрешить неравенство
𝑡
1
< 𝐺(


𝑋 , 𝜃) < 𝑡
2 14. ОПРЕДЕЛЕНИЯ РАСПРЕДЕЛЕНИЙ. Хи квадрат. Пусть 𝜉
1
, ..., 𝜉
𝑘
независимы и имеют стандартное нормальное распределение, то случай- ная величина
𝑥 = 𝜉
2 1
+ 𝜉
2 2
+ ... + 𝜉
2
𝑘
имеет распределение хи-квадрат с 𝑘 степенями свободы.
Стьюдента. Пусть 𝜉
0
, 𝜉
1
, ..., 𝜉
𝑘
независимы и имеют стандартное нор- мальное распределение. Распределение СВ
𝑡
𝑘
=
𝜉
0
√︁
𝜉
2 1
+...+𝜉
2
𝑘
𝑘
называется распределение Стьюдента с k степенями свободы и обозна- чается 𝑇
𝑘
Фишера.Пусть 𝑌
1
, 𝑌
2
- две независимые СВ, имеющие распределение хи-квадрат. Тогда распределение случайной величины
𝐹 =
𝑌
1
𝑘
𝑌
2
𝑛
называется распределением Фишера с 𝑘 и 𝑛 степенями свободы.
15. ЛЕММА ФИШЕРА. Пусть вектор 𝑋 состоит из независимых СВ со стандартным нормальным распределением, 𝐶 - ортогональная матрица,


𝑌 = 𝐶


𝑋
. Тогда при любом 𝑘 = 1, ..., 𝑛 − 1 СВ
𝑇 (


𝑋 ) =
𝑛
∑︁
𝑖=1
𝑋
2
𝑖
− 𝑌
2 1
− ... − 𝑌
2
𝑘
3
не зависит от 𝑌
1
, ..., 𝑌
𝑘
и имеет распределение 𝐻
𝑛−𝑘
СЛЕДСТВИЕ ИЗ ЛЕММЫ. Пусть 𝑋
1
, .., 𝑋
𝑛
независимы и имеют нор- мальное распределение с параметрами 𝑎 и 𝜎
2
. Тогда
(a)

𝑛
𝑋 − 𝑎
𝜎
∼ 𝑁
0,1
,
(b)
(𝑛 − 1)𝑆
2 0
𝜎
2
=
𝑛
∑︁
𝑖=1
(𝑋
𝑖
− 𝑋)
𝜎
2
∼ 𝐻
𝑛−1
(c) Случайные величины 𝑋 и 𝑆
2 0
независимы.
16. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ МАТЕМАТИЧЕСКОГО
ОЖИДАНИЯ НОРМАЛЬНОЙ ВЫБОРКИ.
(a) Случай известной дисперсии Случайная величина
𝑍 =
𝑋 − 𝑎
𝜎

𝑛
имеет стандартное нормальное распределение. Пусть 𝑧
𝛼
- это 𝛼 кван- тиль стандарстного нормального распределения. Получаем
𝑃
(︂
𝑋 − 𝑧
1−
𝛼
2
𝜎

𝑛
≤ 𝑎 ≤ 𝑋 + 𝑧
1−
𝛼
2
𝜎

𝑛
)︂
= 1 − 𝛼
(b) Случай неизвестной дисперсии Случайная величина
𝑇 =
𝑋 − 𝑎
𝑆

𝑛
где 𝑆 - несмещенное выборочное стандартное отклонение, имеет рас- пределение Стьюдента с 𝑛 − 1 степенями свободы. Пусть 𝑡
𝛼,𝑛−1
- квантиль распределения Стьюдента. Тогда
𝑃
(︂
𝑋 − 𝑡
1−
𝛼
2
,𝑛−1
𝑆

𝑛
≤ 𝑎 ≤ 𝑋 + 𝑡
1−
𝛼
2
,𝑛−1
𝑆

𝑛
)︂
= 1 − 𝛼
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ДИСПЕРСИИ
НОРМАЛЬНОЙ ВЫБОРКИ.
(a) Случай известного среднего. Случайная величина
𝐻 =
𝑛
∑︀
𝑖=1
(𝑋
𝑖
− 𝑎)
2
𝜎
2 4
имеет распределение хи-квадрат. Пусть 𝑥
2
𝛼,𝑛
- квантиль этого рас- пределения. Тогда
𝑃




𝑛
∑︀
𝑖=1
(𝑋
𝑖
− 𝑎)
2
𝑥
2
𝛼
2
,𝑛
≤ 𝜎
2

𝑛
∑︀
𝑖=1
(𝑋
𝑖
− 𝑎)
2
𝑥
2 1−
𝛼
2
,𝑛




= 1 − 𝛼
(b) Случай неизвестного среднего. Случайная величина
𝐻 =
(𝑛 − 1)𝑆
2
𝜎
2
где 𝑆
2
-несмещенное выборочная дисперсия, имеет распределение хи-квадрат (n-1). Пусть 𝑥
2
𝛼,𝑛
- квантиль этого распределения. Тогда
𝑝
(︃
(𝑛 − 1)𝑆
2
𝑥
2 1−
𝛼
2
,𝑛−1
≤ 𝜎
2

(𝑛 − 1)𝑆
2
𝑥
2
𝛼
2
,𝑛−1
)︃
= 1 − 𝛼
17. ГИПОТЕЗЫ. Гипотезой 𝐻
𝑘
называется любое суждение о неизвестном распределении.
Гипотеза называется простой, если она однозначно восстанавливает неиз- вестное распределение.
18. КРИТЕРИЙ. Критерием называется отображение
𝛿 : 𝑋
𝑛
→ {1, ..., 𝑚}
Где 𝑋
𝑛
- выборочное пространство, {1, ..., 𝑚} - множество индексов ги- потез.
19. ВЕРОЯТНОСТИ ОШИБКОК i-ГО РОДА. I рода.
𝛼
1
= 𝑃
𝐻
0
(𝛿 = 1)
Вероятность того, что критерий принимает альтернативную гипо- тезу при условии, что верная основная.
II рода.
𝛼
2
= 𝑃
𝐻
1
(𝛿 = 0)
Вероятность того, что критерий принимает основну гипотезу при условии, что верная альтернативная.
20. ОПРЕДЕЛЕНИЕ МОЩНОСТИ, СОСТОЯТЕЛЬНОСТИ
В КРИТЕРИЯХ СОГЛАСИЯ.
Надежность:
𝛾 = 1 − 𝛼
1 5

Мощность:
𝛽 = 1 − 𝛼
2
Критерий называется состоятельным, если
𝛼
2

𝑛→∞
0 ⇔ 𝛽 → 1 21. ОБЩИЙ ВИД КРИТЕРИЕВ СОГЛАСИЯ.
𝛿(


𝑋 ) =
{︂ 𝐻
0
, 𝑑 < 𝐶
𝐻
1
, 𝑑 ≥ 𝐶
где 𝑑 = 𝑑(𝐹
*
𝑛
, 𝐹
0
)
- статистическое расстояние.
УСЛОВИЯ:
(a) если гипотеза 𝐻
0
верна, то распределение величины 𝑑 либо целиком известно, либо при больших n сближается с известным распределе- нием 𝜚;
(b) если гипотеза 𝐻
0
верна, то 𝑑
𝑝
→ ∞
22. ТЕОРЕМА КОЛМОГОРОВА, ТЕОРЕМА ПИРСОНА. Колмогоро- ва. Пусть


𝑋 ∈ 𝐹
0
, где 𝐹
0
- непрерывная. Тогда
𝑑
𝑘
=

𝑛 sup |𝐹
*
𝑛
− 𝐹 (𝑡)| ⇒ 𝜂,
где 𝜂 имеет распределение Колмогорова
𝐾(𝑡) =
+∞
∑︁
𝑗=−∞
(−1)
𝑗
𝑒
−𝛼𝑗
2
𝑡
2
. Пирсона. Пусть 𝑋 ∈ 𝐹
0
, тогда
𝑑
𝑥
2
=
𝑛
∑︁
𝑗=1
(𝑣
𝑗
− 𝑛𝑝
𝑗
)
2
𝑛𝑝
𝑗
⇒ 𝜂 ∈ 𝑥
2
𝑘−1 6

23. ТЕОРЕМА СТЬЮДЕНТА.
24. КРИТЕРИЙ СТЬЮДЕНТА.
25. ТЕОРЕМА ФИШЕРА.
7

26. КРИТЕРИЙ ФИШЕРА.
27. РЕАЛЬНО ДОСТИГНУТЫЙ УРОВЕНЬ ЗНАЧИМОСТИ.
8

(−2.35766 ≤ 𝑎 ≤ −1.80714)
(−2.33167 ≤ 𝑎 ≤ −1.83313)
(︀0.368054 ≤ 𝜎
2
≤ 0.943518
)︀
(︀0.351328 ≤ 𝜎
2
≤ 0.909492
)︀
9


написать администратору сайта