Математическая статистика. Основные определения. Воспросы. 1. выборка. Выборкой
Скачать 368.88 Kb.
|
1. ВЫБОРКА. Выборкой − → 𝑋 = (𝑋 1 , ..., 𝑋 𝑛 ) объема 𝑛 из распределения F называется набор из 𝑛 независимых и одинакого распределенных слу- чайных величин, имеющих распределение F. 2. ВАРИАЦИОННЫЙ РЯД. Если элементы выборки − → 𝑋 = (𝑋 1 , ..., 𝑋 𝑛 ) упорядочить по возрастанию на каждом элементарном исходе, получит- ся новый набор СВ, называемый вариационным рядом 𝑋 1 ≤ 𝑋 (2) ≤ ... ≤ 𝑋 (𝑛) Элемент 𝑋 (𝑘) называется 𝑘 членом вариационного ряда или порядковой статистикой. 3. СТАТИСТИКА (ОЦЕНКА). Статистика - любая измеримая функ- ция от выборки. Оценка - статистика, которая в том или ином смысле приближает оцениваемый параметр. 4. НЕСМЕЩЕННАЯ ОЦЕНКА. 𝜃 * - несмещенная оценка для 𝜃, если E𝜃 * = 𝜃. 5. СОСТОЯТЕЛЬНАЯ ОЦЕНКА. 𝜃 * - состоятельная оценка для 𝜃, ес- ли 𝜃 * 𝑝 → 𝜃. 6. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ. Эмпирическая функция распределения, построенная по выборке − → 𝑋 = (𝑋 1 , ..., 𝑋 𝑛 ) объе- ма 𝑛 называется случайная функция 𝐹 * 𝑛 = 1 𝑛 𝑛 ∑︁ 𝑖=1 𝐼{𝑋 𝑖 < 𝑡} 7. ВЫБОРОЧНЫЕ МОМЕНТЫ. Выборочный первый момент (выбороч- ное среднее): 𝑋 = 1 𝑛 𝑛 ∑︁ 𝑖=1 𝑋 𝑖 = 𝑋 1 + 𝑋 2 + ...𝑋 𝑛 𝑛 Выборочный 𝑘−ый момент: 𝑋 𝑘 = 1 𝑛 𝑛 ∑︁ 𝑖=1 𝑋 𝑘 𝑖 = 𝑋 𝑘 1 + 𝑋 𝑘 2 + ... + 𝑋 𝑘 𝑛 𝑛 8. ВЫБОРОЧНАЯ ДИСПЕРСИЯ. Смещенная: 𝑆 2 = 1 𝑛 𝑛 ∑︁ 𝑖=1 (𝑋 𝑖 − 𝑋) 2 = 𝑋 2 − (𝑋) 2 Несмещенная 𝑆 2 0 = 𝑛 𝑛 − 1 𝑆 2 = 1 𝑛 − 1 𝑛 ∑︁ 𝑖=1 (𝑋 𝑖 − 𝑋) 2 1 9. 𝑋 пн → 𝑛→∞ 𝐸𝑋 1 по УЗБЧ 𝑋 2 пн → 𝑛→∞ 𝐸𝑋 2 1 S 2 p → 𝑛→∞ 𝐷𝑋 1 𝑆 2 0 p → 𝑛→∞ 𝐷𝑋 1 𝐹 * 𝑛 (𝑡) пн → 𝑛→∞ 𝐹 (𝑡) 10. 𝐸𝑋 = 𝐸𝑋 1 𝐸𝑋 2 = 𝐸𝑋 2 1 𝐸𝑆 2 = 𝑛 − 1 𝑛 𝐷𝑋 1 = 𝑛 − 1 𝑛 𝜎 2 𝐸𝑆 2 0 = 𝐷𝑋 1 = 𝜎 2 𝐸𝐹 * 𝑛 (𝑡) = 𝐹 (𝑡) 𝐷𝐹 * 𝑛 (𝑡) = 𝐹 (𝑡)(1 − 𝐹 (𝑡)) 𝑛 11. ТЕОРЕМА ГЛИВЕНКО-КАНТЕЛЛИ Пусть дана выборка из рас- пределения с функцияей распределения 𝐹 и пусть 𝐹 * 𝑛 - эмпирическая функция распределения, построенная по этой выборке, тогда для любой фиксированной точки 𝑦 выполнено sup 𝑦∈R |𝐹 * 𝑛 (𝑦) − 𝐹 (𝑦)| 𝑝 → 0, 𝑛 → ∞. 12. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ. Пусть 𝑋 1 , .., 𝑋 𝑛 - выборка объе- ма 𝑛 из распределения ℱ 𝜃 с параметром 𝜃 ∈ 𝑅. Пусть задано число 0 < 𝜀 < 1 Интервал (𝜃 − , 𝜃 + ) , границы которого зависят от заданного 𝜀 и от вы- борки 𝑋 1 , ...𝑋 𝑛 , называется доверительным интервалом для параметра 𝜃 уровня доверия 1 − 𝜀, если при любом возможном значении 𝜃 𝑃 (𝜃 * ≤ 𝜃 ≤ 𝜃 + ) = 1 − 𝜀. Асимптотически доверительным, если 𝑃 (𝜃 * ≤ 𝜃 ≤ 𝜃 + ) → 1 − 𝜀, 𝑛 → ∞. 2 13. СХЕМА ПОСТРОЕНИЯ ДИ. Точного ДИ: I. Найти функцию 𝐺( − → 𝑋 , 𝜃) , распределение которой 𝜚 не зависит от па- раметра 𝜃. II. Найти числа 𝑡 1 , 𝑡 2 - квантили распределения 𝜚, для которых 𝑃 (𝑡 1 < 𝐺( − → 𝑋 , 𝜃) < 𝑡 2 ) = 1 − 𝜀 III. Разрешить неравенство 𝑡 1 < 𝐺( − → 𝑋 , 𝜃) < 𝑡 2 Асимптотических ДИ: I. Найти функцию 𝐺( − → 𝑋 , 𝜃) , распределение которой 𝜚 не зависит от па- раметра 𝜃. II. Найти числа 𝑡 1 , 𝑡 2 - квантили распределения 𝜚, для которых 𝑃 (𝑡 1 < 𝐺( − → 𝑋 , 𝜃) < 𝑡 2 ) → 1 − 𝜀, 𝑛 → ∞ III. Разрешить неравенство 𝑡 1 < 𝐺( − → 𝑋 , 𝜃) < 𝑡 2 14. ОПРЕДЕЛЕНИЯ РАСПРЕДЕЛЕНИЙ. Хи квадрат. Пусть 𝜉 1 , ..., 𝜉 𝑘 независимы и имеют стандартное нормальное распределение, то случай- ная величина 𝑥 = 𝜉 2 1 + 𝜉 2 2 + ... + 𝜉 2 𝑘 имеет распределение хи-квадрат с 𝑘 степенями свободы. Стьюдента. Пусть 𝜉 0 , 𝜉 1 , ..., 𝜉 𝑘 независимы и имеют стандартное нор- мальное распределение. Распределение СВ 𝑡 𝑘 = 𝜉 0 √︁ 𝜉 2 1 +...+𝜉 2 𝑘 𝑘 называется распределение Стьюдента с k степенями свободы и обозна- чается 𝑇 𝑘 Фишера.Пусть 𝑌 1 , 𝑌 2 - две независимые СВ, имеющие распределение хи-квадрат. Тогда распределение случайной величины 𝐹 = 𝑌 1 𝑘 𝑌 2 𝑛 называется распределением Фишера с 𝑘 и 𝑛 степенями свободы. 15. ЛЕММА ФИШЕРА. Пусть вектор 𝑋 состоит из независимых СВ со стандартным нормальным распределением, 𝐶 - ортогональная матрица, − → 𝑌 = 𝐶 − → 𝑋 . Тогда при любом 𝑘 = 1, ..., 𝑛 − 1 СВ 𝑇 ( − → 𝑋 ) = 𝑛 ∑︁ 𝑖=1 𝑋 2 𝑖 − 𝑌 2 1 − ... − 𝑌 2 𝑘 3 не зависит от 𝑌 1 , ..., 𝑌 𝑘 и имеет распределение 𝐻 𝑛−𝑘 СЛЕДСТВИЕ ИЗ ЛЕММЫ. Пусть 𝑋 1 , .., 𝑋 𝑛 независимы и имеют нор- мальное распределение с параметрами 𝑎 и 𝜎 2 . Тогда (a) √ 𝑛 𝑋 − 𝑎 𝜎 ∼ 𝑁 0,1 , (b) (𝑛 − 1)𝑆 2 0 𝜎 2 = 𝑛 ∑︁ 𝑖=1 (𝑋 𝑖 − 𝑋) 𝜎 2 ∼ 𝐻 𝑛−1 (c) Случайные величины 𝑋 и 𝑆 2 0 независимы. 16. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ НОРМАЛЬНОЙ ВЫБОРКИ. (a) Случай известной дисперсии Случайная величина 𝑍 = 𝑋 − 𝑎 𝜎 √ 𝑛 имеет стандартное нормальное распределение. Пусть 𝑧 𝛼 - это 𝛼 кван- тиль стандарстного нормального распределения. Получаем 𝑃 (︂ 𝑋 − 𝑧 1− 𝛼 2 𝜎 √ 𝑛 ≤ 𝑎 ≤ 𝑋 + 𝑧 1− 𝛼 2 𝜎 √ 𝑛 )︂ = 1 − 𝛼 (b) Случай неизвестной дисперсии Случайная величина 𝑇 = 𝑋 − 𝑎 𝑆 √ 𝑛 где 𝑆 - несмещенное выборочное стандартное отклонение, имеет рас- пределение Стьюдента с 𝑛 − 1 степенями свободы. Пусть 𝑡 𝛼,𝑛−1 - квантиль распределения Стьюдента. Тогда 𝑃 (︂ 𝑋 − 𝑡 1− 𝛼 2 ,𝑛−1 𝑆 √ 𝑛 ≤ 𝑎 ≤ 𝑋 + 𝑡 1− 𝛼 2 ,𝑛−1 𝑆 √ 𝑛 )︂ = 1 − 𝛼 ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ДИСПЕРСИИ НОРМАЛЬНОЙ ВЫБОРКИ. (a) Случай известного среднего. Случайная величина 𝐻 = 𝑛 ∑︀ 𝑖=1 (𝑋 𝑖 − 𝑎) 2 𝜎 2 4 имеет распределение хи-квадрат. Пусть 𝑥 2 𝛼,𝑛 - квантиль этого рас- пределения. Тогда 𝑃 ⎛ ⎜ ⎜ ⎝ 𝑛 ∑︀ 𝑖=1 (𝑋 𝑖 − 𝑎) 2 𝑥 2 𝛼 2 ,𝑛 ≤ 𝜎 2 ≤ 𝑛 ∑︀ 𝑖=1 (𝑋 𝑖 − 𝑎) 2 𝑥 2 1− 𝛼 2 ,𝑛 ⎞ ⎟ ⎟ ⎠ = 1 − 𝛼 (b) Случай неизвестного среднего. Случайная величина 𝐻 = (𝑛 − 1)𝑆 2 𝜎 2 где 𝑆 2 -несмещенное выборочная дисперсия, имеет распределение хи-квадрат (n-1). Пусть 𝑥 2 𝛼,𝑛 - квантиль этого распределения. Тогда 𝑝 (︃ (𝑛 − 1)𝑆 2 𝑥 2 1− 𝛼 2 ,𝑛−1 ≤ 𝜎 2 ≤ (𝑛 − 1)𝑆 2 𝑥 2 𝛼 2 ,𝑛−1 )︃ = 1 − 𝛼 17. ГИПОТЕЗЫ. Гипотезой 𝐻 𝑘 называется любое суждение о неизвестном распределении. Гипотеза называется простой, если она однозначно восстанавливает неиз- вестное распределение. 18. КРИТЕРИЙ. Критерием называется отображение 𝛿 : 𝑋 𝑛 → {1, ..., 𝑚} Где 𝑋 𝑛 - выборочное пространство, {1, ..., 𝑚} - множество индексов ги- потез. 19. ВЕРОЯТНОСТИ ОШИБКОК i-ГО РОДА. I рода. 𝛼 1 = 𝑃 𝐻 0 (𝛿 = 1) Вероятность того, что критерий принимает альтернативную гипо- тезу при условии, что верная основная. II рода. 𝛼 2 = 𝑃 𝐻 1 (𝛿 = 0) Вероятность того, что критерий принимает основну гипотезу при условии, что верная альтернативная. 20. ОПРЕДЕЛЕНИЕ МОЩНОСТИ, СОСТОЯТЕЛЬНОСТИ В КРИТЕРИЯХ СОГЛАСИЯ. Надежность: 𝛾 = 1 − 𝛼 1 5 Мощность: 𝛽 = 1 − 𝛼 2 Критерий называется состоятельным, если 𝛼 2 → 𝑛→∞ 0 ⇔ 𝛽 → 1 21. ОБЩИЙ ВИД КРИТЕРИЕВ СОГЛАСИЯ. 𝛿( − → 𝑋 ) = {︂ 𝐻 0 , 𝑑 < 𝐶 𝐻 1 , 𝑑 ≥ 𝐶 где 𝑑 = 𝑑(𝐹 * 𝑛 , 𝐹 0 ) - статистическое расстояние. УСЛОВИЯ: (a) если гипотеза 𝐻 0 верна, то распределение величины 𝑑 либо целиком известно, либо при больших n сближается с известным распределе- нием 𝜚; (b) если гипотеза 𝐻 0 верна, то 𝑑 𝑝 → ∞ 22. ТЕОРЕМА КОЛМОГОРОВА, ТЕОРЕМА ПИРСОНА. Колмогоро- ва. Пусть − → 𝑋 ∈ 𝐹 0 , где 𝐹 0 - непрерывная. Тогда 𝑑 𝑘 = √ 𝑛 sup |𝐹 * 𝑛 − 𝐹 (𝑡)| ⇒ 𝜂, где 𝜂 имеет распределение Колмогорова 𝐾(𝑡) = +∞ ∑︁ 𝑗=−∞ (−1) 𝑗 𝑒 −𝛼𝑗 2 𝑡 2 . Пирсона. Пусть 𝑋 ∈ 𝐹 0 , тогда 𝑑 𝑥 2 = 𝑛 ∑︁ 𝑗=1 (𝑣 𝑗 − 𝑛𝑝 𝑗 ) 2 𝑛𝑝 𝑗 ⇒ 𝜂 ∈ 𝑥 2 𝑘−1 6 23. ТЕОРЕМА СТЬЮДЕНТА. 24. КРИТЕРИЙ СТЬЮДЕНТА. 25. ТЕОРЕМА ФИШЕРА. 7 26. КРИТЕРИЙ ФИШЕРА. 27. РЕАЛЬНО ДОСТИГНУТЫЙ УРОВЕНЬ ЗНАЧИМОСТИ. 8 (−2.35766 ≤ 𝑎 ≤ −1.80714) (−2.33167 ≤ 𝑎 ≤ −1.83313) (︀0.368054 ≤ 𝜎 2 ≤ 0.943518 )︀ (︀0.351328 ≤ 𝜎 2 ≤ 0.909492 )︀ 9 |