твмс. ТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20). Контрольная работа выполняется и оформляется при соблюдении следующих правил
Скачать 2.47 Mb.
|
2. Постановка задачи Предположим, что по данным выборки исследуется некоторый количественный признак X генеральной совокупности. Пусть признак X подчинен нормальному закону распределения вероятностей с параметрами M(x) = a — математическое ожидание и σ(Х) = σ — среднее квадратическое отклонение. Задача заключается в том, чтобы с заданной надежностью (доверительной вероятностью) γ получить интервальную оценку неизвестного значения параметра а: а) при известном σ, б) при неизвестном σ. Получить интервальную оценку — это означает, что, в условиях сформулированной задачи, необходимо составить такие статистики и при помощи которых, подставляя вместо любое значение опытных данных мы получили бы численные значения и границ интервала, накрывающего параметр а с заданной надежностью γ. Решение задачи основано на применении следующей теоремы. Теорема Фишера. Пусть 1) — случайная выборка объемом п из генеральной совокупности нормально распределенной случайной величины X с параметрами а и σ, 2)выборочное среднее (9) 3) выборочная дисперсия (10) Тогда 1) статистика (11) имеет нормированное нормальное распределение N (x; 0; 1); 2) статистика (12) имеет распределение с числом k = n – 1 степеней свободы; 3) статистика (13) где — выборочное среднее квадратическое отклонение, имеет распределение Стьюдента с k = n – 1 числом степеней свободы, 4) случайные величины и независимы. 3. Построение интервальной оценки для параметра а при известном Интервал (14) называется доверительным интервалом для параметра а, его границы (15) являются случайными и образуют интервальную оценку для параметра a с помощью двух чисел: (нижняя граница), (верхняя граница) с доверительной вероятностью γ. Здесь — точность оценки. Поскольку на основании теоремы Фишера распределяется по нормальному закону с параметрами то вероятность отклонения от параметра a на величину меньше, чем , определяется из выражения: (16) где — функция Лапласа, (17) Из (17) получаем (18) тогда (19) Следовательно, доверительный интервал (20) с надежностью γ и точностью предоставляет интервальную оценку для неизвестного математического ожидания a нормально распределенного количественного признака X при известном среднем квадратическом отклонении признака X. Вместо в (20) подставим его значение значение t находим по таблице значений функции Лапласа (прил. 3) (21) тогда получаем значение искомой интервальной оценки для неизвестного значения параметра a признака X в виде (22) 4. Построение интервальной оценки для параметра а при неизвестном На основании теоремы Фишера статистика (23) где — выборочное среднее, (24), — выборочное среднее квадратическое отклонение, (25), подчиняется закону распределения Стьюдента с k = n – 1 числом степеней свободы. Пусть — плотность вероятностей распределения Стьюдента. Тогда (26) где — функция распределения Стьюдента с k = n – 1 числом степеней свободы, γ — уровень доверительной вероятности, γ = 1 – , — уровень значимости. Из (26) получаем (27) или (28) где — квантиль распределения Стьюдента с числом k = n – 1 степеней свободы и порядком квантили Подставляя в (28) вместо выборочных характеристик и S их численные значения и s, определенные по данным выборки — среднее значение выборки, (29) — значение среднего квадратического отклонения выборки, (30) окончательно получаем интервальную оценку неизвестного a в виде двух чисел или, что то же самое, значения границ доверительного интервала, накрывающего с уровнем доверительной вероятности γ = 1 – неизвестное значение параметра а количественного признака X при неизвестном σ: (31) Пример. В результате 10 независимых измерений некоторой случайной величины X, выполненных с одинаковой точностью, получены опытные данные
Предполагая, что случайная величина X подчинена нормальному закону распределения вероятностей, оценить математическое ожидание случайной величины X при помощи доверительного интервала с уровнем доверительной вероятности γ = 0,95. Решение. 1. Опытные данные являются реализацией случайной выборки полученной из случайной величины X (генеральной совокупности). По опытным данным (по выборке) определяем выборочные значения и s выборочных характеристик соответственно, среднего и среднего квадратического отклонения S случайной выборки по формулам 2. В соответствии с теоремой Фишера статистика (случайная величина) (13) распределена по закону Стьюдента с числом степеней свободы. Предварительно из таблицы квантилей распределения Стьюдента по значениям порядка квантили и числа степеней свободы k= 9 находим квантиль (прил. 6). 3. Определяем границы доверительного интервала, являющиеся нижним aн и верхним aв значениями интервальной оценки неизвестного истинного значения математического ожидания а случайной величины Х (исследуемого количественного признака Х) по формуле (31): 4. Ответ: доверительный интервал (1,47; 3,13) с уровнем доверительной вероятности = 0,95 накрывает неизвестное истинное значение математического ожидания а случайной величины Х и представляет его интервальную оценку. Задача 6. Статистическая проверка гипотез [1, С, 10.4], [2, 25.5], [5, гл. 13, § 16–21], [6, разд. 2, гл. 7], [7, разд. 2, гл. 8] 1. Основные понятия и общая постановка задачи При исследовании закона распределения вероятностей случайной величины Х выдвигаются статистические гипотезы. Под статистической гипотезой понимаем любое предположение о генеральной совокупности Х, которое можно поверить по результатам независимых наблюдений (опытным данным) в случайной выборке из генеральной совокупности Х. Одновременно из соображений физического характера или на основании имеющегося статистического материала формулируются две гипотезы: проверяемая, которая называется основной и обозначается Ho, и альтернативная (конкурирующая) H1. Пример 1. Генеральная совокупность (случайная величина) Х распределена по нормальному закону, но неизвестен его параметр а — математическое ожидание. Проведен опыт по независимым наблюдениям над значениями случайной величины Х и в результате из генеральной совокупности Х получена выборка Проверить гипотезу Ho о том, что параметр а = 5 при альтернативной гипотезе Н1: а 5. Статистическая гипотеза Ho о параметрах закона распределения генеральной совокупности Х называется параметрической. Пример 2. Распределение генеральной совокупности Х неизвестно. Проведен опыт по независимым наблюдениям над значениями случайной величины Х, в результате которого из генеральной совокупности Х получена выборка Требуется проверить гипотезу Ho о том, что генеральная совокупность Х распределена по нормальному закону при альтернативной гипотезе Н1: генеральная совокупность Х распределена по какому-либо другому закону. Статистическая гипотеза Ho о виде закона распределения генеральной совокупности Х называется непараметрической. При проверке статистической гипотезы осуществляется выбор между основной и альтернативной гипотезами с помощью составляемой выборочной характеристики (статистики), называемой статистическим критерием К = Используемые статистические критерии имеют известные распределения и, как правило, общепринятые обозначения, например, статистический критерий Z = Z имеет нормальное распределение, F = F — распределениe Фишера, T = T — распределениe Стьюдента, — распределение хи-квадрат. По результатам проверки гипотеза Ho может быть признана либо ложной, либо истинной. Но в том и в другом случаях ввиду целого ряда причин, повлиять на которые заранее не представляется возможным (например, из-за случайного характера выборки, ограниченности ее объема, непредставительности), может быть допущена случайная ошибка и принято неправильное решение: а) гипотеза Ho признается ложной, хотя в действительности она является истинной. Ошибка называется ошибкой 1-го рода, когда истинная гипотеза Ho признается ложной и отвергается, но принимается ложная гипотеза H1. Вероятность ошибки 1-го рода обозначается α и называется уровнем значимости статистического критерия; б) гипотеза Ho признается истинной, хотя в действительности она является ложной. Ошибка называется ошибкой 2-го рода, когда ложная гипотеза Ho признается истинной и принимается, а отвергается истинная гипотеза H1. Вероятность ошибки 2-го рода обозначается β, вероятность M = 1 – β противоположного события « не совершить ошибку 2-го рода» (отклонение проверяемой ложной гипотезы Ho при условии, что верна альтернативная гипотеза H1) называется мощностью статистического критерия. Мощность является важнейшей характеристикой статистического критерия: чем больше мощность, тем меньше вероятность совершить ошибку 2-го рода. Вероятность α и β выражает степень риска совершить ошибки, соответственно, 1-го и 2-го рода. Очевидно, что случайные события, противоположные ошибкам 1-го и 2-го рода, состоят в принятии правильного решения в следующих случаях: а) гипотеза Ho признана истинной, когда в действительности она также истинна, — событие А; б) гипотеза Ho признана ложной, когда в действительности она также ложная, — событие В. В соответствии с теоремой о вероятности суммы противоположных событий вероятности событий А и В равны: P(A) = 1 – , P(B) = 1 – . Между α и имеет место обратная взаимосвязь: чем меньше , тем больше и наоборот. Очевидно также, что чем меньше и , тем лучше. Однако, учитывая их взаимосвязь, приходится искать некоторый компромисс между значениями и . Учитывая случайный характер ошибок 1-го и 2-го рода и противоположных им событий А и В, применение статистического критерия К = f с целью проверки гипотезы Ho предполагает построение двух непересекающихся областей значений критерия: доверительной области G, попадание в которую с доверительной вероятностью γ = 1 – дает основание принять гипотезу Ho, и критической области попадание в которую с уровнем значимости (вероятностью) α дает основание отклонить гипотезуHo. Критическая область строится в соответствии с заданным уровнем значимости попадания в нее выборочного значения k = статистического критерия K = . Обычно уровень выбирается достаточно малым, из набора стандартных значений = 0,005; 0,01; 0,05; 0,1 с тем, чтобы случайное событие и попадание выборочного значения k = f(x1,…,xn) в критическую область считалось практически невозможным, лишь с некоторой степенью риска α. Однако, при заданном уровне значимости можно по-разному строить критическую область с помощью составляемого статистического критерия K = . Чтобы критическая область была наилучшей, необходимо, чтобы вероятность попадания в нее выборочного значения k = была наилучшей при условии истинности альтернативной гипотезы в соответствии с леммой Неймана — Пирсона. |