Главная страница
Навигация по странице:

  • Теорема Фишера.

  • 4. Построение интервальной оценки для параметра

  • Ответ

  • твмс. ТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20). Контрольная работа выполняется и оформляется при соблюдении следующих правил


    Скачать 2.47 Mb.
    НазваниеКонтрольная работа выполняется и оформляется при соблюдении следующих правил
    Дата21.12.2022
    Размер2.47 Mb.
    Формат файлаdoc
    Имя файлаТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20).doc
    ТипКонтрольная работа
    #857186
    страница6 из 9
    1   2   3   4   5   6   7   8   9

    2. Постановка задачи

    Предположим, что по данным выборки исследуется некоторый количественный признак X генеральной совокупности. Пусть признак X подчинен нормальному закону распределения вероятностей с параметрами M(x) = a математическое ожидание и σ(Х) = σ — среднее квадратическое отклонение.

    Задача заключается в том, чтобы с заданной надежностью (доверительной вероятностью) γ получить интервальную оценку неизвестного значения параметра а: а) при известном σ, б) при неизвестном σ.

    Получить интервальную оценку — это означает, что, в условиях сформулированной задачи, необходимо составить такие статистики и при помощи которых, подставляя вместо любое значение опытных данных  мы получили бы численные значения и границ интервала, накрывающего параметр а с заданной надежностью γ.

    Решение задачи основано на применении следующей теоремы.

    Теорема Фишера. Пусть 1) — случайная выборка объемом п из генеральной совокупности нормально распределенной случайной величины X с параметрами а и σ, 2)выборочное среднее

    (9)

    3) выборочная дисперсия

    (10)

    Тогда 1) статистика

    (11)

    имеет нормированное нормальное распределение N (x; 0; 1);

    2) статистика

    (12)

    имеет распределение с числом k = n – 1 степеней свободы;

    3) статистика

    (13)
    где — выборочное среднее квадратическое отклонение, имеет распределение Стьюдента с k = n – 1 числом степеней свободы,

    4) случайные величины  и  независимы.

    3. Построение интервальной оценки для параметра а при известном

    Интервал

    (14)

    называется доверительным интервалом для параметра а, его границы

    (15)

    являются случайными и образуют интервальную оценку для параметра a с помощью двух чисел: (нижняя граница), (верхняя граница) с доверительной вероятностью γ. Здесь  — точность оценки.

    Поскольку на основании теоремы Фишера распределяется по нормальному закону с параметрами то вероятность отклонения  от параметра a на величину меньше, чем , определяется из выражения:

    (16)

    где — функция Лапласа,

    (17)

    Из (17) получаем

    (18)

    тогда

    (19)

    Следовательно, доверительный интервал

    (20)

    с надежностью γ и точностью предоставляет интервальную оценку для неизвестного математического ожидания a нормально распределенного количественного признака X при известном среднем квадратическом отклонении  признака X.

    Вместо в (20) подставим его значение значение t находим по таблице значений функции Лапласа (прил. 3)

    (21)

    тогда получаем значение искомой интервальной оценки для неизвестного значения параметра a признака X в виде

    (22)

    4. Построение интервальной оценки для параметра а при неизвестном

    На основании теоремы Фишера статистика

    (23)

    где — выборочное среднее, (24), — выборочное среднее квадратическое отклонение, (25),

    подчиняется закону распределения Стьюдента с k = n – 1 числом степеней свободы.

    Пусть  — плотность вероятностей распределения Стьюдента. Тогда

    (26)

    где — функция распределения Стьюдента с k = n – 1 числом степеней свободы, γ — уровень доверительной вероятности, γ = 1 – ,  — уровень значимости.

    Из (26) получаем

    (27)

    или

    (28)

    где — квантиль распределения Стьюдента с числом k = n – 1 степеней свободы и порядком квантили

    Подставляя в (28) вместо выборочных характеристик и S их численные значения и s, определенные по данным выборки

    — среднее значение выборки, (29)

    — значение среднего квадратического отклонения выборки, (30)

    окончательно получаем интервальную оценку неизвестного a в виде двух чисел или, что то же самое, значения границ доверительного интервала, накрывающего с уровнем доверительной вероятности γ = 1 –  неизвестное значение параметра а количественного признака X при неизвестном σ:

    (31)
    Пример. В результате 10 независимых измерений некоторой случайной величины X, выполненных с одинаковой точностью, получены опытные данные

    x1

    x2

    x3

    x4

    x5

    x6

    x7

    x8

    x9

    x10

    1

    2

    2

    2

    3

    1

    1

    3

    4

    4

    Предполагая, что случайная величина X подчинена нормальному закону распределения вероятностей, оценить математическое ожидание случайной величины X при помощи доверительного интервала с уровнем доверительной вероятности γ = 0,95.

    Решение. 1. Опытные данные являются реализацией случайной выборки полученной из случайной величины X (генеральной совокупности). По опытным данным (по выборке) определяем выборочные значения и s выборочных характеристик соответственно, среднего и среднего квадратического отклонения S случайной выборки по формулам



    2. В соответствии с теоремой Фишера статистика (случайная величина) (13) распределена по закону Стьюдента с числом степеней свободы. Предварительно из таблицы квантилей распределения Стьюдента по значениям порядка квантили и числа степеней свободы k= 9 находим квантиль (прил. 6).

    3. Определяем границы доверительного интервала, являющиеся нижним aн и верхним aв значениями интервальной оценки неизвестного истинного значения математического ожидания а случайной величины Х (исследуемого количественного признака Х) по формуле (31):



    4. Ответ: доверительный интервал (1,47; 3,13) с уровнем доверительной вероятности  = 0,95 накрывает неизвестное истинное значение математического ожидания а случайной величины Х и представляет его интервальную оценку.

    Задача 6. Статистическая проверка гипотез

    [1, С, 10.4], [2, 25.5], [5, гл. 13, § 16–21], [6, разд. 2, гл. 7], [7, разд. 2, гл. 8]

    1. Основные понятия и общая постановка задачи

    При исследовании закона распределения вероятностей случайной величины Х выдвигаются статистические гипотезы.

    Под статистической гипотезой понимаем любое предположение о генеральной совокупности Х, которое можно поверить по результатам независимых наблюдений (опытным данным) в случайной выборке  из генеральной совокупности Х.

    Одновременно из соображений физического характера или на основании имеющегося статистического материала формулируются две гипотезы: проверяемая, которая называется основной и обозначается Ho, и альтернативная (конкурирующая) H1.

    Пример 1. Генеральная совокупность (случайная величина) Х распределена по нормальному закону, но неизвестен его параметр а — математическое ожидание. Проведен опыт по независимым наблюдениям над значениями случайной величины Х и в результате из генеральной совокупности Х получена выборка Проверить гипотезу Ho о том, что параметр а = 5 при альтернативной гипотезе Н1: а 5.

    Статистическая гипотеза Ho о параметрах закона распределения генеральной совокупности Х называется параметрической.

    Пример 2. Распределение генеральной совокупности Х неизвестно. Проведен опыт по независимым наблюдениям над значениями случайной величины Х, в результате которого из генеральной совокупности Х получена выборка Требуется проверить гипотезу Ho о том, что генеральная совокупность Х распределена по нормальному закону при альтернативной гипотезе Н1: генеральная совокупность Х распределена по какому-либо другому закону.

    Статистическая гипотеза Ho о виде закона распределения генеральной совокупности Х называется непараметрической.

    При проверке статистической гипотезы осуществляется выбор между основной и альтернативной гипотезами с помощью составляемой выборочной характеристики (статистики), называемой статистическим критерием К = Используемые статистические критерии имеют известные распределения и, как правило, общепринятые обозначения, например, статистический критерий Z = Z имеет нормальное распределение, F = F — распределениe Фишера, T = T — распределениe Стьюдента, распределение хи-квадрат.

    По результатам проверки гипотеза Ho может быть признана либо ложной, либо истинной. Но в том и в другом случаях ввиду целого ряда причин, повлиять на которые заранее не представляется возможным (например, из-за случайного характера выборки, ограниченности ее объема, непредставительности), может быть допущена случайная ошибка и принято неправильное решение:

    а) гипотеза Ho признается ложной, хотя в действительности она является истинной.

    Ошибка называется ошибкой 1-го рода, когда истинная гипотеза Ho признается ложной и отвергается, но принимается ложная гипотеза H1.

    Вероятность ошибки 1-го рода обозначается α и называется уровнем значимости статистического критерия;

    б) гипотеза Ho признается истинной, хотя в действительности она является ложной.

    Ошибка называется ошибкой 2-го рода, когда ложная гипотеза Ho признается истинной и принимается, а отвергается истинная гипотеза H1.

    Вероятность ошибки 2-го рода обозначается β, вероятность M = 1 – β противоположного события « не совершить ошибку 2-го рода» (отклонение проверяемой ложной гипотезы Ho при условии, что верна альтернативная гипотеза H1) называется мощностью статистического критерия. Мощность является важнейшей характеристикой статистического критерия: чем больше мощность, тем меньше вероятность совершить ошибку 2-го рода.

    Вероятность α и β выражает степень риска совершить ошибки, соответственно, 1-го и 2-го рода.

    Очевидно, что случайные события, противоположные ошибкам 1-го и 2-го рода, состоят в принятии правильного решения в следующих случаях:

    а) гипотеза Ho признана истинной, когда в действительности она также истинна, — событие А;

    б) гипотеза Ho признана ложной, когда в действительности она также ложная, — событие В.

    В соответствии с теоремой о вероятности суммы противоположных событий вероятности событий А и В равны: P(A) = 1 – , P(B) = 1 – .

    Между α и  имеет место обратная взаимосвязь: чем меньше , тем больше  и наоборот. Очевидно также, что чем меньше  и , тем лучше. Однако, учитывая их взаимосвязь, приходится искать некоторый компромисс между значениями  и .

    Учитывая случайный характер ошибок 1-го и 2-го рода и противоположных им событий А и В, применение статистического критерия К = f с целью проверки гипотезы Ho предполагает построение двух непересекающихся областей значений критерия: доверительной области G, попадание в которую с доверительной вероятностью γ = 1 –  дает основание принять гипотезу Ho, и критической области попадание в которую с уровнем значимости (вероятностью) α дает основание отклонить гипотезуHo. Критическая область строится в соответствии с заданным уровнем значимости  попадания в нее выборочного значения k = статистического критерия K = .

    Обычно уровень  выбирается достаточно малым, из набора стандартных значений  = 0,005; 0,01; 0,05; 0,1 с тем, чтобы случайное событие и попадание выборочного значения k = f(x1,…,xn) в критическую область   считалось практически невозможным, лишь с некоторой степенью риска α.

    Однако, при заданном уровне значимости  можно по-разному строить критическую область с помощью составляемого статистического критерия K = . Чтобы критическая область была наилучшей, необходимо, чтобы вероятность попадания в нее выборочного значения k = была наилучшей при условии истинности альтернативной гипотезы   в соответствии с леммой Неймана — Пирсона.
    1   2   3   4   5   6   7   8   9


    написать администратору сайта