Главная страница
Навигация по странице:

  • 8. Статистическая проверка статистических гипотез. Виды гипотез, ошибки первого и второго рода. Критическая область и область принятия гипотезы, определения, примеры.

  • анализ данных ответы на экзмен. анализ данных ответы на экзамен. 1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая фция распределения. Полигон и гистограмма


    Скачать 74.77 Kb.
    Название1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая фция распределения. Полигон и гистограмма
    Анкоранализ данных ответы на экзмен
    Дата17.11.2019
    Размер74.77 Kb.
    Формат файлаdocx
    Имя файлаанализ данных ответы на экзамен.docx
    ТипДокументы
    #95587
    страница5 из 7
    1   2   3   4   5   6   7

    7. Интервальные оценки неизвестных параметров генеральной совокупности. Доверительная вероятность. Интервальная оценка мат. Ожидания нормально распределенного признака при известном ср. квадратическом отклонении.
    Интервальной называют оценку, к. определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.
    Пусть найденная по данным выборки статистическая хар-ка θ* служит оценкой неизвестного параметра θ. Будем считать θ постоянным числом (θ может быть и случайной величиной). Ясно, что θ* тем точнее определяет параметр θ, чем меньше абсолютная величина разности |θ - θ*|. Другими словами, если δ>0 и |θ - θ*| <δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.
    Однако статистические методы не позволяют категорически утверждать, что оценка θ* удовлетворяет неравенству |θ - θ*| <δ; можно лишь говорить о вероятности γ, с к. это неравенство осуществляется.
    Надежностью (доверительной вероятностью) оценки θ по θ* называют вероятность γ, с к. осуществляется неравенство |θ - θ*| <δ. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к 1. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
    Доверительным называют интервал (θ-δ, θ+δ), к. покрывает неизвестный параметр с заданной надежностью γ.
    Интервальной оценкой (с надежностью γ) математического ожидания а нормально распределенного количественного признака Х по выборочной средней при известном ср. квадратическом отклонении σ генеральной совокупности служит доверительный интервал
    , где =δ – точность оценки, n – объем выборки, t – значение аргумента ф-ции Лапласа Ф(t), при к. Ф(t)=γ/2; при неизвестном σ (и объеме выборки n<30)
    , где s – «исправленное» выборочное среднее кв. отклонение, tγ находят по таблице по заданным n и γ.
    Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака Х по «исправленному» выборочному ср. квадратическому отклонению s служит доверительный интервал
    s(1-q)<σ0<σ1), где q находят по таблице по заданным n и γ.
    Интервальной оценкой (с надежностью γ) неизвестной вероятности р биномиального распределения по относит. Частоте w служит доверительный интервал (с приближенными концами р1 и р2)
    р12, где
    ,
    ,
    где n – общее число испытаний; m – число появлений события; w – относительная частота, равная отн-ю m/n; t – значение аргумента ф-ции Лапласа, при к. Ф(t)=γ/2

    8. Статистическая проверка статистических гипотез. Виды гипотез, ошибки первого и второго рода. Критическая область и область принятия гипотезы, определения, примеры.
    Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Например, статистическими явл. Гипотезы:
    1) генеральная совокупность распределена по закону Пуассона
    2) дисперсии двух нормальных совокупностей равны между собой
    В первой гипотезе сделано предположение о виде неизвестного распределения, во второй – о параметрах двух известных распределений.
    Гипотеза «на Марсе есть жизнь» не явл. Статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения.
    Нулевой (основной) называют выдвинутую гипотезу Н0.
    Конкурирующей (альтернативной) называют гипотезу Н1, к. противоречит нулевой.
    Например, если нулевая гипотеза состоит в предположении, что мат. Ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а≠10. Коротко это записывают так: Н0: а=10; Н1: а≠10.
    Различают гипотезы, к. содержат 1 и более 1 предположений.
    Простой называют гипотезу, содержащую только 1 предположение. Например, если λ – параметр показательного распределения, то гипотеза Н0: λ=5 – простая. Гипотеза Н0: мат. Ожидание нормального распределения равно 3 (σ известно) – простая.
    Сложной называют гипотезу, к. состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза Н: λ>5 состоит из бесчисленного мн-ва простых вида Нi:λ=bi, где bi – любое чисто, большее 5. Гипотеза Н0: мат. Ожидание нормального распределения равно 3 (σ неизвестно) – сложная.
    В итоге проверки гипотезы могут быть допущены ошибки двух родов.
    Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через α.
    Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рожа обозначают через β.
    Последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей.
    Статистическим критерием (или просто критерием) называют случайную величину К, к. служит для проверки гипотезы.
    Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимают отн-е исправленных выборочных дисперсий:
    F=s12/s22 .
    Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперед неизвестные значения, и распределена по закону Фишера-Снедекора.
    Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
    Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсии s12 = 20 и s22 = 5, то наблюдаемое значение критерия F
    Fнабл = s12/s22 = 20/5 = 4
    Критической областью называют совокупность значений критерия, при к. нулевую гипотезу отвергают.
    Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при к. нулевую гипотезу принимают.
    Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение принадлежит области принятия гипотезы – гипотезу принимают.
    Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
    Различают одностороннюю(правостороннюю или левостороннюю) и двустороннюю критические области.
    Правосторонней называют критическую область, определяемую неравенством K>kкр, где kкр - положительное число.
    Левосторонней называют критическую область, определяемую неравенством Kкр , где kкр - отрицательное число.
    Двусторонней называют критическую область, определяемую неравенствами K 1, K> k2, где k2> k1.
    В частности, если критические т. Симметричны отн. Нуля, двусторонняя критическая обл. определяется неравенствами (в предположении, что kкр>0): К<- kкр, К> kкр , или равносильным неравенством |K|> kкр.
    Для отыскания критической обл. задаются уровнем значимости α и ищут критические точки, исходя из сл. Соотношений:
    1) для правосторонней кр. Обл.
    Р(K>kкр) =α (kкр>0)
    2) для левосторонней кр. Обл.
    Р(Kкр) =α (kкр <0)
    3) для двусторонней симметричной области
    Р(K>kкр) = (α/2) (kкр>0), Р (К<- kкр) = α/2.
    Мощностью критерия называют вероятность попадания критерия в критическую обл. при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.
    1   2   3   4   5   6   7


    написать администратору сайта