Главная страница
Навигация по странице:

  • 2.2. Статистические гипотезы Статистической гипотезой

  • Возможные выводы при проверке гипотез

  • Количество измерений, необходимое для построения доверительного интервала для математического ожидания

  • 2.4. Исключение грубых погрешностей

  • 2.6. Сравнение двух дисперсий

  • 2.7. Проверка гипотезы о законе распределения 2.7.1. Общие сведения

  • Реброва ТПЭ. Программа для чтения pdfфайлов Adobe Acrobat Reader Редактор Н. И. Косенкова Техническая подготовка Т. И. Кукина Издание первое. Дата подписания к использованию 18. 03. 2016


    Скачать 1.31 Mb.
    НазваниеПрограмма для чтения pdfфайлов Adobe Acrobat Reader Редактор Н. И. Косенкова Техническая подготовка Т. И. Кукина Издание первое. Дата подписания к использованию 18. 03. 2016
    Дата06.10.2021
    Размер1.31 Mb.
    Формат файлаpdf
    Имя файлаРеброва ТПЭ.pdf
    ТипПрограмма
    #242678
    страница3 из 13
    1   2   3   4   5   6   7   8   9   ...   13
    19
    Следовательно, можно записать следующее вероятностное ут- верждение:
















    1
    /
    1
    t
    n
    m
    x
    t
    P
    (2.5)
    Преобразуем выражение в скобках:

















    1 1
    n
    t
    x
    m
    n
    t
    x
    P
    (2.6)
    Величина
    Д
    P



    1
    – доверительная вероятность. При этой до- верительной вероятности доверительный интервал для математиче- ского ожидания
    1
    m
    задается пределами
    

    







    n
    t
    x
    n
    t
    x
    ;
    Величина
    x
    x
    S
    t
    n
    t






    представляет случайную ошибку наблюдения.
    На практике, как правило, число измерений не превышает
    10…30. При таком числе наблюдений фактическая дисперсия
    2
     не- известна, поэтому при построении доверительного интервала для ма- тематического ожидания используют выборочную дисперсию
    2
    x
    S
    При этом t-критерий имеет распределение Стьюдента и зависит от числа степеней свободы d.f.
    Число степеней свободы – это понятие, которое учитывает в статистических ситуациях связи, ограничивающие свободу изменения случайных величин. Поэтому число степеней свободы вычисляется
    Рис. 2.1. Кривые плотности вероятности:
    a – нормального распределения; бt-распределения

    t
    Площадь


    1
    Площадь
    2
    /

    Площадь
    2
    /


    t
    t
     
    t
    p
     
    t
    p
    0,4
    0,1
    -2 4
    2 0
    -
    4
    t
    d.f =
    d.f = 5
    d.f = 1
    а
    б
    Си бА
    ДИ

    20
    как разность между числом экспериментальных точек n и числом свя- зей, ограничивающих свободу изменения случайной величины.
    Так, при вычислении выборочно дисперсии по формуле (2.3) на- блюдается одна связь, определяемая уровнем выборочного среднего, поэтому число степеней свободы выборочной дисперсии
    1

    n
    f
    d
    , а для дисперсии, найденной из соотношения (2.2), число степеней сво- боды равно числу испытаний, так как m
    1
    определено независимым способом.
    2.2. Статистические гипотезы
    Статистической гипотезой H называется предположение о свойстве генеральной совокупности, которое можно проверить, опи- раясь на данные выборки. Гипотезы о параметрах генеральной сово- купности называются параметрическими, о распределениях – непара- метрическими.
    Любая гипотеза формулируется до опыта и проверяется на ос- нове последующего эксперимента. Основная гипотеза
    0
    H
    обычно вы- сказывается в форме, отрицающей наличие каких-либо видимых от- личий, поэтому гипотеза
    0
    H
    называется нулевой. Одновременно формулируется альтернативная гипотеза
    1
    H
    Проверка гипотезы осуществляется на основе выявления согла- сованности эмпирических (экспериментальных) данных с гипотетиче- скими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу при- нимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Нулевая гипотеза отвергается тогда, когда по выборке полу- чается результат, который при истинности выдвинутой нулевой гипо- тезы маловероятен. Границей невозможного или маловероятного обычно считают


    0,05, или 0,01, или 0,001 и называют уровнем
    значимости.
    Процедура проверки гипотезы производится при помощи стати-
    стического критерия – правила, определяющего условия, при кото- ром проверяемую нулевую гипотезу следует либо принять, либо от- клонить. Критерий представляет собой случайную функцию резуль- татов наблюдения с известным законом распределения (t-, F-,
    2

    - критерий). В соответствии с характером распределения одни значения
    Си бА
    ДИ

    21
    критерия являются более вероятными, другие – менее. Таким обра- зом, область возможных значений делится на две части. Одна называ- ется областью принятия гипотезы, другая (где гипотеза должна быть отвергнута) – критической областью. Чтобы проверить гипоте- зу, необходимо вычислить критерий и посмотреть, в какую область попадает вычисленное значение.
    Проверка статистических гипотез складывается из следующих этапов:
     формулируется в виде статистической гипотезы задача ис- следования;
     выбирается статистическая характеристика гипотезы;
     выбираются нулевая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий;
     выбирается приемлемый уровень значимости;
    выбирается критерий проверки гипотезы;
     вычисляется фактическое значение статистического крите- рия;
     определяется критическое значение статистического крите- рия по соответствующей таблице;
     проверяется нулевая гипотеза на основе сравнения фактиче- ского и критического значений критерия, в зависимости от результа- тов проверки гипотеза либо отклоняется, либо не отклоняется.
    При проверке гипотез по одному из критериев возможны два ошибочных решения:
     неправильное отклонение нулевой гипотезы – ошибка перво- го рода;
     неправильное принятие нулевой гипотезы – ошибка второго рода.
    Возможные решения приведены в табл. 2.1. Вероятность ошибки первого рода равна уровню значимости  . Вероятность не совершить ошибку второго рода




    1
    называют мощностью критерия. Обычно задают  и пытаются сделать  возможно малым.
    Таблица 2.1
    Возможные выводы при проверке гипотез
    Решение по критерию
    Фактически
    0
    H верна
    0
    H не верна
    0
    H отклоняется
    Ошибка первого рода
    Правильное решение
    0
    H не отклоняется
    Правильное решение
    Ошибка второго рода
    Си бА
    ДИ

    22
    2.3. Определение необходимого количества опытов
    при построении интервальной оценки
    для математического ожидания
    Увеличение количества измерений даже при неизменной их точности (
    const


    ) может увеличить доверительную вероятность Р или сузить доверительный интервал


    для определения действи- тельного значения измеряемой величины (математического ожида- ния).
    Необходимое количество измерений n для достижения требуе- мой точности  при заданной доверительной вероятности Р можно определить заранее в том случае, когда известно действительное зна- чение среднеквадратического отклонения (СКО)  , а эксперимен- тальные данные подчиняются нормальному закону распределения.
    Действительно, при этих допущениях число измерений можно определить
    2 2
    2



















    t
    t
    n
    ,
    (
    2.7) где t – критерий для нормального закона распределения вероятностей.
    Таким образом, число измерений n определяется требуемой до- верительной вероятностью (уровнем значимости) и относительным
    (по отношению к среднеквадратичному отклонению) значением по- ловины ширины доверительного интервала  , т.е. требуемой точно- стью определения измеряемой величины. Так при t=1,96 для Р=0,95 или
    05
    ,
    0


    ,



    число измерений n = 4; при t=3 для Р=0,9973,



    , n = 9.
    При увеличении необходимой точности измерений в 2 раза, т.е. сужении доверительного интервала до величины
    2
    /



    , необходи- мое число измерений составит n =16. Нетрудно заметить, что необхо- димое число измерений с увеличением точности возрастает в квадра- тичной зависимости.
    Как правило, действительное значение среднеквадратической ошибки неизвестно, а имеется только её оценка S
    x
    . Тогда
    2 2
    2

















    x
    x
    S
    t
    S
    t
    n
    ,
    (2.8) где t-критерий Стьюдента.
    Значение критерия Стьюдента зависит не только от выбранного уровня значимости  , но и от числа степеней свободы d.f, которое
    Си бА
    ДИ

    23
    определяется числом измерений. В связи с этим последнее уравнение следует решать методом последовательных приближений. В качестве начального приближения можно задать, в частности, число измере- ний, рассчитанных по формуле для нормального закона распределе- ния. Далее решая уравнения методом последовательных приближе- ний при
    05
    ,
    0


    ,
    x
    S


    , для определения доверительного интервала требуется 7 измерений, при
    x
    S
    5
    ,
    0


    n = 19. С повышением необхо- димой точности различие в числе измерений, рассчитанных при нор- мальном законе распределения и распределении Стьюдента, умень- шается и при
    x
    S
    2
    ,
    0


    практически совпадает.
    Необходимое количество измерений при построении довери- тельного интервала для математического ожидания приведено в табл.
    2.2.
    В скобках приведены данные для нормального закона распреде- ления.
    Таблица 2.2
    Количество измерений, необходимое для построения доверительного
    интервала для математического ожидания
    x
    S
    /

    Р = 0,90
    Р = 0,95
    Р= 0,99 1
    5 7 (4)
    11 0,5 13 19 (16)
    31 0,4 19 27 (24)
    46 0,3 32 46 (48)
    78 0,1 273 387 (384)
    668
    2.4. Исключение грубых погрешностей
    Даже тщательно поставленные эксперименты могут давать не- однородные данные, поскольку в процессе эксперимента могут изме- ниться условия проведения опытов. Если в полученной группе ре- зультатов наблюдений одно или два существенно отличаются от ос- тальных, а наличия ошибки в снятии показаний, описки и других промахов не обнаружено, то необходимо проверить, не являются ли они грубыми погрешностями, подлежащими исключению. Решение этой задачи выполняется общими методами проверки статистических гипотез в предположении нормального распределения результатов наблюдений. Проверяемая гипотеза состоит в утверждении, что ре- зультат i-го наблюдения
    i
    x
    не содержит грубой погрешности, т.е. яв- ляется одним из значений измеряемой величины. Пользуясь опреде-
    Си бА
    ДИ

    24
    ленными статистическими критериями, пытаются опровергнуть вы- двинутую гипотезу. Если это удается, то результат наблюдения рас- сматривают как грубую погрешность и его исключают.
    Критерий оценки анормальности результатов наблюдений при
    неизвестном СКО (критерий Н.В. Смирнова). При исключении по этому критерию грубых погрешностей из результатов наблюдений проводят следующие операции:
     результаты группы из n наблюдений упорядочивают по воз- растанию
    n
    x
    x
    x



    2 1
    . Выделяют предполагаемые промахи, обычно ими могут оказаться результаты
    1
    x
    и
    n
    x
    ;
     вычисляют оценки математического ожидания x и СКО S .
    Значения x и S вычисляют без учета экстремальных значений
    i
    x
    ;
     для предполагаемых промахов проводят расчет коэффициен- тов
    S
    x
    x
    t


    1 1
    ;
    S
    x
    x
    t
    n
    n


    ;
    (2.9)
    ­
    задаются уровнем значимости критерия ошибки  . Очевид- но, этот уровень должен быть достаточно малым, чтобы вероятность ошибки была невелика;
    ­
    по заданным параметрам  , n находят критическое значение
    T
    t
    из таблиц для распределения Стьюдента (n<20) (прил. 4) либо нормального распределения (n>20) (прил. 3);
    ­
    выполняют сравнение коэффициентов, определенных по формулам (2.9), с критическими значениями. Если выполняются ус- ловия
    Т
    t
    t
    1
    и
    Т
    n
    t
    t
    , то результаты
    1
    x
    и
    n
    x
    относят к промахам и ис- ключают из результатов наблюдений. Процедуру проверки повторяют для
    2
    x
    ,
    1

    n
    x
    и т.д., пока все промахи не будут исключены из выборки.
    Критерий «трех сигм». Данный критерий применяется для ре- зультатов измерений, распределенных по нормальному закону, одним из граничных параметров служит оценка СКО измерений
    S . По это- му критерию считается, что результат, полученный с вероятностью
    003 0,


    , маловероятен, и его можно считать промахом, если
    S
    x
    x
    i
    3


    . Данный критерий достаточно хорошо работает при числе измерений
    50 20

    n
    Си бА
    ДИ

    25
    2.5. Сравнение двух рядов наблюдений
    При анализе результатов экспериментальных исследований час- то приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Решение подобных задач осуществляется также с использова- нием аппарата проверки статистических гипотез.
    Гипотеза о равенстве средних выдвигается, когда необходимо определить, существенно ли расхождение между двумя выборочными средними. Для проверки этой гипотезы определяют среднюю (стан- дартную) случайную ошибку разности двух выборочных средних

    S
    Для двух независимых выборок она определяется по формуле
    2 2
    2 1
    2 1
    n
    S
    n
    S
    S



    ,
    (2.10) где
    2 1
    S
    и
    2 2
    S
    – выборочные дисперсии соответственно в первой и вто- рой выборках.
    Фактическое значение критерия



    S
    x
    x
    t
    2 1
    (2.11)
    Критическое значение
    T
    t
    определяют по таблице распределения
    Стьюдента для заданного уровня значимости и числа степеней свобо- ды
    2 2
    1



    n
    n
    f
    d
    . Если
    T
    t
    t
    , нулевая гипотеза принимается. Сле- довательно, можно считать, что математические ожидания в двух подгруппах одинаковы, эти подгруппы можно объединить в одну группу и характеризовать последнюю общим средним.
    2.6. Сравнение двух дисперсий
    При выполнении измерений в различных условиях часто возни- кает задача сравнения степени разброса (дисперсий) исследуемых па- раметров (случайных величин).
    Проверка гипотезы о равенстве дисперсий имеет большое зна- чение, так как измеряемая дисперсией величина рассеяния характери- зует такие важные показатели, как точность машин, приборов, ста- бильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии
    Си бА
    ДИ

    26
    или о качестве выпускаемой продукции вывод можно сделать в ре- зультате сравнения дисперсий тех параметров, которые их характери- зуют.
    Таким образом, требуется установить, являются ли выборочные дисперсии
    2 2
    2 1
    S
    S
    со степенями свободы d.f
    1
    и d.f
    2
    значимо отли- чающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупности или из генеральных совокупностей с равными дисперсиями


    2 2
    2 2
    1





    . В этом случае нулевая гипо- теза формулируется в виде Н
    0
    :
    2 2
    2 2
    1





    , т.е. при заданном уровне значимости  между двумя генеральными дисперсиями нет различия.
    Для проверки этой гипотезы используется критерий, основан- ный на распределении Фишера, зависящий только от числа степеней свободы d.f
    1
    и d.f
    2
    . Аналитическое выражение критерия Фишера имеет вид

     
     
     

    2 1
    2 2
    2 2
    2 1
    2 2
    2 2
    2 1
    2 1






    S
    S
    S
    S
    F
    (2.12)
    Плотность распределения вероятностей р(F) представлена на рис. 2.2.
    Значения F всегда больше единицы.
    Поскольку по условию основной гипотезы
    2 2
    2 2
    1





    , то вы- ражение для F-критерия имеет вид
    2 2
    2 1
    S
    S
    F
    ,
    (2.13) где
    2 2
    2 1
    S
    S
    При проверке расчётное значение сравнивают с табличным, ес- ли
    Т
    F
    F
    , то нулевая гипотеза принимается.
    4 3
    2 1
    0
    F
     
    F
    p
    1,0 0,8 0,6 0,4 0,2
    Рис. 2.2. F-распределение для различных d.
    1
    f
    и d.
    2
    f



    ,
    10


    50
    ,
    10


    10
    ,
    10


    4
    ,
    10
    Си бА
    ДИ

    27
    Следовательно, по двум выборочным дисперсиям можно найти оценку общей генеральной дисперсии




    2 1
    1 2
    1 2
    2 2
    2 1
    1 2






    n
    n
    S
    n
    S
    n
    S
    (2.14)
    2.7. Проверка гипотезы о законе распределения
    2.7.1. Общие сведения
    Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в генеральной совокупности подчиняется какому-то определенному закону. При планировании эксперимента важно, чтобы наблюдаемые значения физических вели- чин подчинялись нормальному закону распределения. Поэтому нуле- вая гипотеза
    0
    H
    : результаты наблюдений подчиняются нормальному закону распределения; альтернативная
    1
    H
    : результаты наблюдений не подчиняются нормальному закону распределения.
    В качестве статистических характеристик гипотезы о законе распределения принимаются оценки параметров распределения.
    Если число наблюдений
    20

    n
    , строится интервальный вариа- ционный ряд. При его построении в первой графе отдельные значения признака указываются в интервалах «от – до», во второй графе – чис- ленность единиц, входящих в интервал. Величина интервала опреде- ляется по формуле
    m
    R
    i
    ,
    (2.15) где R –размах варьирования признака, min max
    x
    x
    R


    ; m – число групп, которое приближенно определяется по формуле Стерджесса
    n
    m
    lg
    32
    ,
    3 1 

    (2.16)
    Полученную по этой формуле величину округляют до целого большего числа. Нижнюю границу первого интервала определяют, вычитая из min
    x
    половину последнего разряда.
    Оценка математического ожидания в этом случае вычисляется по формуле

     


    m
    j
    j
    m
    j
    j
    j
    f
    f
    x
    x
    *
    1
    *
    ,
    (2.17)
    Си бА
    ДИ

    1   2   3   4   5   6   7   8   9   ...   13


    написать администратору сайта