Главная страница
Навигация по странице:

  • Еще один проблемный случай

  • СЛУЧАЙ 2. Выборки зависимы. Проблема.

  • Статистика. 7 проверка стат гипотез. Непараметрические критерии проверки статистических гипотез


    Скачать 30.59 Kb.
    НазваниеНепараметрические критерии проверки статистических гипотез
    АнкорСтатистика
    Дата01.12.2022
    Размер30.59 Kb.
    Формат файлаdocx
    Имя файла7 проверка стат гипотез.docx
    ТипДокументы
    #823547

    Непараметрические критерии проверки статистических гипотез





    Проблема. При испытании нового лекарственного препарата на лабораторных мышах было проведено взвешивание после месячного приема. В эксперименте изучались две группы мышей: опытная (n1=9), которой давали новый препарат и контрольная, принимавшая плацебо (n2=11).

    Были получены следующие данные по весу (г)


    Опытная гр.

    80

    76

    75

    64

    70

    68

    72

    79

    83







    Контрольная гр.

    70

    78

    60

    80

    62

    68

    73

    60

    71

    66

    69


    Необходимо определить, влияет ли новый препарат на привес животных.


    Так как эти данные выборочные, то для выяснения этого вопроса можно было бы найти средние значения веса и сравнить по критерию Стъюдента. Но, вспомним, что основным условием применения t – критерия является нормальное распределение признака. В нашем случае распределение веса неизвестно и проверить его нельзя из-за ограниченности объема выборки.


    Еще один проблемный случай. Как правило, имеющийся дефицит гемодиализной помощи не позволяет уделять должного внимания проблеме лечения терминальной хронической почечной недостаточности у пожилых лиц. Для выяснения действительно ли существует такая проблема, было решено сравнить возрастной состав лиц, лечившихся гемодиализом в странах с развитой экономикой и развивающихся странах. Случайным образом были сформированы выборки таких больных (n1=7, n2=8) в двух странах с различным уровнем развития, и определен возрастной состав.


    1 страна

    Юноша

    (Ю)

    Подросток

    (ПД)

    Пожилой

    (ПЖ)

    Взрослый

    (В)

    Юноша

    (Ю)

    Взрослый

    (В)

    Ребенок

    (Р)




    2 страна

    Ребенок

    (Р)

    Ребенок

    (Р)

    Юноша

    (Ю)

    Взрослый

    (В)

    Пожилой

    (ПЖ)

    Взрослый

    (В)

    Пожилой

    (ПЖ)

    Ребенок

    (Р)





    Исследуемый признак – возраст - является качественным ординальным, для него нельзя вычислить ни среднее значение, ни дисперсию, нельзя определить распределение.

    В случае если распределение случайной величины неизвестно, а также если изучаемые признаки являются качественными ординальными, то для проверки гипотезы о принадлежности двух сравниваемых выборок одной генеральной совокупности может применяться и целый ряд непараметрических критериев, среди которых важное место занимают так называемые ранговые критерии. Применение этих критериев основано на ранжировании членов сравниваемых групп. При этом сравниваются не сами члены ранжированного ряда, а их порядковые номера или ранги.

    Вспомним, что выбор критерия определяется также тем, являются ли сравниваемые выборки зависимыми или независимыми.
    СЛУЧАЙ 1. Выборки независимы.

    Весьма распространенным непараметрическим критерием является U-критерий Манна-Уитни. Рассмотрим расчет этого критерия на примере второго проблемного случая.

    Сформулируем гипотезы:

    Н(0): Возрастной состав лиц, получающих лечение гемодиализом, не зависит от уровня экономического развития страны

    Н(1): Возрастной состав лиц, получающих лечение гемодиализом, не одинаков в странах с различным экономическим уровнем (ненаправленная гипотеза)

    Выберем уровень значимости α=0,01

    Вычислим значение U-критерия по следующему алгоритму

    • Объединим все значения обеих выборок в один ранжированный ряд






    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    1гр

    Р










    ПД

    Ю

    Ю




    В

    В







    ПЖ







    2гр




    Р

    Р

    Р










    Ю







    В

    В




    ПЖ

    ПЖ

    ранг

    2,5

    2,5

    2,5

    2,5

    5

    7

    7

    7

    10,5

    10,5

    10,5

    10,5

    14

    14

    14




    • Каждому элементу этого ряда присвоим ранг, при этом, если несколько элементов ряда совпадают по величине, то каждому присваивается ранг, равный среднему арифметическому их номеров

    • Для каждой выборки находятся суммы рангов

    R1 = 2,5+5+7+7+10,5+10,5+14=56,5

    R2 =2,5+2,5+2,5+7+10,5+10,5+14+14=63,5

    • Рассчитываются статистики:

    г
    де i=1,2 номера выборок

    U1 = 56,5 - 7 * 8/2 =28,5

    U2= 63,5 -8*9/2 = 27,5

    Для проверки правильности расчетов можно использовать следующее соотношение




    В качестве критерия выбираем наименьшую из двух сумм Uвыч = 27,5 и сравниваем ее с табличным значением для nl =7, n2 = 8 и уровня значимости α=0,01 Uкрит = 6 (Приложение 3, двусторонний тест).

    • Если Uвыч > Uкрит то принимается Н(0)

    • Если UвычUкрит то принимается Н(1)

    В нашей задаче вычисленное значение критерия больше табличного, поэтому принимается нулевая гипотеза, и различия в возрастном составе между группами считаются статистически незначимыми (нет аргументов отвергнуть нулевую гипотезу).

    Но окончательно принять нулевую гипотезу мы пока еще не можем, возможно, мы обнаружим различия, если увеличим объем выборки и применим параметрический критерий. Но этот вопрос относится уже к проблемам планирования эксперимента.
    СЛУЧАЙ 2. Выборки зависимы.


    Проблема. Необходимо определить влияет ли новый препарат на содержание холестерина в плазме крови. С этой целью препарат был испытан на десяти кроликах. В результате получены следующие данные





    Концентрация холестерина

    «До», ммоль/л

    6,3

    7

    6,8

    5,6

    4,8

    7,2

    6,2

    5

    8,1

    7,9

    «После», ммоль/л

    4,8

    4,6

    3,3

    5,6

    6,3

    5,1

    4,7

    6,3

    5,5

    6,2





    Исследуемый признак количественный, закон распределения для которого неизвестен и его нельзя оценить вследствие малой выборки, а выборки являются зависимыми (попарно связанными). В таком случае можно использовать непараметрический Т-критерий Уилкоксона.

    Выдвигаем гипотезы:

    Н(0): В генеральной совокупности содержание холестерина в плазме крови после приема препарата не изменяется, или «препарат не влияет на содержание холестерина в плазме крови», или «две выборки извлечены из одной генеральной совокупности»

    Н(1): В генеральной совокупности содержание холестерина в плазме крови после приема препарата изменяется (ненаправленная гипотеза)-

    Выберем уровень значимости α = 0,05

    Т-критерий Уилкоксона вычисляется по следующему алгоритму

    • Вычисляются попарные разницы значений «до» и «после»







    Концентрация холестерина

    «До», ммоль/л

    6,3

    7

    6,8

    5,6

    4,8

    7,2

    6,2

    5

    8,1

    7,9

    «После», ммоль/л

    4,8

    4,6

    3,3

    5,6

    6,3

    5,1

    4,7

    6,3

    5,5

    6,2

    Разница, ммоль/л

    1,5

    2,4

    3,5

    0

    -1,5

    2,1

    1,5

    -1,3

    2,6

    1,7


































    Ранжир. ряд

    0

    -1,3

    -1,4

    1,5

    -1,5

    1,5

    1,7

    2,4

    2,6

    3,5

    Ранги




    1

    2

    3

    3

    3

    4

    5

    6

    7

    Т+

    28




























    Т-

    6































    • Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд

    • Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг

    • Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т-),

    Т+ = 3+3+4+5+6+7=28

    Т- = 1+2+3=6

    • Меньшую из двух таких сумм без учета знака выбирают в качестве критерия:

    Твыч = 6

    Табличное значение для уровня значимости α = 0,05 и числа пар наблюдений п=10 (двусторонний критерий, Приложение 4):

    Ткрит = 9


    • Если Твыч > Ткрит то Н(0)

    • Если Твыч ≤ Ткрит то Н(1)


    В нашем случае вычисленное значение критерия меньше табличного и принимается альтернативная гипотеза.

    Вывод: Содержание холестерина в плазме крови после приема препарата изменяется с вероятностью не менее 95%.


    написать администратору сайта