Главная страница
Навигация по странице:

  • Рис. 4.4.

  • Рис. 4.5. А.

  • Таблица 4.1.

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница8 из 37
    1   ...   4   5   6   7   8   9   10   11   ...   37
    Рис. 4.3 А. Из этой совокупности мы будем извлекать пары и вычислять разности.
    Б. Разности первых 6 пар. В. Разности еще ста пар. Разброс разностей больше,
    чем разброс самих значений.
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

    86
    ждой из которых вычислим разность. Теперь все разности вклю- чая вычисленные ранее изображены на рис. 4.3В. Стандартное отклонение для полученной совокупности разностей — пример- но 1,4 то есть на 40% больше чем в исходной совокупности.
    Можно доказать что дисперсия разности двух случайно из-
    влеченных значении равна сумме дисперсии совокупностей из
    которых они извлечены*.
    В частности если извлекать значения из одной совокупно-
    * Интересно, что дисперсия суммы двух случайно извлеченных значений тоже равна сумме дисперсий совокупностей, из которых они извлечены.
    Отсюда можно вывести формулу для стандартной ошибки среднего:
    =
    X
    n
    σ
    σ
    Предположим, что мы случайным образом извлекли n значений из сово- купности, имеющей стандартное отклонение
    σ. Выборочное среднее рав- но
    (
    )
    1 2
    3 1
    ,
    =
    +
    +
    +…
    n
    X
    X
    X
    X
    X
    n
    поэтому
    1 2
    3
    =
    +
    +
    +…
    n
    nX
    X
    X
    X
    X
    Так как дисперсия каждого из X
    i
    равна
    σ
    2
    , дисперсия величины nX соста- вит
    2 2
    2 2
    2 2
    ,
    =
    +
    +
    +
    =

    nX
    n
    σ
    σ
    σ
    σ
    σ
    σ
    а стандартное отклонение
    =
    nX
    n
    σ
    σ
    Нам нужно найти стандартное отклонение среднего X тождественно рав- ного nX n поэтому
    =
    =
    =
    nX
    X
    n
    n
    n
    n
    σ
    σ
    σ
    σ
    Мы получили формулу, которой неоднократно пользовались в предыду- щих главах — формулу для стандартной ошибки среднего. Заметим что,
    выводя, ее мы, не делали никаких допущений о совокупности, из которой извлечена выборка. В частности мы не требовали, чтобы она имела нор- мальное распределение.
    ГЛАВА 4

    87
    сти, то дисперсия их разности будет равна удвоенной диспер- сии этой совокупности. Говоря формально если значение X из- влечено из совокупности, имеющей дисперсию
    2
    X
    σ
    , а значение
    Y из совокупности имеющей дисперсию
    2
    Y
    σ
    , то распределение всех возможных значений X – Y имеет дисперсию
    2 2
    2

    =
    +
    X Y
    X
    Y
    σ
    σ
    σ
    Почему дисперсия разностей больше дисперсии совокупно- сти легко понять на нашем примере (см. рис. 4.3): в половине случаев члены пары лежат по разные стороны от среднего, по- этому их разность еще больше отклоняется от среднего, чем они сами.
    Продолжим рассматривать рис. 4.3. Все пары извлекали из одной совокупности. Ее дисперсия равна 1. В таком случае дис- персия разностей будет
    2 2
    2 1 1 2.

    =
    +
    = + =
    X Y
    X
    Y
    σ
    σ
    σ
    Стандартное отклонение есть квадратный корень из диспер- сии. Поэтому стандартное отклонение разностей равно 2, то есть больше стандартного отклонения исходной совокупности примерно на 40%, как и получилось в нашем примере.
    Чтобы оценить дисперсию разности членов двух совокупно- стей по выборочным данным нужно в приведенной выше фор- муле заменить дисперсии их выборочными оценками
    2 2
    2

    =
    +
    X Y
    X
    Y
    s
    s
    s
    Этой формулой можно воспользоваться и для оценки стан- дартной ошибки разности выборочных средних. В самом деле,
    стандартная ошибка выборочного среднего — это стандартное отклонение совокупности средних значений всех выборок объе- мом n. Поэтому
    2 2
    2

    =
    +
    X Y
    X
    Y
    s
    s
    s
    Тем самым искомая стандартная ошибка разности средних
    2 2

    =
    +
    X Y
    X
    Y
    s
    s
    s
    Теперь мы можем вычислить отношение t.
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

    88
    КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t
    Напомним, что мы рассматриваем отношение
    Разность выборочных средних
    Стандартная ошибка разности выборочных средних
    =
    t
    Воспользовавшись результатом предыдущего раздела, имеем
    1 2
    1 2
    2 2

    =
    +
    X
    X
    X
    X
    t
    s
    s
    Если ошибку среднего выразить через выборочное стандар- тное отклонение, получим другую запись этой формулы
    1 2
    2 2
    1 2
    ,

    =
    +
    X
    X
    t
    s
    s
    n
    n
    где n — объем выборки.
    Если обе выборки извлечены из одной совокупности, то вы- борочные дисперсии
    2 1
    s
    и
    2 2
    s
    — это оценки одной и той же дис- персии
    σ
    2
    . Поэтому их можно заменить на объединенную оцен-
    ку дисперсии. Для выборок равного объема объединенная оцен- ка дисперсии вычисляется как
    2 2
    2 1
    2 2
    +
    =
    s
    s
    s
    Значение t, полученное на основе объединенной оценки
    1 2
    2 2

    =
    +
    X
    X
    t
    s
    s
    n
    n
    Если объем выборок одинаков, оба способа вычисления t да- дут одинаковый результат. Однако если объем выборок разный,
    то это не так. Вскоре мы увидим, почему важно вычислять объе- диненную оценку дисперсии, а пока посмотрим, какие значения
    ГЛАВА 4

    89
    t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.
    Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значе- ния t (вспомним опыты с F в предыдущей главе). Чтобы понять,
    какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент,
    подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в дей- ствительности препарат не оказывает диуретического действия.
    Тогда и контрольную группу, которая получает плацебо, и экспе- риментальную, которая получает препарат, можно считать слу- чайными выборками из одной совокупности. Пусть это будет со- вокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штрихов- кой. В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти дан- ные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение t равно –0,2.
    Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно раз- личается. Соответствующее значение t равно –2,1. На рис. 4.4В
    изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение t для них равно 0.
    Разных пар выборок можно извлечь более 10 27
    . На рис. 4.5А
    приведено распределение значений t, вычисленных по 200 парам выборок. По нему уже можно судить о распределении t. Оно сим- метрично относительно нуля, поскольку любую из пары выбо- рок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю, значения, меньшие –2 и большие +2,
    встречаются редко.
    На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев)
    t меньше –2,1 или больше +2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

    90
    Рис. 4.4.
    ГЛАВА 4

    91
    t лежит вне интервала от –2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение прини- мает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5%
    крайних значений соответствуют закрашенным областям графи- ка левее –2,1 и правее +2,1. Итак, мы нашли, что если две выбор- ки извлечены из одной и той же совокупности, то вероятность получить значение t, большее +2,1 или меньшее –2,1, составля- ет всего 5%. Следовательно, если значение t находится вне
    Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препа- рат не обладает диуретическим действием, поэтому обе группы — просто две слу- чайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, поме- чены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диу- рез в группах различается очень незначительно. Б. Исследователю могла бы попа- сться и такая пара выборок. В этом случае он наверняка бы счел препарат диуре- тиком. В. Еще две выборки из той же совокупности.
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

    92
    Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения для t трех пар выборок с рис. 4.4 помечены черным. Боль- шая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1 составляет 5%. В. Продолжая извлекать пары выбо- рок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолют- ной величине) значений образуют две заштрихованные области (сумма заштрихо- ванных площадей как раз и составляет 5% всей площади под кривой). Следова- тельно «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t =
    ±2,1. Вероятность получить столь высокое значение t, извле- кая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в
    5% случаев мы будем находить различия там, где их нет. Чтобь снизить вероят- ность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от обшей площади под кривой, критическое значение должно составлять 2,878.
    B
    Г
    t
    -3,0 -2,0 -1,0 0 1,0 2,0 3,0

    93
    интервала от –2,1 до +2,1, нулевую гипотезу следует отклонить,
    а наблюдаемые различия признать статистически значимыми.
    Обратите внимание, что таким образом мы выявляем отли- чия экспериментальной группы от контрольной как в меньшую,
    так и в большую сторону — именно поэтому мы отвергаем ну- левую гипотезу как при t < –2,1 так и при t > +2,1. Этот вариант критерия Стьюдента называется двусторонним, именно его обы- чно и используют. Существует и односторонний вариант крите- рия Стьюдента. Используется он гораздо реже, и в дальнейшем говоря о критерии Стьюдента, мы будем иметь в виду двусто- ронний вариант.
    Вернемся к рис. 4.4Б. На нем показаны две случайные вы- борки из одной и той же совокупности при этом t = – 2,2. Как мы только что выяснили, нам следует отвергнуть нулевую ги- потезу и признать исследуемый препарат диуретиком, что са- мой собой неверно. Хотя все расчеты были выполнены правиль- но, вывод ошибочен. Увы, такие случаи возможны.
    Разберемся подробнее. Если значение t меньше –2,1 или боль- ше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши груп- пы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые раз- личия (или более сильные) равна 0,05. Следовательно, ошибоч- ный вывод о существовании различии мы будем делать в 5%
    случаев. Один из таких случаев и показан на рис. 4.4Б.
    Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а скажем 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < –2,88
    или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не при- знаем подобные различия статистически значимыми. Однако во первых ошибочные выводы о существовании различий все же не исключены просто их вероятность снизилась до 1% и во вто- рых вероятность не найти различии там где они есть теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6.
    Критические значения t (подобно критическим значениям F
    они сведены в таблицу) зависят не только от уровня значимос- ти, но и от числа степеней свободы
    ν. Если объем обеих выбо-
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

    94
    ГЛАВА 4
    ν
    0,5 0,2 0,1 0,05 0,02 0,01 0,005 0,002 0,001 1
    1,000 3,078 6,314 12,706 31,821 63,656 127,321 318,289 636,578 2
    0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,328 31,600 3
    0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,214 12,924 4
    0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610 5
    0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,869 6
    0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959 7
    0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 8
    0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041 9
    0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 10 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587 11 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437 12 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 13 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 14 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140 15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015 17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850 21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 22 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 23 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768 24 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745 25 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,689 28 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674 29 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,660 30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646 31 0,682 1,309 1,696 2,040 2,453 2,744 3,022 3,375 3,633 32 0,682 1,309 1,694 2,037 2,449 2,738 3,015 3,365 3,622 33 0,682 1,308 1,692 2,035 2,445 2,733 3,008 3,356 3,611 34 0,682 1,307 1,691 2,032 2,441 2,728 3,002 3,348 3,601 35 0,682 1,306 1,690 2,030 2,438 2,724 2,996 3,340 3,591 36 0,681 1,306 1,688 2,028 2,434 2,719 2,990 3,333 3,582 37 0,681 1,305 1,687 2,026 2,431 2,715 2,985 3,326 3,574 38 0,681 1,304 1,686 2,024 2,429 2,712 2,980 3,319 3,566 39 0,681 1,304 1,685 2,023 2,426 2,708 2,976 3,313 3,558 40 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
    Уровень значимости
    α
    Таблица 4.1. Критические значения t (двусторонний вариант)

    95
    рок — n, то число степеней свободы для критерия Стьюдента равно 2(n – 1). Чем больше объем выборок, тем меньше крити- ческое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонении и тем точнее представляют исходную совокупность.
    СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА
    ν
    0,5 0,2 0,1 0,05 0,02 0,01 0,005 0,002 0,001 42 0,680 1,302 1,682 2,018 2,418 2,698 2,963 3,296 3,538 44 0,680 1,301 1,680 2,015 2,414 2,692 2,956 3,286 3,526 46 0,680 1,300 1,679 2,013 2,410 2,687 2,949 3,277 3,515 48 0,680 1,299 1,677 2,011 2,407 2,682 2,943 3,269 3,505 50 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496 52 0,679 1,298 1,675 2,007 2,400 2,674 2,932 3,255 3,488 54 0,679 1,297 1,674 2,005 2,397 2,670 2,927 3,248 3,480 56 0,679 1,297 1,673 2,003 2,395 2,667 2,923 3,242 3,473 58 0,679 1,296 1,672 2,002 2,392 2,663 2,918 3,237 3,466 60 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460 62 0,678 1,295 1,670 1,999 2,388 2,657 2,911 3,227 3,454 64 0,678 1,295 1,669 1,998 2,386 2,655 2,908 3,223 3,449 66 0,678 1,295 1,668 1,997 2,384 2,652 2,904 3,218 3,444 68 0,678 1,294 1,668 1,995 2,382 2,650 2,902 3,214 3,439 70 0,678 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,435 72 0,678 1,293 1,666 1,993 2,379 2,646 2,896 3,207 3,431 74 0,678 1,293 1,666 1,993 2,378 2,644 2,894 3,204 3,427 76 0,678 1,293 1,665 1,992 2,376 2,642 2,891 3,201 3,423 78 0,678 1,292 1,665 1,991 2,375 2,640 2,889 3,198 3,420 80 0,678 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416 90 0,677 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402 100 0,677 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390 120 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373 140 0,676 1,288 1,656 1,977 2,353 2,611 2,852 3,149 3,361 160 0,676 1,287 1,654 1,975 2,350 2,607 2,847 3,142 3,352 180 0,676 1,286 1,653 1,973 2,347 2,603 2,842 3,136 3,345 200 0,676 1,286 1,653 1,972 2,345 2,601 2,838 3,131 3,340

    0,675 1,282 1,645 1,960 2,327 2,576 2,808 3,091 3,291
    Уровень значимости
    α
    Таблица 4.1. Окончание
    J. H. Zar. Biostatistical analysis (2 ed.). Prentice-Hall, Englewood Cliffs, N. J., 1984.

    96
    ВЫБОРКИ ПРОИЗВОЛЬНОГО ОБЪЕМА
    Критерий Стьюдента легко обобщается на случай, когда выбор- ки содержат неодинаковое число членов. Напомним, что по оп- ределению
    1 2
    1 2
    2 2
    ,

    =
    +
    X
    X
    X
    X
    t
    s
    s
    где
    1
    X
    s и
    2
    X
    s — стандартные ошибки средних для двух выбо- рок.
    Если объем первой выборки равен n
    1
    , а объем второй — n
    2
    , то
    1 2
    2 1
    1
    =
    X
    s
    s
    n и
    2 2
    2 2
    2
    ,
    =
    X
    s
    s
    n
    где
    1
    s
    и
    2
    s
    — стандартные отклонения выборок.
    Перепишем определение t, используя выборочные стандарт- ные отклонения:
    1 2
    2 2
    1 2
    1 2

    =
    +
    X
    X
    t
    s
    s
    n
    n
    Объединенная оценка дисперсии для выборок объема n
    1
    и n
    2
    равна
    (
    )
    (
    )
    2 2
    1 1
    2 2
    2 1
    2 1
    1 2

    +

    =
    + −
    n
    s
    n
    s
    s
    n
    n
    Тогда
    1 2
    2 2
    1 2

    =
    +
    X
    X
    t
    s
    s
    n
    n
    Это определение t для выборок произвольного объема. Чис- ло степеней свободы
    ν = n
    1
    + n
    2
    – 2.
    Заметим, что если объемы выборок равны, то есть n
    1
    = n
    2
    = n,
    то мы получим ранее использовавшуюся формулу для t.
    ГЛАВА 4

    97
    ПРОДОЛЖЕНИЕ ПРИМЕРОВ
    Применим теперь критерий Стьюдента к тем данным, которые рассматривались при изучении дисперсионного анализа. Выво- ды, которые мы получим, не будут отличаться от прежних, по- скольку как говорилось критерий Стьюдента есть частный слу- чай дисперсионного анализа.
    1   ...   4   5   6   7   8   9   10   11   ...   37


    написать администратору сайта