Главная страница
Навигация по странице:

  • Таблица 10.6.

  • Таблица 10.7.

  • Курение и функция тромбоцитов

  • Таблица 10.8.

  • Влияние пероральных контрацептивов на выведение кофеина

  • Таблица 10.9.

  • Непараметрическое множественное сравнение

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница28 из 37
    1   ...   24   25   26   27   28   29   30   31   ...   37
    Таблица 10.5. Действие диуретика
    Суточный диурез, мл
    До
    После
    Величина Ранг изме- Знаковый
    Участник приема приема изменения нения ранг
    1 1490 1600 110 5
    5 2
    1300 1850 550 6
    6 3
    1400 1300
    –100 4
    –4 4
    1410 1500 90 3
    3 5
    1350 1400 50 2
    2 6
    1000 1010 10 1
    1
    W = 13
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    340
    Таблица 10.6. Возможные сочетания знаковых рангов для 6 пар измерений
    Ранги
    Сумма зна-
    1 2
    3 4
    5 6
    ковых рангов






    –21
    +





    –19

    +




    –17


    +



    –15



    +


    –13




    +

    –11





    +
    –9
    +
    +




    –15
    +

    +



    –13
    +


    +


    –11
    +



    +

    –9
    +




    +
    –7

    +
    +



    –11

    +

    +


    –9

    +


    +

    –7

    +



    +
    –5


    +
    +


    –7


    +

    +

    –5


    +


    +
    –3



    +
    +

    –3



    +

    +
    –1




    +
    +
    1
    +
    +
    +



    –9
    +
    +

    +


    –7
    +
    +


    +

    –5
    +
    +



    +
    –3
    +

    +
    +


    –5
    +

    +

    +

    –3
    +

    +


    +
    –1
    +


    +
    +

    –1
    +


    +

    +
    1
    +



    +
    +
    3
    ГЛАВА 10

    341
    Таблица 10.6. Окончание
    Ранги
    Сумма зна-
    1 2
    3 4
    5 6
    ковых рангов

    +
    +
    +


    –3

    +
    +

    +

    –1

    +
    +


    +
    1

    +

    +
    +

    1

    +

    +

    +
    3

    +


    +
    +
    5


    +
    +
    +

    3


    +
    +

    +
    5


    +

    +
    +
    7



    +
    +
    +
    9
    +
    +
    +
    +


    –1
    +
    +
    +

    +

    1
    +
    +
    +


    +
    3
    +
    +

    +
    +

    3
    +
    +

    +

    +
    5
    +
    +


    +
    +
    7
    +

    +
    +
    +

    5
    +

    +
    +

    +
    7
    +

    +

    +
    +
    9
    +


    +
    +
    +
    11

    +
    +
    +
    +

    7

    +
    +
    +

    +
    9

    +
    +

    +
    +
    11

    +

    +
    +
    +
    13


    +
    +
    +
    +
    15
    +
    +
    +
    +
    +

    9
    +
    +
    +
    +

    +
    11
    +
    +
    +

    +
    +
    13
    +
    +

    +
    +
    +
    15
    +

    +
    +
    +
    +
    17

    +
    +
    +
    +
    +
    19
    +
    +
    +
    +
    +
    +
    21
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    342
    Рис. 10.3. 64 возможные суммы рангов для группы из 6 человек (см. табл. 10.6). 4 наи- больших по абсолютной величине значения помечены черным.
    Р < 0,0625. На самом деле в таблице имеется 14 значений W, по абсолютной величине не меньших 13. Поскольку 14/64 = 0,219,
    мы могли бы записать Р < 14/64.
    Как и в случае критерия Манна— Уитни, распределение W
    не является непрерывным и поэтому нельзя указать критичес- кое значение, для которого уровень значимости в точности рав- нялся бы, например, 5%. В табл. 10.7 приведены критические значения, наиболее близкие к 5 и 1% уровням значимости для случая, когда численность группы не превосходит 20.
    Если число пар измерений больше 20, то распределение W
    достаточно близко к нормальному со средним
    µ
    W
    = 0 и стандарт- ным отклонением
    (
    )(
    )
    1 2 1
    ,
    6
    W
    n n
    n
    +
    +
    σ =
    где n — число пар наблюдений (то есть численность группы).
    Можно, таким образом, использовать
    (
    )(
    )
    1 2 1
    6
    W
    W
    W
    W
    W
    z
    n n
    n
    − µ
    =
    =
    σ
    +
    +
    Чтобы приближение было более точным, воспользуемся по- правкой Йейтса на непрерывность:
    (
    )(
    )
    1 2
    1 2 1
    6
    W
    W
    z
    n n
    n

    =
    +
    +
    ГЛАВА 10

    343
    Таблица 10.7. Критические значения W (двусторонний вариант)
    п
    W
    Р
    п
    W
    Р
    5 15 0,062 13 65 0,022 6
    21 0,032 57 0,048 19 0,062 14 73 0,020 7
    28 0,016 63 0,050 24 0,046 15 80 0,022 8
    32 0,024 70 0,048 28 0,054 16 88 0,022 9
    39 0,020 76 0,050 33 0,054 17 97 0,020 10 45 0,020 83 0,050 39 0,048 18 105 0,020 11 52 0,018 91 0,048 44 0,054 19 114 0,020 12 58 0,020 98 0,050 50 0,052 20 124 0,020 106 0,048
    F. Mostellerand R. Rourke. Sturdy statistics: nonparametrics and order statistics, Addison-
    Wesley, Reading, Mass., 1973.
    При анализе наблюдений до—после встречается два вида сов- падений. Это, во-первых, совпадение величин, которым присва- иваются ранги. Такая ситуация возникает при использовании любого рангового метода, будь то критерий Манна—Уитни или коэффициент корреляции Спирмена. Как всегда, совпадающим величинам присваивается общий ранг, равный среднему мест,
    занимаемых ими в упорядоченном наборе*.
    Единственная особенность — то, что в случае наблюдений
    (до—после) речь идет о совпадении не самих величин наблюдае-
    * Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено в соответствии со следующей формулой:
    (
    )(
    )
    (
    ) (
    )
    1 2 1
    1 1
    ,
    6 12
    i
    i
    i
    W
    n n
    n
    +
    +
    τ − τ τ +
    σ =


    где n — численность группы,
    τ
    i
    , - число значений i-го ранга.
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    344
    мого признака, а их изменений. Другой вид совпадения — совпа- дение значений «до» и «после». Каждую такую пару наблюде- ний нужно исключать из расчета, соответственно уменьшая на единицу объем выборки.
    Повторим последовательность шагов, позволяющую по на- блюдениям, выполненным до и после лечения, проверить его эффективность.
    • Вычислите величины изменений наблюдаемого признака. От- бросьте пары наблюдений, которым соответствует нулевое изменение.
    • Упорядочите изменения по возрастанию их абсолютной ве- личины и присвойте соответствующие ранги. Рангами оди- наковых величин назначьте средние тех мест, которые они делят в упорядоченном ряду.
    • Присвойте каждому рангу знак в соответствии с направле- нием изменения: если значение увеличилось — «+», если уменьшилось — «–».
    • Вычислите сумму знаковых рангов W*.
    Сравните полученную величину W с критическим значени- ем. Если она больше критического значения, изменение пока- зателя статистически значимо.
    А теперь применим критерий Уилкоксона к анализу рассмот- ренного в гл. 9 эксперимента Левина.
    Курение и функция тромбоцитов
    В гл. 9 мы разобрали исследование Левина, посвященное вли- янию курения на функцию тромбоцитов. В частности, на рис.
    9.2 приведены результаты опыта с выкуриванием сигареты: агре- гация тромбоцитов до и после этого вредоносного воздействия.
    Рассмотрим еще раз эти данные (табл. 10.8). Обратим внимание на 4-й столбец: здесь показана величина изменения интересую-
    * Существует вариант критерия Уилкоксона, в котором суммируют только положительные или только отрицательные знаковые ранги.
    На выводе это никак не сказывается, однако значение W, естест- венно, получается другим. Поэтому важно знать, на какой вариант критерия рассчитана имеющаяся в вашем распоряжении таблица критических значений.
    ГЛАВА 10

    345
    щего нас показателя. Можно ли считать распределение изме- нения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% —
    оно наводит на мысль о возможной асимметрии распределения.
    В подобных случаях лучше не рисковать и воспользоваться не- параметрическим критерием. Применим критерий Уилкоксона.
    Выпишем абсолютные величины изменений в порядке воз- растания. Полученные ранги приведены в пятом столбце табл.
    10.8, а шестой столбец содержит те же ранги, но со знаками,
    соответствующими направлению изменения. Сумма знаковых
    Рис. 10.4. Изменение агрегации тромбоцитов после выкуривания сигареты. Вряд ли мы имеем дело с нормальным распределением, об этом свидетельствует, в час- тности, «выпадающее» значение 27%. В таких случаях непараметрические мето- ды, например критерий Уилкоксона, предпочтительнее параметрических, таких,
    как критерий Стьюдента.
    Таблица 10.8. Агрегация тромбоцитов до и после сигареты выкуривания
    Участ- До
    После
    Измене- Ранг изме- Знаковый ранг ник курения курения ние нения изменения
    1 25 27 2
    2 2
    2 25 29 4
    3,5 3,5 3
    27 37 10 6
    6 4
    44 56 12 7
    7 5
    30 46 16 10 10 6
    67 82 15 8,5 8,5 7
    53 57 4
    3,5 3,5 8
    53 80 27 11 11 9
    52 61 9
    5 5
    10 60 59
    –1 1
    –1 11 28 43 15 8,5 8,5
    W = 64
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    346
    рангов W = 2 + 3,5 + 6 + 7 + 10 + 8,5 + 3,5 + 11 + 5 + (–l) + 8,5 = 64.
    В табл. 10.7 находим 1,8% критическое Значение для суммы ран- гов. Оно равно 52, то есть меньше полученного нами. Поэтому мы признаем изменение агрегации тромбоцитов статистически значимым (Р < 0,018).
    СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:
    КРИТЕРИЙ КРУСКАЛА-УОЛЛИСА
    В гл. 3 была рассмотрена задача сравнения нескольких выбо- рок. Эта задача возникает, например, когда нужно определить,
    одинаково ли эффективны несколько методов лечения, каждый из которых испытывается на отдельной группе. Предполагалось,
    что данные, полученные для каждой из групп, подчиняются нор- мальному распределению, причем дисперсии по всем группам примерно одинаковы. На этом допущении и основан изложен- ный в гл. 3 однофакторный дисперсионный анализ. Сейчас мы познакомимся с его непараметрическим аналогом, не. требую- щим предположения о нормальности распределения. Это кри- терий Крускала—Уоллиса.
    Критерий Крускала—Уоллиса представляет собой обобще- ние критерия Манна—Уитни. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по воз- растанию. Каждому значению присваивается ранг — номер его места в упорядоченном ряду. (Совпадающим значениям при- сваивают общий ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду.)
    Затем вычисляют суммы рангов, относящихся к каждой группе,
    и для каждой группы определяют средний ранг. При отсутствии межгрупповых различий средние ранги групп должны оказать- ся близки. Напротив, если существует значительное расхожде- ние средних рангов, то гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала—
    Уоллиса H и является мерой такого расхождения средних рангов.
    Для простоты положим, что групп всего три. Обобщение на большее число групп получится автоматически. Имеются ре- зультаты измерения некоторого признака в трех группах. Чис-
    ГЛАВА 10

    347
    ленность групп — n
    1
    , n
    2
    и n
    3
    . Значения объединим, упорядочим и каждому присвоим ранг. Вычислим сумму рангов для каждой группы — R
    1
    , R
    2
    и R
    3
    .Найдем средние ранги:
    1 1
    1 2
    2 2
    ,
    R
    R n R
    R n
    =
    =
    и
    3 3
    3
    R
    R n
    =
    Общее число наблюдений N = n
    1
    + n
    2
    + n
    3
    . Для объединенной группы рангами являются числа 1,2, ..., N и общая сумма рангов равна
    (
    )
    (
    )
    1 1 2 1
    2
    N N
    N
    N
    +
    + + +
    − + =

    Тогда средний ранг R для объединенной группы равен
    1 2 1
    2
    N
    N
    R
    N
    + +
    +
    +
    =
    =

    Теперь найдем величину D, равную
    (
    )
    (
    )
    (
    )
    2 2
    2 1
    1 2
    2 3
    3
    D
    n R
    R
    n R
    R
    n R
    R
    =

    +

    +

    Это прямой аналог межгрупповой вариации, знакомой нам по гл. 9. Величина D зависит от размеров групп. Чтобы полу- чить показатель, отражающий их различия, следует поделить D
    на N(N +1)/12. Полученная величина
    (
    )
    (
    )
    (
    )
    2
    м м
    12 1 12 1
    D
    H
    n R
    R
    N N
    N N
    =
    =

    +
    +

    является значением критерия Крускала—Уоллиса. Суммирова- ние в приведенной формуле производится по всем группам.
    Как найти критическое значение Н? Можно было бы просто перечислить все сочетания рангов, как это делалось для кри- териев Манна—Уитни и Уилкоксона. Однако сделать это до- вольно трудно — число вариантов слишком велико. К счастью,
    если группы не слишком малы, распределение H хорошо при- ближается распределением
    χ
    2
    с числом степеней свободы
    ν =
    = k – 1, где k — число групп. Тогда для проверки нулевой гипо- тезы нужно просто вычислить по имеющимся наблюдениям зна- чение Н и сравнить его с критическим значением
    χ
    2
    из табл. 5.7.
    В случае трех групп приближение с помощью
    χ
    2
    пригодно, если численность каждой группы не меньше 5. Для четырех групп —
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    348
    если общее число наблюдений не менее 10. Но если группы со- всем малы, не остается ничего, кроме как обратиться к таблице точных значений распределения Крускала—Уоллиса (мы не приводим эту таблицу из-за ее громоздкости).
    Итак, чтобы выяснить, одинаково ли действие нескольких методов лечения, каждый из которых испытывается на отдель- ной группе, нужно проделать следующее.
    • Объединив все наблюдения, упорядочить их по возрастанию.
    Совпадающим значениям ранги присваиваются как среднее тех мест, которые делят между собой эти значения*.
    • Вычислить критерий Крускала—Уоллиса Н.
    Сравнить вычисленное значение Н с критическим значени- ем
    χ
    2
    для числа степеней свободы, на единицу меньшего числа групп. Если вычисленное значение Н окажется больше кри- тического, различия групп статистически значимы.
    Приведем пример использования критерия Крускала—Уоллиса.
    Влияние пероральных контрацептивов на выведение
    кофеина
    Ряд лекарственных средств и пищевых продуктов (кофе, чай и прохладительные напитки) содержат кофеин. Беременным не сле- дует увлекаться крепким кофе, поскольку кофеин может оказать неблагоприятное влияние на плод, а выведение кофеина у бере- менных замедлено. Существует предположение, что замедлен- ное выведение кофеина обусловлено высоким уровнем половых гормонов во время беременности. Р. Патвардан и соавт.** реши- ли косвенно подтвердить это предположение, определив скорость
    * При большом числе совпадающих рангов значение H следует поделить на
    (
    ) (
    )
    (
    )
    2 1
    1 1
    1
    i
    i
    i
    N N

    +



    ,
    τ
    τ τ
    где N — число членов всех групп,
    τ
    i
    — как обычно, число рангов в i-й связке, а суммирование производится по всем связкам.
    ** R. Patwardhan, P. Desmond, R. Johnson, S. Schenker. Impaired elimination of caffeine by oral contraceptives. J. Lab. Clin. Med., 95:603—608, 1980.
    ГЛАВА 10

    349
    выведения кофеина у женщин, принимающих пероральные кон- трацептивы. (При приеме пероральных контрацептивов уровень эстрогенов и прогестагенов в крови повышается — то же самое происходит и при беременности.)
    Скорость выведения кофеина (как и других веществ) непо- стоянна — она прямо пропорциональна его концентрации в пла- зме. Поэтому нет смысла измерять скорость выведения, скажем,
    в миллиграммах в минуту. Вместо этого используют период по- лувыведения (T
    1/2
    ) — время уменьшения концентрации вдвое:
    после того как вещество всосется и поступит в кровь, эта вели- чина остается постоянной, пока вещество не будет почти пол- ностью выведено из организма.
    T
    1/2
    определили у женщин, принимающих и не принимаю- щих пероральные контрацептивы, а также у мужчин. Числен- ность групп составила соответственно 9, 9 и 13 человек. Каж-
    Таблица 10.9. Период полувыведения кофеина
    Женщины
    Не принимающие
    Принимающие пероральных пероральные
    Мужчины контрацептивов контрацептивы
    T
    1/2
    , ч
    Ранг
    T
    1/2
    , ч
    Ранг
    T
    1/2
    , ч
    Ранг
    2,04 1
    5,30 12 10,36 25 5,16 10 7,28 19 13,28 29 6,11 15 8,98 21 11,81 28 5,82 14 6,59 16 4,54 6
    5,41 13 4,59 8
    11,04 26 3,51 4
    5,17 11 10,08 24 3,18 2
    7,25 18 14,47 31 4,57 7
    3,47 3
    9,43 23 4,83 9
    7,60 20 13,41 30 11,34 27 3,79 5
    9,03 22 7,21 17
    Сумма рангов
    146 128 222
    Средний ранг
    11,23 14,22 24,67
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    350
    дый участник эксперимента принимал 250 мг кофеина, что со- ответствует примерно 3 чашкам кофе, после чего дважды опре- деляли концентрацию кофеина в крови и рассчитывали T
    1/2
    . Ре- зультаты представлены в табл. 10.9.
    Общий средний ранг
    1 2 31 1
    31 1 16 31 2
    2
    N
    R
    + +
    +
    +
    +
    =
    =
    =
    =

    Вычисляем взвешенную сумму квадратов отклонений сред- них по группам от общего среднего
    D = 13(11,23 – 16)
    2
    + 9(14,22 – 16)
    2
    + 9(24,67 – 16)
    2
    = 1000,82
    и значение критерия Крускала—Уоллиса
    (
    )
    (
    )
    12 12 1000 82 12 107 1
    31 31 1
    H
    D
    N N
    =
    =
    =
    +
    +
    ,
    ,
    По табл. 5.7 находим 1% критическое значение
    χ
    2
    с числом степеней свободы
    ν = k – l = 3 – l = 2. Оно равно 9,210, то есть меньше полученного нами. Таким образом, различия групп ста- тистически значимы (Р < 0,01).
    Непараметрическое множественное сравнение
    Потребность во множественном сравнении возникает всякий раз,
    когда с помощью дисперсионного анализа (или его непа- раметрического аналога — критерия Крускала—Уоллиса) обна- руживается различие нескольких выборок. В этом случае и тре- буется установить, в чем состоит это различие. В гл. 4 мы по- знакомились с параметрическими методами множественного сравнения. Они позволяют сравнить группы попарно и затем объединить их в несколько однородных наборов так, что раз- личия между группами из одного набора статистически незна- чимы, а между группами из разных наборов — значимы. Кроме того, они позволяют сравнить все группы с контрольной.
    К счастью, параметрические методы множественного срав- нения легко преобразовать в непараметрические. Когда объемы выборок равны, для множественного сравнения используют не-
    ГЛАВА 10

    351
    параметрические варианты критериев Ньюмена—Кейлса и Дан- нета. Когда же объемы выборок различны, применяется крите- рий Данна. Опишем вкратце эти методы.
    Начнем с критериев для выборок равного объема. Критерии
    Ньюмена—Кейлса и Даннета совпадают практически полнос- тью, поскольку критерий Даннета есть просто вариант крите- рия Ньюмена—Кейлса для сравнения всех выборок с одной кон- трольной.
    Формула для непараметрического варианта критерия Нью- мена—Кейлса:
    (
    )
    2 1
    12
    A
    B
    R
    R
    q
    n l nl

    =
    +
    ,
    где R
    A
    R
    B
    суммы рантов двух сравниваемых выборок, п
    объем каждой выборки, l — интервал сравнения. Вычисленное
    q сравнивается с критическим значением в табл. 4.3 для беско- нечного числа степеней свободы.
    Значение непараметрического критерия Даннета определя- ется формулой:
    (
    )
    кон
    1 6
    A
    R
    R
    q
    nl l

    ′ =
    +
    ,
    где R
    кон
    , — сумма рангов контрольной выборки, а остальные ве- личины те же, что в Критерии q. Уточним только, что lчисло всех выборок, включая контрольную. Значение q
    ′ сравнивается с критическим значением для бесконечного числа степеней сво- боды (табл. 4.4).
    Наконец, для сравнения выборок разного объема использу- ется критерий Данна. Впрочем, ничто не мешает применить его и к выборкам одинакового объема. Значение критерия Данна:
    (
    )
    1 1
    1 12
    A
    B
    A
    B
    R
    R
    Q
    N N
    n
    n

    =


    +
    +




    ,
    НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

    352
    где
    A
    R и
    B
    R средние ранги двух сравниваемых выборок, п
    A
    и п
    B
    их объемы, а N — общий объем всех сравниваемых выборок.
    Критические значения Q приведены в табл. 10.10. «Стягива- ющее» сравнение проводится как в критерии Ньюмена—Кейлса.
    Критерием Данна можно воспользоваться и для сравнения с контрольной выборкой. Приэтом формула для Q остается преж- ней, только критические значения находятся уже по табл. 10.11.
    1   ...   24   25   26   27   28   29   30   31   ...   37


    написать администратору сайта