Главная страница
Навигация по странице:

  • Расчет по исходным данным

  • Диаграммы чувствительности дисперсионного анализа

  • Решения задач 2.1.

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница35 из 37
    1   ...   29   30   31   32   33   34   35   36   37
    Формулы для вычислений
    ДИСПЕРСИЯ
    (
    )
    2 2
    2 1
    X
    X
    n
    s
    n

    =



    ДИСПЕРСИОННЫЙ АНАЛИЗ
    Расчет по групповым средним и стандартным
    отклонениям
    Имеется k групп; п
    i
    — численность i-й группы,
    i
    X — среднее в
    i-й группе, s
    i
    стандартное отклонение в i-й группе.
    i
    N
    n
    =

    (
    )
    2
    вну
    1
    i
    i
    S
    n
    s
    =


    вну
    N
    k
    =

    ν
    (
    )
    2 2
    меж
    i
    i
    i
    i
    n X
    S
    n X
    N
    =




    424
    меж
    1.
    k
    = −
    ν
    меж меж вну вну
    S
    F
    S
    =
    ν
    ν
    Расчет по исходным данным
    п
    i
    численность i-й группы, Х
    ij
    значение признака у j-го больного i-й группы.
    2
    ij
    i
    j
    X
    C
    N






    =
    ∑∑
    2
    общ
    ij
    i
    j
    S
    X
    C
    =

    ∑∑
    2
    меж
    ij
    j
    i
    i
    X
    S
    C
    n






    =



    вну общ меж
    S
    S
    S
    =

    Число степеней свободы и величина F вычисляются как при расчете по групповым средним и стандартным отклонениям.
    КРИТЕРИЙ СТЬЮДЕНТА
    Расчет по групповым средним и стандартным отклонениям
    1 2
    1 2
    ,
    X
    X
    X
    X
    t
    s


    =
    где
    (
    ) (
    )
    (
    )
    1 2
    2 2
    1 2
    1 1
    2 2
    1 2 1
    2 1
    1 2
    X
    X
    n
    n
    s
    n
    s
    n
    s
    n n n
    n

    +


    =

    +



    +

    1 2
    2.
    n
    n
    =
    +

    ν
    ПРИЛОЖЕНИЕ А

    425
    Расчет по исходным данным
    (
    )
    (
    )
    (
    )
    1 2
    2 2
    1 2
    2 2
    1 2
    1 2
    1 2 1
    2 1
    2 2
    X X
    X
    X
    n
    n
    s
    X
    X
    n n n
    n
    n
    n



    +
    =

    +



    + − 







    Значения t и n вычисляются как при расчете по групповым средним и стандартным отклонениям.
    ТАБЛИЦА СОПРЯЖЕННОСТИ 2
    ×2
    Имеется таблица сопряженности
    A
    B
    C
    D
    (
    )(
    )(
    )(
    )
    2 2
    2
    ,
    N
    N AD BC
    A B C
    D A C B
    D








    =
    +
    +
    +
    +
    χ
    где N = A + B + С + D.
    ν = 1.
    Критерий Мак-Нимара
    Значения двух качественных признаков «есть—нет» определе- ны у одних и тех же больных:
    Признак 1
    +

    +
    А
    В
    Признак 2

    С
    D
    Тогда
    ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ

    426
    (
    )
    2 2
    1
    B C
    B C


    =
    +
    χ
    ν = 1.
    Точный критерий Фишера
    1. Вычислить
    1 2
    1 2
    !
    !
    !
    !
    !
    ,
    ! ! ! !
    R R C C
    N
    P
    A B C D
    ′ =
    где R
    1
    и R
    2
    — суммы по строкам. C
    1
    и C
    2
    — суммы по столбцам.
    2. Найти наименьшее из чисел А, В, С и D. Допустим, это число A.
    3. Уменьшить A на единицу.
    4. Пересчитать числа в остальных клетках так, чтобы суммы по строкам и столбцам остались прежними.
    5. Вычислить Р
    ′ по приведенной формуле.
    6. Повторять шаги 3—5, пока А не станет равным 0.
    7. Сложить все значения Р
    , которые не превышают Р′ для исходной таблицы (включая Р
    ′ для исходной таблицы).
    Полученная сумма представляет собой значение Р для одно- стороннего варианта точного критерия Фишера. Чтобы полу- чить значение Р для двустороннего варианта, нужно продолжить вычисления в следующем порядке.
    8. Вернуться к исходной таблице.
    9. Увеличить А на единицу.
    10. Пересчитать числа в остальных клетках так, чтобы сум- мы по строкам и столбцам остались прежними.
    11. Вычислить Р
    ′.
    12. Повторять шаги 9—11, пока одно из чисел в клетках не станет равным 0.
    13. Сложить значения Р
    , которые не превышают Р′ для ис- ходной таблицы, и прибавить значение Р для одностороннего варианта. Полученная сумма представляет собой значение Р для двустороннего варианта точного критерия Фишера.
    ПРИЛОЖЕНИЕ А

    427
    Факториалы чисел от 0 до 20
    п
    п!
    0 1
    1 1
    2 2
    3 6
    4 24 5
    120 6
    720 7
    5040 8
    40320 9
    362880 10 3628800 11 39916800 12 479001600 13 6227020800 14 87178291200 15 1307674368000 16 20922789888000 17 355687428096000 18 6402373705728000 19 121645100408832000 20 2432902008176640000
    При n > 20 используйте формулу
    2
    ,
    !
    n
    n
    n
    n
    e
     
    ≈  
     
    π
    где е = 2,71828 (основание натуральных логарифмов),
    π = 3,14159
    (число «пи»).
    ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ

    428
    КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
    ( )
    2 2
    общ
    Y
    S
    Y
    n
    =



    рег
    X
    Y
    S
    b
    XY
    n


    =







    ∑ ∑

    (
    )(
    )
    рег
    2 2
    2 2
    общ
    S
    XY
    nXY
    r
    S
    X
    nX
    Y
    nY

    =
    =





    ДИСПЕРСИОННЫЙ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
    k — число измерений, п — число больных. Подстрочные индек- сы: i — номер измерения, j — номер больного, например Х
    ij

    результат i-го измерения у j-го больного.
    2
    ij
    i
    j
    X
    A
    kn






    =
    ∑∑
    2
    ij
    i
    j
    B
    X
    =
    ∑∑
    2
    ij
    i
    j
    X
    C
    n






    =
    ∑ ∑
    2
    ij
    j
    i
    X
    D
    k






    =
    ∑ ∑
    S
    ле
    = СA.
    S
    ост
    = A + BСD.
    ν
    ле
    = k – 1.
    ν
    ост
    = (n – 1)(k – 1).
    ПРИЛОЖЕНИЕ А

    429
    ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ
    ле ле ост ост
    S
    F
    S
    =
    ν
    ν
    КРИТЕРИЙ КРУСКАЛА—УОЛЛИСА
    (
    )
    (
    )
    2 12 3
    1 ,
    1
    i
    i
    R
    H
    N
    N N
    n


    =

    +


    +



    (
    )
    (
    )
    2 2
    12 3
    1 ,
    1
    r
    i
    R
    n k
    nk k
    =

    +
    +

    χ
    где R
    i
    сумма рангов i-го измерения.

    Приложение Б
    Диаграммы чувствительности
    дисперсионного анализа

    431
    ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ

    432
    ПРИЛОЖЕНИЕ Б

    433
    ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ
    0,99 0,98 0,
    97 0,96 0,
    95 0,
    94 0,
    92 0,
    90 0,
    80 0,
    70 0,
    60 0,
    50 0,4 0
    0,
    30 0,2 0
    0,1 0
    1 2
    3 5
    4 3
    2 1
    ϕ
    (дл я α
    = 0,01)
    ϕ
    (для
    α
    =
    0,
    05
    )
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 3
    ν
    вну
    =

    30 15 10 8
    6 60 20 12 9
    7

    60 30 20 15 12 10 9
    87 6
    Чувс тви тел ьнос ть

    434
    ПРИЛОЖЕНИЕ Б
    0,99 0,98 0,
    97 0,96 0,
    95 0,
    94 0,
    92 0,
    90 0,
    80 0,
    70 0,
    60 0,
    50 0,4 0
    0,
    30 0,2 0
    0,1 0
    1 2
    3 5
    4 3
    2 1
    ϕ
    (дл я α
    = 0,01)
    ϕ
    (для
    α
    =
    0,
    05
    )
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 4
    ν
    вну
    =

    30 15 10 8
    6 60 20 12 9
    7

    60 30 20 15 12 10 9
    8 7
    6
    Чувс тви тел ьнос ть

    435
    ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ
    0,99 0,98 0,
    97 0,96 0,
    95 0,
    94 0,
    92 0,
    90 0,
    80 0,
    70 0,
    60 0,
    50 0,4 0
    0,
    30 0,2 0
    0,1 0
    1 2
    3 5
    4 3
    2 1
    ϕ
    (дл я α
    = 0,01)
    ϕ
    (для
    α
    =
    0,
    05
    )
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 5
    ν
    вну
    =

    30 15 10 8
    6 60 20 12 9
    7

    60 30 20 15 12 10 98 7
    6
    Чувс тви тел ьнос ть

    436
    ПРИЛОЖЕНИЕ Б
    0,
    99 0,
    98 0,9 7
    0,96 0,9 5
    0,9 4
    0,9 2
    0,9 0
    0,8 0
    0,7 0
    0,6 0
    0,5 0
    0,40 0,3 0
    0,20 0,10 1
    2 3
    4 3
    2 1
    ϕ
    (дл я α
    =
    0,01
    )
    ϕ
    (для
    α
    = 0,05)
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 6
    ν
    вну
    =

    30 15 10 86 60 20 12 97

    60 30 20 15 12 10 9
    8 7
    6
    Чув ств итель нос ть

    437
    ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ
    0,
    99 0,
    98 0,9 7
    0,96 0,9 5
    0,9 4
    0,9 2
    0,9 0
    0,8 0
    0,7 0
    0,6 0
    0,5 0
    0,40 0,3 0
    0,20 0,10 1
    2 3
    4 3
    2 1
    ϕ
    (дл я α
    =
    0,01
    )
    ϕ
    (для
    α
    = 0,05)
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 7
    ν
    вн у
    =

    30 15 10 8
    6 60 20 12 9
    7

    60 30 20 15 12 10 98 7
    6
    Чув ств итель нос ть

    438
    ПРИЛОЖЕНИЕ Б
    0,
    99 0,
    98 0,9 7
    0,96 0,9 5
    0,9 4
    0,9 2
    0,9 0
    0,8 0
    0,7 0
    0,6 0
    0,5 0
    0,40 0,3 0
    0,20 0,10 1
    2 3
    4 3
    2 1
    ϕ
    (дл я α
    =
    0,01
    )
    ϕ
    (для
    α
    = 0,05)
    α =
    0,
    05
    α =
    0,
    01
    ν
    ме ж
    = 8
    ν
    вн у
    =

    30 15 10 8
    6 60 20 12 9
    7

    60 30 20 15 12 10 98 7
    6
    Чув ств итель нос ть

    Приложение В
    Решения задач
    2.1. Среднее — 3,09; стандартное отклонение — 2,89; медиана
    — 2; 25-й процентиль — 1; 75-й процентиль — 5. Вряд ли дан- ные извлечены из совокупности с нормальным распределени- ем: среднее довольно сильно отличается от медианы, медиана гораздо ближе к 25-му процентилю, чем к 75-му, а значит,
    распределение асимметрично. Поскольку среднее почти равно стандартному отклонению, в случае нормального распределе- ния примерно 15% значений было бы меньше нуля. Поэтому отсутствие отрицательных значений также говорит против нор- мальности распределения.
    2.2. Среднее — 244; стандартное отклонение — 43; медиана
    — 235,5; 25-й процентиль — 211; 75-й процентиль — 246. Вы- борка вполне может быть извлечена из совокупности с нормаль- ным распределением: медиана близка к среднему и находится примерно посредине между 25-м и 75-м проценталями. Срав- ните с предыдущей задачей.
    2.3. Среднее — 5,4; стандартное отклонение — 7,6; медиана —

    440 2,0; 25-й процентиль — 1,6; 75-й процентиль — 2,4. Выборку нельзя считать извлеченной из нормально распределенной сово- купности: среднее не только не равно медиане, но даже превы- шает 75-й процентиль. Стандартное отклонение превышает сред- нее, при этом среди данных нет отрицательных значений (и не может быть по самой природе данных). Высокие значения сред- него и стандартного отклонения обусловлены главным образом двумя «выпадающими» значениями — 19,0 и 23,6.
    2.4. Это равномерное распределение: все значения от 1 до 6
    выпадают с равной вероятностью. Среднее число очков — 3,5.
    2.5. Это распределение выборочных средних, вычисленных по выборкам объемом 2, извлеченным из совокупности, описан- ной в предыдущей задаче. Среднее этого распределения равно среднему в совокупности, то есть 3,5, а стандартное отклоне- ние (примерно 1,2) — это оценка стандартной ошибки средне- го, вычисленного по выборке объемом 2.
    2.6. Распределение по числу авторов не может быть нормаль- ным уже потому, что нормальное распределение непрерывно, а число авторов всегда целое. Кроме того, все 4 средних меньше двух стандартных отклонений. Это значит, что в случае нормаль- ного распределения какое-то число статей должно было бы иметь отрицательное число авторов. Следовательно, мы имеем дело с асимметричным распределением наподобие распределения юпи- териан по росту. К 1976 г. среднее число авторов резко возрос- ло, однако стандартное отклонение возросло еще больше, так что теперь среднее меньше одного стандартного отклонения. Это говорит об увеличении асимметрии. Обратите внимание, что если бы Р. и С. Флетчеры привели не стандартное отклонение, а стандартную ошибку, мы не смогли бы прийти к этим выводам.
    3.1. F = 15,74;
    ν
    меж
    = 1;
    ν
    вну
    = 40. Полученное значение F пре- вышает критическое для данного числа степеней свободы и уро- вня значимости 0,01 (7,31). Различия статистически значимы.
    Можно утверждать, что гель с простагландином Е
    2
    сокращал продолжительность родов.
    3.2. F = 64,18;
    ν
    меж
    = 4;
    ν
    вну
    = 995. Различия статистически значимы (максимальную объемную скорость середины выдоха нельзя считать одинаковой во всех группах, Р < 0,01).
    3.3. F = 35,25;
    ν
    меж
    = 2;
    ν
    вну
    = 207; P < 0,01.
    ПРИЛОЖЕНИЕ В

    441
    3.4. F = 60,37;
    ν
    меж
    = 6;
    ν
    вну
    = 245; P < 0,01.
    3.5. F = 2,52;
    ν
    меж
    = 1;
    ν
    вну
    = 70; Р > 0,05.
    3.6. F = 3,85;
    ν
    меж
    = 5;
    ν
    вну
    = 90; P < 0,01.
    3.7. F = 8,19;
    ν
    меж
    = 3;
    ν
    вну
    = 79; P < 0,01.
    3.8. F = 0,41;
    ν
    меж
    =4;
    ν
    вну
    =101; P > 0,05.
    4.1. Для среднего артериального давления t = –1,97, для обще- го периферического сосудистого сопротивления t = –1,29. Чис- ло степеней свободы в обоих случаях
    ν = 23, при α = 0,05 ему соответствует критическое значение t = 2,069. Следовательно,
    различия обоих гемодинамическйх показателей статистически не значимо.
    4.2. t = 3,14;
    ν = 20; Р < 0,01. Различия статистически значи- мы, однако, вопреки первоначальным предположениям, нифе- дипин не повышает, а снижает артериальное давление.
    4.3. Нет. t = 1,33;
    ν = 20; Р > 0,05. Нифедипин не влияет на диаметр коронарных артерий.
    4.4. Задача 3.1: t = 3,97;
    ν = 40; P < 0,001. Задача 3.5: t = 1,59
    ν = 70; P > 0,05.
    4.5. Вот некоторые результаты попарных сравнений. Некуря- щие, работающие в помещении, где не курят, и пассивные ку- рильщики — t = 6,21, выкуривающие небольшое число сигарет и выкуривающие среднее число сигарет — t = 4,72, выкуриваю- щие среднее число сигарет и выкуривающие большое число сига- рет — t = 2,39. Применим поправку Бонферрони. Поскольку име- ется 5 групп, можно провести 10 попарных сравнений. Чтобы истинный уровень значимости остался равным 0,05, в каж- дом из сравнений уровень значимости следует принять рав- ным 0,05/10 = 0,005. Число степеней свободы
    ν = 995. Таким образом,
    критическое значение t составляет 2,807. Отличия проходимости дыха- тельных путей у некурящих, работающих в помещении, где не курят, и пассивных курильщиков статистически значимы.
    4.6. Некурящие, работающие в накуренном помещении (пас- сивные курильщики): q
    = 6,249; l = 5. Выкуривающие небольшое число сигарет: q
    = 7,499; l = 5. Выкуривающие среднее число си- гарет: q
    = 12,220; l =5. Выкуривающие большое число сигарет: q
    = 14,580; l = 5. Критическое значение q
    ′ при уровне значимости
    0,01, числе степеней свободы 995 и l = 5 составляет 3,00. Следова- тельно, отличие некурящих, работающих в помещении, где не
    РЕШЕНИЯ ЗАДАЧ

    442
    курят, от пассивных курильщиков и от собственно курильщи- ков всех степеней злостности статистически значимо.
    4.7. Не занимающиеся спортом и бегуны трусцой: t = 5,616.
    Не занимающиеся спортом и бегуны-марафонцы: t = 8,214. Бегу- ны трусцой и бегуны-марафонцы: t = 2,598. Чтобы истинный уро- вень значимости остался равным 0,05, в каждом из сравнений уровень значимости следует принять равным 0,05/3 = 0,017. Чис- ло степеней свободы
    ν = 207. Критический уровень t составляет
    2,42. Все три группы различаются статистически значимо.
    4.8. Бегуны трусцой: t = 5,616. Бегуны-марафонцы: t = 8,214.
    Поскольку в данном случае возможно только два парных сравне- ния, в каждом из них уровень значимости следует принять рав- ным 0,05/2 = 0,025. Число степеней свободы
    ν = 207. Критичес- кий уровень t составляет 2,282. Таким образом, не занимающиеся спортом статистически значимо отличаются как от бегунов трус- цой, так и от марафонцев. Обратите внимание, что мы получили те же значения t, что и в предыдущей задаче, но число возмож- ных сравнений уменьшилось до 2, благодаря чему критический уровень t снизился. Однако при таком методе анализа мы не мо- жем сделать никакого вывода о различиях бегунов трусцой и марафонцев.
    4.9. Контрольная группа, 15 и 30 сигарет; 75 сигарет без тет- рагидроканнабинолов и 50 сигарет; 75 и 150 сигарет.
    4.10. Всего можно провести 6 сравнений. Контроль и дофа- мин в низкой дозе: t = 0. Контроль и дофамин в высокой дозе:
    t = 3,171. Контроль и нитропруссид натрия: t = 4,228. Дофамин в низкой дозе и дофамин в высокой дозе: t = 2,569. Дофамин в низкой дозе и нитропруссид натрия: t = 3,426. Дофамин в высо- кой дозе и нитропруссид натрия: t = 0,964. Уровень значимости в каждом из сравнений 0,05/6 = 0,0083, число степеней свободы
    ν = 79, соответствующий критический уровень t составляет 2,72.
    Итак, группы довольно четко разделились на контроль и дофа- мин в низкой дозе, с одной стороны, и дофамин в высокой дозе и нитропруссид натрия, с другой. Картину несколько портит срав- нение дофамина в низкой и высокой дозе: значение t не достига- ет критического уровня, хотя и близко к нему. В такой ситуации большинство исследователей, вероятно, все же сочтет различие
    ПРИЛОЖЕНИЕ В

    443
    этих групп статистически значимым, учитывая «жесткость» по- правки Бонферрони, их вряд ли можно за это упрекнуть.
    1   ...   29   30   31   32   33   34   35   36   37


    написать администратору сайта