Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
Формулы для вычислений ДИСПЕРСИЯ ( ) 2 2 2 1 X X n s n − = − ∑ ∑ ДИСПЕРСИОННЫЙ АНАЛИЗ Расчет по групповым средним и стандартным отклонениям Имеется k групп; п i — численность i-й группы, i X — среднее в i-й группе, s i — стандартное отклонение в i-й группе. i N n = ∑ ( ) 2 вну 1 i i S n s = − ∑ вну N k = − ν ( ) 2 2 меж i i i i n X S n X N = − ∑ ∑ 424 меж 1. k = − ν меж меж вну вну S F S = ν ν Расчет по исходным данным п i — численность i-й группы, Х ij — значение признака у j-го больного i-й группы. 2 ij i j X C N = ∑∑ 2 общ ij i j S X C = − ∑∑ 2 меж ij j i i X S C n = − ∑ ∑ вну общ меж S S S = − Число степеней свободы и величина F вычисляются как при расчете по групповым средним и стандартным отклонениям. КРИТЕРИЙ СТЬЮДЕНТА Расчет по групповым средним и стандартным отклонениям 1 2 1 2 , X X X X t s − − = где ( ) ( ) ( ) 1 2 2 2 1 2 1 1 2 2 1 2 1 2 1 1 2 X X n n s n s n s n n n n − + = − + − + − 1 2 2. n n = + − ν ПРИЛОЖЕНИЕ А 425 Расчет по исходным данным ( ) ( ) ( ) 1 2 2 2 1 2 2 2 1 2 1 2 1 2 1 2 1 2 2 X X X X n n s X X n n n n n n − + = − + − + − ∑ ∑ ∑ ∑ Значения t и n вычисляются как при расчете по групповым средним и стандартным отклонениям. ТАБЛИЦА СОПРЯЖЕННОСТИ 2 ×2 Имеется таблица сопряженности A B C D ( )( )( )( ) 2 2 2 , N N AD BC A B C D A C B D − − = + + + + χ где N = A + B + С + D. ν = 1. Критерий Мак-Нимара Значения двух качественных признаков «есть—нет» определе- ны у одних и тех же больных: Признак 1 + – + А В Признак 2 – С D Тогда ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ 426 ( ) 2 2 1 B C B C − − = + χ ν = 1. Точный критерий Фишера 1. Вычислить 1 2 1 2 ! ! ! ! ! , ! ! ! ! R R C C N P A B C D ′ = где R 1 и R 2 — суммы по строкам. C 1 и C 2 — суммы по столбцам. 2. Найти наименьшее из чисел А, В, С и D. Допустим, это число A. 3. Уменьшить A на единицу. 4. Пересчитать числа в остальных клетках так, чтобы суммы по строкам и столбцам остались прежними. 5. Вычислить Р ′ по приведенной формуле. 6. Повторять шаги 3—5, пока А не станет равным 0. 7. Сложить все значения Р ′, которые не превышают Р′ для исходной таблицы (включая Р ′ для исходной таблицы). Полученная сумма представляет собой значение Р для одно- стороннего варианта точного критерия Фишера. Чтобы полу- чить значение Р для двустороннего варианта, нужно продолжить вычисления в следующем порядке. 8. Вернуться к исходной таблице. 9. Увеличить А на единицу. 10. Пересчитать числа в остальных клетках так, чтобы сум- мы по строкам и столбцам остались прежними. 11. Вычислить Р ′. 12. Повторять шаги 9—11, пока одно из чисел в клетках не станет равным 0. 13. Сложить значения Р ′, которые не превышают Р′ для ис- ходной таблицы, и прибавить значение Р для одностороннего варианта. Полученная сумма представляет собой значение Р для двустороннего варианта точного критерия Фишера. ПРИЛОЖЕНИЕ А 427 Факториалы чисел от 0 до 20 п п! 0 1 1 1 2 2 3 6 4 24 5 120 6 720 7 5040 8 40320 9 362880 10 3628800 11 39916800 12 479001600 13 6227020800 14 87178291200 15 1307674368000 16 20922789888000 17 355687428096000 18 6402373705728000 19 121645100408832000 20 2432902008176640000 При n > 20 используйте формулу 2 , ! n n n n e ≈ π где е = 2,71828 (основание натуральных логарифмов), π = 3,14159 (число «пи»). ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ 428 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ( ) 2 2 общ Y S Y n = − ∑ ∑ рег X Y S b XY n = − ∑ ∑ ∑ ( )( ) рег 2 2 2 2 общ S XY nXY r S X nX Y nY − = = − − ∑ ∑ ∑ ДИСПЕРСИОННЫЙ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ k — число измерений, п — число больных. Подстрочные индек- сы: i — номер измерения, j — номер больного, например Х ij — результат i-го измерения у j-го больного. 2 ij i j X A kn = ∑∑ 2 ij i j B X = ∑∑ 2 ij i j X C n = ∑ ∑ 2 ij j i X D k = ∑ ∑ S ле = С – A. S ост = A + B – С – D. ν ле = k – 1. ν ост = (n – 1)(k – 1). ПРИЛОЖЕНИЕ А 429 ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЙ ле ле ост ост S F S = ν ν КРИТЕРИЙ КРУСКАЛА—УОЛЛИСА ( ) ( ) 2 12 3 1 , 1 i i R H N N N n = − + + ∑ ( ) ( ) 2 2 12 3 1 , 1 r i R n k nk k = − + + ∑ χ где R i — сумма рангов i-го измерения. Приложение Б Диаграммы чувствительности дисперсионного анализа 431 ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ 432 ПРИЛОЖЕНИЕ Б 433 ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ 0,99 0,98 0, 97 0,96 0, 95 0, 94 0, 92 0, 90 0, 80 0, 70 0, 60 0, 50 0,4 0 0, 30 0,2 0 0,1 0 1 2 3 5 4 3 2 1 ϕ (дл я α = 0,01) ϕ (для α = 0, 05 ) α = 0, 05 α = 0, 01 ν ме ж = 3 ν вну = ∞ 30 15 10 8 6 60 20 12 9 7 ∞ 60 30 20 15 12 10 9 87 6 Чувс тви тел ьнос ть 434 ПРИЛОЖЕНИЕ Б 0,99 0,98 0, 97 0,96 0, 95 0, 94 0, 92 0, 90 0, 80 0, 70 0, 60 0, 50 0,4 0 0, 30 0,2 0 0,1 0 1 2 3 5 4 3 2 1 ϕ (дл я α = 0,01) ϕ (для α = 0, 05 ) α = 0, 05 α = 0, 01 ν ме ж = 4 ν вну = ∞ 30 15 10 8 6 60 20 12 9 7 ∞ 60 30 20 15 12 10 9 8 7 6 Чувс тви тел ьнос ть 435 ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ 0,99 0,98 0, 97 0,96 0, 95 0, 94 0, 92 0, 90 0, 80 0, 70 0, 60 0, 50 0,4 0 0, 30 0,2 0 0,1 0 1 2 3 5 4 3 2 1 ϕ (дл я α = 0,01) ϕ (для α = 0, 05 ) α = 0, 05 α = 0, 01 ν ме ж = 5 ν вну = ∞ 30 15 10 8 6 60 20 12 9 7 ∞ 60 30 20 15 12 10 98 7 6 Чувс тви тел ьнос ть 436 ПРИЛОЖЕНИЕ Б 0, 99 0, 98 0,9 7 0,96 0,9 5 0,9 4 0,9 2 0,9 0 0,8 0 0,7 0 0,6 0 0,5 0 0,40 0,3 0 0,20 0,10 1 2 3 4 3 2 1 ϕ (дл я α = 0,01 ) ϕ (для α = 0,05) α = 0, 05 α = 0, 01 ν ме ж = 6 ν вну = ∞ 30 15 10 86 60 20 12 97 ∞ 60 30 20 15 12 10 9 8 7 6 Чув ств итель нос ть 437 ДИАГРАММЫ ЧУВСТВИТЕЛЬНОСТИ 0, 99 0, 98 0,9 7 0,96 0,9 5 0,9 4 0,9 2 0,9 0 0,8 0 0,7 0 0,6 0 0,5 0 0,40 0,3 0 0,20 0,10 1 2 3 4 3 2 1 ϕ (дл я α = 0,01 ) ϕ (для α = 0,05) α = 0, 05 α = 0, 01 ν ме ж = 7 ν вн у = ∞ 30 15 10 8 6 60 20 12 9 7 ∞ 60 30 20 15 12 10 98 7 6 Чув ств итель нос ть 438 ПРИЛОЖЕНИЕ Б 0, 99 0, 98 0,9 7 0,96 0,9 5 0,9 4 0,9 2 0,9 0 0,8 0 0,7 0 0,6 0 0,5 0 0,40 0,3 0 0,20 0,10 1 2 3 4 3 2 1 ϕ (дл я α = 0,01 ) ϕ (для α = 0,05) α = 0, 05 α = 0, 01 ν ме ж = 8 ν вн у = ∞ 30 15 10 8 6 60 20 12 9 7 ∞ 60 30 20 15 12 10 98 7 6 Чув ств итель нос ть Приложение В Решения задач 2.1. Среднее — 3,09; стандартное отклонение — 2,89; медиана — 2; 25-й процентиль — 1; 75-й процентиль — 5. Вряд ли дан- ные извлечены из совокупности с нормальным распределени- ем: среднее довольно сильно отличается от медианы, медиана гораздо ближе к 25-му процентилю, чем к 75-му, а значит, распределение асимметрично. Поскольку среднее почти равно стандартному отклонению, в случае нормального распределе- ния примерно 15% значений было бы меньше нуля. Поэтому отсутствие отрицательных значений также говорит против нор- мальности распределения. 2.2. Среднее — 244; стандартное отклонение — 43; медиана — 235,5; 25-й процентиль — 211; 75-й процентиль — 246. Вы- борка вполне может быть извлечена из совокупности с нормаль- ным распределением: медиана близка к среднему и находится примерно посредине между 25-м и 75-м проценталями. Срав- ните с предыдущей задачей. 2.3. Среднее — 5,4; стандартное отклонение — 7,6; медиана — 440 2,0; 25-й процентиль — 1,6; 75-й процентиль — 2,4. Выборку нельзя считать извлеченной из нормально распределенной сово- купности: среднее не только не равно медиане, но даже превы- шает 75-й процентиль. Стандартное отклонение превышает сред- нее, при этом среди данных нет отрицательных значений (и не может быть по самой природе данных). Высокие значения сред- него и стандартного отклонения обусловлены главным образом двумя «выпадающими» значениями — 19,0 и 23,6. 2.4. Это равномерное распределение: все значения от 1 до 6 выпадают с равной вероятностью. Среднее число очков — 3,5. 2.5. Это распределение выборочных средних, вычисленных по выборкам объемом 2, извлеченным из совокупности, описан- ной в предыдущей задаче. Среднее этого распределения равно среднему в совокупности, то есть 3,5, а стандартное отклоне- ние (примерно 1,2) — это оценка стандартной ошибки средне- го, вычисленного по выборке объемом 2. 2.6. Распределение по числу авторов не может быть нормаль- ным уже потому, что нормальное распределение непрерывно, а число авторов всегда целое. Кроме того, все 4 средних меньше двух стандартных отклонений. Это значит, что в случае нормаль- ного распределения какое-то число статей должно было бы иметь отрицательное число авторов. Следовательно, мы имеем дело с асимметричным распределением наподобие распределения юпи- териан по росту. К 1976 г. среднее число авторов резко возрос- ло, однако стандартное отклонение возросло еще больше, так что теперь среднее меньше одного стандартного отклонения. Это говорит об увеличении асимметрии. Обратите внимание, что если бы Р. и С. Флетчеры привели не стандартное отклонение, а стандартную ошибку, мы не смогли бы прийти к этим выводам. 3.1. F = 15,74; ν меж = 1; ν вну = 40. Полученное значение F пре- вышает критическое для данного числа степеней свободы и уро- вня значимости 0,01 (7,31). Различия статистически значимы. Можно утверждать, что гель с простагландином Е 2 сокращал продолжительность родов. 3.2. F = 64,18; ν меж = 4; ν вну = 995. Различия статистически значимы (максимальную объемную скорость середины выдоха нельзя считать одинаковой во всех группах, Р < 0,01). 3.3. F = 35,25; ν меж = 2; ν вну = 207; P < 0,01. ПРИЛОЖЕНИЕ В 441 3.4. F = 60,37; ν меж = 6; ν вну = 245; P < 0,01. 3.5. F = 2,52; ν меж = 1; ν вну = 70; Р > 0,05. 3.6. F = 3,85; ν меж = 5; ν вну = 90; P < 0,01. 3.7. F = 8,19; ν меж = 3; ν вну = 79; P < 0,01. 3.8. F = 0,41; ν меж =4; ν вну =101; P > 0,05. 4.1. Для среднего артериального давления t = –1,97, для обще- го периферического сосудистого сопротивления t = –1,29. Чис- ло степеней свободы в обоих случаях ν = 23, при α = 0,05 ему соответствует критическое значение t = 2,069. Следовательно, различия обоих гемодинамическйх показателей статистически не значимо. 4.2. t = 3,14; ν = 20; Р < 0,01. Различия статистически значи- мы, однако, вопреки первоначальным предположениям, нифе- дипин не повышает, а снижает артериальное давление. 4.3. Нет. t = 1,33; ν = 20; Р > 0,05. Нифедипин не влияет на диаметр коронарных артерий. 4.4. Задача 3.1: t = 3,97; ν = 40; P < 0,001. Задача 3.5: t = 1,59 ν = 70; P > 0,05. 4.5. Вот некоторые результаты попарных сравнений. Некуря- щие, работающие в помещении, где не курят, и пассивные ку- рильщики — t = 6,21, выкуривающие небольшое число сигарет и выкуривающие среднее число сигарет — t = 4,72, выкуриваю- щие среднее число сигарет и выкуривающие большое число сига- рет — t = 2,39. Применим поправку Бонферрони. Поскольку име- ется 5 групп, можно провести 10 попарных сравнений. Чтобы истинный уровень значимости остался равным 0,05, в каж- дом из сравнений уровень значимости следует принять рав- ным 0,05/10 = 0,005. Число степеней свободы ν = 995. Таким образом, критическое значение t составляет 2,807. Отличия проходимости дыха- тельных путей у некурящих, работающих в помещении, где не курят, и пассивных курильщиков статистически значимы. 4.6. Некурящие, работающие в накуренном помещении (пас- сивные курильщики): q ′ = 6,249; l = 5. Выкуривающие небольшое число сигарет: q ′ = 7,499; l = 5. Выкуривающие среднее число си- гарет: q ′ = 12,220; l =5. Выкуривающие большое число сигарет: q′ = 14,580; l = 5. Критическое значение q ′ при уровне значимости 0,01, числе степеней свободы 995 и l = 5 составляет 3,00. Следова- тельно, отличие некурящих, работающих в помещении, где не РЕШЕНИЯ ЗАДАЧ 442 курят, от пассивных курильщиков и от собственно курильщи- ков всех степеней злостности статистически значимо. 4.7. Не занимающиеся спортом и бегуны трусцой: t = 5,616. Не занимающиеся спортом и бегуны-марафонцы: t = 8,214. Бегу- ны трусцой и бегуны-марафонцы: t = 2,598. Чтобы истинный уро- вень значимости остался равным 0,05, в каждом из сравнений уровень значимости следует принять равным 0,05/3 = 0,017. Чис- ло степеней свободы ν = 207. Критический уровень t составляет 2,42. Все три группы различаются статистически значимо. 4.8. Бегуны трусцой: t = 5,616. Бегуны-марафонцы: t = 8,214. Поскольку в данном случае возможно только два парных сравне- ния, в каждом из них уровень значимости следует принять рав- ным 0,05/2 = 0,025. Число степеней свободы ν = 207. Критичес- кий уровень t составляет 2,282. Таким образом, не занимающиеся спортом статистически значимо отличаются как от бегунов трус- цой, так и от марафонцев. Обратите внимание, что мы получили те же значения t, что и в предыдущей задаче, но число возмож- ных сравнений уменьшилось до 2, благодаря чему критический уровень t снизился. Однако при таком методе анализа мы не мо- жем сделать никакого вывода о различиях бегунов трусцой и марафонцев. 4.9. Контрольная группа, 15 и 30 сигарет; 75 сигарет без тет- рагидроканнабинолов и 50 сигарет; 75 и 150 сигарет. 4.10. Всего можно провести 6 сравнений. Контроль и дофа- мин в низкой дозе: t = 0. Контроль и дофамин в высокой дозе: t = 3,171. Контроль и нитропруссид натрия: t = 4,228. Дофамин в низкой дозе и дофамин в высокой дозе: t = 2,569. Дофамин в низкой дозе и нитропруссид натрия: t = 3,426. Дофамин в высо- кой дозе и нитропруссид натрия: t = 0,964. Уровень значимости в каждом из сравнений 0,05/6 = 0,0083, число степеней свободы ν = 79, соответствующий критический уровень t составляет 2,72. Итак, группы довольно четко разделились на контроль и дофа- мин в низкой дозе, с одной стороны, и дофамин в высокой дозе и нитропруссид натрия, с другой. Картину несколько портит срав- нение дофамина в низкой и высокой дозе: значение t не достига- ет критического уровня, хотя и близко к нему. В такой ситуации большинство исследователей, вероятно, все же сочтет различие ПРИЛОЖЕНИЕ В |