Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
1,87 38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02 1,96 1,92 1,85 1,81 1,76 1,71 1,68 1,63 1,61 1,57 1,54 1,53 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69 2,59 2,51 2,40 2,32 2,23 2,14 2,09 2,01 1,97 1,90 1,86 1,84 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,95 1,90 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,56 2,48 2,37 2,29 2,20 2,1 1 2,06 1,98 1,94 1,87 1,83 1,81 42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,1 1 2,06 2,03 1,99 1,94 1,89 1,83 1,78 1,73 1,68 1,65 1,60 1,57 1,53 1,51 1,49 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64 2,54 2,46 2,34 2,26 2,18 2,09 2,03 1,95 1,91 1,85 1,80 1,78 44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98 1,92 1,88 1,81 1,77 1,72 1,67 1,63 1,59 1,56 1,52 1,49 1,48 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62 2,52 2,44 2,32 2,24 2,15 2,07 2,01 1,93 1,89 1,82 1,78 1,75 46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97 1,91 1,87 1,80 1,76 1,71 1,65 1,62 1,57 1,55 1,51 1,48 1,46 7,22 5,10 4,24 3,76 3,44 3,22 3,06 2,93 2,82 2,73 2,66 2,60 2,50 2,42 2,30 2,22 2,13 2,04 1,99 1,91 1,86 1,80 1,76 1,73 48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96 1,90 1,86 1,79 1,75 1,70 1,64 1,61 1,56 1,54 1,49 1,47 1,45 7,19 5,08 4,22 3,74 3,43 3,20 3,04 2,91 2,80 2,71 2,64 2,58 2,48 2,40 2,28 2,20 2,12 2,02 1,97 1,89 1,84 1,78 1,73 1,71 50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95 1,89 1,85 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56 2,46 2,38 2,27 2,18 2,10 2,01 1,95 1,87 1,82 1,76 1,71 1,68 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,86 1,82 1,75 1,70 1,65 1,59 1,56 1,51 1,48 1,44 1,41 1,39 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50 2,39 2,31 2,20 2,12 2,03 1,94 1,88 1,79 1,75 1,68 1,63 1,60 70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89 1,84 1,79 1,72 1,67 1,62 1,57 1,53 1,48 1,45 1,40 1,37 1,35 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,51 2,45 2,35 2,27 2,15 2,07 1,98 1,89 1,83 1,74 1,70 1,62 1,57 1,54 80 3,96 3,1 1 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88 1,82 1,77 1,70 1,65 1,60 1,54 1,51 1,45 1,43 1,38 1,35 1,33 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,48 2,42 2,31 2,23 2,12 2,03 1,94 1,85 1,79 1,70 1,65 1,58 1,53 1,50 100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85 1,79 1,75 1,68 1,63 1,57 1,52 1,48 1,42 1,39 1,34 1,31 1,28 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37 2,27 2,19 2,07 1,98 1,89 1,80 1,74 1,65 1,60 1,52 1,47 1,43 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,87 1,83 1,78 1,73 1,66 1,61 1,55 1,50 1,46 1,40 1,37 1,32 1,28 1,26 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,40 2,34 2,23 2,15 2,03 1,95 1,86 1,76 1,70 1,61 1,56 1,48 1,42 1,38 ∞ 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75 1,69 1,64 1,57 1,52 1,46 1,40 1,35 1,28 1,25 1,17 1,1 1 1,03 63 лиз, в котором проверяется влияние одного фактора, называет- ся однофакторным. При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ (в этой книге не рассматривается). ТРИ ПРИМЕРА Сейчас мы уже можем оценивать статистическую значимость реальных данных. Покажем это на трех примерах, заимствован- ных из медицинской литературы. Оговорюсь, что при изложе- нии этих примеров мне пришлось несколько отклониться от пер- воисточников. Тому есть две причины. Во-первых, в медицинс- ких публикациях обычно приводят не сами данные, а средние величины и прочие обобщенные показатели. Нередко дело об- стоит и того хуже. Минуя все промежуточные этапы, авторы сообщают, что «Р < 0,05». Поэтому «данные из литературных источников» по большей части являются плодом моих собствен- ных догадок, какими могли бы быть исходные данные. Во-вто- рых. дисперсионный анализ в том виде, как мы его изложили, требует, чтобы численность всех групп была одинаковой. По- этому мне пришлось видоизменять приводимые в работах дан- ные так, чтобы соблюсти это требование. Впоследствии мы обоб- щим наши статистические методы, и их можно будет приме- нять и при неравной численности групп. Позволяет ли правильное лечение сократить срок госпитализации? Стоимость пребывания в больнице — самая весомая статья рас- ходов на здравоохранение. Сокращение госпитализации без сни- жения качества лечения дало бы значительный экономический эффект. Способствует ли соблюдение официальных схем лече- ния сокращению госпитализации? Чтобы ответить на этот воп- рос, Кнапп и соавт.* изучили истории болезни лиц, поступив- * D. Е. Knapp, D. А. Knapp, М. К. Speedie, D. M. Yaeger, С. L. Baker Relationship of inappropriate drug prescribing to increased length of hospital stay. Am. J. Hosp. Pharm., 36:1334–1337, 1979. СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ 64 ших в бесплатную больницу с острым пиелонефритом. Острый пи- елонефрит был выбран как заболевание, имеющее четко очерчен- ную клиническую картину и столь же четко регламентированные методы лечения. Эта работа — пример обсервационного исследования. В от- личие от экспериментального исследования, где исследователь сам формирует группы и сам оказывает то или иное воздействие в обсервационном исследовании он может лишь наблюдать те- чение процесса. С другой стороны, это исследование — рет- роспективное, поскольку имеет дело с данными, полученными в прошлом (в отличие от проспективного). В обсервационном исследовании мы никогда не можем га- рантировать, что группы различаются только тем признаком, по которому они были сформированы. Этот неустранимый недо- статок исследований такого рода. Известно, например, что ку- рильщики чаще болеют раком легких. Это считается доказатель- ством того, что курение вызывает рак легких. Однако возможна и другая точка зрения у людей с генетической предрасположен- ностью к раку легких существует и генетическая предрасполо- женность к курению. В обсервационном исследовании отверг- нуть такое объяснение невозможно. Ретроспективное исследование, естественно, всегда являет- ся обсервационным, разделяя недостатки последнего, оно обла- дает и рядом собственных. Исследователь использует инфор- мацию, собранную для других целей, — естественно, часть ее приходится реконструировать, еще часть неизбежно теряется. Меняются методы исследования, диагностические критерии и сами представления о нозологических единицах, наконец, ис- тории болезни ведутся порой небрежно. Кроме того, имея весь материал в руках, здесь особенно трудно удержаться от непред- намеренной подтасовки. Тем не менее, ретроспективные исследования проводились и бу- дут проводиться. Они недороги и позволяют получить большой объем информации в короткий срок. Последнее особенно важно в случае редкого заболевания при проспективном исследовании на сбор данных уйдут годы. В примере, который мы разбираем, проспек- тивное исследование вообще невозможно нельзя же, в самом деле, одну группу больных лечить правильно, а другую неправильно. ГЛАВА 3 65 Чтобы избежать ловушек обсервационного (и особенно рет- роспективного) исследования, чрезвычайно важно в явном виде задать критерии, по которым больных относили к той или иной группе. Самому исследователю это поможет избежать невольно- го самообмана, читателю работы это даст возможность судить, насколько результаты исследования приложимы к его больным. Кнапп и соавт. сформулировали следующие критерии вклю- чения в исследование. 1. Диагноз при выписке — острый пиелонефрит. 2. При поступлении — боли в пояснице, температура выше 37,8°С. 3. Бактериурия более 100 000 колоний/мл, определена чувстви- тельность к антибиотикам. 4. Возраст от 18 до 44 лет (больных старше 44 лет не включали в связи с высокой вероятностью сопутствующих заболева- ний, ограничивающих выбор терапии). 5. Отсутствие почечной, печеночной недостаточности, а также заболеваний, требующих хирургического лечения (эти состо- яния тоже ограничивают выбор терапии). 6. Больной был выписан в связи с улучшением (то есть не поки- нул больницу самовольно, не умер и не был переведен в дру- гое лечебное учреждение). Кроме того, исследователи сформулировали критерий того, что считать «правильным» лечением. Правильным считалось лече- ние, соответствующее рекомендациям авторитетного справочни- ка по лекарственным средствам «Physicians’ Desk Reference» («На- стольный справочник врача»). По этому критерию больных раз- делили на две группы леченных правильно (1-я группа) и непра- вильно (2-я группа). В обеих группах было по 36 больных. Результат представлен на рис. 3.7. Средняя длительность гос- питализации составила для первой группы 4,51 сут. (стандарт- ное отклонение 1,98 сут.), для второй группы 6,28 сут. (стандар- тное отклонение 2,54 сут). Можно ли считать эти различия слу- чайными? Прибегнем к дисперсионному анализу. Вычислим сначала внутригрупповую дисперсию как сред- нюю дисперсий обеих групп: ( ) ( ) 2 2 2 2 2 вну 1 2 1 1 1,98 2,54 5,19. 2 2 s s s = + = + = СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ 66 Теперь вычислим межгрупповую дисперсию. Среднее двух выборочных средних равно ( ) ( ) 1 2 1 1 4,51 6, 28 5, 40, 2 2 X X X = + = + = следовательно, стандартное отклонение равно ( ) ( ) ( ) ( ) 2 2 1 2 2 2 1 4,51 5,40 6,28 5,40 1,25 2 1 X X X X X s m − + − = = − − + − = = − и наконец межгрупповая дисперсия равна 2 2 2 меж 36 1,25 56,25 X s ns = = × = Рис. 3.7. Длительность госпитализации при правильном (1-я руппа) и непра- вильном лечении. Каждый больгой обозначен кружком; положение кружка со- ответствует сроку госпитализации. Средняя длительность госпитализации в первой группе меньше, чем во второй. Можно ли отнести это различие на счет случайности? ГЛАВА 3 67 Теперь можно вычислить F — как отношение межгруппо- вой к внутригрупповой дисперсии: 2 меж 2 вну 56,25 10,84 5,19 s F s = = = Рассчитаем межгрупповое и внутри групповое число степе- ней свободы ν меж = 2 – 1 = 1, ν вну = 2 (36 – 1) = 70. Теперь по таблице 3.1 найдем критическое значение F. На пересечении столбца «1» и строки «70» находим число 7,01, набранное жир- ным шрифтом. То есть при уровне значимости 0,01 критичес- кое значение F составляет 7,01. Итак, на наш вопрос можно ли считать различия в длительности госпитализации случайными мы можем дать ответ, вероятность этого весьма мала меньше 1%. Леченные правильно находились в больнице меньше чем, леченные неправильно и различия эти статистически значимы. Значит ли это, что благодаря правильному лечению больные выз- доравливают быстрее? Увы, нет. Как это всегда бывает в обсер- вационном исследовании, мы не можем исключить того, что группы различались чем-то еще кроме лечения. Может быть, врачи, которые лечат «по справочнику» просто более склонны быстрее выписывать своих больных? Галотан и морфин при операциях на открытом сердце Галотан препарат, широко используемый при общей анестезии. Он обладает сильным действием, удобен в применении и очень надежен. Галотан — газ его можно вводить через респиратор. Поступая в организм через легкие, галотан действует быстро и кратковременно поэтому, регулируя подачу препарата можно оперативно управлять анестезией. Однако галотан имеет суще- ственный недостаток — он угнетает сократимость миокарда и расширяет вены, что ведет к падению АД. В связи с этим было предложено вместо галотана для общей анестезии применять морфин, который не снижает АД. Т. Конахан и соавт.* сравнили * Т. J. Conahan III, A. J. Ominsky, H. Wollman R. A. Stroth. A prospective random comparison of halothane and morphine for open heart anesthesia: one year expenence. Anesthesiology, 38:528-535, 1973. СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ 68 галотановую и морфиновую анестезию у больных, подвергшихся операции на открытом сердце. В исследование включали больных, у которых не было про- тивопоказаний ни к галотану, ни к морфину. Способ анестезии (галотан или морфин) выбирали случайным образом. Такое исследование — со случайно отобранной контрольной группой (то есть рандомизированное) и наличием воздействия со стороны исследователя — называется рандомизированным контролируемым клиническим испытанием или просто конт- ролируемым испытанием. Контролируемое испытание — это всегда проспективное исследование (данные получают после начала исследования), кроме того, это экспериментальное ис- следование (воздействие оказывает исследователь). Экспери- мент, который в естественных науках давно стал основным ме- тодом исследования, в медицине получил распространение срав- нительно недавно. Значение контролируемых испытаний труд- но переоценить. Благодаря рандомизации мы уверены в том, что группы различаются только исследуемым признаком, тем самым преодолевается основной недостаток обсервационных исследо- ваний. В отличие от ретроспективного исследования, в проспек- тивном исследовании никто до его завершения не знает, к чему оно приведет. Это уменьшает риск невольной подтасовки, о ко- торой мы говорили выше. Быть может, по этим причинам конт- ролируемые испытания нередко приводят к заключению о не- эффективности того или иного метода лечения, когда обсерва- ционное исследование, напротив, доказывает его эффектив- ность*. Но почему в таком случае не все методы лечения проходят контролируемое испытание? Немаловажную роль играет кон- серватизм, когда метод уже вошел в практику, трудно убедить врачей и больных, что его эффективность еще нуждается в под- тверждении. Рандомизация психологически трудна: предлагая * Превосходное обсуждение значения контролируемых испытаний в ме- дицине, а также нелицеприятный анализ того сколь малая часть обще- принятых методов лечения в действительности приносит, хоть какую ни будь пользу, можно найти в работе А. К. Cochran. Effectiveness and efficien- cy: random reflections on health services. Nuffield Provincial Hospitals Trust, London, 1972. ГЛАВА 3 69 по жребию лечиться тем или иным способом, врач по сути дела признается в незнании и призывает больного стать объектом эк- сперимента. Чтобы охватить достаточное количество больных, исследование часто приходится проводить одновременно в не- скольких местах (кооперированные испытания). Конечно, это вносит приятное разнообразие в работу координаторов проек- та, однако повышает его стоимость и оборачивается дополни- тельной нагрузкой для сотрудников сторонних медицинских уч- реждений. Контролируемые испытания, как и вообще проспек- тивные исследования иногда занимают многие годы. За это вре- мя больной может переехать в другой город, утратить интерес к эксперименту или умереть (по причинам, не относящимся к ис- следованию). Нередко основная трудность состоит в том, что- бы не потерять участников испытания из виду. С выбыванием больных из исследования связан и более прин- ципиальный недостаток контролируемых испытаний (и проспек- тивных исследований вообще). Если в обсервационном иссле- довании мы не можем гарантировать сопоставимость началь- ного состава групп, то в проспективном исследовании мы не можем гарантировать сопоставимость выбывания из исследо- вания. Проблема состоит в том, что выбывание может быть свя- зано с лечением. Если, например, риск побочного действия пре- парата связан с тяжестью заболевания, то из группы леченных будут выбывать (из-за непереносимости препарата) наиболее тя- желые больные. Тем самым состояние группы леченных будет «улучшаться». Чтобы избежать подобных иллюзий, эффектив- ность метода лечения следует рассчитывать как долю всех боль- ных, включенных в исследование, а не только прошедших пол- ный курс. Даже при соблюдении этого условия результаты иссле- дования с большим числом выбывших всегда сомнительны. Суще- ствуют и более тонкие методы анализа результатов проспективных исследований, с ними мы познакомимся позже, в гл. 11. Удачный выбор предмета исследования позволил Конахану и соавт. избежать большинства упомянутых трудностей. Посколь- ку исследователей интересовали только ближайшие результаты, проблемы выбывания не возникало. Регистрировали следующие показатели параметры гемодинамики на разных этапах опера- ции, длительность пребывания в реанимационном отделении и СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ 70 общую длительность пребывания в больнице после операции, а также послеоперационную летальность. Данные по летальнос- ти мы проанализируем после того, как познакомимся в гл. 5 с необходимыми статистическими методами. Пока же сосредото- чим внимание на артериальном давлении между началом анес- тезии и началом операции. Именно в этот период артериальное давление наиболее адекватно отражает гипотензивное действие анестетика, поскольку в дальнейшем начинает сказываться ги- потензивный эффект самой операции. Артериальное давление между началом анестезии и началом операции измеряли много- кратно, каждый раз вычисляя среднее артериальное давление: С Д средн Д АД АД АД АД 3 − = + , где АД средн — среднее артериальное давление, АД Д — диастоли- ческое артериальное давление, АД С — систолическое артери- альное давление. Брали минимальное из полученных значений. В исследование вошло 122 больных. У половины больных использовали галотан (1-я группа), у половины — морфин (2-я группа). Результаты представлены на рис. 3.8. Данные округле- ны до ближайшего четного числа. В среднем у больных, полу- чавших галотан, минимальное АД средн было на 6,3 мм рт. ст. ниже, чем у больных, получавших морфин. Разброс значений доволь- но велик, и диапазоны значений сильно перекрываются. Стан- дартное отклонение в группе галотана составило 12,2 мм рт. ст. в группе морфина — 14,4 мм рт. ст. Достаточно ли велико различие в 6,3 мм рт. ст., чтобы его нельзя было отнести за счет случайности? Применим дисперсионный анализ. Оценкой внутригруппо- вой дисперсии служит среднее двух выборочных дисперсий: ( ) ( ) 2 2 2 2 2 вну 1 2 1 1 12, 2 14, 4 178,1 2 2 s s s = + = + = Эта оценка дисперсии вычислена по дисперсиям отдельных выборок, поэтому она не зависит от того, различны или нет вы- борочные средние. Оценим теперь дисперсию, полагая, что галотан и морфин ГЛАВА 3 71 оказывают одинаковое действие на артериальное давление. В этом случае две группы бальных, представленные на рис. 3.8, являются просто двумя случайными выборками из одной и той же совокупности. В результате стандартное отклонение выбо- рочных средних есть оценка стандартной ошибки среднего. Среднее двух выборочных средних равно ( ) ( ) 1 2 1 1 66,9 73,2 70 2 2 X X X = + = + = Стандартное отклонение выборочных средних: ( ) ( ) ( ) ( ) 2 2 1 2 2 2 1 66,9 70,0 73,2 70,0 4,46 2 1 X X X X X s m − + − = = − − + − = = − |