Главная страница
Навигация по странице:

  • Рис. 12.1. А.

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница34 из 37
    1   ...   29   30   31   32   33   34   35   36   37
    Всегда ли нужна рандомизация?
    Следует признать, что великие открытия, изменившие облик медицины в середине XX века, такие, как открытие пеницилли- на, не подвергались проверке в рандомизированных исследова- ниях.
    Порой сами обстоятельства способны натолкнуть на пере- оценку общепринятых методов лечения. Так, французский во- енный хирург Амбруаз Парэ в полном соответствии с предписа- ниями лечил огнестрельные раны кипящим маслом. Однажды,
    в одну из битв 1536 г., масла на всех раненых не хватило. Части солдат Парэ сделал перевязку, не обработав рану этим целитель- ным средством. Утром он с удивлением обнаружил, что солда- ты, чьи раны перед перевязкой были обработаны по всем пра- вилам, корчатся от боли, тогда как просто перевязанные «пре- красно отдохнули и не испытывали болей»*. История умалчи- вает, подал ли Парэ рапорт о необходимости проведения рандомизированных клинических испытаний эффективности кипящего масла как средства лечения пулевых ранений. Но нам не кажется, что, соверши он свое открытие в наши дни, ему по- требовалось бы детальная проверка.
    Наконец, рандомизация не всегда возможна. Так, в гл. 11 мы рассмотрели выживаемость после трансплантации костного моз- га при остром лимфобластном лейкозе взрослых. Одним боль- ным пересаживался костный мозг близких родственников, дру-
    * Пример заимствован из книги Н. R. Wullf. Rational Diagnosis and Treatment,
    Blackwell, Oxford, 1976. В этой небольшой по объему и блистательно на- писанной книге вы найдете многое идей, перекликающихся с нашим об- суждением.
    ГЛАВА 12

    413
    гим — их собственный. Случайно распределить больных по двум этим группам невозможно, поскольку не у каждого найдется родственник-донор. К счастью для экспериментаторов, само по себе наличие или отсутствие близких родственников не влияет на течение заболевания. Ситуация, когда разделить больных случайным образом невозможно, в медицинских исследовани- ях возникает довольно часто. В таких случаях надо стремиться сделать группы максимально схожими по всем известным прогностическим факторам.
    ДОСТАТОЧНО ЛИ РАНДОМИЗАЦИИ?
    Контролируемые рандомизированные клинические испытания сегодня стали эталоном медицинского исследования. Но всегда ли они приводят к верным заключениям? Нет, не всегда. Неред- ко в исследовании скрыто присутствует множественное сравне- ние. Исследователь не учитывает эту множественность и в ре- зультате, сам того не подозревая, многократно занижает вероят- ность ошибочно выявить мнимый эффект. Рассмотрим три ти- пичных случая.
    Проверкой нового метода лечения независимо друг от друга занимаются несколько исследователей. Получив положительный результат, исследователь опубликует его. А получив отрица- тельный? Вероятно, воздержится от публикации, но, кроме того,
    еще и предпримет повторную проверку. В конце концов в одной
    из многих проверок будет обнаружен желанный «эффект». В гл.
    4 мы описали эту ситуацию и привели оценки истинной вероятности ошибиться, многократно превышающей вероят- ность ошибки в единичном испытании.
    В медицине приняты широкомасштабные исследования раз- личных методов лечения, используемых прежде всего при хро- нических болезнях, таких, например, как ишемическая болезнь сердца и сахарный диабет. Результатом исследования является описание огромного числа разнообразных признаков. Данные подвергаются различным группировкам с целью выяснения наи- более информативных признаков, в наибольшей степени вли- яющих на конечный показатель — выживаемость. Понятно, что
    КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ

    414
    при значительном числе возможных группировок не составит труда выделить группы, на которых тот или иной метод лече- ния будет наиболее эффективен. Эту плодотворную деятельность мог бы омрачить учет множественности сравнений, например применение поправки Бонферрони. Приведем пример. Админист- рация по делам ветеранов провела рандомизированное исследо- вание коронарного шунтирования*. Среди наблюдавшихся боль- ных в целом не было выявлено статистически значимых различий в выживаемости между оперированными и неоперированными больными. Однако стоило разделить наблюдения на подгруппы,
    как оказалось, что хирургическое вмешательство обеспечивает более высокую выживаемость среди «больных с поражением ство- ла левой коронарной артерии». Интерпретация подобных нахо- док требует крайней осторожности.
    Сходная картина наблюдается, когда в данных, полученных для анализа одних факторов, обнаруживается связь между дру- гими. Возможно, это реально существующая связь, но, возмож- но, и злая шутка эффекта множественных сравнений, когда, по- парно сравнивая все со всем, исследователь непременно найдет какую-нибудь статистическую зависимость. Поэтому для про- верки такой попутно обнаруженной связи нужно выполнить от- дельное исследование.
    К чему может привести вольная группировка данных, по- лученных в безупречно выполненном рандомизированном ис- следовании, было убедительно показано Ли и соавт.** Они вос- произвели достаточно типичное исследование. Взяв истории бо- лезни 1073 больных ишемической болезнью сердца, они случай- ным образом разделили их на две группы. Одну группу назвали контрольной, а другую экспериментальной (представим себе,
    что попавшие в нее получали волшебный препарат «рандоми-
    * М. Murphy, H. Hultgren, К. Detre, J. Thomsen, Т. Takaro. Treatment of chronic stable angina: a preliminary report of survival data of the Ran- domized Veterans Administration Cooperative Study. N. Engl. J. Med.,
    297:621–627, 1977.
    ** K. Lee, F. McNeer, F. Starmer, P. Harris, R. Rosati. Clinical judgement and statistics: lessons from a simulated randomized trial in coronary artery disease. Circulation, 61:508–515, 1980.
    ГЛАВА 12

    415
    зин»). Между группами не было обнаружено значимых разли- чий по таким признакам, как возраст, пол, число пораженных коронарных артерий и т. д. По одному признаку — сократимос- ти левого желудочка — статистически значимое различие наблюдалось. Несомненно, пытливый исследователь не преми- нул бы связать это различие с использованием «рандомизина».
    Однако, увы, по самому важному признаку — выживаемости
    — различие было статистически не значимым (см. рис. 12.1А).
    В этой ситуации исследователь наверняка продолжил бы по- иск различий, разделив больных на более мелкие группы. Так и поступил Ли. Больные были разделены (стратифицированы) по двум признакам: числу пораженных коронарных артерий (1, 2
    или 3) и сократимости левого желудочка (нормальной или сни- женной). В результате получилось 6 подгрупп. Влияние рандо- мизина на выживаемость изучалось в каждой из этих подгрупп.
    Но этого мало. Каждая подгруппа была разделена еще на две в зависимости от наличия или отсутствия сердечной недоста- точности. В каждой из получившихся 12 подгрупп вновь оцени- валась эффективность рандомизина. Упорные усилия были воз- награждены. В одной из подгрупп (больные с поражением 3
    коронарных артерий и сниженной сократимостью левого же- лудочка) рандомизин оказался эффективен: различия выжи- ваемости «леченых» и «нелеченых» были статистически зна- чимыми, Р < 0,025 (рис. 12.1 Б).
    Рандомизин — выдумка. Но многочисленные препараты, эф- фективность которых была доказана совершенно таким же спо- собом, существуют в действительности. Секрет их «эффектив- ности» очень прост — это множественность сравнений. В ис- следовании рандомизина бьыо построено 18 пар подгрупп и вы- полнено 18 сравнений. Чему равна вероятность получить хотя бы один значимый результат в 18 сравнениях, уровень значимо- сти в каждом из которых равен 0,05? Находим:
    α′ = 1 – (1 – α)
    k
    =
    = 1 – (1 – 0,05)
    18
    = 1 – 0,40 = 0,60. Таким образом, истинная вероятность ошибки I рода оказалась в 12 раз выше той, о кото- рой доложил бы исследователь.
    Как избежать несостоятельных выводов, не отказываясь от возможности группировать данные? Для этого достаточно в уровне значимости каждого отдельного сравнения учесть, что их
    КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ

    416
    Рис. 12.1. А. Больных с ишемической болезнью сердца (1073 человека) случайным об- разом разделили на 2 группы. Статистически значимых различий выживаемости не об- наружено. Б. Выделив больных с поражением 3 коронарных артерий и сниженной со- кратимостью левого желудочка, их вновь случайным образом разделили на 2 группы.
    На этот раз различия выживаемости статистически значимы (Р < 0,025). Выделяя все новые подгруппы, мы в конце концов всегда найдем различия там, где их нет.
    ГЛАВА 12

    417
    более одного. Поправка Бонферрони дает уровень значимости,
    равный
    α′/k, где α′ выбранный уровень значимости для всего набора из k сравнений. Это чрезмерно жесткая, заниженная оцен- ка. Наиболее продуктивный подход состоит в применении мно- гофакторных статистических методов*. Помимо прочего, они позволяют обнаружить одновременное влияние более чем двух методов лечения, что в принципе недоступно методам, изложен- ным ранее.
    КОГО МЫ ИЗУЧАЕМ
    В лабораторных исследованиях, в исследованиях общественного мнения или потребительского спроса существует достаточная определенность, что представляет собой исследуемая совокуп- ность. Понятно и как организовать представительную выборку из нее. Иначе обстоит дело в клинических исследованиях. Здесь нет ясности ни в том, какова изучаемая совокупность, ни в том,
    как построить представительную выборку из нее.
    Чаще всего исследования проводятся в крупных клиниках,
    куда попадают далеко не все больные. При всей своей условно- сти рис. 12.2, тем не менее, отражает реальную картину. Из 1000
    больных госпитализируется лишь девять и только один попа- дает в клинику. Ясно, что сложный путь больного по медицин- ским учреждениям далеко не случаен — он определяется преж- де всего тяжестью, сложностью случая или редкостью болезни.
    Поэтому при всем желании больных в клиниках трудно при- знать представительной выборкой. Это несоответствие обяза- тельно нужно иметь в виду, решая, на какую совокупность боль- ных могут быть (и в какой мере) распространены полученные в исследовании результаты.
    Данные, относящиеся к госпитализированным больным, и прежде всего к больным из крупных клиник, не отражают ни об- щий спектр болезней и их стадий, ни их взаимосвязь. Исследова- тели вынуждены изучать взаимосвязь болезней, опираясь на дан-
    * С ними вы можете познакомиться в нашей книге: S. A. Glantz,
    В. К. Sliriker. Primer of Applied Regression and Analysis of Variance.
    McGraw-Нill, N.Y., 1990.
    КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ

    418
    ные, относящиеся к госпитализированным или амбулаторным больным. Но разные заболевания и разные стадии одного забо- левания требуют разных форм лечения. В результате связь забо- леваний представляется искаженной. Человек, страдающий не- сколькими болезнями, имеет больше шансов попасть в больницу,
    чем человек с одной болезнью. Поэтому наиболее частый вид искажения — это мнимое обнаружение связи заболеваний или преувеличение действительно существующей связи. В задаче
    5.10 мы встретились с более сложным видом искажения, когда из-за неравной вероятности госпитализации создается впечат- ление о более сильной связи болезни Х с болезью Z, чем с бо- лезнью Y. Данные о связи заболеваний, полученные при изу- чении госпитализированных больных, следует оценивать с чрез-
    Рис. 12.2. В специализированных медицинских учреждениях оказывается лишь очень незначительная доля больных — обычно они лечатся амбулаторно или не лечатся вооб- ще. На рисунке показано, сколько человек на 1000 населения болеют, обращаются к врачу и попадают в больницу в течение месяца.
    ГЛАВА 12 1000 750 250
    − Взрослое население
    − Болели хотя бы
    1 раз в месяц
    − Обращались к врачу
    Госпитализированы
    Направлены на консультацию
    Переведен в специализированное медицинское учреждение
    9 6 1

    419
    вычайной осторожностью. Эта проблема названа по имени Бер- ксона*, первым обратившего на нее внимание.
    КАК УЛУЧШИТЬ ПОЛОЖЕНИЕ
    Способность применить статистический подход в медицине не сводится к заучиванию нескольких формул и умению отыскать табличное значение. Как и любая творческая деятельность, при- менение статистических методов и интерпретация полученных результатов требуют глубокого проникновения в суть дела —
    понимания как возможностей и ограничений используемых методов, так и существа решаемой клинической задачи. В гл. 1
    мы говорили, что значение статистических методов возрастает по мере ужесточения требований к обоснованию эффективнос- ти предлагаемых методов лечения. Статистическое обоснова- ние зачастую оказывается важнейшим фактором, определяющим решение в пользу предлагаемого лечения.
    В то же время сами медики редко занимаются статистичес- ким обоснованием своих исследований в силу того, что их по- знания в этой области столь же скромны, сколь и оторваны от практики. Обычно вся статистическая сторона дела перепору- чается консультантам, нередко действительно разбирающимся в статистике, но имеющим довольно смутное представление о медицинских вопросах. Единственный выход состоит в том,
    чтобы медики наконец сами занялись статистическим анализом,
    поскольку именно они знают цели исследования и несут за него ответственность.
    * J. Berkson. Limitations of the applications of fourfold table analysis to hospital data. Biometrics, 2:47—53, 1946. Менее формальное обсуждение вы най- дете в работе D. Mainland. The risk of fallacious conclusions from autopsy data on the incidence of diseases with application to heart disease. Am. Heart.
    J., 45:644—654, 1953. Пример того, сколь различны выводы, полученные в результате наблюдения больных из конкретной клиники, всех госпита- лизированных больных и, наконец, всех больных, приведен в коммента- рии Мюнча (N. Engl. J. Med. 272:1134, 1965) к работе Н. Binder, A. Clement,
    W. Thayer, H. Spiro. Rarity of hiatus hernia in achalasia. N. Engl. J. Med.,
    272:680—682, 1965.
    КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ

    420
    Увы, проблема усугубляется еще и тем, что у немалой части исследователей сбор данных предшествует формулировке во- проса, на который они должны бы ответить. На этом пути иссле- дователя неизменно подстерегают малоприятные открытия. Вся- кий раз исследователь попадает в ситуацию, когда данные собра- ны и остается только вычислить значение Р, но тут обнаружива- ется, что это значение существует не само по себе, а лишь в связи с проверкой гипотезы. Но самое обескураживающее —
    чтобы проверить гипотезу, ее, оказывается, нужно иметь.
    Не многие исследователи обременяют себя необходимостью еще до начала сбора данных осознать цели исследования и под- лежащие проверке гипотезы. Например, лишь 20% протоколов,
    одобренных комитетом по клиническим исследованиям одного крупного научно-медицинского центра, содержали четко сфор- мулированные гипотезы*.
    Попытайтесь понять, что вы хотите от исследования, какой вопрос вы хотите решить. И когда у вас будет конкретная гипоте- за, станет понятно, каким должен быть тип предстоящего экспе- римента и какие потребуются данные. Тогда по табл. 12.1 вы легко определите нужный метод анализа. Придерживаясь этих правил, вы всегда соберете данные, необходимые и достаточ- ные для анализа.
    Лишь очень немногие поступают таким образом. Поэтому неудивительно, что, когда настает время вычислить значение Р,
    исследователь обнаруживает, что собранные им данные мало свя- заны с проверяемой гипотезой, да к тому же нарушают пред- посылки известных ему статистических методов. Но не начинать же все с начала. Поэтому для устранения и сглаживания стати- стических несообразностей на этом, завершающем этапе призы- вается специалист, который оставляет от Монблана данных не- многое, хоть как-то пригодное для анализа, заменяет неприме- нимые параметрические методы неприхотливыми, но менее чув-
    * Подробнее об этой проблеме и той роли, которую могли бы сыграть в ее решении комитеты по клиническим исследованиям, говорится в работе М. Giammona, S. Glantz. Poor statistical design in research on humans: the role of Committees on Human Research. Clin. Res., 31:571—
    577, 1983.
    ГЛАВА 12

    421
    ствительными непараметрическими или предлагает вместо од- ной гипотезы перейти к нескольким, пригодным для статисти- ческой проверки. Отчет об исследовании приобретает приемле- мый вид. Однако само исследование не становится более осмыс- ленным. Способ избежать этого прост и состоит в том, чтобы задуматься о том, как анализировать данные, в начале, а не в конце исследования.
    С примерами несостоятельных работ мы неоднократно встре- чались в этой книге. Еще чаще они встречаются в жизни. Поэто- му серьезный врач, особенно исследователь, не должен прини- мать за чистую монету все, что пишется в журналах.
    Знакомясь с материалами очередного исследования, обрати- те внимание, названы ли:
    • подлежащая проверке гипотеза;
    • использованные данные и способ их получения (включая ме- тод рандомизации);
    • совокупность, которую представляют используемые в иссле- довании выборки;
    • статистические методы, использованные для оценки гипо- тезы.
    Очень трудно найти публикацию, которая бы содержала все это. Но чем ближе она к такому идеалу, тем вернее можно поло- житься на приведенные в ней выводы. Напротив, очень мало до- верия заслуживает статья, в которой использованные методы не указаны вовсе или упоминаются некие «стандартные методы».
    Возвращаясь к вопросу об этичности исследований на лю- дях, хочется подчеркнуть, что чем менее грамотно и добросове- стно исследование, тем менее оно этично, как по отношению к тем больным, которые в нем участвовали, так и ко всем боль- ным, лечение которых напрямую зависит от его результатов.
    Неэтичен любой вводящий в заблуждение результат. Неэтично подвергать людей страданиям и мучить лабораторных живот- ных ради получения данных, на основании которых невозмож- но сделать какой-либо вывод. Неэтично выполнять такие исследования, опровержение которых потребует чьих-то сил,
    здоровья и средств.
    Конечно, тщательная проработка статистической стороны ис- следования не освобождает исследователя от обязанности тща-
    КАК ПОСТРОИТЬ ИССЛЕДОВАНИЕ

    422
    тельно продумать эксперимент с врачебной точки зрения, свес- ти риск и страдания больных к минимуму. Больше того, она даже не гарантирует, что в исследовании будут получены глубокие и новаторские результаты. Иными словами, статистическая кор- ректность — это необходимое, но еще не достаточное условие успеха исследования.
    Как же изменить исследовательскую практику к лучшему?
    Прежде всего, будьте активны. Если это от вас зависит, не под- пускайте к исследованиям людей, несведущих в статистике, как не подпускаете тех, кто не смыслит в медицине. Встретив ста- тистические несуразности в журнале, пишите редактору*. Не стесняйтесь задавать вопросы своим коллегам. Не поддавайтесь гипнозу наукообразия — докапывайтесь до сути дела. Когда вас осыпают мудреными терминами, спросите, что в данном слу- чае означает Р.
    Но самое главное, чтобы ваши собственные исследования были безупречны с точки зрения планирования и применения статистических методов.
    * Если редактор не утратил интерес к жизни и профессии, он обяза- тельно среагирует. Так, в 1978 г., еще никому неизвестным меди- ком, я написал в Circulation Research о случаях неверного использо- вания критерия Стьюдента для множественного сравнения (об этом см. гл. 1 и 4). Редакторы получили отзыв на мое письмо у специали- ста, после чего пересмотрели требования редакции к изложению в публикуемых статьях статистических методов и методов проведе- ния эксперимента. Два года спустя редакция сообщила о «значитель- ном улучшении применения методов проверки статистической значи- мости публикуемых в журнале результатов». Желающих ознакоми- ться с перепиской по этому вопросу отошлем к работам М. Rosen,
    В. Hoffman. Editorial: statistics, biomedical scientists, and circulation research. Circ. Res., 42:739, 1978 и S. Glantz. Biostatistics: how to detect, correct, and prevent errors in the medical literature. Circulation,
    61:1—7, 1980; S. Wallenstein, С. Zucker, J. Heiss. Some statistical methods useful in circulation research. Circ. Res., 47:1—9, 1980.
    ГЛАВА 12

    Приложение А
    1   ...   29   30   31   32   33   34   35   36   37


    написать администратору сайта