Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
Таблица 10.17. Попарные сравнения Разность Критичес- Сравне- сумм кое значе- ние рангов l q ние q P < 0,05 2 и 6 53 – 10 = 43 6 7,268 4,030 Да 2 и 4 53 – 20 = 33 5 6,600 3,858 Да 2 и 3 53 – 39 = 14 4 3,430 3,633 Нет 2 и 5 53 – 44 = 9 3 Нет 2 и 1 53 – 44 = 9 2 Нет 1 и 6 44 – 10 = 34 5 6,800 3,858 Да 1 и 4 44 – 20 = 24 4 5,879 3,633 Да 1 и 3 44 – 39 = 5 3 1,581 3,314 Нет 1 и 5 44 – 44 = 0 2 Нет 5 и 6 44 – 10 = 34 4 8,329 3,633 Да 5 и 4 44 – 20 = 24 3 7,590 3,314 Да 5 и 3 44 – 39 = 5 2 2,236 2,772 Нет 3 и 6 39 – 10 = 29 3 9,171 3,314 Да 3 и 4 39 – 20 = 19 2 8,497 2,772 Да 4 и 6 20 – 10 = 10 2 4,472 2,772 Да ГЛАВА 10 365 нениях. Если распределение все же оказывается нормальным, то при этом происходит некоторое снижение чувствительнос- ти. Однако если распределение отлично от нормального, непараметрические методы чувствительнее параметрических. Обратите внимание, что, оперируя не данными, а рангами, рассмотренные методы строятся, в сущности, по тому же прин- ципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее. • Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны. • Выбираем критерий, то есть числовое выражение различий. • Определяем, каким было бы распределение величины кри- терия при условии справедливости нулевой гипотезы. • Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, рав- ной уровню значимости α). • Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, при- знаем различия статистически значимыми. Выбор между па- раметрическими и непараметрическими методами определя- ется прежде всего характером данных. Имея дело с порядко- выми признаками, не остается ничего, кроме как воспользо- ваться непараметрическими методами. Если признак число- вой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое пред- ставление данных. Даже если нет веских оснований сомне- ваться в нормальности распределения, но данных мало, или вы не хотите делать никаких предположений о типе распреде- ления — воспользуйтесь непараметрическими методами. ЗАДАЧИ 10.1 Анализы, инструментальные исследования и лекарст- венные средства назначает врач, а платит за них главным об- разом больной. Многие врачи весьма смутно представляют себе НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 366 стоимость своих назначений и не озабочены тем, чтобы умень- шить расходы больного. Чтобы побудить врачей задуматься об этом, все шире практикуется учет затрат на обследование и ле- чение. Есть ли основания считать, что это сделает врача более экономным? Интересное исследование провели С. Шредер и соавт. (S. Schroeder et al. Use of laboratory tests and pharmaceuticals: variation among physicians and effect of cost audit on subsequent use. JAMA, 225:969—973, 1973). В течение трех месяцев они регистрировали расходы на обследование и лечение амбулатор- ных больных, которых наблюдали врачи из клиники Вашингтонского университета. Данные собирали по больным со сходными заболеваниями. Рассчитав для каждого врача сред- негодовые расходы на обследование и лечение одного больно- го, составили общий список, который раздали врачам. Каждый врач знал свой номер в списке, но не знал номеров своих коллег, ГЛАВА 10 К задаче 10.1. Среднегодовые расходы Среднегодовые расходы на обследование одного на лечение одного больного, долл. больного, долл. До озна- После озна- До озна- После озна- комления с комления с комления с комления с Врач расходами расходами расходами расходами 1 20 20 32 42 2 17 26 41 90 3 14 1 51 71 4 42 24 29 47 5 50 1 76 56 6 62 47 47 43 7 8 15 60 137 8 49 7 58 63 9 81 65 40 28 10 54 9 64 60 11 48 21 73 87 12 55 36 66 69 13 56 30 73 50 367 таким образом он мог сравнить свои расходы с расходами дру- гих, но не знал, кого именно. Через некоторое время исследова- тели проверили, какие изменения произошли в расходовании средств у тех же врачей. Результаты представлены в таблице на предыдущей странице. Произошли ли изменения в расходах на обследование и ле- чение? Есть ли связь между расходами на обследование и лече- ние? Как можно объяснить полученные результаты? 10.2. При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmol., 104:545—548, 1986) измерили проницаемость сосу- дов сетчатки у здоровых и у больных с ее поражением. Полу- ченные результаты приведены в таблице. Проницаемость сосудов сетчатки Здоровые Больные 0,5 1,2 0,7 1,4 0,7 1,6 1,0 1,7 1,0 1,7 1,2 1,8 1,4 2,2 1,4 2,3 1,6 2,4 1,6 6,4 1,7 19,0 2,2 23,6 С помощью непараметрического метода проверьте, подтвер- ждают ли эти данные гипотезу о различии в проницаемости со- судов сетчатки? После этого воспользуйтесь соответствующим параметрическим методом. Если выводы окажутся иными, объясните, в чем причина различия. 10.3. Данные задачи 10.2 — часть более широкого исследо- вания проницаемости сетчатки. Сравните данные, относящие- ся к разным видам поражений. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 368 10.4. Решите задачи 9.5 и 9.6, используя непараметрические методы. 10.5. В гл. 3 на примере больных пиелонефритом была рас- смотрена зависимость продолжительности госпитализации от правильности лечения. Д. Кнапп и соавт. решили выяснить, на- блюдается ли такая зависимость при лечении пневмонии. Изу- чив 28 историй болезни, исследователи обнаружили следующее. Продолжительность госпитализации, сут При правильном лечении При неправильном лечении 3,7 3,8 1,7 4,8 8,6 2,5 6,8 2,5 5,3 9,0 2,8 7,9 2,9 5,5 10,3 3,0 8,8 3,0 5,8 11,0 5,5 9,0 3,4 7,1 6,4 9,3 3,7 6,6 Есть ли разница в продолжительности госпитализации? 10.6. Предсердный натрийуретический гормон усиливает вы- ведение натрия и воды почками. В. Хименес и соавт. (W. Jimenez ГЛАВА 10 Проницаемость сосудов сетчатки Нормальная Поражение только в Аномалии в области сетчатка области центральной центральной ямки ямки и на перефирии 0,5 1,2 6,2 0,7 1,4 12,6 0,7 1,6 12,8 1,0 1,7 13,2 1,0 1,7 14,1 1,2 1,8 15,0 1,4 2,2 20,3 1,4 2,3 22,7 1,6 2,4 27,7 1,6 6,4 1,7 19,0 2,2 23,6 369 et al. Atrial natriuretic factor: reduced cardiac content in cirrhotic rats with ascites. Am. J. Physiol., 250:F749—F752, 1986) исследо- вали его роль в задержке натрия и воды при циррозе печени. Крысам вводили экстракт предсердия: одной группе — экст- ракт, полученный от здоровых крыс, другой — от крыс с цирро- зом печени. Регистрировали изменение выделения натрия с мо- чой (в процентах от исходного). Результаты представлены в таб- лице. Какой вывод можно сделать по результатам опыта? Экстракт от здоровых крыс Экстракт от крыс с циррозом 760 80 1000 80 1370 80 1680 210 1970 210 2420 320 3260 500 5000 610 5400 760 7370 760 890 890 1870 1950 10.7. Введя изотоп внутривенно и наблюдая за его распростра- нением с помощью гамма-камеры, можно определить кровена- полнение различных органов, в том числе легких. Р. Окада и со- авт. (R. Okada et al. Radionuclide-determined change in pulmonary blood volume with exercise: improved sensitivity ofmultigated blood- pool scanning in detecting coronary-artery disease. N. Engl. J. Med., 301:569—576, 1979) решили использовать этот метод для локали- зации поражения коронарных артерий при ишемической болез- ни сердца. Правая коронарная артерия снабжает кровью главным образом правый желудочек, левая — главным образом левый. Ле- вый желудочек перекачивает кровь, которая поступает в него из легких, по всему телу. При поражении левой коронарной артерии кровоснабжение левого желудочка ухудшается. В покое, когда НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 370 объем перекачиваемой крови невелик, это никак не проявляет- ся, однако при физической нагрузке это приводит к накопле- нию крови в легких. При поражении правой коронарной арте- рии этого не происходит. Примерно так рассуждали авторы, приступая к работе. Было обследовано 33 человека: 9 здоровых (1-я группа) и 24 больных ишемической болезнью сердца, из них 5 с поражением только правой коронарной артерии (2-я груп- па) и 19 с поражением обеих коронарных артерий или только левой (3-я группа). Рассчитывали отношение кровенаполнения легких при физической нагрузке к кровенаполнению в покое: по мысли авторов, в 3-й группе этот показатель должен быть выше, чем в первых двух. Результаты представлены в таблице. Группа 1 2 3 0,83 0,86 0,98 0,89 0,92 1,02 0,91 1,00 1,03 0,93 1,02 1,04 0,94 1,20 1,05 0,97 1,06 0,97 1,07 0,98 1,22 1,02 1,07 1,23 1,13 1,08 1,32 1,10 1,15 1,37 1,18 1,12 1,58 Различаются ли группы межцу собой? Если да, то как имен- но и достаточно ли велико различие, чтобы исследуемый показа- ГЛАВА 10 371 тель можно было использовать для определения пораженной ко- ронарной артерии? 10.8. Грезя о славе, автор этих строк предложил новый метод оценки эффективности лечения. Преимущество метода — его простота. Он состоит в следующем. Если у больного интересую- щий нас показатель увеличивается, ставится оценка +1, если уменьшается — 0 (допустим, случай неизменности показателя исключен). Сумма оценок по всем больным и есть значение кри- терия G. Вот пример расчета. Значение показателя до после Изменение Больной лечения лечения показателя Оценка 1 100 110 +10 +1 2 95 96 +1 +1 3 120 100 –20 0 4 111 123 +12 +1 Значение критерия G = 1 + 1 + 0 + 1 = 3. Является ли G полно- ценным критерием? Постройте распределение G и найдите кри- тическое значение для случаев, когда число больных равно 4 и 6. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Глава 11 Анализ выживаемости До сих пор мы имели дело только с полными данными: мы зна- ли исход лечения у каждого больного. В гл. 5 мы разобрали ра- боту, целью которой было определить влияние аспирина на риск тромбоза шунта у больных на гемодиализе. Мы подсчитали число больных с тромбозом и без тромбоза в группах аспирина и плацебо и свели результаты в таблицу сопряженности (см. табл. 5.1). Затем мы построили вторую таблицу сопряженности, со- державшую ожидаемые числа, которые наблюдались бы, если бы в группах аспирина и плацебо частота тромбозов была оди- наковой. По двум этим таблицам мы вычислили величину χ 2 Полученное значение оказалось достаточно большим, чтобы отклонить гипотезу об отсутствии межгрупповых различий. В этом исследовании срок наблюдения всех больных был одина- ковым и никто из них не выбыл из-под наблюдения до заверше- ния исследования. То же самое можно сказать об исследовании галотановой и морфиновой анестезии, с которым мы впервые встретились в гл. 2. Тогда, говоря о трудностях, связанных с проспективными исследованиями, мы упомянули о проблеме 373 выбывания*, но в рассмотренных примерах мы с ней не сталки- вались. Однако ситуация, когда исследование должно быть за- вершено до наступления исхода у всех больных, для проспек- тивных исследований, в частности клинических испытаний, скорее правило, чем исключение. Понятно, что на этот случай нужны специальные статистические методы. Наиболее типичный пример исследования такого рода — это изучение выживаемости, когда больных наблюдают от начала болезни до смерти. Обычно больных включают в исследование на всем его протяжении, поэтому оно всегда заканчивается до смерти последнего больного. Истинная продолжительность бо- лезни выживших к концу исследования остается неизвестной. Кроме того, исследователь может потерять больного из виду до завершения исследования, если тот, к примеру, переехал в дру- гой город. Наконец, больной может умереть по причине, не свя- занной с изучаемым заболеванием, например погибнуть вавто- катастрофе. Во всех этих случаях длительность заболевания остается неизвестной, мы знаем только, что она превышает не- который срок. Сейчас мы займемся именно изучением выживаемости, од- нако будем иметь в виду, что те методы, которые мы освоим, пригодны и для других исследований, в том числе для контроли- руемых испытаний. ПАССИВНОЕ КУРЕНИЕ НА ПЛУТОНЕ Табачные дельцы, теснимые все дальше от Земли борцами за здо- ровый образ жизни, окопались на Плутоне. Они решили превра- тить эту девственную планету в оплот табакокурения. Многое наивные плутониане поддались навязчивой рекламе и закурили. Но это еще полбеды. Как известно, на Плутоне очень холодно, * Здесь мы не говорим о пропусках в данных, причины которых — ошибка измерения, разбитая пробирка с пробой, потерянный анализ и т. п. К дан- ным, содержащим пропуски, применяются обычные статистические ме- тоды с внесением необходимых вычислительных поправок. Подробнее об анализе данных с пропусками можно прочесть в книге S. Glantz, В. Slinker. Primer of applied regression and analysis of variance. McGraw-Hill, N.Y., 1990. АНАЛИЗ ВЫЖИВАЕМОСТИ 374 поэтому его обитатели редко покидают свои домики. Чрезвы- чайно деликатные по природе, плутониане не могут выставить курильщика на улицу и вынуждены дышать табачным дымом, который производит их несознательный соотечественник. Плутониане вообще живут недолго, что же будет теперь, ко- гда Плутон охватила эпидемия пассивного курения! Первое, что мы должны сделать в этой ситуации, — это оценить продолжи- тельность жизни плутонианина после начала пассивного куре- ния. Вот как проводилось исследование. Мы попросили всех плу- тониан сообщать нам, как только в их домике появится актив- ный курильщик. Выявленных таким образом пассивных куриль- щиков включали в группу наблюдения и дожидались (увы!) их смерти. Исследование длилось 15 плутонианских часов; за это время пассивными курильщиками стали 10 плутониан. Первы- ми сообщили о начале пассивного курения А и Б. Остальные участники вошли в группу наблюдения уже после начала ис- следования (что типично для исследований выживаемости); их звали В, Г, Д, Е, Ж, 3, И и К. Периоды наблюдения за каждым из них показаны на рис 11.1А в виде горизонтальных отрезков. Из десяти участников к концу исследования умерли семь — А, Б, В, Е, Ж, 3 и К; в живых остались двое — Г и И. Еще одного участника, Д, местное начальство на 14-м часу исследования послало в командировку на Нептун; что с ним было дальше, нам неизвестно. Таким образом, продолжительность жизни после начала пас- сивного курения нам известна в 7 случаях. В 3 случаях нам из- вестно только, что наблюдаемые прожили не меньше такого-то срока*. Неважно, почему они не прослежены до конца жизни — * В исследованиях выживаемости неполные данные называют также цен- зурированными. Данные о трех выбывших плутонианах цензурированы справа — известен момент начала наблюдения, но неизвестно, когда на- блюдаемый умер. Если бы в исследовании участвовали плутониане, на- чавшие курить до его начала, то мы могли бы получить также данные, цензурированные слева, а также цензурированные с обеих сторон. Эта виды цензурирования и соответствующие методы анализа можно найти в D. Collett. Modelling survival in medical research. Chapman and Hall, London, 1994 и Е. Т. Lee. Statistical methods for survival data analysis. Wiley, 2nd ed.. New York, 1992. ГЛАВА 11 375 Рис. 11.1. Продолжительность жизни плутониан после начала пассивного ку- рения. А. Ход исследования показан в обычной шкале времени. Жизнь плуто- нианина после начала пассивного курения представлена горизонтальным от- резком. Левый конец отрезка—это начало наблюдения. На правом конце от- резка — черный или белый кружок. Черный кружок означает, что плутонианин умер и, таким образом, продолжительность его жизни нам известна. Белый кружок означает, что исследование закончилось до его смерти либо он куда-то уехал — словом, выбыл из-под наблюдения. Относительно выбывших нам из- вестно только, что они прожили не меньше определенного срока. Б. Ход ис- следования показан так, как будто все плутониане начали наблюдаться одно- временно. Теперь на шкале времени не астрономические часы, а часы наблю- дения. Такое представление данных облегчит нам дальнейшие расчеты. АНАЛИЗ ВЫЖИВАЕМОСТИ 376 прекратилось ли исследование, уехали они куда-то, — всех их мы будем называть выбывшими. На рис. 11.1 Б изображены те же данные, что и на рис. 11.1А. Теперь отрезки, соответствующие периоду наблюдения за каж- дым плутонианином, расположены так, как если бы все наблю- дения были начаты в один момент. Это представление данных более удобно. Теперь сразу видно, кто сколько прожил после начала пассивного курения. Кружок на правом конце каждого из отрезков показывает, умер плутонианин за время наблюде- ния (кружок закрашен) или выбыл (кружок не закрашен). Если бы продолжительность наблюдения была одинаковой, мы могли бы рассчитать долю выживших и применить методы, опи- санные в гл. 5. Однако поскольку участники входили в группу наблюдения на разных сроках исследования, это условие не вы- полняется. Если бы все наблюдаемые умерли, то можно было бы применить методы, изложенные в гл. 2 или 10. Однако и этого не произошло, как это обычно и бывает в исследованиях такого рода. Для анализа выживаемости нужны новые методы. Прежде чем с ними познакомиться, сформулируем требования, которым долж- ны удовлетворять все исследования выживаемости. • Для всех наблюдаемых известно время начала наблюдения. • Для всех наблюдаемых известно время окончания наблюде- ния, а также — умер он или выбыл. • Выбор наблюдаемых произведен случайно. Для начала мы научимся строить кривую выживаемости, а затем перейдем к оценке статистической значимости различий кривых выживаемости. КРИВАЯ ВЫЖИВАЕМОСТИ Кривая выживаемости задает вероятность пережить любой из моментов времени после некоторого начального события. Эту вероятность обычно называют просто выживаемостью. В при- мере, который мы сейчас разбираем, кривая выживаемости при- меняется для изучения продолжительности жизни. Однако кри- выми такого рода можно описать продолжительность самых раз- нообразных процессов. Тогда в качестве исхода будет выступать ГЛАВА 11 377 не смерть, а другое интересующее нас событие, не всегда неже- лательное. Например, можно изучать срок лечения какого-либо заболевания (исход — ремиссия), длительность лечения беспло- дия или эффективность контрацепции (исход в обоих случаях — наступление беременности), долговечность протеза (исход- поломка). Для начала, как всегда, рассмотрим кривую выживаемости для совокупности. Такая кривая получилась бы, если бы мы про- следили судьбу всех плутониан от рождения до смерти. Выжи- ваемость к моменту времени t обозначим S(t), Дадим определе- ние. Выживаемость S(t) — это вероятность прожить более t с момента начала наблюдения. Для совокупности эта вероятность выражается формулой: ( ) Число переживших момент Объем совокупности t S t = Типичная кривая выживаемости изображена на рис. 11.2. По- нятно, что в точке 0, соответствующей начальному моменту, на- пример моменту рождения, выживаемость равна 1. Затем кривая |