Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
Рис. 9.4. Разложение вариации и числа степеней свободы при дисперсионном анализе. Таблица 9.3. Таблица дисперсионного анализа для эксперимента с 4 диетами Число степеней Вариация свободы Дисперсия Межгрупповая 0,685 3 0,228 Внутригрупповая 3,825 24 0,159 Общая 4,51 27 АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ меж меж вну вну 0,228 1,4 0,159 S F S ν = = = ν 304 Рис. 9.5. Разложение вариации и числа степеней свободы при дисперсионном анализе повторных измерений. ГЛАВА 9 305 Оба разложения изображены на рис. 9.4. Перечисленные ве- личины обычно включают в таблицы дисперсионного анализа наподобие табл. 9.3. Теперь, наконец, мы располагаем средствами, необходимы- ми в дисперсионном анализе повторных измерений. ДИСПЕРСИОННЫЙ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ До сих пор мы имели дело с несколькими группами больных, которые подвергались различным методам лечения. В дисперсионном анализе повторных измерений ситуация иная: одни и те же больные последовательно подвергаются несколь- ким методам лечения или просто наблюдаются в несколько пос- ледовательных моментов времени. По-другому распределяется и общая вариация S общ (рис. 9.5). Прежде всего можно выделить- межиндивидуальную (S МИ ) и внутрииндивидуальную (S ВИ ) ва- риацию, последняя, в свою очередь, распадается на обусловлен- ную методом лечения (S ле ) и остаточную (S ост ), обусловленную случайными колебаниями, ошибкой измерения и т. п. Обозначения, которые мы будем использовать в дисперсион- ном анализе повторных измерений, приведены в табл. 9.4. Пред- ставлены 4 больных, каждого из которых последовательно ле- чили 3 методами. Значения интересующего нас признака обо- АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ Таблица 9.4. Обозначения, используемые в дисперсионном ана- лизе повторных измерений Метод лечения Среднее Вариация Больной 1 2 3 б X S ВИб 1 X 11 Х 21 Х 31 1 X ( ) 2 м1 1 м X X − ∑ 2 Х 12 Х 22 Х 32 2 X ( ) 2 м2 2 м X X − ∑ 3 Х 13 Х 23 X 33 3 X ( ) 2 м3 3 м X X − ∑ 4 Х 14 Х 24 Х 34 4 X ( ) 2 м4 4 м X X − ∑ Среднее 1 T 2 T 3 T 306 значены Х мб , например, Х 12 — значение у 2-го больного при 1-м методе лечения, Х 31 — значение у 1-го больного при 3-м методе лечения и так далее. Величины б X ( 1 X , 2 X , 3 X и 4 X ) — это «индивидуальные» средние (средние значения признака при всех методах лечения у 1-го, 2-го и т. д. больного): мб м б , X X m = ∑ где т — число методов лечения. м T ( 1 T , 2 T , 3 T и 4 T ) — средние значения признака у всех больных при 1-м, 2-м и т. д. методе лечения: мб б м , X T n = ∑ где п — число больных. Общая вариация — это сумма квадратов отклонений всех зна- чений (у всех больных при всех методах лечения) от общего среднего, которое составляет мб м б ; X X mn = ∑∑ таким образом, ( ) 2 общ мб м б S X X = − ∑∑ Соответствующее число степеней свободы ν общ = тп – 1. Общая вариация складывается из межиндивидуальной и внутрииндивидуальной вариации. Рассчитаем внутрииндивиду- альную вариацию S ВИ . У первого больного сумма квадратов от- клонений от индивидуального среднего 1 X равна ( ) 1 2 ВИ м1 1 м S X X = − ∑ У второго больного ( ) 2 2 ВИ м2 2 м S X X = − ∑ ГЛАВА 9 307 и так далее. Чтобы рассчитать внутрииндивидуальную вариа- цию, просуммируем б ВИ S по всем больным: ( ) 1 2 3 4 2 ВИ ВИ ВИ ВИ ВИ мб б б м S S S S S X X = + + + = − ∑∑ Соответствующее число степеней свободы составляет ν ВИ = = n(m – 1). Перейдем к межиндивидуальной вариации. Она складывается из квадратов отклонений индивидуальных средних б X от об- щего среднего X : ( ) 2 МИ б S m X X = − ∑ Множитель т появляется из-за того, что каждое б X — это среднее по т методам лечения. Число степеней свободы ν МИ = = n – 1. Можно показать*, что общая вариация равна сумме внутри- и межиндивидуальной вариаций: общ ВИ МИ S S S = + Теперь из внутрииндивидуальной вариации нам предстоит выделить вариацию, связанную с лечением S ле , и остаточную вариацию S ост , связанную со случайными отклонениями и ошиб- ками измерения. Вариация, связанная с лечением, складывает- ся из квадратов отклонений средних по методам лечения м T от общего среднего X : ( ) 2 ле м S n T X = − ∑ Наличие коэффициента п связано с тем, что каждое Т м — это среднее по п больным. Соответствующее число степеней свободы ν ле = m – 1. Остаточная вариация — вторая составляющая внутриинди- видуальной вариации — получается вычитанием: ост ВИ ле S S S = − * Вывод этого равенства см. в: В. J. Winer, D. R. Brown, К. М. Michels. Statistical principles in experimental design, 3d ed. McGraw-Hill, New York, 1991. АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 308 Аналогично вычисляется и остаточное число степеней свобо- ды ν ост : ν ост = ν ВИ – ν ле = n(m –1) – (m – 1) = (n – 1)(m – 1). Теперь мы можем получить две независимые оценки диспер- сии: на основании вариации, связанной с лечением 2 ле ле ле , S s = ν и на основании остаточной вариации: 2 ост ост ост , S s = ν после чего можно применить знакомый нам критерий F: 2 ле 2 ост s F s = Далее следует поступить как при обычном дисперсионном анализе. Вычисленное значение F сравнивают с критическим для выбранного уровня значимости и числа степеней свободы. Чтобы воспользоваться табл. 3.1, нужно в качестве ν меж взять ν ле , а в качестве ν вну — соответственно ν ост Боюсь, читателя утомили сложные выкладки и громоздкие термины, которыми несколько перегружен этот раздел. Пора пе- рейти к практическим применениям. Как мы уже говорили, дис- персионный анализ повторных наблюдений можно использо- вать не только когда к одним и тем же больным применяется несколько методов лечения, но и когда больные просто наблюда- ются в несколько разных моментов времени. Именно на таком, очень простом примере мы и рассмотрим применение дисперси- онного анализа повторных измерений. Гидралазин при первичной легочной гипертензии Первичная легочная гипертезия — редкое и чрезвычайно тяже- лое заболевание, при котором вследствие неизвестных причин повышается давление в артериях легких. Стенки артерий утол- ГЛАВА 9 309 щаются, что затрудняет газообмен в легких. Из-за повышенной нагрузки на правый желудочек страдает сердце. Без лечения больные живут не более нескольких лет. Гидралазин — препа- рат, расширяющий сосуды, — успешно используется при гипертонической болезни. Л. Рубин и Р. Питер* предположили, что его можно использовать и при первичной легочной гипер- тензии. В исследование вошли 4 больных. Измерения произво- дили трижды: перед началом лечения, спустя 48 ч и 3—6 мес лечения. (В дальнейшем мы будем говорить просто о 1,2 и 3-м измерениях.) Измеряли, в частности, легочное сосудистое со- противление. Этот показатель отражает тяжесть легочной ги- пертензии: чем выше сопротивление, тем тяжелее гипертензия. Результаты представлены на рис. 9.6. Похоже, данные говорят в пользу препарата. С другой стороны, они получены на мало- численной выборке. Поэтому не будем доверяться впечатлени- ям, а воспользуемся дисперсионным анализом повторных из- мерений. Обратимся к табл. 9.5. Здесь помимо первичных данных при- ведены средние значения легочного сосудистого сопротивления для каждого из 4 больных и для каждого из трех моментов изме- рения. Например, у второго больного среднее легочное сосуди- стое сопротивление составило 2 17,0 6,3 6,2 9,83, 3 X + + = = а среднее легочное сосудистое сопротивление при 1-м измере- нии: 1 22,2 17,0 14,1 17,0 17,58. 3 T + + + = = Среднее сопротивление по всем измерениям X = 11,63, а об- щая вариация S общ = 289,82. В табл. 9.5 приведены также суммы квадратов отклонений от индивидуального среднего. Например, для второго больного 2 ВИ S = (17,0 – 9,83) 2 + (6,3 – 9,83) 2 + (6,2 – 9,83) 2 = 77,05. * L. J. Rubin and R. H. Peter. Oral hydralazine therapy for primary pulmonary hypertension. N. Engl. J. Med., 302:69—73, 1980. АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 310 Внутрииндивидуальная вариация составляет S ВИ = 147,95 + 77,05 + 18,35 + 21,45 = 264,80. Можно найти межиндивидуальную вариацию S МИ = 3[(12,73 – 11,63) 2 + (9,83 – 11,63) 2 + + (10,63 – 11,63) 2 + (13,33 – 11,63) 2 ] = 25,02. Заметьте, что, как это и должно быть, выполняется равенство S общ = S ВИ + S МИ Рассчитаем S ле (теперь эта вариация связана со временем, но мы оставим прежнее обозначение): S ле = 4[(17,58 – 11,63) 2 + (7,73 – 11,63) 2 + (9,60 – 11,63) 2 ] = 218,93. Соответствующее число степеней свободы: Рис. 9.6. Изменение легочного сосудистого сопротивления у 4 больных с легочной ги- пертензией при лечении гидралазином. ГЛАВА 9 311 ν ле = m – 1 = 3 – 1 = 2. Наконец, остаточная вариация определяется равенством S ост = S ВИ – S ле = 264,80 – 218,93 = 45,87 и имеет ν ост = (n – 1)(m – 1) = (4 – 1)(3 – 1) = 6 степеней свободы. Все найденные величины сведены в табл. 9.6. Обратите вни- мание, что здесь общая вариация разложена на большее число составляющих, чем в табл. 9.3. Причина в том, что теперь рас- сматриваются результаты повторных измерений одной группы, а не однократных измерений нескольких групп. Вычисляем оценку дисперсии на основании вариации, обу- словленной лечением: 2 ле ле ле 218,93 109,47 2 S s = = = ν и на основании остаточной вариации: 2 ост ост ост 45,87 7,65. 6 S s = = = ν Теперь, наконец, можно вычислить F: 2 ле 2 ост 14,31. s F s = = Критическое значение для числа степеней свободы ν меж = 2 и Таблица 9.5. Легочное сосудистое сопротивление у больных пер- вичной легочной гипертензией на фоне лечения гидралазином Измерение Больной 1 2 3 Среднее Вариация 1 22,2 5,4 10,6 12,73 147,95 2 17,0 6,3 6,2 9,83 77,05 3 14,1 8,5 9,3 10,63 18,35 4 17,0 10,7 12,3 13,33 21,45 Среднее 17,58 7,73 9,60 Общее среднее X = 11,63. Общая вариация S общ = 289,82. АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 312 ν вну = 6 составляет 10,92, то есть меньше полученного нами. Та- ким образом, легочное сосудистое сопротивление нельзя счи- тать постоянным. По крайней мере в один из моментов легоч- ное сосудистое сопротивление значимо отличается от наблюда- емого в остальные моменты. Ответить на вопрос, что это за момент и что это за отличия, дисперсионный анализ не может. Для этого следует воспользоваться методами множественных сравнений (гл.4). Как выявить различия в повторных измерениях В гл. 4 мы познакомились с критерием Стьюдента с поправкой Бонферрони. Он вычисляется как обычный критерий Стьюдента: 2 2 i j X X t s n − = Однако уровень значимости в каждом из сравнений, соглас- но поправке Бонферрони, принимается равным α = α′/k, где α′ — истинный уровень значимости (по всем сравнениям в целом), а k — число сравнений. Критерий Стьюдента с поправкой Бон- феррони, как и другие методы множественного сравнения, при- меняется лишь после того, как дисперсионный анализ обнару- жит сам факт существования различий. Таблица 9.6. Таблица дисперсионного анализа (исследование гидралазина при первичной легочной гипертензии) Число степеней Оценка Вариация свободы дисперсии Межиндивидуальная S МИ = 25,02 3 Внутрииндивидуальная S ВИ = 264,80 8 обусловленная лечением S ле = 218,93 2 109,47 остаточная S ост = 45,87 6 7,65 Общая S общ = 289,82 11 2 ле 2 ост 14,31 s F s = = ГЛАВА 9 313 При дисперсионном анализе повторных измерений схема ис- пользования критерия остается прежней. Отличие в том, что в формуле для t вместо s 2 следует взять остаточную дисперсию 2 ост s , а средние по группам заменить на средние по методам ле- чения (моментам наблюдения) м T . Тогда формула для t примет вид: 2 ост 2 i j T T t s n − = Полученное значение нужно сравнить с критическим зна- чением для распределения Стьюдента при ν ост степенях свобо- ды. Вернемся к эксперименту с гидралазином. Остаточная оцен- ка дисперсии 2 ост s = 7,65. Число больных при каждом измерении n = 4. Сравним 1-е и 2-е измерения: 17,58 7,73 5,036. 2 7,65 4 t − = = × Сравним 1-е и 3-е измерения: 17,58 9,60 4,080. 2 7,65 4 t − = = × И наконец, 2-е и 3-е измерения: 7,73 9,60 0,9561. 2 7,65 4 t − = = − × Чтобы вероятность ошибочно обнаружить различие была в совокупности по всем трем сравнениям меньше 0,05, нужно в каждом отдельном сравнении использовать в три раза меньший уровень значимости 0,05/3 = 0,016. Для этого уровня значимости АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 314 и при числе степеней свободы ν = 6 находим по табл. 4.1 кри- тическое значение, приближенно равное 3,37 (поскольку табли- ца не содержит значений для α = 0,016, оно расчитывается приблизительно по соседним значениям α = 0,01 и α = 0,02). Значения t для первых двух сравнений больше критического, а для третьего — меньше. Поэтому при уровне значимости 0,05 (но ни в коем случае не 0,016, используемом в каждом сравне- нии) различие в величине общего легочного сопротивления до и после приема гидралазина статистически значимо, а между из- мерениями на фоне приема гидралазина статистически незначимо. Заканчивая обсуждение парных сравнений, скажем, что вме- сто поправки Бонферрони можно воспользоваться более точным критерием Ньюмена—Кейлса или критерием Тыоки. Кроме того, в рассматриваемом примере, где измерения, выполненные до начала лечения, играют роль «контрольной группы», пригоден и критерий Даннета для множественного сравнения с контро- льной группой. Все эти критерии описаны в гл. 4. При их при- менении нужно, как и в случае критерия Стьюдента с поправкой Бонферрони, в качестве оценки дисперсии брать 2 ост s , а при на- хождении критического значения использовать число степеней свободы остаточной вариации. Чувствительность дисперсионного анализа повторных измерений Чувствительность вычисляется так же, как в обычном дисперси- онном анализе, с той разницей, что в качестве оценки для s ис- пользуется s ост , а вместо численности отдельных групп — чис- ленность единственной рассматриваемой группы. КАЧЕСТВЕННЫЕ ПРИЗНАКИ: КРИТЕРИЙ МАК-НИМАРА Парный критерий Стьюдента и дисперсионный анализ повтор- ных измерений применимы, только если зависимый признак яв- ляется числовым и, сверх того, подчиняется нормальному зако- ну распределения. Как быть, если признак качественный, то есть имеет своими значениями не числа, а «названия» (с такими при- ГЛАВА 9 315 знаками мы познакомились в гл. 5). Они часто встречаются в медицине. Например, диагноз — типичный качественный при- знак. Сейчас мы познакомимся с критерием Мак-Нимара. Он предназначен для анализа повторных измерений качественных признаков и в некотором смысле является аналогом парного критерия Стьюдента. Знакомство с новым критерием мы нач- нем с примера. Проба с динитрохлорбензолом при онкологических заболеваниях Ослабление иммунитета повышает риск онкологических забо- леваний. Считается также, что при уже развившемся злокачест- венном новообразовании ослабление иммунитета — плохой прогностический признак и наоборот — сохранность иммуни- тета говорит о высокой вероятности успеха лечения. Для оцен- ки состояния иммунитета применяется кожная проба с динитро- хлорбензолом. Проба считается положительной, если через 48 часов после нанесения динитрохлорбензола на кожу развивает- ся выраженная воспалительная реакция. Положительная проба говорит о сохранности иммунитета. Ряд авторов оспаривают значение пробы, указывая, в част- ности, на то, что воспалительная реакции может быть вызвана местнораздражающим действием динитрохлорбензола и не от- ражает состояния иммунитета. Чтобы выяснить этот вопрос, Рот и соавт.* проделали сле- дующий опыт. На кожу больных наносили динитрохлорбензол и одновременно — на соседний участок кожи — кротоновое масло. Кротоновое масло оказывает местнораздражающее дей- ствие, которое не зависит от состояния иммунитета. Если оба раздражителя вызовут сходную реакцию, рассуждал автор, то в обоих случаях она не отражает состояния иммунитета. В табл. 9.7 приведены результаты опыта. Знак «плюс» соот- ветствует наличию реакции, знак «минус» — отсутствию. При виде такой таблицы хочется немедленно рассчитать χ 2 . Посмот- * J. A. Roth, F. R. Eilber, J. A. Nizle, D. L. Morton. Lack of correlation between skin reactivity to dinitrochlorobenzene and croton oil in patients with cancer. N. Engl. J. Med., 293:388–389, 1975. АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 316 рим, что из этого получится. Вычисленное с поправкой Йейтса значение χ 2 = 1,107. Это заметно меньше критического значе- ния 3,841, соответствующего уровню значимости 0,05 при од- ной степени свободы. Напрашивается вывод вроде: «Статисти- чески значимых различий между реакцией на динитрохлорбен- зол и кротоновое масло не выявлено». В этой формулировке есть неточность, на первый взгляд не- значительная. При построении критерия χ 2 в гл. 5 мы проверя- ли нулевую гипотезу об отсутствии связи между признаками. Например, мы предполагали, что аспирин не влияет на частоту тромбоза. Если нулевая гипотеза отвергалась, мы признавали существование связи между признаками. Если строки таблицы представлены двумя методами лечения, это равнозначно приз- нанию различий эффективности этих методов. В данном слу- чае это не так, поэтому мы должны ограничиться констатацией отсутствия связи между реакцией на динитрохлорбензол и кро- тоновое масло. В отличие от поспешного вывода, который мы привели выше, это утверждение говорит в пользу самостоятель- ного значения пробы с динитрохлорбензолом: если бы она да- вала те же резулътатьт, что и проба с кротоновым маслом, это как раз и говорило бы о том, что ее результат, скорее всего, обус- ловлен местнораздражающим действием. Этого мало. С помощью критерия Мак-Нимара мы покажем, что динитрохлорбензол дает меньше положительных результа- тов пробы, чем кротоновое масло. Реакция только на динитрохлорбензол наблюдалась у 23 боль- ных, а только на кротоновое масло — у 48. Если действие ди- нитрохлорбензола и кротонового масла примерно одинаково, то больные, у которых наблюдалась реакция только на один раз- дражитель, разделились бы примерно поровну — у одной поло- вины реакцию вызвал бы динитрохлорбензол, у другой — крото- новое масло. Следовательно, ожидаемое число в обоих случаях (23 + 48)/2 = 35,5. Для сравнения наблюдаемых чисел с ожидае- мыми воспользуемся критерием χ 2 . (Поскольку число степеней свободы равно 1, применим также поправку Йейтса.) Имеем: ГЛАВА 9 317 2 2 2 2 1 2 1 1 23 35,5 48 35,5 2 2 8,817. 35,5 35,5 O E E − − χ = = − − − − = + = ∑ Для уровня значимости 0,01 табличное значение χ 2 с одной степенью свободы равно 6,635 (см. табл. 5.7), то есть меньше вычисленного. Таким образом, оказывается, что действие дини- трохлорбензола отличается от действия кротонового масла. Рассмотренный пример показывает, сколь далекими от исти- ны могут оказаться выводы при необоснованном применении статистических методов. Критерий Мак-Нимара, подобно парному критерию Стью- дента, часто используется для выявления изменений в наблюде- ниях типа «до—после», когда интересующий нас признак при- нимает одно из двух значений («есть—нет»). Другое, очень важ- ное, применение критерия связано с анализом парных наблю- дений. Что это такое, вы узнаете, решив задачи 9.9 и 9.10. А теперь перечислим шаги критерия Мак-Нимара. • Исключите из рассмотрения больных, реакция которых была неизменной, и подсчитайте число тех, чья реакция изменилась. • Поделите это число пополам. • Вычислите меру отклонения наблюдаемого числа меняющих реакцию больных от ожидаемого. Для этого воспользуйтесь критерием χ 2 с поправкой Йейтса. • Сравните полученное значение χ 2 с критическим, имеющим одну степень свободы. |