Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
Рис. 9.2. Агрегация тромбоцитов до и после выкуривания сигареты. Агрегация тромбо- цитов повысилась, но значит ли это, что она повысилась от табака? ГЛАВА 9 291 ключением одного, агрегация тромбоцитов после курения по- высилась. Выпишем изменения у каждого из обследованных. Получим 2, 4, 10, 12, 16, 15, 4, 27, 9, –1 и 15%. Средняя величи- на изменения d = 10,3%. Стандартное отклонение величины изме- нения s d = 8% и стандартная ошибка 8,0 11 2, 41%. d s = = = Тог- да: 10,3 4, 27. 2, 41 d d t s = = = В табл. 4.1 находим критическое значение t 0,01 для уровня зна- чимости 0,01 и ν = п – 1 степеней свободы. Оно равно 3,169, то есть меньше полученного нами. Таким образом, повышение аг- регации тромбоцитов после курения статистически значимо. На этом выводе Левин не остановился. Если курение повы- шает агрегацию тромбоцитов, то значит ли это, что повышение вызвано курением табака! Нет, не значит. С тем же успехом можно признать причиной вдыхание окиси углерода, выделяю- щейся при горении сигареты. Не менее веской причиной будет и волнение, испытываемое участниками эксперимента. Имеющиеся данные не позволяют отвергнуть такие объяснения. Значит, нуж- но провести эксперименты, совпадающие с исходным во всем, кроме интересующего нас фактора — в данном случае курения сигарет с табаком. Именно это и сделал Левин. Добровольцам пришлось выкуривать не только обычные, но и безникотиновые сигареты из салатных листьев. Кроме того, им предлагали по- держать в зубах незажженную сигарету, изображая курение. Результаты приведены на рис. 9.3 вместе с данными с рис. 9.2. Оказалось, что в отличие от обычной сигареты незажженная или безникотиновая сигарета не вызывает повышения агрегации тромбоцитов. Разобранное исследование служит иллюстрацией следующе- го правила. Единственным различием между контрольной и экспериментальной группой должно быть воздействие иссле- дуемого, и никакого другого, фактора. Чем лучше удается вычленить действие изучаемого фактора, тем достовернее выводы эксперимента. Так, рассмотренный экс- АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 292 перимент доказал, что повышение агрегации тромбоцитов вы- звано не просто курением, а именно курением табака. Затронув вопрос о планировании эксперимента, стоит упо- мянуть еще об одной важной проблеме. Кроме необходимости выделить исследуемый фактор и тем самым исключить неодно- значное толкование результатов эксперимента, нужно избежать искажений, привносимых участниками эксперимента. В меди- Рис. 9.3. Агрегация тромбоцитов до и после изображения курения с незажженной сига- ретой, выкуривания сигареты с салатными листьями, выкуривания сигареты с табаком. Похоже, что именно табак, а не сам факт курения и не дым вызывает повышение агре- гации тромбоцитов. ГЛАВА 9 293 цинских экспериментах человек не только оказывает воздействие и наблюдает его результат — он присутствует и как объект на- блюдений. Но люди пристрастны и внушаемы. Пристрастность экспериментатора может повлечь неосознанную подтасовку. А лаборантке, поборнице некурения, не составит труда чуть-чуть завысить долю склеившихся тромбоцитов в крови курилыцика и чуть-чуть занизить ее для некурящего. При проведении клинических испытаний на первый план выходит роль больного. Особенно велика она, если критерием эффективности служат его собственные оценки (боль умень- шилась — усилилась, стал спать лучше — хуже). Вера больно- го в новый метод лечения — могучий (и благотворный) фактор, однако объективной оценке он мешает. Вернемся к исследова- ниям агрегации тромбоцитов. Как в данном случае на результат эксперимента может повлиять испытуемый? Человек не может усилием воли изменять состояние своих тромбоцитов, однако, обратившись еще раз к рис. 9.3, можно заметить, что у добровольцев, которым только еще предстояло выкурить (воз- можно, безвредную салатную) сигарету, агрегация тромбоци- тов была заметно выше, чем у тех, которым было известно, что им придется лишь подержать сигарету в зубах. Следовательно, не только субъективные оценки, но и объективные показатели могут изменяться под влиянием отношения испытуемого к экспериментальному воздействию. Чтобы исключить влияние субъективного фактора, Левин применил двойной слепой метод. Суть метода в том, что экс- периментальное воздействие не известно ни испытуемым, ни наблюдателям, оценивающим его результаты. В эксперименте Левина ни исследователям, ни добровольцам не было известно содержимое сигарет, а производившим анализ крови лаборан- там — курил ли доброволец, и если да, то что именно. В действительности исследование Левина не было полнос- тью двойным слепым (о чем свидетельствуют различия исход- ной агрегации тромбоцитов). Действительно, даже если о со- держимом сигареты добровольцам не сообщали, они могли легко определить его на вкус. Предвидя подобные трудности, исследование часто заранее планируют как простое слепое. В этом случае одна из сторон АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 294 (обычно наблюдатель) осведомлена о характере эксперимен- тального воздействия, а другая (обычно испытуемый) — нет. Наконец, характер исследования может быть таков, что ни одну из сторон нельзя держать в полном неведении и обе располага- ют частью информации — в таких случаях говорят о частично слепом исследовании. Завершая обсуждение парного критерия Стьюдента, повто- рим, что он используется для проверки эффективности одного метода лечения в случае, когда имеются данные о состоянии каждого участника до и после лечения. Когда же требуется срав- нить эффективность нескольких методов лечения, испытанных на одних и тех же больных, применяют дисперсионный анализ повторных наблюдений. Для его изложения нам потребуется пересмотреть тот вариант дисперсионного анализа, который был изложен в гл. 3, то есть вариант на случай использования раз- ных методов для лечения разных больных. Затем перейдем к варианту дисперсионного анализа на случай повторных наблю- дений за одними и теми же больными, подвергаемыми разным методам лечения. НОВЫЙ ПОДХОД К ДИСПЕРСИОННОМУ АНАЛИЗУ* Напомним вкратце схему дисперсионного анализа, изложенную в гл. 3. В качестве нулевой гипотезы мы брали предположение о том, что несколько (обычно более двух) методов лечения облада- ют равной эффективностью, то есть экспериментальные груп- пы — это просто выборки из одной нормально распределенной совокупности и различия между ними обусловлены случайно- стью. Для проверки нулевой гипотезы мы сравнивали разброс * Если этот раздел, посвященный дисперсионному анализу повтор- ных измерений, покажется вам слишком утомительным из-за оби- лия выкладок, пропустите его при первом чтении. Только не забудь- те вернуться, когда возникнет необходимость. А она обязательно воз- никнет. Эксперименты, для обработки которых предназначен этот вариант дисперсионного анализа, типичны для медицины. Сам же анализ, увы, не очень. Чаще приходится сталкиваться с многократ- ным использованием критерия Стьюдента, совершенно ошибочным (см. гл. 4). ГЛАВА 9 295 значений относительно групповых средних с разбросом самих групповых средних. Если разброс средних значительно превы- шал разброс значений, мы отвергали нулевую гипотезу. В качес- тве показателя разброса мы использовали дисперсию. Диспер- сию можно определить как сумма квадратов отклонений, делен- ную на число степеней свободы. Теперь показателем разброса будет служить сама сумма квадратов отклонений*, которую мы будем называть вариацией. Основываясь на вариации, мы повто- рим построение дисперсионного анализа. Перспектива второй раз разбирать уже знакомый метод не слишком вдохновляет, од- нако мы будем вознаграждены: новый взгляд позволит нам пе- рейти к дисперсионному анализу повторных измерений. В гл. 3 мы рассмотрели такой пример. Чтобы выяснить, влия- ет ли питание на сердечный выброс, из 200 обитателей городка были случайным образом выбраны четыре группы по семь чело- век в каждой. Члены первой (контрольной) группы продолжали питаться как обычно, членам второй группы пришлось есть одни макароны, третьей — мясо, а четвертой — фрукты. Эксперимент длился ровно месяц, после чего у каждого участника был изме- * Такой подход мы уже использовали в гл. 8 при рассмотрении регрес- сионного анализа. Таблица 9.1. Сердечный выброс, л/мин Группа Контрольная Макароны Мясо Фрукты 4,6 4,6 4,3 4,3 4,7 5,0 4,4 4,4 4,7 5,2 4,9 4,5 4,9 5,2 4,9 4,9 5,1 5,5 5,1 4,9 5,3 5,5 5,3 5,0 5,4 5,6 5,6 5,6 Среднее 4,96 5,23 4,93 4,80 Вариация 0,597 0,734 1,294 1,200 Среднее по всем группам = 4,98 Общая вариация = 4,51 АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 296 рен сердечный выброс. Как видно из рис. 3.1, диета не влияет на величину сердечного выброса. Экспериментальные группы — это просто четыре случайные выборки из нормально распреде- ленной совокупности. Однако рис. 3.1 недоступен исследовате- лю, в распоряжении которого есть только данные об участни- ках эксперимента. Эти данные представлены на рис. 3.2 и в табл. 9.1. Как видим, группы все же различаются по средней величи- не сердечного выброса. Можно ли объяснить эти различия случайностью? Новые обозначения Прежде чем двигаться дальше, введем новые обозначения (табл. 9.2). Отвлечемся от фруктов и макарон и вообще специфики рассматриваемого эксперимента. Перенумеруем группы от 1 до 4. Участников исследования также перенумеруем и впредь бу- дем называть больными (хотя применительно к данному слу- чаю это не совсем удачно). Значения признака (в данном случае это сердечный выброс) обозначим Х гб , например Х 25 — значение у 5-го больного 2-й группы. Средние по группам обозначим г X , например 3 X — среднее по 3-й группе. Под средними в таблице мы видим групповые вариации S г — суммы квадратов отклоне- ний от среднего по группе: ( ) 2 г гб г б S X X = − ∑ Значок «б» под символом суммы означает, что мы суммиру- ем значения для всех больных данной группы. Для примера рас- считаем вариацию для 1-й группы: ( ) 2 1 1б 1 б S X X = − = ∑ =(4,6 – 4,96) 2 + (4,7 – 4,96) 2 + (4,7 – 4,96) 2 + (4,9 – 4,96) 2 + +(5,1 – 4,96) 2 + (5,3 – 4,96) 2 + (5,4 – 4,96) 2 = 0,597. Вспомним определение выборочной дисперсии: ( ) 2 2 , 1 X X s n − = − ∑ ГЛАВА 9 297 где п — объем выборки. В числителе стоит сумма квадратов от- клонений от выборочного среднего, то есть вариация. Тем са- мым 2 1 S s n = − Следовательно, выборочную дисперсию для группы можно записать как 2 г г , 1 S s n = − где п — численность группы. Если все выборки извлечены из одной совокупности, оценкой ее дисперсии можно взять сред- нее выборочных дисперсий. Такая оценка называется внутприг- рупповой дисперсией: ( ) 2 2 2 2 2 вну 1 2 3 4 1 , s s s s s m = + + + где m — число групп, в данном случае равное 4. Заменим теперь Таблица 9.2. Обозначения однофакторного дисперсионного ана- лиза Группа 1 2 3 4 Х 11 Х 21 Х 31 Х 41 Х 12 Х 22 Х 32 Х 42 Х 13 Х 23 Х 33 Х 43 Х 14 Х 24 Х 34 Х 44 Х 15 Х 25 Х 35 Х 45 Х 16 Х 26 Х 36 Х 46 Х 17 Х 27 Х 37 Х 47 Среднее г X 1 X 2 X 3 X 4 X Вариация S г ( ) 2 1б 1 б X X − ∑ ( ) 2 2б 2 б X X − ∑ ( ) 2 3б 3 б X X − ∑ ( ) 2 4б 4 б X X − ∑ Среднее по всем группам X Общая вариация ( ) 2 гб г б X X − ∑∑ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 298 каждую выборочную дисперсию ее выражением через вариа- цию: 2 3 1 2 4 вну 1 , 1 1 1 1 S S S S s m n n n n = + + + − − − − где n — численность каждой из групп. Перенесем n – 1 под дроб- ную черту: 2 1 2 3 4 вну 1 1 S S S S s m n + + + = − В числителе — сумма вариаций по всем группам. Назовем ее внутригрупповой вариацией и обозначим S вну . Обратите внима- ние, что внутригрупповая вариация — это сумма квадратов от- клонений от групповых средних, поэтому она не зависит от того, различаются эти средние или нет. В примере с диетой и сердечным выбросом S вну = 0,597 + 0,734 + 1,294 + 1,200 = 3,825. Перепишем еще раз формулу для внутригрупповой диспер- сии: ( ) вну 2 вну 1 S s m n = − В знаменателе теперь стоит выражение, знакомое нам по гл. 3. Это внутригрупповое число степеней свободы: ν вну = m(n – 1). В рассматриваемом примере ν вну = 4(7 – 1) = 24. Таким образом, внутригрупповую дисперсию можно выразить через внугригруп- повую вариацию и внутригрупповое число степеней свободы: вну 2 вну вну S s = ν По данным из табл. 9.1 находим 2 вну 3,825 0,159. 24 s = = Как нам известно из гл. 3, чтобы вычислить F, помимо внут- ГЛАВА 9 299 ригрупповой нужна межгрупповая дисперсия. Внутригруппо- вую дисперсию нам удалось выразить через вариацию и число степеней свободы. Проделаем те же действия с межгрупповой дисперсией. Межгрупповая дисперсия 2 меж s отражает разброс групповых средних. Мы вычисляли ее по формуле 2 2 меж X s ns = Здесь 2 X s равно ( ) ( ) ( ) ( ) 2 2 2 2 1 2 3 2 1 m X X X X X X X X X s m − + − + − + + − = − … В более общем виде: ( ) 2 г 2 г , 1 X X X s m − = − ∑ где т — число групп. Под символом суммы стоит значок «г», это означает, что теперь мы суммируем по группам, а не по боль- ным. Подставив это выражение в формулу межгрупповой дисперсии, получим: ( ) 2 г 2 г меж , 1 n X X s m − = − ∑ Величину в числителе назовем межгрупповой вариацией и обозначим S меж : ( ) 2 меж г г S n X X = − ∑ Тогда 2 меж меж 1 S s m = − В этой формуле мы снова обнаруживаем число степеней сво- боды из гл. 3, на этот раз это межгрупповое число степеней сво- боды: ν меж = т – 1. Тем самым АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 300 2 меж меж меж S s = ν В нашем примере (табл. 9.1) ν меж = m – 1 = 4 – 1 = 3. Тогда 2 меж 0,685 3 0, 228. s = = Формула для критерия F в новых обозначениях принимает вид: меж меж вну вну S F S ν = ν Соответственно, в рассматриваемом примере 0,228 1,4. 0,159 F = = Новая формула для F получена непосредственно из приве- денной в гл. 3 и отличается от нее только обозначениями. Поэто- му, конечно, значение F = 1,4 совпадает с найденным в гл. 3. Естественно спросить, зачем же потребовались столь про- странные рассуждения и многочисленные тождественные заме- ны? Неужели для одного только повторения ранее полученных результатов? Ответ состоит в том, что переход к использованию вариации дает возможность понять, из каких компонентов она складывается, и в дальнейшем перейти к дисперсионному ана- лизу повторных измерений. Разложение общей вариации Внутригрупповая вариация S вну служит мерой разброса значе- ний внутри трупп. В свою очередь, межгрупповая вариация S меж — это мера разброса групповых средних, то есть различий между группами. Но существует и мера общего разброса зна- чений. Это общая сумма квадратов отклонений всех наблюдае- мых значений от их общего среднего. Она называется общей вариацией и обозначается S общ : ( ) 2 общ гб г б S X X = − ∑∑ ГЛАВА 9 301 Два символа суммы означают, что суммирование произво- дится по всем группам и всем больным внутри каждой группы. Число степеней свободы общей вариации обозначается ν общ и равно тп – 1, то есть оно на единицу меньше общего числа больных (т — число групп, п — число больных в каждой груп- пе). В рассматриваемом примере S общ = 4,51 и ν общ = 4 × 7 – 1 = 27 Обратите внимание, что общая дисперсия, вычисленная по всем наблюдениям, равна ( ) 2 гб общ общ 2 г б общ общ 1 1 X X S S s mn mn − = = = − − ν ∑∑ Существует ли связь между рассмотренными видами вариа- ции: общей, внугригрупповой и межгрупповой? Оказывается, существует, и очень простая. Общая вариация равна сумме внут- ригрупповой и межгрупповой вариаций: общ вну меж S S S = + Докажем справедливость этого разложения (это доказатель- ство можно пропустить). Тождественно верно ( ) ( ) ( ) гб гб г г X X X X X X − = − + − Возведем левую и правую части тождества в квадрат: ( ) ( ) ( ) 2 2 гб гб г г X X X X X X − = − + − Просуммируем левую часть по всем наблюдениям: ( ) 2 гб г б X X − ∑∑ Это не что иное, как общая вариация S общ Правая часть преобразуется в ( ) ( )( ) ( ) 2 2 гб г гб г г г 2 X X X X X X X X − + − − + − Суммируя по всем наблюдениям, получим ( ) ( )( ) ( ) 2 2 гб г гб г г г г б г б г б 2 X X X X X X X X − + − − + − ∑∑ ∑∑ ∑∑ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ 302 Первый член этого выражения, ( ) 2 гб г г б X X − ∑∑ , представ- ляет собой значение S вну Покажем, что второй член, ( )( ) гб г г г б 2 X X X X − − ∑∑ ,тожде- ственно равен нулю. В самом деле, разность ( ) г X X − в каждой из групп посто- янна, и поэтому ее можно вынести за знак суммирования по больным: ( )( ) ( ) ( ) гб г г г гб г г б г б 2 2 X X X X X X X X − − = − − ∑∑ ∑ ∑ Но— это среднее по группе, то есть гб б г X X n = ∑ В таком случае ( ) ( ) гб г гб г гб г б б б б гб б г г г 0. X X X X X nX X n X n X X n − = − = − = = − = − = ∑ ∑ ∑ ∑ ∑ Рассмотрим третий член. Поскольку г X X − для всех боль- ных в группе одинаково, ( ) ( ) 2 2 г г б г , X X n X X − = − ∑ ∑ а это величина S меж Итак, имеем: общ вну меж вну меж 0 , S S S S S = + + = + что и требовалось доказать. Как общая вариация разлагается на две составляющие — вну- тригрупповую и межгрупповую, так и общее число степеней свободы разлагается на внутригрупповое и межгрупповое. Дей- ствительно, поскольку ν общ = mn – 1, ν меж = m – 1 и ν вну = m(n – 1), то ν меж + ν вну = m – 1 + m(n – 1) = m(l + n – l) – l = mn – l = ν общ ГЛАВА 9 |