Глантз. Книга Primer of biostatistics fourth edition
Скачать 6.07 Mb.
|
4.1. Конахан и соавт. определили среднее артериальное дав- ление и общее периферическое сосудистое сопротивление при операциях на открытом сердце с галотановой (9 больных) и мор- финовой (16 больных) анестезией. Результаты приведены в табл. 4.2. Можно ли утверждать, что в группах галотановой и морфи- новой анестезии эти гемодинамические показатели различают- ся статистически значимо? 4.2. Кокаин чрезвычайно вреден для сердца, он может вызвать инфаркт миокарда даже у молодых людей без атеросклероза. Ко- каин сужает коронарные сосуды что приводит к уменьшению притока крови к миокарду кроме того, он ухудшает насосную функцию сердца. Нифедипин (препарат из группы антагонистов кальция) обладает способностью расширять сосуды, его приме- няют при ишемической болезни сердца. Ш. Хейл и соавт. (S. L. Hale, К. J. Alker, S. H. Rezkalla et al. Nifedipine protects the heart from the acute deleterious effects of cocaine if administered before but not after cocaine. Circulation, 83:1437—1443, 1991) предположи- ли, что нифедипин можно использовать и при поражении сердца, СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА 120 вызванном кокаином. Собакам вводили кокаин, а затем нифеди- пин либо физиологический раствор. Показателем насосной фун- кции сердца служило среднее артериальное давление. Были по- лучены следующие данные. Среднее артериальное давление после приема кокаина, мм рт. ст. Плацебо Нифедипин 156 73 171 81 133 103 102 88 129 130 150 106 120 106 110 111 112 122 130 108 105 99 Влияет ли нифедипин на среднее артериальное давление пос- ле приема кокаина? 4.3. Ш. Хейл и соавт. измеряли также диаметр коронарных артерии после приема нифедипина и плацебо. Позволяют ли при- водимые ниже данные утверждать, что нифедипин влияет на диаметр коронарных артерий? Диаметр коронарной артерии, мм Плацебо Нифедипин 2,5 2,5 2,2 1,7 2,6 1,5 2,0 2,5 2,1 1,4 1,8 1,9 2,4 2,3 2,3 2,0 2,7 2,6 2,7 2,3 1,9 2,2 ГЛАВА 4 121 4.4. Решите задачи 3.1 и 3.5 используя критерий Стьюдента. 4.5. В задаче 3.2 приведены данные, собранные Уайтом и Фре- бом о проходимости дыхательных путей у некурящих работаю- щих в помещении, где не курят у пассивных курильщиков и у курильщиков выкуривающих различное число сигарет. Диспер- сионный анализ обнаружил, что приведенные данные не согла- суются с гипотезой о том, что проходимость дыхательных пу- тей во всех группах одинакова. Выделите группы с одинаковой функцией легких. Что означает полученный результат, с точки зрения первоначально поставленного вопроса влияет ли пассив- ное курение на функцию легких? 4.6. Используя данные задачи 3.2, оцените статистическую значимость различий некурящих работающих в помещении, где не курят со всеми остальными группами. Воспользуйтесь кри- терием Даннета. 4.7. Решив задачу 3.3, мы пришли к заключению, что уро- вень холестерина липопротеидов высокой плотности (ХЛПВП) у бегунов марафонцев бегунов трусцой и лиц, не занимающих- ся спортом неодинаков. Пользуясь критерием Стьюдента с по- правкой Бонферрони, сравните эти группы попарно. 4.8. Используя данные задачи 3.3 и рассматривая группу не занимающихся спортом как контрольную сравните ее с осталь- ными двумя группами. Используйте поправку Бонферрони. 4.9. Пользуясь данными задачи 3.4, найдите группы с близ- кими показателями антибактериальной защиты. 4.10. По данным задачи 3.7 опишите различия групп. Исполь- зуйте поправку Бонферрони. 4.11. Решите снова задачу 4.10, пользуясь критерием Нью- мена—Кейлса. Сравните результат с решением задачи 4.10 и объясните различия, если они есть. 4.12. В задаче 3.6 мы установили, что существуют различия в степени опустошенности у медицинских сестер работающих с больными разной тяжести. В чем заключаются эти различия? СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА Глава 5 Анализ качественных признаков Статистические процедуры, с которыми мы познакомились в пре- дыдущих главах, предназначены для анализа количественных при- знаков. Примером таких признаков служат артериальное давле- ние диурез или продолжительность госпитализации. Единицей их измерения могут быть миллиметры ртутного столба, литры или дни. Над значениями количественных признаков можно про- изводить арифметические действия. Можно, например, сказать, что диурез увеличился вдвое. Кроме того, их можно упорядочить, то есть расположить в порядке возрастания или убывания. Однако очень многие признаки невозможно измерить чис- лом. Например, можно быть либо мужчиной, либо женщиной, либо мертвым либо живым. Можно быть врачом, юристом, ра- бочим и так далее. Здесь мы имеем дело с качественными при- знаками. Эти признаки не связаны между собой никакими ариф- метическими соотношениями, упорядочить их также нельзя. Единственный способ описания качественных признаков состо- ит в том, чтобы подсчитать число объектов, имеющих одно и 123 то же значение. Кроме того, можно подсчитать, какая доля от общего числа объектов приходится на то или иное значение. Существует еще один вид признаков. Это порядковые при- знаки. Их можно упорядочить, но производить над ними ариф- метические действия нельзя. Пример порядкового признака — состояние больного тяжелое, средней тяжести, удовлетворитель- ное. С такими признаками мы познакомимся в гл. 8 и 10, а сей- час продолжим обсуждение работы Т. Конахана и соавт. по срав- нению галотановой и морфиновой анестезии начатое в гл. 3. Мы уже знаем, что галотан и морфин по-разному влияли на артериальное давление и что это различие статистически зна- чимо. Однако для клинициста важнее знать, наблюдалось ли различие в операционной летальности? Из 61 больного, опери- рованного под галотановой анестезией, умерли 8, то есть 13,1%. При использовании морфина умерли 10 из 67, то есть 14,9%. (В гл. 4 мы для простоты считали размеры обеих групп одинако- выми, теперь используются реальные данные). Летальность при использовании галотана оказалась примерно на 1% ниже, чем при использовании морфина. Можно ли считать, что морфин опаснее галотана, или такой результат мог быть результатом случайности? Чтобы ответить на этот вопрос нам сначала нужно найти спо- соб оценить точность, с которой доли вычисленные по выбор- кам, соответствуют долям во всей совокупности. Однако преж- де нам нужно понять, каким должно быть описание самой сово- купности. Здесь нам пригодятся уже несколько подзабытые мар- сиане. НОВОСТИ С МАРСА В гл. 2 мы побывали на Марсе, где измерили всех его обитате- лей. Хотя ранее мы не говорили об этом, но больше всего нас поразило различие в пигментации марсиан, 50 марсиан были розового, а остальные 150 — зеленого цвета (рис. 5.1). Как описать совокупность марсиан по этому признаку? Ясно, что нужно указать долю, которую составляют марсиане каждого цвета во всей совокупности марсиан. В нашем случае доля розо- вых марсиан p роз = 50/200 = 0,25 и зеленых p зел = 150/200 = 0,75. АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 124 Рис. 5.1. Из 200 марсиан 150 имеют зеленую окраску, остальные 50 розовые. Если на- угад извлечь марсианина, то вероятность, что он окажется розовым, составляет 50/200 = 0,25, то есть 25%. Поскольку марсиане бывают только розовые и зеленые, справед- ливо тождество p роз + p зел = 1. Или, что то же самое, p роз = 1 – p зел То есть, зная p роз , мы легко определим и p зел . Таким образом, для характеристики совокупности, которая состоит из двух классов, достаточно указать численность одного из них если доля одного класса во всей совокупности равна р, то доля другого равна 1 – р. Заметим, что p роз есть еще и вероятность того, что случайно выбранный марсианин окажется розовым. Покажем, что доля р в некотором смысле аналогична среднему µ по совокупности. Введем числовой признак X, который принимает только два зна- чения 1 для розового и 0 для зеленого. Среднее значение призна- ка X равно 1 1 1 0 0 0 200 50 1 150 0 50 0,25. 200 200 X N µ + + + + + + + = = = × + × = = = ∑ … … Как видим, полученное значение совпадает с долей розовых марсиан. Повторим это рассуждение для общего случая. Пусть име- ется совокупность из N членов. При этом М членов обладают каким-то качественным признаком, которого нет у остальных ГЛАВА 5 125 N – M членов. Введем числовой признак X: у членов совокуп- ности, обладающих качественным признаком, он будет равен 1, а у членов, не обладающих этим признаком, он будет равен 0. Тогда среднее значение X равно ( ) 1 0 , X M N M M p N N N µ × + − × = = = = ∑ то есть доле членов совокупности, обладающих качественным признаком. Используя такой подход, легко рассчитать и показатель раз- броса — стандартное отклонение. Не совсем ясно, однако, что понимать под разбросом, если значений признака всего два — 0 и 1. На рис. 5.2 мы изобразили три совокупности по 200 членов в каждой. В первой из них (5.2А) все члены принадлежат к од- ному классу. Разброс равен нулю. На рис. 5.2Б разброс уже име- ется, но он невелик. На рис. 5.2В совокупность делится на два равные класса. В этом случае разброс максимален. Итак, найдем стандартное отклонение. По определению оно равно ( ) 2 , X N µ σ − = ∑ где для М членов совокупности значение X = 1, а для остальных N – М членов X = 0. Величина µ = р. Таким образом, ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 2 2 2 1 1 0 0 1 1 1 p p p p N M p N M p M M p p N N N σ − + + − + − + + − = = − + − = = − + − … … Но так как M N p = , то ( ) ( ) ( ) ( ) 2 2 2 1 1 1 1 , p p p p p p p p σ = − + − = − + − или, после преобразования, ( ) 1 p p σ = − АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 126 Рис. 5.2. Что такое разброс данных, если значений признака всего два? Возможно, это станет яснее, если вспомнить, что разброс — это отсутствие единства. Рассмотрим три совокупности из 200 марсиан. А. Все марсиане зеленые. Царит полное единство, раз- брос отсутствует, σ = 0. Б. Среди стройных рядов зеленых марсиан появилось 10 розо- вых. Единство немного нарушено, появился некоторый разброс, σ = 0,2. В. От единства марсиан не осталось и следа: они разделились поровну на зеленых и розовых. Разброс максимален, σ = 0,5. ГЛАВА 5 127 Найденное стандартное отклонение σ полностью определя- ется величиной р. Этим оно принципиально отличается от стан- дартного отклонения для нормального распределения которое не зависит от µ. На рис. 5.3 показана зависимость σ от р. Она вполне согласуется с теми впечатлениями которые возникают при рассмотрении рис. 5.2: стандартное отклонение достигает максимума при р = 0,5 и равно 0 когда р равно 0 или 1. Зная стандартное отклонение σ можно найти стандартную ошибку для выборочной оценки р. Посмотрим, как это делается. ТОЧНОСТЬ ОЦЕНКИ ДОЛЕЙ Если бы в наших руках были данные по всем членам совокуп- ности, то не было бы никаких проблем связанных с точностью оценок. Однако нам всегда приходится довольствоваться огра- ниченной выборкой. Поэтому возникает вопрос, насколько точ- но доли в выборке соответствуют долям в совокупности. Про- делаем мысленный эксперимент наподобие того, который мы провели в гл. 2, когда рассматривали насколько хорошей оцен- кой среднего по совокупности является выборочное среднее. Рис. 5.3. Стандартное отклонение доли σ полностью определяется самой этой долей р. Когда доля равна 0 или 1, разброс отсутствует и σ = 0. Когда р = 0,5, разброс максима- лен, σ = 0,5 АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 128 Рис. 5.4. А. Из совокупности марсиан, среди которых 150 зеленых и 50 розовых, из- влекли случайную выборку из 10 особей. В выборку попало 5 зеленых и 5 розовых марсиан, на рисунке они помечены черным. Б. В таком виде данные предстанут перед исследователем, который не может наблюдать всю совокупность и вынужден судить о ней по выборке. Оценка доли розовых марсиан p = 5/10 = 0,5. Предположим, что из всех 200 марсиан случайным образом выбрали 10. Распределение розовых и зеленых марсиан во всей совокупности неизвестное исследователям изображено в верх- ней части рис. 5.4. Закрашенные кружки соответствуют марси- анам, попавшим в выборку. В нижней части рис. 5.4 показана информация, которой располагал бы исследователь, получив- ший такую выборку. Как видим в выборке розовые, и зеленые марсиане поделились поровну. Основываясь на этих данных, мы решили бы, что розовых марсиан столько же, сколько и зеле- ных, то есть их доля составляет 50%. Исследователь мог бы извлечь другую выборку, например одну из представленных на рис. 5.5. Здесь выборочные доли розовых марсиан равны 30, 30, 10, и 20%. Как любая выборочная оценка, оценка доли (обозначим ее ˆp) отражает долю р в сово- купности, но отклоняется от нее в силу случайности. Рассмот- ГЛАВА 5 129 рим теперь не совокупность марсиан, а совокупность всех значе- ний p , вычисленных по выборкам объемом 10 каждая. (Из сово- купности в 200 членов можно получить более 10 6 таких выбо- рок). На рис. 5.6 приведены пять значений p , вычисленных по пяти выборкам с рис. 5.4 и 5.5 и еще 20 значений полученных на других случайных выборках того же объема. Среднее этих 25 значений составляет 30%. Это близко к истинной доле розовых марсиан — 25%. По аналогии со стандартной ошибкой среднего найдем стандартную ошибку доли. Для этого нужно охаракте- ризовать разброс выборочных оценок доли, то есть рассчитать Рис. 5.5. Еще 4 случайные выборки из той же совокупности марсиан. Оценки доли ро- зовых марсиан: 30, 30, 10 и 20%. АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 130 стандартное отклонение совокупности p . В данном случае оно равно примерно 14%, в общем случае ˆ , p n σ σ = где ˆp σ — стандартная ошибка доли, σ — стандартное отклоне- ние, n — объем выборки. Поскольку ( ) 1 , p p σ = − то ( ) ˆ 1 p p p n σ − = Заменив в приведенной формуле истинное значение доли ее оценкой p , получим оценку стандартной ошибки доли: ( ) ˆ ˆ ˆ 1 p p p s n − = Из центральной предельной теоремы (см. гл. 2) вытекает, что при достаточно большом объеме выборки выборочная оценка p приближенно подчиняется нормальному распределению, имею- щему среднее р и стандартное отклонение ˆp σ . Однако при значе- ниях р, близких к 0 или 1, и при малом объеме выборки это не так. При какой численности выборки можно пользоваться приве- денным способом оценки? Математическая статистика утвер- ждает, что нормальное распределение служит хорошим при- Рис. 5.6. Нанесем на график оценки доли розовых марсиан, полученные по выборке с рис. 5.4 и четырем выборкам с рис. 5.5. Добавим к ним еще 20 выборочных оценок. Получилось распределение выборочных оценок p . Стандартное отклонение совокуп- ности средних — это стандартная ошибка доли. ГЛАВА 5 131 ближением, если и ˆ np и ( ) ˆ 1 n p − превосходят 5*. Напомним, что примерно 95% всех членов нормально распределенной совокуп- ности находятся в пределах двух стандартных отклонений от среднего. Поэтому если перечисленные условия соблюдены, то с вероятностью 95% можно утверждать, что истинное значение р лежит в пределах ˆ 2 p s от p . Вернемся на минуту к сравнению операционной летальности при галотановой и морфиновой анестезии. Напомним, что при использовании галотана летальность составила 13,1% (числен- ность группы — 61 больной), а при использовании морфина — 14,9% (численность группы — 67 больных). Стандартная ошибка доли для группы галотана ( ) гал ˆ 0,131 1 0,131 0,043 4,3%, 61 p s − = = = для группы морфина ( ) мор ˆ 0,149 1 0,149 0,044 4,4%. 67 p s − = = = Если учесть, что различие в летальности составило лишь 2%, то маловероятно, чтобы оно было обусловлено чем-нибудь, кро- ме случайного характера выборки. Прежде чем двигаться дальше, перечислим те предпосылки, на которых основан излагаемый подход. Мы изучаем то, что в статистике принято называть независимыми испытаниями Бер- нулли. Эти испытания обладают следующими свойствами. • Каждое отдельное испытание имеет ровно два возможных взаимно исключающих исхода. • Вероятность данного исхода одна и та же в любом испыта- нии. • Все испытания независимы друг от друга. В терминах совокупности и выборок эти свойства формулиру- ются так. * Если объем выборки недостаточен для использования нормального рас- пределения, можно прибегнуть к помощи биномиального распределения. О биномиальном распределении см. J. H. Zar. Biostatistical analysis, 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984. АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 132 • Каждый член совокупности принадлежит одному из двух классов. • Доля членов совокупности принадлежащих одному классу неизменна. • Каждый член выборки извлекается из совокупности незави- симо от остальных. СРАВНЕНИЕ ДОЛЕЙ В предыдущей главе мы рассмотрели критерий Стьюдента t. Он вычисляется на основе выборочных средних и стандартной ошибки: Разность выборочных средних Стандартная ошибка разности выборочных средних t = Выборочная доля p аналогична выборочному среднему. Вы- ражение для стандартной ошибки мы уже вывели. Теперь мы можем перейти к задаче сравнения долей, то есть к проверке нулевой гипотезы о равенстве долей. Для этого используется критерий z, аналогичный критерию Стьюдента t: Разность выборочных долей Стандартная ошибка разности выборочных долей z = Пусть p 1 и p 2 — выборочные доли. Поскольку стандартная ошибка — это стандартное отклонение всех возможных значе- ний p , полученных по выборкам заданного объема, и посколь- ку дисперсия разности равна сумме дисперсии стандартная ошибка разности долей равна 1 2 1 2 2 2 ˆ ˆ ˆ ˆ p p p p s s s − = + Следовательно, 1 2 1 2 1 2 1 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ p p p p p p p p z s s s − − − = = + Если n 1 и n 2 — объемы двух выборок, то ГЛАВА 5 133 ( ) 1 1 1 ˆ 1 ˆ ˆ 1 p p p s n − = и ( ) 2 2 2 ˆ 2 ˆ ˆ 1 p p p s n − = Таким образом, ( ) ( ) 1 2 1 1 2 2 1 2 ˆ ˆ ˆ ˆ ˆ ˆ 1 1 p p z p p p p n n − = − − + Итак, мы вывели формулу для критерия z. Вообще этой бук- вой обозначаются величины со стандартным нормальным рас- пределением (то есть нормальным распределением со средним µ = 0 и стандартным отклонением σ = 1 см. табл. 6.4). С величи- ной z мы встретимся еще неоднократно. В данном случае нор- мальное распределение имеет место только при достаточно боль- ших объемах выборок*. Если при оценке дисперсии объединить наблюдения из обе- их выборок, чувствительность критерия Стьюдента увеличит- ся. Таким же способом можно повысить чувствительность кри- терия z. Действительно если справедлива нулевая гипотеза то обе выборочные доли p 1 = m 1 /n 1 и p 2 = m 2 /n 2 — это две оценки одной и той же доли p , которую мы, следовательно, можем оце- нить как 1 2 1 2 ˆ m m p n n + = + Тогда ( ) ˆ ˆ ˆ 1 p s p p = − Отсюда имеем ( ) 1 2 2 2 ˆ ˆ ˆ ˆ 1 2 1 2 1 1 ˆ ˆ 1 p p p p s s s p p n n n n − = + = − + * Точнее говоря, когда значения n p и n(1 – p ) больше 5. Если хотя бы для одной выборки это условие не выполняется, то критерий z неприменим, и нужно воспользоваться точным критерием Фишера. Этот критерий мы рассмотрим чуть позже. АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ 134 Подставляя полученную объединенную оценку в формулу для критерия z, имеем: ( ) 1 2 1 2 ˆ ˆ 1 1 ˆ ˆ 1 p p z p p n n − = − + О статистически значимом различии долей можно говорить, если значение z окажется «большим». С такой же ситуацией мы имели дело, рассматривая критерии Стьюдента. Отличие состо- ит в том, что t подчиняется распределению Стьюдента, а z — стандартному нормальному распределению. Соответственно для нахождения «больших» значении z нужно воспользоваться стан- дартным нормальным распределением (рис. 2.5). Однако, по- скольку при увеличении числа степеней свободы распределе- ние Стьюдента стремится к нормальному, критические значе- ния z можно найти в последней строке табл. 4.1. Для 5% уровня значимости оно составляет 1,96, для 1% — 2,58. |