Главная страница
Навигация по странице:

  • 5.3.

  • Таблица 5.14.

  • Что значит «незначимо»: чувствительность критерия

  • Рис. 6.1.

  • Рис. 6.2. А и Б.

  • Рис. 6.3. А.

  • Таблица 6.1.

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница14 из 37
    1   ...   10   11   12   13   14   15   16   17   ...   37
    5.1. Т. Бишоп (Т. Bishop. High frequency neural modulation in dentistry. J. Am. Dent. Assoc., 112:176—177, 1986) изучил эффек- тивность высокочастотной стимуляции нерва в качестве обез- боливающего средства при удалении зуба. Все больные подклю- чались к прибору, но в одних случаях он работал, в других был выключен. Ни стоматолог, ни больной не знали, включен ли при- бор. Позволяют ли следующие данные считать высокочастот- ную стимуляцию нерва действенным анальгезируюшим сред- ством?
    Прибор включен
    Прибор выключен
    Боли нет
    24 3
    Боль есть
    6 17
    5.2. Синдром внезапной детской смерти — основная причи- на смерти детей в возрасте от 1 недели до 1 года. Обычно смерть наступает на фоне полного здоровья незаметно, во сне, поэтому определение факторов риска имеет первостепенное значение.
    Считается, что синдром внезапной детской смерти чаще случа- ется у недоношенных детей, негров, а также в семьях с низкими доходами. Н. Левак и соавт. (N. Lewak et al. Sudden infant death syndrome risk factors: prospective data review. Clin. Pediatr., 18:
    404—411, 1979) решили уточнить эти данные. Исследователи собрали сведения о 19047 детях, родившихся в одном из роддо- мов Окленда, штат Калифорния, с 1960 по 1967 г. Судьбу детей проследили до 1 года. Данных о 48 детях получить не удалось.
    От синдрома внезапной детской смерти умерли 44 ребенка. Дан- ные о предполагаемых факторах риска представлены в табл. 5,14.
    Найдите признаки, связанные с риском синдрома внезапной детской смерти.
    5.3. Могло ли повлиять отсутствие данных о 48 детях на ре- зультаты исследования? Если да, то как?
    5.4. Р. Феннел и соавт. (R. Fennell et al. Urinary tract infections in children effect of short course antibiotic therapy on recurrence rate in children with previous infections. Clin. Pediatr., 19:121—124, 1980)
    сравнили эффективность трех антибиотиков при рецидивиру-
    АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

    156
    ющей инфекции мочевых путей у девочек 3—16 лет. После ко- роткого курса одного из антибактериальных препаратов (назна- ченного случайным образом) в течение года делали повторные посевы мочи. При выявлении бактериурии констатировали ре- цидив. Были получены следующие результаты.
    Рецидив
    Есть
    Нет
    Ампициллин
    20 7
    Триметоприм/сульфаметоксазол
    24 21
    Цефалексин
    14 2
    Есть ли основания говорить о разной эффективности препа- ратов? Если да, то какой лучше?
    Таблица 5.14.
    По некоторым признакам данные отсутствуют, поэтому сумма в третьем столбце может оказаться меньше 44, а в четвертом — меньше 18 955.
    ГЛАВА 5
    Синдром внезапной детской смерти
    Фактор
    +

    Возраст матери
    До 25 лет
    29 7301 25 лет и старше 15 11241
    Время от окончания
    Менее 1 года
    23 4694
    предыдущей беременности
    Более 1 года
    11 7339
    Планировалась ли
    Нет
    23 7654
    беременность
    Да
    5 4253
    Повторная
    Нет
    36 12987
    беременность
    Да
    8 4999
    Курение во время
    Да
    24 5228
    беременности
    Нет
    10 9595
    Посещения врача во время
    Менее 11 раз
    31 10512
    беременности
    11 раз или более 11 8154
    Самый низкий гемоглобин во Менее 12 мг%
    26 12613
    время беременности
    12 мг% и более 7 2678
    Раса
    Белые
    31 12240
    Негры
    9 4323
    Другие
    4 2153

    157
    5.5. А. О’Нил и соавт. (A. O’Neil et al. A waterborn epidemic of acute infectious non-bacterial gastroenteritis in Alberta, Canada. Can.
    J. Public Health, 76:199—203, 1985) недавно сообщили о вспыш- ке гастроэнтерита в маленьком канадском городке. Исследова- тели предположили, что источником инфекции была водопро- водная вода. Они исследовали зависимость между количеством выпитой воды и числом заболевших. Какие выводы можно сде- лать из приводимых данных?
    Количество выпитой воды, стаканов в день
    Число заболевших Число не заболевших
    Менее 1 39 121
    От 1 до 4 264 258 5 и более
    265 146
    5.6. Как правило, качество исследования выше, а соответствие собираемых данных поставленному вопросу точнее, если дан- ные собираются специально для этого исследования после его планирования. Р. и С. Флетчеры (R. Fletcher, S. Fletcher. Clinical research in general medical journals: а 30-year perspective. N. Engl.
    J. Med., 301:180—183, 1979) исследовали 612 работ, случайным образом выбранных из журналов Journal of American Medical
    Association, Lancet и New England Journal of Medicine, чтобы определить, собирали ли их авторы свои данные до или после планирования исследования. Вот что удалось обнаружить:
    1946 1956 1966 1976
    Число рассмотренных
    151 149 157 155
    работ
    Процент работ,
    где данные собирали после планирования
    76 71 49 44
    исследования до планирования
    24 29 51 56
    исследования
    Оцените статистическую значимость различия долей. Если различия есть, то можно ли сказать, что положение меняется к лучшему?
    АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

    158
    5.7. Одна из причин инсульта — окклюзия сонной артерии.
    Чтобы выяснить, какое лечение — медикаментозное или хирур- гическое — дает в этом случае лучшие результаты, У. Филдс и соавт. (W. Fields et al. Joint study of extracranial arterial occlusion,
    V: Progress report of prognosis following surgery or nonsurginal treatment for transient ishemic attacks and cervical carotid artery lesions. JAMA, 211:1993—2003, 1970) сравнили долгосрочный прогноз у леченных двумя методами.
    Повторный инсульт или смерть
    Лечение
    Да
    Нет
    Хирургическое
    43 36
    Медикаментозное
    53 19
    Можно ли говорить о превосходстве одного из видов лече- ния?
    5.8. В диагностике ишемической болезни сердца используют нагрузочную пробу, с помощью физической нагрузки вызывают ишемию миокарда, которую выявляют на ЭКГ. Существует дру- гой метод, ишемию вызывают внутривенным введением дипири- дамола, а выявляют с помощью эхокардиографии. Ф. Латтанци и соавт. (F. Lattanzi et al. Inhibition of dipyndamole-induced ishemia by antianginal therapy in humans: correlation with exercise electrocardiography. Circulation, 83:1256—1262, 1991) сравнили ре- зультаты двух методов у больных, получавших и не получавших антиангинальную терапию. Результаты приведены в таблице.
    Без антиангинальной терапии
    Дипиридамол + эхокардиография
    +

    Нагрузка + ЭКГ +
    38 2

    14 3
    На фоне антиангинальной терапии
    Дипиридамол + эхокардиография
    +

    Нагрузка + ЭКГ +
    21 6

    16 14
    Оцените различия между результатами двух методов.
    ГЛАВА 5

    159
    5.9. Д. Сакетт и М. Гент (D. Sackett, M. Gent. Controversy in counting and attributing events in clinical trials. N. Engl. J. Med.,
    301:1410—1412, 1979) сделали важное замечание относитель- но методики сбора данных в исследовании результатов меди- каментозного и хирургического лечения окклюзии сонной ар- терии (задача 5.7). Так как изучался «долгосрочный прогноз»,
    в исследование включали только тех больных, которые не умер- ли и у которых не было повторного инсульта во время госпи- тализации. В результате из рассмотрения были исключены 15
    оперированных (5 из них умерли, а у 10 инсульт произошел вскоре после операции) и только 1 больной, лечившийся ме- дикаментозно. Если учесть и этих 16 больных, то данные при- мут такой вид:
    Повторный инсульт или смерть
    Лечение
    Да
    Нет
    Хирургическое
    58 36
    Медикаментозное
    54 19
    Что теперь можно сказать о предпочтительности одного из видов лечения? Какое сравнение более верно — с учетом этих
    16 больных или без их учета (как в задаче 5.7)? Почему?
    5.10. Распространенность болезни Xравна 10%. Болезнью Y
    страдает 1000 человек, болезнью Z — также 1000 человек. Бо- лезнь X с равной вероятностью поражает страдающих болезня- ми Y и Z. Вероятность госпитализации при этих болезнях раз- ная: для болезни X она составляет 40%, Y — 50%, Z — 20%.
    Посмотрим, сколько больных с разными сочетаниями болезней окажется в больнице.
    Из 1000 человек, страдающих болезнью Y, болезнь X имеют
    10%, то есть 100 человек. Из них 50% (50 человек) будут госпи- тализированы в связи с болезнью Y, из оставшихся 50 человек в связи с болезнью X госпитализируют 40%, то есть 20 человек.
    Таким образом, в больнице окажется 70 больных с сочетанием болезней Y и X.
    Из 900 человек, страдающих болезнью Y, но не X, будут гос- питализированы 50%, то есть 450 человек.
    Такой же расчет для болезни Z показывает, что в больницу
    АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

    160
    ГЛАВА 5
    попадет 52 человека с сочетанием болезней Z и X, а с болезнью
    Z, но не Х, — 180 человек.
    Исследователь, работающий в больнице в которую попали все госпитализированные, обнаружил следующую связь.
    С болезнью X
    Без болезни X
    Болезнь Y
    70 450
    Болезнь Z
    52 180
    Оцените статистическую значимость различий частоты бо- лезни X среди страдающих болезнями Y и Z. Можно ли по этим данным судить о связи болезней Y и Z с болезнью X? (Приве- денный пример заимствован из работы: D. Mainland. The risk of fallacious conclusions from autopsy data on the incidence of diseases with applications to heart disease. Am. Heart J., 45:644—654, 1953).

    * С этим понятием мы уже встречались в гл. 3 и 4; другое название чувстви- тельности — мощность.
    Глава 6
    Что значит «незначимо»:
    чувствительность критерия
    До сих пор мы занимались оценкой вероятности нулевой гипо- тезы, то есть предположения об отсутствии эффекта экспери- ментального воздействия. Вероятность нулевой гипотезы (P) мы оценивали с помощью различных критериев значимости — F, t,
    q, q
    ′, z и χ
    2
    . Если значение критерия превышало критическое,
    нулевую гипотезу отклоняли. При этом мы совершенно спра- ведливо утверждали, что нашли статистически значимые раз-
    личия. Если значение критерия оказывалось меньше критичес- кого, говорили об отсутствии статистически значимых раз-
    личий. И это тоже справедливо. К сожалению, обычно этим не ограничиваются. Не обнаружив различий, исследователь счи- тает это доказательством их отсутствия. А это уже совершенно неверно. Прежде чем сделать вывод об отсутствии различий следует выяснить, была ли чувствительность критерия доста- точной, чтобы их обнаружить.
    Чувствительностью* называется способность критерия об- наружить различия. Чувствительность зависит от величины раз-

    162
    ГЛАВА 6
    ГЛАВА 6
    личий, от разброса данных и от объема выборки. Наиболее ва- жен объем выборок: чем он больше, тем чувствительнее крите- рий. При достаточно больших выборках малейшее различие оказывается статистически значимым. И наоборот если выбор- ки малы, даже большие различия статистически незначимы. Зная эти закономерности, можно заранее определить численность выборок, необходимую для выявления эффекта.
    ЭФФЕКТИВНЫЙ ДИУРЕТИК
    Разбирая критерий Стьюдента, мы использовали пример, в ко- тором препарат, предположительно обладавший диуретическим действием, в действительности не увеличивал диурез. Сейчас рассмотрим обратный пример. Исследуемый препарат на самом деле диуретик. Он увеличивает суточный диурез в среднем с
    1200 до 1400 мл. На рис. 6.1А показано распределение суточно- го диуреза для всех 200 членов совокупности при приеме пла- цебо, а на рис. 6.1Б при приеме этого препарата.
    Теперь представим себе исследователя, который, разумеет- ся, не может наблюдать всю совокупность. Случайным образом он выбирает две группы, по 10 человек в каждой, дает 1-й груп- пе плацебо, а 2-й — препарат (диуретик) после чего измеряет суточный диурез в обеих группах. На рис. 6.1В представлены результаты этих измерений. В 1-й группе средний суточный ди- урез составил 1180 мл (стандартное отклонение 144 мл), а во 2- й группе — 1400 мл (стандартное отклонение 245 мл). Оценим различия по критерию Стьюдента.
    Объединенная оценка дисперсии равна
    (
    ) (
    )
    2 2
    2 2
    2 2
    1 2
    1 1
    144 245 40381 201 .
    2 2
    s
    s
    s
    =
    +
    =
    +
    =
    =
    Значение t равно
    2 1
    2 2
    2 2
    2 1
    1400 1180 2,447,
    201 201 10 10
    X
    X
    t
    s
    s
    n
    n


    =
    =
    =
    +
    +

    163
    Рис. 6.1. Исследование диуретического эффекта нового препарата. А. Суточный диурез в совокупности из 200 человек после приема плацебо. Десять человек, попавшие в вы- борку, помечены черным. Б. Суточный диурез в той же совокупности после приема препарата. Суточный диурез увеличился на 200 мл. Десять человек, попавшие в выбор- ку, помечены штриховкой. В. Такими видит данные исследователь; t = 2,447. Это боль- ше критического значения t для 18 степеней свободы (2,101) и 5% уровня значимости,
    поэтому можно заключить, что различия статистически значимы, то есть препарат об- ладает диуретическим действием.
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ

    164
    Рис. 6.2. А и Б. Та же совокупность, что и на рис. 6.1, но в выборку попали другие люди.
    В. Изменился и результат, который наблюдает исследователь. Теперь t = 1,71, что мень- ше критического значения. В данном случае исследователю не повезло — ему придется признать, что значимых различий не выявлено, то есть диуретическое действие препа- рата не доказано, — тогда как в действительности оно есть.
    ГЛАВА 6

    165
    Рис. 6.3. А. Такое распределение мы получим, извлекая пары случайных выборок по 10
    человек в каждой из одной и той же совокупности и каждый раз вычисляя t (см. рис.
    4.5А). Только 5% значений по абсолютной величине превышают 2,1 (помечены чер- ным). Таким образом, 2,1 — критическое значение для 5% уровня значимости. Б. Те- перь будем извлекать пары выборок из разных совокупностей, средний диурез в кото- рых различается на 200 мл (рис. 6.1А и Б). Распределение значений t сместилось впра- во. Критическое значение превышено в 111 случаях из 200. Следовательно, вероятность получить правильное заключение об эффективности препарата составляет 55%.
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    что превышает 2,101 — критическое значение при уровне зна- чимости 0,05 и числе степеней свободы 2(n – 1) = 18. Поэтому нулевая гипотеза будет отклонена, а препарат будет назван эф- фективным диуретиком. Как это и есть на самом деле.
    Конечно, исследователь мог бы набрать и другие две груп- пы, например представленные на рис. 6.2. На этот раз средний суточный диурез — 1216 мл в контрольной группе и 1368 мл в группе получавшей препарат. Стандартное отклонение состав- ляет соответственно 97 и 263 мл, а объединенная оценка дис- персии 1/2(97 2
    + 263 2
    ) = 198 2
    . Теперь значение t:
    2 2
    1368 1216 1,71,
    198 198 10 10
    t

    =
    =
    +
    что меньше 2,101. Нулевую гипотезу отклонить нельзя, хотя мы то знаем, что она неверна! Какова вероятность такой ситуации?

    166
    ГЛАВА 6
    Для ответа на этот вопрос повторим мысленные эксперимен- ты, подобные тем, что мы проделали в гл. 4 (см. рис. 4.5). Тогда мы строили распределение величины для случая, когда сравни- ваемые группы представляли собой случайные выборки из од- ной и той же совокупности. Это распределение показано на рис.
    6.ЗА. Теперь построим распределение t для случая, когда вы- борки извлекаются из разных совокупностей. Из двух совокуп- ностей, показанных на рис. 6.2, можно извлечь более 10 27
    выбо- рок объемом в 10 человек; ограничимся пока двумястами. Ре- зультат показан на рис. 6.3Б. В 111 случаях из 200 значение t
    оказалось не меньше критического значения 2,101. Итак, в этом случае (то есть при этих величине эффекта, дисперсии и чис- ленности групп) вероятность отклонить нулевую гипотезу (то есть найти различие) составляет 111/200 = 0,55. Можно оценить и вероятность не отклонить нулевую гипотезу (то есть не най- ти существующих различий). Это 1 — 0,55 = 0,45, то есть 45%.
    Как видим, шансы обнаружить и не обнаружить диуретический эффект были примерно равны.
    ДВА РОДА ОШИБОК
    В медицине для характеристики диагностических проб часто используют два показателя: чувствительность и специфичность.
    Чувствительность — это вероятность положительного резуль- тата у больного; она характеризует способность пробы выяв- лять болезнь. Специфичность — это вероятность отрицатель- ного результата у здорового; можно сказать, что она характери- зует способность пробы выявлять отсутствие болезни.
    Диагностические пробы и критерии значимости во многом схо- жи. Диагностические пробы выявляют болезни, критерии значи- мости выявляют различия. Можно сказать, что с третьей главы по пятую мы занимались специфичностью критериев значимос- ти. В этой главе мы рассматриваем чувствительность, то есть спо- собность критерия выявлять различия. Иногда свойства крите- риев значимости описывают в несколько иных терминах: не ве- роятностью правильного результата, а вероятностью ошибки.
    Если мы ошибочно отклоняем нулевую гипотезу, то есть, на-

    167
    Таблица 6.1. Ошибки критериев значимости
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    ходим различия там, где их нет, то это называется ошибкой I рода.
    Максимальная приемлемая вероятность ошибки I рода называется уровнем значимости и обозначается
    α. С этой величиной мы уже много раз встречались; обычно
    α принимают равной 0,05 (то есть
    5%), однако можно взять и какой-нибудь другой уровень значимо- сти, например 0,1 или 0,01.
    Если мы не отклоняем нулевую гипотезу, когда она не верна, то есть не находим различий там, где они есть, то это — ошибка II
    рода. Ее вероятность обозначается
    β. Ясно, что вероятность обна- ружить различия, то есть чувствительность критерия, равна 1 –
    β.
    В нашем примере с диуретиком
    β = 0,45 и 1 – β = 0,55, то есть чувствительность критерия при данных условиях составляет 55%.
    Все, что мы узнали об ошибках критериев значимости, крат- ко представлено в таблице 6.1.
    ЧЕМ ОПРЕДЕЛЯЕТСЯ ЧУВСТВИТЕЛЬНОСТЬ?
    Естественно, мы заинтересованы в том, чтобы по возможности уменьшить вероятность ошибки II рода, то есть повысить чув- ствительность критерия. Для этого нужно знать, от чего она за- висит. В принципе, эта задача похожа на ту, что решалась при- менительно к ошибкам I рода, но за одним важным исключени- ем. Чтобы оценить чувствительность критерия, нужно задать
    величину различий, которую он должен выявлять. Эта величина оп- ределяется задачами исследования. В примере с диуретиком чув- ствительность была невелика — 55%. Но, может быть, исследова-
    В действительности
    По результатам при- Различия
    Различий менения критерия есть нет
    Различия
    Истинноположитель- Ложноположитель- выявлены ный результат, 1 –
    β
    ный результат
    (ошибка I рода),
    α
    Различий не
    Ложноотрицательный Истииноотрицатель- выявлено результат (ошибка ный результат, 1 –
    α
    II рода),
    β

    168
    ГЛАВА 6
    тель просто не считал нужным выявлять прирост диуреза с 1200
    до 1400 мл/сут, то есть всего на 17%?
    С увеличением разброса данных повышается вероятность ошибок обоих типов. Как мы вскоре увидим, величину разли- чий и разброс данных удобнее учитывать совместно, рассчитав отношение величины различий к стандартному отклонению.
    Чувствительность диагностической пробы можно повысить,
    снизив ее специфичность — аналогичное соотношение суще- ствует между уровнем значимости и чувствительностью крите- рия. Чем выше уровень значимости (то есть чем меньше
    α), тем ниже чувствительность.
    Как мы уже говорили, важнейший фактор, который влияет на вероятность ошибок как I, так и II рода, — это объем выбо-
    рок. С ростом объема выборок вероятность ошибок уменьшает- ся. Практически это очень важно, поскольку прямо связано с планированием эксперимента.
    Прежде чем перейти к подробному рассмотрению факторов,
    влияющих на чувствительность критерия, перечислим их еще раз.
    • Уровень значимости α. Чем меньше α, тем ниже чувстви- тельность.
    • Отношение величины различий к стандартному отклонению.
    Чем больше это отношение, тем чувствительнее критерий.
    • Объем выборок. Чем больше объем, тем выше чувствитель- ность критерия.
    1   ...   10   11   12   13   14   15   16   17   ...   37


    написать администратору сайта