Главная страница
Навигация по странице:

  • Рис. 6.4.

  • Величина различий

  • Разброс значений

  • Объем выборки

  • Как определить чувствительность критерия

  • Галотан и морфин при операциях на открытом сердце

  • Глантз. Книга Primer of biostatistics fourth edition


    Скачать 6.07 Mb.
    НазваниеКнига Primer of biostatistics fourth edition
    АнкорГлантз
    Дата30.04.2023
    Размер6.07 Mb.
    Формат файлаpdf
    Имя файлаglantz.pdf
    ТипКнига
    #1099022
    страница15 из 37
    1   ...   11   12   13   14   15   16   17   18   ...   37
    Уровень значимости
    Чтобы получить наглядное представление о связи чувствитель- ности критерия с уровнем значимости, вернемся к рис. 6.3. Вы- бирая уровень значимости
    α, мы тем самым задаем критичес- кое значение t. Это значение мы выбираем так, чтобы доля пре- восходящих его значений — при условии, что препарат не ока-
    зывает эффекта, — была равна
    α (рис. 6.3А). Чувствительность критерия есть доля тех значений критерия, которые превосхо- дят критическое при условии, что лечение дает эффект (рис.
    6.3Б). Как видно из рисунка, если изменить критическое значе- ние, изменится и эта доля.

    169
    Рис. 6.4. Выбирая уровень значимости
    α, мы тем самым определяем критический уровень t. Чем меньше
    α, тем выше критический уровень и тем ниже чувствитель- ность. А. Уровень значимости
    α = 0,05, критическое значение t = 2,101, чувстви- тельность 55%. Б. Теперь уровень значимости
    α = 0,01, критическое значение t вы- росло до 2,878 и чувствительность снизилась до 45%.
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ

    170
    ГЛАВА 6
    Рассмотрим подробнее, как это происходит. На рис. 6.4А изо- бизображено распределение значений критерия Стьюдента.
    Отличие от рис. 6.3 состоит в том, что теперь это распределе- ние, полученное для всех 10 27
    возможных пар выборок. Верх- ний график — это распределение значений t для случая, когда препарат не обладает диуретическим действием. Предположим,
    мы выбрали уровень значимости 0,05, то есть приняли
    α = 0,05.
    В этом случае критическое значение равно 2,101, то есть мы отвергаем нулевую гипотезу и признаем различия статистичес- ки значимыми при t > +2,101 или t < –2,101. Соответствующие области на графике заштрихованы, а критическое значение изоб- ражено вертикальной пунктирной линией, спускающейся к ниж- нему графику, на котором изображено распределение t для слу- чая, когда препарат обладает диуретическим действием, а имен- но увеличивает суточный диурез на 200 мл. По форме, нижний график такой же, как верхний, но сдвинут на 200 мл вправо.
    Доля значений t, превышающих критическое значение 2,101
    (заштрихованная область), составляет 0,55. Итак, чувствитель- ность критерия в данном случае 55%; а вероятность ошибки второго рода
    β = 1 – 0,55 = 0,45, то есть 45%.
    А теперь взглянем на рис. 6.4Б. На нем изображены те же самые распределения значений t. Отличие в выбранном уров- не значимости —
    α = 0,01. Критическое значение t повыси- лось до 2,878, пунктирная линия сместилась вправо и отсека- ет от нижнего графика только 45%. Таким образом, при пере- ходе от 5% к 1% уровню значимости чувствительность снизи- лась с 55 до 45%. Соответственно, вероятность ошибки II рода повысилась до 1 – 0,45 = 0,55.
    Итак, снижая
    α, мы снижаем риск отвергнуть верную нуле- вую гипотезу, то есть найти различия (эффект) там, где их нет.
    Но тем самым мы снижаем и чувствительность — вероятность выявить имеющиеся на самом деле различия.
    Величина различий
    Рассматривая влияние уровня значимости, мы принимали ве- личину различий постоянной: наш препарат увеличивал суточ- ный диурез с 1200 до 1400 мл, то есть на 200 мл. Теперь примем

    171
    Рис. 6.5. Чем больше величина различий, тем сильнее распределение t сдвигается впра- во и тем выше чувствительность.
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    постоянным уровень значимости
    α = 0,05 и посмотрим, как чув- ствительность критерия зависит от величины различий. Понят- но, что большие различия выявить легче, чем маленькие. Рас- смотрим следующие примеры. На рис. 6.5А изображено рас- пределение значений t для случая, когда исследуемый препарат не обладает диуретическим действием. Заштрихованы 5% наиболь- ших по абсолютной величине значений t, расположенных левее –
    2,101 или правее +2,101. На рис. 6.5Б изображено распределение значений t для случая, когда препарат увеличивает суточный

    172
    Рис. 6.6. Чувствительность критерия Стьюдента как функция от величины различий при объеме выборок 10 человек и уровне значимости
    α = 0,05. Пунктирная линия пока- зывает, как пользоваться графиком. Для величины различий 200 мл чувствительность составляет 0,55.
    ГЛАВА 6
    1,0
    0,8
    0,6
    0,4
    0,2
    0
    100
    200
    300
    Увеличение суточного диуреза, мл
    Ч
    ув
    ст
    вите
    л
    ьн
    о
    с
    ть

    173
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    диурез в среднем на 200 мл (эту ситуацию мы уже рассматрива- ли). Выше правого критического значения лежит 55% возмож- ных значений t: чувствительность равна 0,55. Далее, на рис. 6.5В
    представлено распределение значений t для случая, когда пре- парат увеличивает диурез в среднем на 100 мл. Теперь только
    17% значений t превышает 2,101. Тем самым, чувствительность критерия равна лишь 0,17. Иными словами, эффект будет обна- ружен менее чем в одном из каждых пяти сравнений контрольной и экспериментальной групп. Наконец, рис. 6.5Г представляет случай увеличения диуреза на 400 мл. В критическую область попало 99% значений t. Чувствительность критерия равна 0,99:
    различия будут выявлены почти наверняка.
    Повторяя этот мысленный эксперимент, можно определить чувствительность критерия для всех возможных значений эф- фекта, от нулевого до «бесконечного». Нанеся результаты на график, мы получим рис. 6.6, где чувствительность критерия показана как функция от величины различий. По этому графи- ку можно определить, какой будет чувствительность при той или иной величине эффекта. Пользоваться графиком пока что не очень удобно, ведь он годится только для этих численности групп, стандартного отклонения и уровня значимости. Вскоре мы построим другой график, более подходящий для планирова- ния исследования, но сначала нужно подробнее разобраться с ролью разброса значений и численности групп.
    Разброс значений
    Чувствительность критерия возрастает с ростом наблюдаемых различий; с ростом разброса значений чувствительность, напро- тив, снижается.
    Напомним, что критерий Стьюдента t определяется следую- щим образом:
    1 2
    2 2
    1 2
    ,
    X
    X
    t
    s
    s
    n
    n

    =
    +
    где
    1
    X и
    2
    X
    — средние, s — объединенная оценка стандартного

    174
    ГЛАВА 6
    отклонения
    σ, n
    1
    и n
    2
    — объемы выборок. Заметьте, что
    1
    X и
    2
    X — это оценки двух (различных) средних —
    µ
    1
    и
    µ
    2
    . Для про- стоты допустим, что объемы обеих выборок равны, то есть
    n
    1
    = n
    2
    . Тогда вычисленное значение t есть оценка величины
    1 2
    1 2
    2 2
    2
    t
    n
    n
    n
    µ µ
    µ µ
    σ
    σ
    σ


    ′ =
    =
    +
    Обозначим
    δ (греческая буква «дельта») величину эффекта,
    то есть разность средних:
    δ = µ
    1

    µ
    2
    , тогда
    2 2
    n
    t
    n
    δ
    δ
    σ
    σ
    ′ =
    =
    Таким образом, t
    ′ зависит от отношения величины эффекта к стандартному отклонению.
    Рассмотрим несколько примеров. Стандартное отклонение в исследуемой нами совокупности составляет 200 мл (см. рис. 6.1).
    В таком случае увеличение суточного диуреза на 200 или 400 мл равно соответственно одному или двум стандартным отклонени- ям. Это очень заметные изменения. Если бы стандартное откло- нение равнялось 50 мл, то те же самые изменения диуреза были бы еще более значительными, составляя соответственно 4 и 8
    стандартных отклонений. Наоборот, если бы стандартное откло- нение равнялось, например, 500 мл, то изменение диуреза в 200
    мл составило бы 0,4 стандартного отклонения. Обнаружить та- кой эффект было бы непросто да и вряд ли вообще стоило бы.
    Итак, на чувствительность критерия влияет не абсолютная величина эффекта, а ее отношение к стандартному отклонению.
    Обозначим его
    ϕ (греческая «фи»); это отношение ϕ = δ/σ назы- вается параметром нецентральности.
    Объем выборки
    Мы узнали о двух факторах, которые влияют на чувствитель- ность критерия: уровень значимости
    α и параметр нецентраль- ности
    ϕ. Чем больше α и чем больше ϕ, тем больше чувстви-

    175
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    тельность. К сожалению, влиять на
    ϕ мы не можем вовсе, а что касается
    α, то его увеличение повышает риск отвергнуть вер- ную нулевую гипотезу, то есть найти различия там, где их нет.
    Однако есть еще один фактор, который мы можем, в определен- ных пределах, менять по своему усмотрению, не жертвуя уров- нем значимости. Речь идет об объеме выборок (численности групп). С увеличением объема выборки чувствительность кри-
    терия увеличивается.
    Существуют две причины, в силу которых увеличение объе- ма выборки увеличивает чувствительность критерия. Во-пер- вых, увеличение объема выборки увеличивает число степеней свободы, что, в свою очередь, уменьшает критическое значе- ние. Во-вторых, как видно из только что полученной формулы
    ,
    2
    n
    t
    δ
    σ
    ′ =
    значение t растет с ростом объема выборки n (это справедливо и для многих других критериев).
    На рис 6.7А воспроизведены распределения с рис. 6.4А. Вер- хний график соответствует случаю, когда препарат не обладает диуретическим действием, нижний — когда препарат увеличи- вает суточный диурез на 200 мл. Численность каждой из групп составляет 10 человек. На рис 6.7Б приведены аналогичные рас- пределения. Отличие в том, что теперь в каждую группу входи- ло не 10, а 20 человек. Раз объем каждой из групп равен 20,
    число степеней свободы равно
    ν = 2(20 – 1) = 38. Из таблицы 4.1
    находим, что критическое значение t при 5% уровне значимос- ти равно 2,024 (в случае выборок объемом 10 оно равнялось
    2,101). С другой стороны, увеличение объема выборок привело к увеличению значений критерия. В результате уже не 55, а 87%
    значений t превышают критическое значение. Итак, увеличе- ние численности групп с 10 до 20 человек привело к повыше- нию чувствительности с 0,55 до 0,87.
    Перебирая все возможные объемы выборок, можно постро- ить график чувствительности критерия как функции от числен- ности групп (рис. 6.8). С увеличением объема чувствительность

    176
    Рис. 6.7. Увеличение объема выборки повышает чувствительность по двум при- чинам. Во-первых, увеличивается число степеней свободы, и критическое зна- чение t уменьшается. Во-вторых, при той же величине различий получаются бо- лее высокие значения t.
    ГЛАВА 6

    177
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    растет. Сначала она растет ускоренно, затем, начиная с некото- рого объема выборки, рост замедляется.
    Расчет чувствительности — важнейшая составная часть пла- нирования медицинских исследований. Теперь, познакомившись с наиболее важным фактором, определяющим чувствительность,
    мы готовы решить эту задачу.
    Как определить чувствительность критерия?
    На рис. 6.9 чувствительность критерия Стьюдента представле- на как функция от параметра нецентральности
    ϕ = δ/σ при уров- не значимости
    α = 0,05. Четыре кривые соответствуют четырем объемам выборок.
    Подразумевается, что выборки имеют равный объем. Что де- лать, если это не так? Если вы обратились к рис. 6.9 при плани-
    ровании исследования (что весьма разумно), то нужно учесть следующее. При заданной общей численности обследованных именно равная численность групп обеспечивает максимальную чувствительность. Значит, равную численность групп и следу- ет запланировать. Если же вы решили рассчитать чувствитель- ность после проведения исследования, когда, не найдя статис- тически-значимых различий, вы хотите определить, в какой сте- пени это можно считать доказательством отсутствия эффекта,
    — тогда следует принять численность обеих групп равной мень- шей из них. Такой расчет даст несколько заниженную оценку чувствительности, но убережет вас от излишнего оптимизма.
    Применим кривые с рис. 6.9 к примеру с диуретиком (см.
    рис. 6.1). Мы хотим вычислить чувствительность критерия Стью- дента при уровне значимости
    α = 0,05. Стандартное отклонение равно 200 мл. Какова вероятность выявить увеличение суточного диуреза на 200 мл?
    200 1.
    200
    δ
    ϕ
    σ
    = =
    =
    Численность контрольной и экспериментальной групп рав- на десяти. Выбираем на рис. 6.9 соответствующую кривую и находим, что чувствительность критерия равна 0,55.
    До сих пор мы говорили о чувствительности критерия Стью-

    178
    Рис. 6.8. Чувствительность критерия Стьюдента как функция от объема выбо- рок при величине различий 200 мл, уровне значимости
    α = 0,05 и стандартном отклонении
    σ = 200 мл. При объеме выборок 10 человек чувствительность со- ставляет 0,55.
    ГЛАВА 6

    179
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    дента. Можно рассчитать чувствительность и других критери- ев. Определяется она теми же самыми факторами, но ход вы- числений будет несколько иным.
    Галотан и морфин при операциях на открытом сердце
    В гл. 4 мы сравнили сердечный индекс при галотановой и морфиновой анестезии (см. табл. 4.2) и не нашли статисти- чески значимых различий. (Напомним, что сердечный индекс
    — это отношение минутного объема сердца к площади по- верхности тела.) Однако группы были малы — 9 и 16 чело- век. Средняя величина сердечного индекса в группе галотана равнялась 2,08 л/мин/м
    2
    ; в группе морфина 1,75 л/мин/м
    2
    , то есть на 16% меньше. Даже если бы различия были статисти- чески значимыми, вряд ли столь небольшая разница представ- ляла бы какой-либо практический интерес.
    Поэтому поставим вопрос так: какова была вероятность вы- явить разницу в 25%? Объединенная оценка дисперсии s
    2
    = 0,89,
    значит, стандартное отклонение равно 0,94 л/мин/м
    2
    . Двадцать пять процентов от 2,08 л/мин/м
    2
    — это 0,52 л/мин/м
    2
    Тем самым,
    0,52 0,553.
    0,94
    δ
    ϕ
    σ
    = =
    =
    Поскольку численности групп не совпадают, для оценки чув- ствительности выберем меньшую из них — 9. Из рис. 6.9 сле- дует, что в таком случае чувствительность критерия — 0,16.
    Шансы выявить даже 25% различия были весьма малы.
    Подведем итоги.
    • Чувствительность критерия есть вероятность отвергнуть лож- ную гипотезу об отсутствии различий.
    • На чувствительность критерия влияет уровень значимости:
    чем меньше
    α, тем ниже чувствительность.
    • Чем больше величина эффекта, тем больше чувствитель- ность.
    • Чем больше объем выборки, тем больше чувствительность.
    • Для разных критериев чувствительность вычисляется по-раз- ному.

    180
    ГЛАВА 6
    Рис. 6.9. Чувствительность критерия Стьюдента в зависимости от параметра не- центральности
    ϕ при уровне значимости α = 0,05 для разных объемов выборок n.
    Параметр нецентральности — это отношение величины различий к стандартному отклонению в совокупности:
    ϕ = δ/σ. Пунктирные линии показывают, как пользо- ваться графиками. Если, например, величина различий
    δ = 200 мл, стандартное отклонение
    σ = 200 мл, то ϕ = 1. Для объема выборок n = 10 чувствительность составляет 0,55. При
    ϕ = 0,55 и n = 9 чувствительность — всего лишь 0,16.

    181
    * Во вводном курсе этот раздел можно пропустить без ущерба для понимания последующего материала.
    ** Численность групп предполагается равной. Как и в случае критерия
    Стьюдента, именно равная численность групп обеспечивает макси- мальную чувствительность при заданной общей численности обсле- дованных.
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    ЧУВСТВИТЕЛЬНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗА
    Чувствительность дисперсионного анализа* определяется теми же факторами, что чувствительность критерия Стьюдента, по- хож и способ ее вычисления. Для расчета нам понадобятся сле- дующие данные: число групп, их численность, уровень значи- мости и величина различий. Что понимать под величиной раз- личий, если число групп больше двух? В качестве величины различий
    δ используют минимальную величину различий меж- ду любыми двумя группами. Параметр нецентральности рас- считывают по формуле:
    ,
    2
    n
    k
    δ
    ϕ
    σ
    =
    где
    σ — стандартное отклонение в совокупности, k — число групп, n — численность каждой из них**. Есть другой способ,
    несколько более сложный. Если
    µ
    i
    , — среднее в i-й труппе, то
    (
    )
    2 2
    ,
    i
    k
    µ µ
    ϕ
    σ

    =

    где
    i
    k
    µ
    µ =

    есть среднее по всем группам.
    Определив параметр нецентральности, и зная межгрупповое число степеней свободы
    ν
    меж
    = k – 1, чувствительность находят по графикам, где она представлена как функция от параметра нецентральности. На рис. 6.10 изображены графики для
    ν
    меж
    = 2,
    графики для других значений
    ν
    меж вы найдете в приложении Б.

    182
    Те же графики можно использовать и для определения чис- ленности групп, обеспечивающей необходимую чувствитель- ность. Это сложнее, чем в случае критерия Стьюдента, так как теперь n входит и в параметр нецентральности
    ϕ, и в выражение для числа степеней свободы
    ν
    вну
    . Поэтому значение n приходится подбирать путем последовательного приближения. Сначала вы произвольно выбираете начальное значение n и вычисляете чув- ствительность. В зависимости от найденного значения чувстви- тельности вы изменяете n, после чего повторяете вычисление.
    Эта процедура повторяется до тех пор, пока значение чувстви- тельности не окажется достаточно близким к нужному.
    БЕГ И МЕНСТРУАЦИИ
    Чтобы получше разобраться с тем, как вычислить чувствитель- ность и объем выборки при дисперсионном анализе, обратимся к примеру с влиянием бега на частоту менструаций, который мы разбирали в гл. 3 (рис. 3.9). Сейчас нас интересует, какова вероят- ность выявить различие в одну менструацию в год (
    δ = 1). Число групп k = 3; стандартное отклонение
    σ = 2. Численность каждой из групп n = 26. Уровень значимости выбираем:
    α = 0,05. Найдем параметр нецентральности:
    1 26 1,04.
    2 2 3
    ϕ =
    =
    ×
    Межгрупповое число степеней свободы
    ν
    меж
    = k – 1 = 3 – 1 = 2
    и внутригрупповое
    ν
    вну
    = k(n – 1) =3(26 – 1) = 75. По рис. 6.10
    находим, что чувствительность составит около 0,30.
    Результат обескураживающий, что вообще характерно для рас- четов чувствительности. Положим, нам хотелось бы иметь чув- ствительность равной 0,80. Какая численность групп нужна для этого? В том, что объем n = 26 слишком мал, мы только что убе- дились. Из рис. 6.10 мы видим, что параметр нецентральности должен быть приблизительно равен 2. Для n = 26 он близок к 1.
    Значит, численность групп должна быть такой, чтобы параметр нецентральности увеличился вдвое. При вычислении
    ϕ из чис- ленности групп n извлекается квадратный корень, поэтому чиc-
    ГЛАВА 6

    183
    ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
    1   ...   11   12   13   14   15   16   17   18   ...   37


    написать администратору сайта