Главная страница
Навигация по странице:

  • Критерий согласия (

  • Критерий Манна ― Уитни (критерий однородности Т)

  • Критерий Вилкоксона

  • 1. озз. Определение, разделы дисциплины, задачи, структура. Роль дисциплины в системе мед образования, практической деятельности врачаспециалиста и организаций здравоохранения


    Скачать 2.59 Mb.
    Название1. озз. Определение, разделы дисциплины, задачи, структура. Роль дисциплины в системе мед образования, практической деятельности врачаспециалиста и организаций здравоохранения
    Анкорozz_otvety.doc
    Дата22.04.2017
    Размер2.59 Mb.
    Формат файлаdoc
    Имя файлаozz_otvety.doc
    ТипДокументы
    #5135
    страница6 из 36
    1   2   3   4   5   6   7   8   9   ...   36

    Применение непараметрических критериев в медицинской статистике
    Для установления эффективности влияния некоторых факторов (лекарственного

    препарата, метода лечения, курения, занятий спортом и т.д.) на

    определенный контролируемый показатель используются критерии достоверности.

    При числовом выражении признаков, их нормальном распределении в

    совокупности, одинаковой или незначительно различающейся дисперсии по

    сравниваемым группам используются критерии параметрической

    статистики (параметрические критерии). Однако если имеются сомнения в

    возможности применения указанных критериев или если исследуемый признак

    является качественным, следует использовать непараметрические критерии.

    Название «непараметрические» многие авторы связывают с тем, что методы

    сравнения наблюдений не зависят от вида распределения и нет необходимости

    расчета параметрических критериев.

    В основе расчета непараметрических критериев лежит упорядочивание

    (ранжирование) имеющихся значений по отношению друг к другу, типа

    «больше ― меньше» или «лучше ― хуже». Это разграничение значений не

    предполагает точных количественных соотношений, а следовательно, и

    ограничений на параметры и вид распределения. Поэтому для

    использования непараметрических критериев нужно меньше информации,

    нежели для использования критериев параметрических. В качестве

    оценок при непараметрических методах используются относительные

    характеристики – ранги, инверсии, серии, знаки и др. В случае

    применимости параметрических критериев (нормальное распределение

    признака и незначительно различающиеся групповые дисперсии) они, как

    учитывающие большее количество информации, оказываются более

    мощными, чем непараметрические критерии, и именно им следует отдать

    предпочтение, хотя они и более трудоемки.

    Впрочем, при современной вычислительной технике понятие «трудоемкость»

    становится условным. Персональный компьютер позволяет начинать

    сравнение вариационных рядов с параметрических методов (критерий

    Стьюдента, дисперсионный анализ). Такая практика особенно выгодна в

    тех научных работах, когда анализируются результаты многих

    (физиологических, биохимических, гематологических,

    психофизиологических, социологических и др.) исследований, полученных у

    одних и тех же лиц в динамике. В этом случае на ПК вариационные ряды

    удобно сравнивать по единой программе. Однако напомним о возможной

    ошибке: сравнение их параметрическими методами будет заканчиваться

    получением недостаточно достоверных данных. В этих случаях исследование

    следует продолжить с применением непараметрических критериев. Особенно

    эффективно применение непараметрических критериев при малых выборках

    (п = 30). Мощность непараметрических критериев, как правило, лишь

    незначительно меньше мощности соответствующих параметрических критериев,

    а значит, используя параметрические критерии даже в случае

    применимости параметрических, мы не слишком рискуем ошибиться.

    Непараметрические методы нашли широкое применение в

    микробиологических, иммунологических, фармакологических

    исследованиях. Гигиенистам, физиологам часто приходится иметь дело

    с малой численностью персонала при изучении условий жизнедеятельности на

    обитаемых технических объектах, а врачам-клиницистам ― при изучении

    редких клинических форм. Учитывая ряд преимуществ исследований при малых

    выборках, они часто применяются и во многих других случаях.

    Непараметрические критерии существенно проще в вычислительной части, что

    позволяет использовать их для «быстрой проверки» результатов.

    Непараметрические методы, используемые для сравнения результатов

    исследований, т.е. для сравнения выборочных совокупностей, заключаются в

    применении определенных формул и других операций в строгой

    последовательности (алгоритмы, шаги). В конечном результате

    высчитывается определенная числовая величина. Эту числовую величину

    сравнивают с табличными пороговыми значениями. Критерием достоверности

    будет результат сравнения полученной величины и табличного значения при

    данном

    числе наблюдений (или степеней свободы) и при заданном пороге

    безошибочного прогноза. Таким образом, критерий в статистической

    процедуре имеет основное значение, поэтому процедуру статистической

    оценки в целом иногда называют тем или иным критерием.

    Использование непараметрических критериев связано с такими понятиями,

    как нулевая гипотеза (Н0), уровень значимости, достоверность статистических

    различий. Нулевой гипотезой называют гипотезу, согласно которой две

    сравниваемые эмпирические выборки принадлежат к одной и той же

    генеральной совокупности. Если вероятность (Р) нулевой гипотезы мала, то

    отклонение от нее утверждает, что сравниваемые статистические выборки

    принадлежат к разным генеральным совокупностям. Уровень значимости ―

    это такая вероятность, которую принимают за основу при статистической оценке

    гипотезы. В качестве максимального уровня значимости, при котором нулевая

    гипотеза еще отклоняется, принимается 5 %. При уровне значимости больше 5 %

    нулевая гипотеза принимается, и различия между сравниваемыми

    совокупностями принимаются статистически недостоверными, незначимыми.

    Особого внимания заслуживает вопрос о мощности (чувствительности) критериев.

    Каждый из изучаемых критериев имеет характерную для себя мощность.

    Оценки значимости различий необходимо начинать с наименее мощного критерия.

    Если этот критерий опровергает нулевую гипотезу, то на этом анализ заканчивается.

    Если же нулевая гипотеза этим критерием не опровергается, то следует

    проверить изучаемую гипотезу более мощным критерием. Однако если

    значение характеристики, вычисленной для менее мощного критерия, оказалось

    очень далеким от критического значения, то мало надежды, что более мощный

    критерий опровергнет нулевую гипотезу.

    Следует сказать и о выборе для статистической оценки результатов подходящих

    критериев. Предлагаются примеры выбора адекватных методов статистической

    обработки данных в зависимости от задач медико-биологических исследований.

    Разумеется, предпочтение следует отдавать менее трудоемким методам, хотя

    данное требование имеет относительное значение в тех случаях, когда

    имеется возможность использовать современную вычислительную технику.

    Перед выбором адекватного метода статистического сравнения данных

    необходимо ответить на следующие основные вопросы:

    1.Результаты получены в количественном или альтернативном (атрибутивном)

    виде, т.е., иными словами, результат каждого измерения представлен числом

    или альтернативной (атрибутивной, двухвариантной) оценкой: «есть признак» ―

    «нет признака», «есть симптом» ― «нет симптома» и т.д.?

    2. Сравниваются независимые выборки (результаты исследования основной и

    контрольной групп) или зависимые выборки, т.е. результаты исследования одних

    и тех же лиц (экспериментальных животных) в динамике?

    3. Сравниваются две или несколько выборок?

    Таким образом, полученный в медико-биологическом исследовании материал

    может быть отнесен к одному из вариантов, для каждого из которых

    приведены адекватные методы сравнения выборок.

    Фактический материал исследования в выборках представлен в

    количественном виде, выборки независимые, сравниваются две выборки.

    Адекватные методы сравнения выборок:

    критерий Стьюдента (t);

    сравнение средних значений двух независимых малых

    выборок по Лорду (U);

    критерий Вилкоксона-Манна-Уитни (U);

    критерий Мостеллера;

    критерий Розенбаума (Q);

    критерий Уайта (К).
    Варианты в выборках имеют количественное выражение,

    выборки независимые, сравниваются несколько выборок.

    Адекватные методы сравнения:

    дисперсионный анализ;

    сравнение нескольких независимых выборок по Немени.
    Варианты имеют количественное выражение, выборки функционально

    связаны (зависимые, согласованные), т.е. с попарно связанными

    вариантами; сравниваются две выборки. Адекватные методы сравнения:

    критерий Стьюдента (разностный метод) (t);

    ранговый критерий Манна-Уитни для разностей пар (Т);

    критерий знаков (Z);

    максимум-критерий для разностей пар.
    Варианты представлены в количественном виде, выборки зависимые,

    сравниваются несколько выборок. Адекватные методы сравнения:

    ранговый дисперсионный анализ для нескольких зависимых

    выборок по Фридману (2 ―критерий);

    множественное сравнение зависимых выборок по Вилкоксону (W).
    Варианты в выборках представлены в альтернативном виде

    («есть признак» ― «нет признака»), выборки независимые,

    сравниваются две выборки. Адекватные методы сравнения:

    критерий Стьюдента (t) (для сравнения данных

    исследования в относительных величинах с применением при

    необходимости поправок Йейтса);

    критерий 2;

    точный метод Фишера (ТМФ);

    критерий Вандер-Вардена (X).
    Варианты представлены в альтернативном виде, сравниваются несколько

    независимых выборок. Адекватные методы сравнения:

    дисперсионный анализ;

    критерий 2 (по Р. Руниони).
    VII.Выборки представлены в альтернативном виде, выборки зависимые,

    сравниваются две выборки. Адекватные методы сравнения:

    модифицированный критерий Макнимара (2 ― критерий Макнимара);

    критерий итерации по Веберу.
    Выборки представлены в альтернативном виде, выборки зависимые,

    сравниваются несколько выборок. Адекватный метод:

    критерий Кохрана (Q).

    Методы в каждой из приведенных 8 групп расположены в порядке убывания их

    мощности. Мощность определяется вероятностью выявления существующих

    достоверных различий. Вместе с тем, чем она больше, тем более трудоемок метод.

    Для некоторых методов имеются ограничения, обусловленные, главным образом,

    числом единиц наблюдения в выборочной совокупности, что также необходимо

    учитывать при выборе метода.

    Таким образом, непараметрические критерии обладают рядом важных и

    неоспоримых достоинств. Использование их не требует знания законов

    распределения изучаемых совокупностей, они могут быть применены к

    совокупностям не только количественным, но также к полуколичественным

    и качественным. Эти методы позволяют проводить статистическую обработку

    результатов исследования при малом числе наблюдений. Они сочетают в

    себе простоту расчетов с достаточной мощностью.
    Критерий согласия (2)

    С помощью 2 определяют соответствие (согласие) эмпирического

    распределения теоретическому и тем самым оценивают достоверность различия

    между выборочными совокупностями. Критерий 2 применяется в тех случаях,

    когда нет необходимости знать величину того или иного параметра

    (среднюю или относительную величину) и требуется оценить достоверность

    различия не только двух, но и большего числа групп.

    В практике работы врача метод 2 может широко использоваться

    при оценке эффективности прививок, действия препаратов, результатов

    различных методов лечения и профилактики заболеваний, влияния условий труда

    и быта на заболеваемость рабочих. С помощью критерия 2 можно определить,

    влияют или нет сроки госпитализации на течение заболевания, влияет ли

    материальное обеспечение населения на уровень заболеваемости и т.д.

    Критерий2 определяется по формуле:

    ,

    где Р ― фактические (эмпирические) данные; Р1 ― «ожидаемые» (теоретические)

    данные, вычисленные на основании нулевой гипотезы.

    Определение критерия 2 основано на расчете разницы между

    фактическими и «ожидаемыми» данными. Чем больше эта разность (Р - Р1),

    тем с большей вероятностью можно утверждать, что существуют различия в

    распределении сравниваемых выборочных совокупностей. Полученную

    величину 2 оценивают по специальной таблице. При этой оценке

    учитывается число степеней свободы, т.е. число «свободно варьирующих»

    элементов, или число клеток таблицы, которые могут быть заполнены

    любыми числами без изменения общих итоговых цифр.

    Для нахождения числа степеней свободы (k) можно применять

    формулу: k = (s - 1)(r - 1), где s ― число граф первоначальной

    таблицы (без графы «итого»); r ― число строк таблицы (без строки «всего»).

    Для того чтобы опровергнуть нулевую гипотезу, вычисленный критерий

    согласия 2 должен быть равен или больше табличного (критического)

    значения 2 при уровне вероятности нулевой гипотезы р = 5%.

    Если условие задачи содержит только одну степень свободы, то расчет критерия

    2 можно проводить алгебраическим способом, обозначив поля таблицы

    «а», «b», «с», «d». Вычисление критерия 2 в этом случае производится по

    формуле:

    .

    Применение критерия 2 очень эффективно в случаях, когда

    надо сопоставить статистические совокупности с большим количеством

    групп (градаций признака) или когда сравниваемых совокупностей больше двух.
    Критерий Манна Уитни (критерий однородности Т)

    Непараметрическим аналогом критерия Стьюдента является критерий

    Манна-Уитни. Данный критерий не связан с конкретными законами

    распределения. Сущность критерия Манна-Уитни состоит в том, что

    обе группы наблюдений объединяются в одну и она упорядочивается по

    возрастанию. Каждому элементу группы предписывается его ранг. При

    этом элемент, обладающий наименьшим значением, получает ранг №1, следующим

    2 ― ранг №2 и т.д. Последний ранг N, где N ― суммарная численность

    группы, получает элемент, принимающий наибольшее значение. Если несколько

    элементов имеют одинаковые значения, то всем им предписывается один

    и тот же ранг, равный среднему арифметическому номеров, под которыми

    стоят элементы в упорядоченной группе.

    Присвоив элементам ранги, опять разводим их по своим группам.

    Вычисляем значение критерия Т, где Т ― сумма рангов элементов

    меньшей из групп. Вводим нулевую гипотезу об однородности двух выборок.

    Полученное значение критерия Т сравниваем с двумя критическими значениями,

    взятыми из специальной таблицы. Если наблюдаемое значение Т находится между

    этими критическими значениями, то принимаем нулевую гипотезу: выборки

    извлечены из одной генеральной совокупности.

    Критерий Манна-Уитни используется при оценке эффективности новых

    лекарственных препаратов, новых методов физиотерапевтического лечения,

    сравнения результатов биохимического исследования в двух группах лиц и т.д.
    Критерий Вилкоксона

    Данный критерий используется как непараметрический критерий, при

    любом типе распределения. Критерий Вилкоксона относится к ранговым

    критериям, причем присваиваемые значения признака (ранга) могут

    быть как положительными, так и отрицательными.

    Наблюдения снимаются дважды: до эксперимента и после эксперимента.

    Под экспериментом понимается некоторое воздействие на объект, в результате

    которого наблюдаемые показатели могут измениться в ту или иную сторону:

    например, прием лекарственного препарата или определенная методика лечения

    приводят к некоторым изменениям контролируемых показателей. При этом у

    различных индивидуумов данные изменения также будут различными. Задача

    критерия ― по статистическим данным установить эффективность

    воздействия. Поскольку изменения показателя у каждого объекта могут быть

    вызваны самыми разными случайными причинами, а нас интересует влияние

    именно нашего эксперимента, то для того, чтобы исключить случайные

    воздействия, требуется рассматривать группу объектов. И чем больше объем этой

    группы, тем более взаимно сокращаются положительные и отрицательные

    случайные отклонения и, наоборот, ярче проявляются отклонения

    систематические, вызванные эффектом эксперимента.

    Группа наблюдений до эксперимента выступает в роли контрольной группы,

    а группа наблюдений после эксперимента ― в роли экспериментальной группы.

    Однако в данной ситуации мы располагаем гораздо большей информацией,

    чем информация из двух произвольных групп наблюдения: парные данные

    выдают непосредственно для каждого объекта зависимость наблюдаемого

    показателя от произведенного воздействия (возросло значение показателя

    или уменьшилось и на сколько единиц измерения). В качестве наблюдаемого

    значения удобно использовать разность наблюдаемых показателей до и после

    эксперимента для каждого индивидуума.

    Таким образом, из двух групп наблюдений получается одна выборка значений,

    среди которых могут быть как положительные (уменьшение показателя),

    так и отрицательные (увеличение показателя). При нулевой разнице

    наблюдение не учитывается. Далее производится ранжирование выборки,

    причем несколько иначе, чем, например, в критерии Манна-Уитни, где

    используется простое упорядочивание. В нашем случае, прежде чем

    приступить к упорядочиванию выборочных значений, их вначале

    заменяют соответствующими абсолютными величинами, а затем

    полученные положительные числа ранжируют по возрастанию.

    Расставленные таким образом ранги изменения показателя являются

    промежуточными, далее каждому рангу приписывается знак «+» или «-» в зависимости

    от знака соответствующей ему разности. Значит, часть рангов окажется

    положительными числами, а другая часть ― отрицательными. Такие

    ранги называются «знаковыми». Сумма знаковых рангов

    ― случайная величина W, называемая «критерий Вилкоксона».

    В случае когда исследуемое воздействие неэффективно, количество

    положительных и отрицательных разностей (а также и знаковых рангов)

    в среднем должно уравновешиваться, так как нет превалирующего

    изменения показателя в ту или иную сторону. Следовательно, среднее значение

    критерия Вилкоксона W должно быть равно нулю (нулевая гипотеза).

    Далее действия стандартны: для конкретной выборки разностей

    вычисляем Whнабл. По специальной таблице находим соответствующие

    критические точки (с учетом желаемого уровня значимости) и определяем

    принадлежность Wнабл. критической области или области принятия нулевой гипотезы.

    Критерий Вилкоксона может применяться в медицинской практике при

    оценке, например, эффективности новых методов медикаментозной

    терапии, диеты, эффективности хирургических вмешательств и т.д.

    Таким образом, критерий Вилкоксона игнорирует вид распределения,

    и его выводы справедливы при любом виде распределения.
    1   2   3   4   5   6   7   8   9   ...   36


    написать администратору сайта