Главная страница
Навигация по странице:

  • 6.3.4 Сравнение нескольких зависимых выборок. 1. Ранговый дисперсионный анализ Фридмана

  • Q - критерий Кохрена (Кокрена )

  • Биометрия верстка_. Учебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия


    Скачать 0.93 Mb.
    НазваниеУчебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия
    Дата31.05.2019
    Размер0.93 Mb.
    Формат файлаpdf
    Имя файлаБиометрия верстка_.pdf
    ТипДокументы
    #79721
    страница10 из 12
    1   ...   4   5   6   7   8   9   10   11   12
    6.3.3 Сравнение двух зависимых выборок
    1. Критерий знаков [1,5] В случаях, когда переменные в выборках попарно связаны (те. выборки не являются независимыми) иногда бывает важным установить, в какую сторону меняются значения элементов выборки при переходе от одной выборки к другой, те. значения элементов в целом увеличиваются или уменьшаются. Для решения такой задачи может быть использован критерий знаков. Критерий знаков, также как и критерий Манна
    – Уитни, относится к непараметрическим критериям сдвига, так как позволяет установить направление сдвига центров эмпирических распределений - в сторону уменьшения или увеличения. Нулевая гипотеза формулируется следующим образом преобладание сдвига в каком – либо направлении является случайным. Методика вычисления критерия заключается в основном в вычислении парных разностей значений элементов выборок, присвоении этим разностям соответственно знаков «+» и «-» и подсчёте количества положительных и отрицательных сдвигов. При этом нулевые разности из расчётов исключаются. Очевидно, что если количества положительных и отрицательных разностей мало отличаются, то выборки, скорее всего, принадлежат одной совокупности и наблюдаемый сдвиг является недостоверным, случайным. Достоверность сдвига определяется сопоставлением значения эмпирического критерия с критическим, значение которого при принятом уровне значимости и данного объёма выборок находят в таблице. Если эмпирическое значение меньше или равно критическому, то преобладающее (типичное) направление сдвига следует считать достоверным. Условия применимости критерия. Тип данных – количественный или качественный. Объём выборок должен быть в пределах от 5 до 300 элементов [6].
    2. Критерий Вилкоксона ( Уилкоксона ) [1,4,5]. Критерий Вилкоксона относится к ранговым критериям сдвига и применяется для определения различия между двумя попарно связанными выборками. Является более мощным критерием по сравнению с критерием знаков [1]. Кроме того, в отличие от этого критерия, использование критерия Вилкоксона позволяет оценить не только направление сдвига (в сторону уменьшения или увеличения значения признака) но и его величину, те. насколько в среднем увеличивается или уменьшается значение признака. Нулевая гипотеза может формулироваться, например, следующим образом обе выборки принадлежат одной совокупности или совокупностям с одинаковыми параметрами. Другая формулировка – преобладании величины сдвига в каком - либо направлении является случайным. Алгоритм вычисления основывается на вычислении попарных разностей значений признака в выборках и вычислении суммы рангов отрицательных и положительных разностей. Нулевые разности при этом исключаются. Наименьшая сумма является эмпирическим критерием Т
    Э
    [1,5,8]. Эмпирический критерий Т
    Э
    сравнивают с критическим Т
    КР
    . Значение критического критерия находят в таблице
    [1,8]. Если значение эмпирического критерия больше или равно критическому, то при принятом уровне значимости преобладающее (типичное) направление сдвига следует считать недостоверным, случайным. Согласно данным [1,5] при объёме выборок n
    > 25 распределение критерия становится примерно нормальным. В этом случае его критическое значение КР вычисляются по формуле [1] :
    24
    )
    1 2
    (
    )
    1
    (
    4
    )
    1
    (
    +

    +



    +

    =
    n
    n
    n
    t
    n
    n
    Т
    КР
    При n > 25 в качестве эмпирического критерия может быть принят также и другой критерий – Z; критерий Z, вычисляется следующим образом [5]:
    24
    )
    1 2
    (
    )
    1
    (
    4
    )
    1
    (
    +

    +

    +


    =
    n
    n
    n
    n
    n
    T
    Z
    Э
    Входящие в эти выражения величины имеют следующий смысл
    Т
    Э
    - наименьшая сумма рангов, n – число парных разностей элементов выборок t =
    1,96 и t = 2,58 при уровнях значимости 0,05 и 0,01 соответственно.
    В этом случае за критическое значение критерия принимается квантиль стандартного нормального распределения N (0, 1) порядка
    2 1 α

    , где α – уровень значимости. Нулевая гипотеза отклоняется если
    Z
    > где U
    1-α/2
    - квантиль стандартно нормального распределения уровня
    2 1 α

    . Значения квантилей стандартного нормального распределения при различных уровнях значимости приведены в таблице Квантили стандартного нормального распределения [9] Вероятность 0,999 0,99 0,977 0,975 0,95 0,90 0,84 0,5 квантиль 3,09 2,33 2,00 1,96 1,645 1,282 1,000 0,00 Иногда за эмпирический критерий принимают общий суммарный ранги используют соответствующие таблицы критических значений этого критерия [4]. Условия применимости критерия. Тип данных – количественный. Объёмы выборок одинаковы и должны быть вне менее пяти.
    6.3.4 Сравнение нескольких зависимых выборок.
    1. Ранговый дисперсионный анализ Фридмана [1,4,5] При сопоставлении более двух выборок, в которых эмпирические распределения подчиняются нормальному распределению, обычно используется дисперсионный анализ повторных измерений.
    В дисперсионном анализе повторных измерений выборки полагаются зависимыми ( например, одни и те же больные последовательно подвергаются нескольким методам лечения. Непараметрическим аналогом такого дисперсионного анализа является ранговый дисперсионный анализ Фридмана
    [1,4,5]. Сущность метода и методика вычисления критерия сводится к следующему. Пусть имеется k связанных выборок объёмом n. Связанность выборок определяется тем, что k наблюдений (или иных каких – либо действий) производятся над одними и теми же объектами. Данные оформляются в виде таблицы. Строками таблицы являются ранжированные по возрастанию значения наблюдаемого признака всех объектов, иначе говоря, каждая строка представляет собой выборку объёмом n. Число таких строк равно k, те. числу наблюдений (или иных каких либо действий над исследуемым объектом. Число столбцов равно числу наблюдаемых объектов, те. равно n. Каждому значению признака присваивается ранги вычисляется суммарный ранг для каждого столбца. Если в значениях признака для всех объектов нет существенной разницы , то и суммы рангов по столбцам будут отличаться несущественно. Значимость различия рангов определяется сопоставлением эмпирического критерия Фридмана [1,5] и критического, которое определяется по таблицам
    [1,4]. Нулевая гипотеза формулируется следующим образом между столбцами различия нет.
    Условия применимости критерия. Переменные должны быть выражены ввели- чинах, допускающих их ранжирование. Объёмы выборок – одинаковы. Количество и объём выборок лимитированы соответствующими таблицами критических значений критерия Фридмана. Для проверки степени различия (согласованности) содержимого строк можно воспользоваться коэффициентом конкордации (согласия) Кендалла W [5]. Такая задача возникает, например, при оценке нескольким судьями (экспертами) качества какого
    – либо объекта [5]. Согласованность решений говорит о том, что судейские (экспертные) оценки действительно отражают качество исследуемого объекта, а не вызваны случайными причинами. Значение коэффициента W находится в пределах
    1 Равенство W=1 выполняется только тогда, когда находящиеся в строках выборки полностью совпадают. Значимость W определяют путём сопоставления его эмпирического значения с критическим. Критическое значение критерия находят в таблицах [5].
    3.
    Q - критерий Кохрена (Кокрена ) [5,8]. Если результаты опыта ( наблюдений ) являются символьными (например, имеют вид да – нет, «1» - «0», «+» - «-» ит. д) задача сравнения k зависимых выборок объ-
    ёмом n может быть решена с помощью
    Q - критерия Кохрена (Кокрена ) [5,8]. При использовании этого критерия результаты обследования (или иных каких – либо воздействий) кодируются символами, например как «1» и «0». Количества тех и других символов подсчитываются построчно и по столбцам, на основании полученных значений вычисляется эмпирическое значение Q – критерия и определяется значимость различия выборок. Условия применимости критерия. Объёмы выборок – одинаковы, данные выражены в символьной форме.
    6.4 Непараметрические методы корреляционного анализа Выявление и оценка силы (тесноты) связи между переменными сопоставляемых выборочных совокупностей является главной задачей корреляционного анализа. В разделе IV рассмотрен метод корреляционного анализа, основой которого является вычисление линейного коэффициента корреляции (Пирсона). Коэффициент корреляции
    Пирсона предназначен для описания линейной связи между переменными в выборках. Метод является параметрическим. Поэтому применение его возможно, если распределение переменных в выборках соответствует нормальному закону распределения. Если эмпирические распределения не подчиняются нормальному закону распределения, то задачи корреляционного анализа решаются непараметрическими методами. Непараметрические методы корреляционного анализа как и все непараметрические методы, не требуют каких – либо априорных предположений о законах распределения в исследуемых выборках, применимы как к дискретным, таки к непрерывным величинам, значения величин могут быть выражены в числовой ив символьной формах Примерами непараметрических методов корреляционного анализа являются ранговые методы Спирмена [1,4,5] и Кендалла [5]. Наибольше практическое распространение
    получил метод Спирмена. Так как эти методы являются ранговыми, то переменные должны быть выражены, по крайней мере, в порядковой шкале, те. в форме, допускающей ранжирование величин в определённом порядке. Методы основываются на ранжировании переменных и замене их значений рангами. Таким образом, корреляция между самими переменными заменяется корреляцией между их рангами. По рангам вычисляются ранговые коэффициенты корреляции. Их значения могут меняться в пределах от -1 до +1. Чем больше по абсолютному значению значение коэффициента к единице, тем больше сила (теснота) связи. Эмпирический коэффициент ранговой корреляции является величиной случайной. Поэтому, необходимо оценить его значимость. Значимость устанавливается сопоставлением эмпирического значения коэффициента с критическим. Критическое значение находят в соответствующих таблицах при заданном уровне значимости. Ниже будет подробно рассмотрено применение рангового коэффициента корреляции Спирмена. Корреляционный анализ может быть проведён также ив тех случаях, когда переменные в выборках выражены не в числовой, а в символьной форме. Наличие и теснота связи в таких случаях может быть оценена с помощью Коэффициента ассоциации
    Пирсона, Коэффициента ассоциации Юла, Коэффициента взаимной сопряжённости
    Пирсона. Если результаты исследований выражены знаками «+» и «-», то для корреляционного анализа таких величин может быть использован Коэффициент корреляции знаков. Описание, методы вычисления этих коэффициентов и примеры решения задач корреляционного анализа сих применением подробно описаны в работе [1] ив настоящем пособии не рассматриваются.
    6.5 Оценка различия двух независимых выборок с помощью критерия Манна - Уитни Как уже отмечалось, критерий предназначен для оценки различия двух независимых выборок и является непараметрическим аналогом статистического критерия значимости Стьюдента для двух независимых выборок (3.12.). Проверяемая гипотеза нулевая) заключается в том, что отличие выборок (например, в значениях выборочных средних) является недостоверным, случайным. Вывод о случайном характере отличий выборок делается на основе результатов сопоставления эмпирических значений критерия Манна – Уитни с критическим. Критические значения критерия находят в соответствующих таблицах для заданных объёмов выборок при принятом уровне значимости. Напомним, что подуровнем значимости понимается вероятность ошибки при отклонении нулевой гипотезы. Как было сказано выше, существует несколько способов применения критерия. Поэтому при использовании таблиц критических значений критерия Манна – Уитни следует обращать внимание на математическую формулировку критерия и на тов каком виде сформулировано условие справедливости нулевой гипотезы, поскольку от этого будут зависеть критические значения критерия. В настоящем пособии за эмпирический критерий Э будет принято наименьшее значение критерия U, вычисляемого по формуле [1]:

    87 2
    )
    1
    (
    1
    +


    =
    i
    i
    i
    n
    n
    T
    U
    ( 6.1 ) В этом выражении i = 1 или 2 - номер выборки n i
    – объём выборки Т
    – сумма рангов выборки. Критические значения этого критерия находятся в таблице 6.2. Напомним условия, при которых критерий Манна – Уитни может быть использован Переменные должны быть выражены в форме, позволяющей их расположить в определённом порядке ( ранжировать ), например в численной. Возможен также символьный тип данных, если эти данные образуют порядковую шкалу.

    Объёмы выборок n
    1
    и n
    2
    должны быть не менее 3 и могут быть разными. В крайнем случае, допускается соотношение объёмов как 2 к 5 и более, в данном пособии значения объёмов лимитированы таблицей критических значений.

    Выборки должны быть независимыми друг от друга. Последовательность действий при использовании критерия Манна - Уитни.

    1. Из элементов обеих выборок объёмами n
    1
    и n
    2
    составить единый ранжированный ряд, в котором элементы выборок расставлены в порядке возрастания.
    2. Каждому элементу ряда поставить в соответствие его номер в общем ряду – ранг наименьший элемент ряда имеет ранг, равный единице. Если несколько элементов ряда совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому из их номеров. Если процедура выполнена правильно, то последний элемент ряда будет иметь номер (ранг) N = ( n
    1
    + n
    2
    ).
    3. Вычислить сумму рангов первой выборки – Т ; за первую выборку обычно принимают выборку, в которой в среднем значения элементов меньше, чем во второй.
    4. Вычислить сумму рангов второй выборки – Т 5. Подставить полученные значения в формулу (6.1) и вычислить значения критериев
    U
    1 и для первой и второй выборок соответственно.
    5. В качестве эмпирического значения критерия Э выбрать наименьшее значение U.
    6. Задавшись уровнем значимости (0,05 или 0,01) найти в таблице 6.2 для заданных объёмов выборок n
    1
    и n
    2
    критическое значение критерия КР. Сделать вывод о достоверности различия сопоставляемых выборок в соответствии с условием если
    КР
    Э
    U
    U
    >
    то нулевая гипотеза не отклоняется, те. при принятом уровне значимости различие выборок является случайным. Пример 6.1 Выявление эффективности новой методики лечения больных тахикардией проводилось путём измерения частоты сердечных сокращений (ЧСС) на двух группах пациентов. Одна группа (контрольная) получила традиционное лечение, другая - по новой методике. Полученные результаты исследования приведены в таблице.
    Частота сердечны сокращений ( удары в мин. Традиционная методика
    Новая методика 135 156 126 144 115 137 140 125 121 145 112 151 130 Среднее значение = 146 Среднее значение = 126 Из таблицы видно, что средние значения ЧСС отличаются. Можно ли считать это расхождение значимым, те новая методика действительно является более эффективной Проанализируем исходные данные. а) Предварительных исследований на соответствие эмпирических распределений переменных в выборках нормальному закону не проводилось. Справедливость применения параметрических методов в данных условиях неочевидна. Поэтому задача должна решаться непараметрическими методами. б) Переменные в выборках выражены в интервальной шкале, те являются количественными, следовательно, возможна их расстановка в определённом порядке (ранжирование. в) Выборки не связаны между собой, т. к. исследования проводились на разных группах пациентов. г) Объёмы выборок соответствуют условиям применения непараметрических методов. Из проведённого анализа исходных данных следует, что задача может быть решена с помощью критерия Манна – Уитни. При решении будем придерживаться последовательности действий, описанных выше. Последовательность действий.

    1. Составим единый ранжированный ряди присвоим переменным соответствующий номер – ранг. Принадлежность переменной к контрольной группе выделим подчёркиванием. Результаты сведём в таблицу.
    ЧСС
    11 2
    11 5
    12 1
    12 5
    12 6
    13 0
    13 5
    13 7
    14 0
    14 4
    14 5
    15 1
    15 6
    16 2 Ранг 2
    3 4
    5 6
    7 8
    9 10 11 12 13 14 2. Вычислим сумму рангов по каждой выборке Т (контр. гр) = 4+8+10+11+12+13+14 = 72;
    Т (опыт. гр. ) = 1+2 + 3 + 5 + 6 + 7 + 9 = 33.

    89 3. Вычислим значение критериев Манна – Уитни для каждой выборки
    5 2
    )
    1 7
    (
    7 33
    .)
    (
    ;
    44
    )
    1 7
    (
    7 72
    .)
    (
    =
    +


    =
    =
    +


    =
    гр
    опытн
    U
    гр
    контр
    U
    4. В качестве эмпирического значения критерия Э выберем наименьшее значение Э = 5.
    5. Задавшись уровнем значимости 0,05 найдём в таблице 6.2 для объёмов выборок критическое значение критерия КР КР = 8 6
    . Вывод так как (Э = 5 )
    < ( КР = 8 ), то предположение о случайности различия средних значений ЧСС отвергаем следовательно новая методика лечения ЧСС более эффективна по сравнению с традиционной вероятность ошибки такого заключения не превышает 0,05. Пример 6.2. Измерение массы щитовидной железы мужчин и женщин одной возрастной категории дало следующие результаты Масса Щ.Ж. женщин
    ( г) Масса Щ.Ж. мужчин
    ( г)
    19,1 12,8 15,8 14,4 12,2 18,4 17,3 14,3 18 9,4 15,3 18 14,3 21,3 16,5 16,4 15,8 18 21,2
    Средн. зн. массы = 16,55 г. Средн. зн. массы = 15,9 г. Из результатов следует, что в среднем значение массы Щ.Ж. женщин превышает значение массы Щ.Ж. мужчин. Значимо ли это различие, или оно носит случайный характер Решение задачи. Анализ исходных данных показывает, что эта задача также может быть решена с применением критерия Манна – Уитни. Единственное отличие условия этой задачи от предыдущей заключается в том, что выборки неравны по объёму. Но, как отмечалось выше, неравенство объёмов выборки не является условием, препятствующим применению критерия Манна - Уитни. Последовательность действий.
    1. Составим единый ранжированный ряди присвоим переменным соответствующий номер – ранг. Переменным, совпадающим по значению, присвоим средний ранг в соответствии с занимаемым ими местом в общем ряду. Принадлежность переменной к группе мужчин выделим подчёркиванием. Результаты сведём в таблицу.
    Масса Щ. Ж. ( г ) Ранг
    9,4 1
    12,2 2
    12,8 3
    14,3 4,5 14,3 4,5 14,4 6
    15,3 7
    15,8 8,5 15,8 8,5 16,4 10 16,5 11 17,3 12 18 14 18 14 18 14 18,4 16 19,1 17 21,2 18 21,3 19 2. Вычислим сумму рангов по каждой выборке Т (Массы Щ. Ж. женщин) = 102,5;
    Т (Массы Щ. Ж. мужчин) = 87,5.
    3. Вычислим значение критериев Манна – Уитни для каждой выборки (для женщин и мужчин соответственно
    5
    ,
    42 2
    )
    1 9
    (
    9 5
    ,
    87
    )
    (
    ;
    5
    ,
    46 2
    )
    1 10
    (
    10 5
    ,
    102
    )
    (
    =
    +


    =
    =
    +


    =
    м
    U
    ж
    U
    4. В качестве эмпирического значения критерия Э выберем наименьшее значение Э = 42,5.
    5. Задавшись уровнем значимости 0,05 найдём в таблице 6.2 для объёмов выборок и n
    2
    = 9 критическое значение критерия КР КР = 20
    1   ...   4   5   6   7   8   9   10   11   12


    написать администратору сайта