Биометрия верстка_. Учебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия
Скачать 0.93 Mb.
|
VI. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА Сущностью решения многих статистических задач является проверка некоторого заранее выдвигаемого предположения – так называемой нулевой гипотезы. При выявлении различия между выборками наиболее распространённой нулевой гипотезой является предположение о том, что наблюдаемое расхождении выборок по каким – либо признакам является случайным, недостоверным. При выявлении взаимосвязи между переменными сравниваемых выборок в качестве нулевой гипотезы обычно выдвигается предположение об отсутствии взаимосвязи между этими переменными. Нулевая гипотеза принимается, если вероятность ошибки при её отбрасывании превышает некоторое наперёд заданное значение. Вероятность ошибки при отбрасывании нулевой гипотезы (хотя она верна) называется уровнем значимости (общепринятым обозначением уровня значимости является Вероятность ошибки при отбрасывании нулевой гипотезы оценивается пут м вычисления различного рода критериев и сравнения полученных значений с критическими. Критические значения критериев для заданных уровней значимости и объёмов выборок находят в соответствующих таблицах. Как правило, таблицы критических значений критериев рассчитаны для уровней значимости α = 0,1; α = 0,05 и α = 0,01, что соответствует вероятностям справедливости нулевой гипотезы 0,9, 0,95 и 0,99 соответственно. В зависимости от результатов сравнения нулевая гипотеза принимается либо отвергается. Различают критерии сдвига, однородности, согласия, нормальности и др. Критерии сдвига чувствительны к отличию центров распределения сравниваемых выборок, например, отличия средних значений выборок. При этом предполагается, что законы распределения переменных в выборках отличаются незначительно. Примером таких критериев является статистический критерий значимости Стьюдента, описанный в разделе III. С помощью критериев однородности проверяется предположение о принадлежности сравниваемых выборок к одному распределению, либо о близости значений параметров распределений, например математического ожидания, дисперсии и других. Критерии согласия используются для проверки эмпирического распределения заданному теоретическому (например, нормальному) или соответствия другому эмпирическому распределению. При решении этих задач часто используется критерий Колмогорова – Смирнова [4,5]. В зависимости оттого, подчиняются эмпирические распределения нормальному закону или нет, применяют соответственно параметрические или непараметрические критерии. Каждому параметрическому критерию есть свой непараметрический аналог. Описанные в настоящем разделе примеры решения задач относятся к непараметрическим критериям сдвига. 76 6.1 Общая характеристика непараметрических методов Описанные в разделах III - V методы статистического анализа относятся к параметрическим методам, так как в процессе вычислений используются параметры распределений – выборочные средние, дисперсии и стандартные отклонения. Применение этих методов предполагает, что члены совокупностей являются непрерывными величинами, а их распределение в выборках подчиняется нормальному закону распределения (см. выражение 2.13). Однако это условие выполнятся далеко не всегда. Существует множество величин и ситуаций когда наблюдаемое эмпирическое распределение не подчиняется нормальному закону. Другим фактором, часто ограничивающим применимость параметрических методов, является объем выборки. Если выборка очень мала, то проверить предположение о соответствии эмпирического распределения нормальному практически невозможно. Во всех случаях, когда нет уверенности в правомерности применения параметрических методов, следует применять непараметрические методы статистического анализа Непараметрические методы могут применяться для малых выборок, не требуют каких – либо предположений о соответствии эмпирического распределения какому либо закону (в том числе нормальному) и не основываются на вычислении параметров распределений - выборочных среднего, дисперсии и стандартного отклонения (отсюда и название методов - непараметрические. Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными. Непараметрические методы являются единственно возможными также в случаях, когда изучаемый признак характеризуется не количественными, а качественными величинами, например, порядковыми номерами, индексами, знаками « + » или « - » и т. д. С помощью непараметрических методов в основном решаются задачи выявления значимости различия между эмпирическими распределениями и установления факта взаимосвязи между переменными сравниваемых выборок. Методы решения этих задач основываются на вычислении различного рода критериев, являющихся аналогами соответствующих параметрических критериев. Однако чувствительность непараметрических критериев (обычно используется термин мощность критерия) ниже по сравнению со своими параметрическими аналогами. Согласно литературным данным мощность непараметрических критериев составляет 95% от мощности своих параметрических аналогов [4]. Поэтому применение параметрических методов статистического анализа является предпочтительным, если условия задачи допускают возможность их использования. 6.2 Характеристика исходных данных Выбор того или иного непараметрического метода при решении данной конкретной задачи (например, задачи о различии двух выборок) определяется исходными данными. Главные факторы, определяющие этот выбор, перечислены ниже. 77 1. Тип величин в выборках – являются они количественными или качественными, те. выражаются они в числовой или в символьной формах. 2. Тип шкалы, в которой выражаются значения исследуемых величин. Различают четыре типа шкал измерения Номинальная (категориальная используется для качественной классификации переменных величины, выраженные в такой шкале являются символьными и не поддаются упорядочиванию (например, такие характеристики как пол человека, здоров он или болен, национальность, символьные значения переменных «+» или «-», цвет исследуемого объекта и т. д. Порядковая (ординальная тип величин – символьный, однако переменные в такой шкале поддаются упорядочиванию, те. ранжированию (например, очень высокий, высокий, средний, маленький и т. д. Интервальная тип величин количественный, те. выражается в числовой форме, в такой шкале ряд может быть ранжирован в определённом порядке Относительная (шкала отношений величины выражаются в числовой форме и, следовательно, могут быть ранжированы. В большинстве статистических процедур для переменных, выраженных в интервальной и относительной шкалах не делается различия. 3. Являются ли выборки несвязанными или связанными друг с другом например, если эффективность метода лечения проверяется на различных группах пациентов, то выборки являются несвязанными если изучается состояние одних и тех же пациентов дои после лечения, то выборки следует считать связанными. 4. Объём выборок - наименьшее и наибольшее его значение наименьшее допустимое значение объёма определяет возможность использования того или иного метода наибольшее значение не должно быть слишком большим, т. к. согласно центральной предельной теореме теории вероятностей при больших объёмах выборок любое распределение случайных величин стремится к нормальному [5]. Следовательно, применение в этих условиях непараметрических методов является нецелесообразным. Поэтому объёмы выборок в статистических таблицах критических значений непараметрических критериев обычно не превышают 20 – 50. 5. Количество сопоставляемых выборок – две или более. 6.3 Определение и оценка значимости различия выборок Основой вычислительной процедуры непараметрических методов является вычисление критерия, значение которого сравнивается с критическим значением этого критерия. Критическое значение критерия находят в соответствующих таблицах для заданных объёмов выборок и уровня значимости. Ниже приводится краткая характеристика некоторых наиболее распространённых в практике статистического анализа непараметрических критериев, назначение которых – выявление и оценка достоверности различия выборочных совокупностей. 78 6.3.1 Сравнение двух независимых выборок 1. Q – критерий Розенбаума. [6] С помощью этого критерия решается задача определения достоверности превышения уровнем значений элементов одной выборки уровня значений другой. Выборки предполагаются независимыми, шкала величин – количественная. Проверяемая нулевая гипотеза является следующей уровень значений элементов выборки №1 не выше уровня значений элементов выборки №2. Алгоритм вычисления критерия заключается в следующем. За выборку №1 принимают выборку, в которой значения элементов предположительно превышают значения элементов выборки №2. Выборки ранжируют в порядке убывания. Затем находят число данных первого ряда S1, превышающих наибольшее значение элементов второго и число данных второго ряда S2 , меньших наименьшего значения элементов первого ряда. Критерий Q вычисляют по формуле Q = S1 + S2 Достоверность различия определяется по таблицам. Чем выше значение Q, тем достовернее различие между выборками. Условия применимости критерия. Объёмы выборок должны быть примерно одинаковыми и не менее 11, значения признака в выборках должны варьироваться в некоторых пределах и диапазоны варьирования не должны совпадать, тип данных – количественный. 2. Х – критерий Ван-дер-Вердена [1] Применяется для сравнения двух независимых выборок. Нулевая гипотеза сводится к предположению, что обе выборки извлечены из генеральных совокупностей с одинаковыми функциями распределения. Х – критерий Ван-дер-Вердена относится к ранговым критериям, когда в вычислениях используются не сами значения величина их порядковые номера (ранги) в общем ранжированном ряду. Алгоритм вычисления следующий. Обе выборки объёмами n 1 и n 2 ранжируют в один общий ряд в порядке возрастания значений признака. Каждому члену ряда присваивается номер (ранг) в соответствии с занимаемым им местом в общем ряду. Для выборки, меньшей по объёму с помощью специальных таблиц функций ) 1 /( ( + N R ψ вычисляется Х – критерий где R – ранг члена выборки, а N = n 1 + n 2 - суммарный объём всего ранжированного ряда. Найденное значение критерия Х сопоставляется с критическим Х КР , находимым в таблицах для заданных значений n 1 - n 2. и уровня значимости. При КР Х Х ≥ нулевая гипотеза отвергается, те. при принятом уровне значимости можно считать, что обе выборки извлечены из разных генеральных совокупностей. Это означает, что различие между выборками является значимым. Условия применимости критерия. Тип данных - количественный, отличие объё- мов n 1 - n 2 ограничено таблицей значений КР. 3. Критерий Вальда – Вольфовица [5] Критерий применяется для сравнения двух независимых выборок. Проверяемая нулевая гипотеза заключается в следующем обе выборки извлечены из одной генеральной совокупности, те. не отличаются между собой по наблюдаемому признаку. Критерий Вальда – Вольфовица относится к критериям серий. Это связано с алгоритмом вычисления критерия, который заключается в следующем обе выборки ранжи- руются в общий вариационный ряда принадлежность переменной к той или иной выборки кодируют каким либо способом, например как «1» и «2» или как «+» и «-» и т. д. Образуется последовательность серий из одинаковых кодов. Идея заключается в том, что для не отличающихся выборок число таких серий N будет большим. Для выборок, извлечённых из совокупностей с отличающимися средними или дисперсиями, число серий N будет невелико. Критические значения N для заданных объёмов выборок и уровня значимости находят в таблицах. Условия применимости критерия. Тип данных - количественный, объёмы выборок могут быть разными. 4. Двухвыборочный критерий Колмогорова - Смирнова [5] Критерий относится к так называемым непараметрическим критериям согласия. Применяется в тех случаях, когда необходимо определить, подчиняются ли распределения переменных в двух независимых выборках одному и тому же закону распределения, те. извлечены они из одной генеральной совокупности или из разных. При этом закон распределения остаётся неизвестным. Является наиболее широко применяемым для решения этой задачи, поскольку значение критерия достаточно чувствительно к различиям в сопоставляемых эмпирических распределениях. Нулевая гипотеза формулируется следующим образом две исследуемые выборки подчиняются одному закону распределения (те. извлечены из одной генеральной совокупности. Критерий широко применяется также при сопоставлении заданного эмпирического распределения какой либо теоретической модели, например нормальному распределению. Условия применимости критерия. Тип данных – количественный, объём выборок при сравнении двух выборок должен быть значительным (не менее 50). При проверки выборки на нормальность распределения объём выборки может быть незначительным (от 5 и выше) [7,8]. 80 5. Критерий Манна – Уитни [5] Также как и критерий серий Вальда – Вольфовица критерий Манна – Уитни применяется при сравнении двух независимых выборок в целях проверки гипотезы о случайном характере их различия. Является непараметрическим аналогом t – критерия Стьюдента для двух независимых выборок. Проверяемая нулевая гипотеза формулируется как утверждение, что выборки извлечены из одной и той же генеральной совокупности или из совокупностей с одинаковыми параметрами ив частности имеют равные средние и медианы. Критерий относится к ранговым критериям сдвига, поскольку позволяет судить о достоверности отличия центров эмпирических распределений (например, выборочных средних, а значения переменных в выборках заменяются рангами в соответствии с занимаемым переменными местом в общем ряду. Алгоритм вычисления основывается на нахождении зоны перекрытия сравниваемых выборок. Если эта зона мала, то выборки, скорее всего, отличаются, если же велика, то справедливо противоположное утверждение. Ширина зоны определяется критическими значениями критерия (Т Н ) и (Т В ), вычисленными при заданном уровне значимости. Если эмпирический критерий находится в пределах этой зоны, то нулевая гипотеза не отвергается. Это означает, что при принятом уровне значимости расхождение выборок (отличие центров их распределений) следует считать случайным. Достоинством критерия Манна – Уитни является достаточно высокая мощность и возможность его применения для малых выборок. Условия применимости критерия. Тип данных – количественный. Возможен также символьный тип данных, если эти данные образуют порядковую шкалу, те. могут быть ранжированы в определённом порядке (например высокий рост, средний рост, малый рост и т. д. Объёмы выборок n 1 и n 2 должны быть не менее и могут быть разными. В крайнем случае, допускается соотношение объёмов как 2 к 5 и более. Но объём каждой выборки не должен быть слишком большим, т. к. при больших объёмах распределение критерия становится примерно нормальным по некоторым данным – не более 60). Так, согласно данным [4], распределение критерия Т Э (см. табл) приближается к нормальному с математическим ожиданием Ми стандартным отклонением ( ) 12 1 + + ⋅ ⋅ = b m b m n n n n σ уже при объёмах выборок n > 8. Эмпирический критерий в этом случае может быть вычислен как Э, а его критическое значение можно определить по таблице t - критериев Стьюдента [4] . Существует несколько способов использования критерия и формулировки условий справедливости нулевой гипотезы. Некоторые из них перечислены таблице Таблица 6.1 Способы использования критерия Манна – Уитни и формулировки условий справедливости нулевой гипотезы Вид эмпирического критерия Условие справедливости нулевой гипотезы Литературный источник [4] Э Т – сумма рангов наименьшей из выборок Если Н Э Т T ≤ или В Э Т Т ≥ тону- левая гипотеза отклоняется. Т Н и Т В находят в таблицах. Литературный источник [4] Если объём выборки n > 8 T Т Э T z σ μ − = Если t z ≤ то нулевая гипотеза отклоняется коэффициент Стью- дента, находят в таблицах критических значений t ( двусторонний вариант ). Литературный источник [5] 2 2 2 2 1 2 1 1 1 2 1 1 2 ) 1 ( 2 ) 1 ( Т n n n n w Т n n n n w − + + = − + + = при правильном вычислении 2 1 2 Если 1 Т w Э ≤ или 2 Т w Э ≥ , тону- левая гипотеза отклоняется. w 1 и w 2 находят в таблицах. В качестве Э принимают наименьшее значение Литературный источник [1] 2 ) 1 ( 2 ) 1 ( 2 2 2 2 1 1 1 1 + − = + − = n n Т U n n Т U Т 1 и Т – суммы рангов выборок Если КР Э U U ≥ то нулевую гипотезу отвергнуть нельзя. В качестве Э принимается наименьшее значение В настоящем пособии за эмпирический критерий принято наименьшее значение критерия U [1]. 6.3.2 Сравнение нескольких независимых выборок 1. Однофакторный дисперсионный анализ Краскела – Уоллиса [4,5] Данный анализ является непараметрическим аналогом однофакторного дисперсионного анализа независимых выборок и предназначен для решения вопроса о принадлежности выборочных совокупностей одной генеральной, те. является обобщением критерия Манна – Уитни для случая, когда число сравниваемых выборок k > 2. Нулевая гипотеза формулируется следующим образом выборки объёмами n 1 , n 2 …….n извлечены из одной генеральной совокупности, те. все выборки имеют одинаковое распределении. Методика вычисления критерия Краскела – Уоллиса примерно такая же, что и при вычислении критерия Манна – Уитни. Все выборки ранжируются в один общий вариационный ряд в порядке возрастания, каждому члену ряда присваивается номер (ранг. Совпадающим значениям присваивается общий средний ранг в соответствии стем местом, которое занимают в общем ряду эти совпадающие значения. Ранги суммируются по каждой выборке и вычисляется средний для каждой выборки ранг. При отсутствии межгрупповых различий средние ранги групп должны быть примерно равными. Напротив, если существует значительное расхождение средних рангов, то нулевую гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала—Уоллиса и является мерой такого расхождения средних рангов. Критерий вычисляется по формуле [5]: ). 1 ( 3 ) 1 ( 12 Другая форма записи критерия имеет вид [4]: ( ) ( ) 2 1 1 12 R R n n n H i k i i − ⋅ ⋅ + ⋅ = = , В этих выражениях R i – сумма рангов по каждой выборке, i R - среднее значение ранга по каждой выборке, R - средний ранг объединённого ряда, n – общее число наблюдений количество групп (выборок. Значение критерия сопоставляется с критическим, которое находят в таблице для заданных объёмов и числа выборок. Условия применимости критерия. Объём выборок должен соответствовать их числу. Так для трёх выборок объём каждой выборки должен быть не менее 5, для че- тырёх – не менее 10. В противном случае критическое значение критерия находят в таблицах, которые имеются для ограниченных объёмов и числа выборок [4]. Тип данных количественный. |