Краткий курс по методам математической статистики краткий курс методы математической статистики
Скачать 1.75 Mb.
|
Тема 9. Параметрические методы сравнения данных Глава 2. Методы проверки статистических гипотез. Корреляции и методы сравнения. Параметрические методы сравнения применяются в том случае, если ваши переменные были измерены в метрической шкале. Сравнение дисперсий 2-х выборок по критерию Фишера. Данный метод позволяет проверить гипотезу о том, что дисперсии 2-х генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Ограничения метода - распределения признака в обеих выборках не должны отличаться от нормального. Альтернативой сравнения дисперсий является критерий Ливена, для которого нет необходимости в проверке на нормальность распределения. Данный метод может применяться для проверки предположения о равенстве (гомогенности) дисперсий перед проверкой достоверности различия средних по критерию Стьюдента для независимых выборок разной численности. Критерий t-Стьюдента для одной выборки Данный метод позволяет проверить гипотезу о том, что среднее значение изучаемого признака отличается от некоторого известного значения. Исходное предположение – распределение признака в выборке приблизительно соответствует нормальному. Пример. Был проведен эксперимент по выявлению уровня агрессивности у охранников, в ходе которого необходимо было выявить влияние «рабочей обстановки» на эмоциональное состояние обследуемых. Исходя из вышеприведенного примера, в качестве изучаемого признака выступит среднее число уровня агрессивности, а известное значение – это тот уровень агрессивности, который, например, по данным той методики, которую вы использовали в эксперименте, определяет средний уровень развития данного свойства. www.statwork.net 24 Таким образом, в ходе данной методики будет доказано, достоверно выше или достоверно ниже нормы, а также возможно и не отличается от среднего уровня развития исследуемого свойства. Критерий t-Стьюдента для независимых выборок Данный метод сравнения позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Исходные предположения – 1) одна выборка извлекается из одной генеральной совокупности, а другая выборка, независимая от первой, извлекается из другой генеральной совокупности; 2) распределение признака в обеих выборках приблизительно соответствует нормальному; 3) дисперсии признака в 2-х выборках примерно одинаковы (гомогенны). Альтернатива методу – непараметрический U-критерий Манна-Уитни (если распределение признака хотя бы в одной выборке отличается от нормального или дисперсии статистически достоверно различаются). Результатом данного анализа будет наличие или отсутствие достоверного различия между двумя группами испытуемых, учитывая, конечно, уровень достоверности (p<0,05). В программе Statistica реализовано 2 способа сравнения данных с помощью данного метода – это 1) по группам и 2) по переменным. Выделение этих двух способов обработки очень удобно, так как основаны они на обработке двух разных матриц данных. Так, первый способ актуален, если Вы построили матрицу исходных данных одной группы испытуемых над другой, а второй способ – когда каждый столбец с данными представляет исходную информацию только одной группы испытуемых. Критерий t-Стьюдента для зависимых выборок Этот метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Зависимая выборка – когда определенные признак измерен на одной и той же выборке дважды, например, до и после воздействия, лечения и т.п. Исходные предположения – 1) каждому представителю одной выборки поставлен в соответствие представитель другой выборки; 2) данные двух выборок положительно коррелируют; 3) распределение признака в обеих выборках приблизительно соответствует нормальному. Альтернатива методу – непараметрический критерий T- Вилкоксона (если распределение признака хотя бы в одной выборке отличается от нормального и t-критерий Стьюдента для независимых выборок (если данные для двух выборок не коррелируют положительно). Более подробно об использовании данных методов сравнения, Вы можете узнать из ВИДЕОКУРСА ПО СТАТИСТИКЕ «БАЗОВЫЙ УРОВЕНЬ» www.statwork.net 25 Тема 10. Непараметрические методы сравнения для независимых выборок Глава 2. Методы проверки статистических гипотез. Корреляции и методы сравнения. Сравнение 2-х независимых выборок Критерий серий Вальда-Вольфовица Критерий серий Вальда-Вольфовица представляет собой непараметрическую альтернативу t- критерию для независимых выборок. Данные имеют тот же вид, что и в t-критерии для независимых выборок. Данные должны содержать группирующую (независимую) переменную, принимающую, по крайней мере, два различных значения (кода), чтобы однозначно определить, к какой группе относится каждое наблюдение в файле данных. Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале. Критерий серий Вальда-Вольфовица устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию). Серия составляется таким образом. Сначала вычисляется медиана, а затем берется каждое отдельное значение и сравнивается с медианой. Если выбранное значение больше медианы, то ставится, например, плюс, а если меньше – минус. Таким образом, данные приводятся к бинарному виду. Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными. Критерий серий Вальда-Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения. Нулевая гипотеза состоит в том, что обе выборки извлечены из одной и той же популяции, то есть данные однородны. www.statwork.net 26 U-критерий Манна-Уитни Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерию для независимых выборок. Опция предполагает, что данные расположены таким же образом, что в и t-критерии для независимых выборок. В частности, данные должны содержать группирующую переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе. Критерий U Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Заметим, что во всех ранговых методах делаются поправки на совпадающие ранги. Интерпретация теста, по существу, похожа на интерпретацию результатов t-критерия для независимых выборок за исключением того, что U-критерий вычисляется как сумма индикаторов парного сравнения элементов первой выборки с элементами второй выборки. U-критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерию для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий. Двухвыборочный критерий Колмогорова-Смирнова Критерий Колмогорова-Смирнова - это непараметрическая альтернатива t-критерию для независимых выборок. Формально он основан на сравнении эмпирических функций распределения двух выборок. Данные имеют такую же организацию, как в t-критерии для независимых выборок. Они должны содержать кодовую (независимую) переменную, имеющую, по крайней мере, два различных кода для однозначного определения, к какой группе принадлежит каждое наблюдение. Критерий Колмогорова-Смирнова проверяет гипотезу о том, что выборки извлечены из одной и той же популяции, против альтернативной гипотезы, когда выборки извлечены из разных популяций. Иными словами, проверяется гипотеза однородности двух выборок. Однако в отличие от параметрического t-критерия для независимых выборок и от U-критерия Манна-Уитни, который проверяет различие в положении двух выборок, критерий Колмогорова- Смирнова также чувствителен к различию общих форм распределений двух выборок (в частности, различия в рассеянии, асимметрии и т. д.). Сравнение более 2-х независимых выборок ANOVA Краскела-Уоллиса и медианный тест www.statwork.net 27 Эти два теста являются непараметрическими альтернативами однофакторного дисперсионного анализа. Мы применяем t-критерий, чтобы сравнить средние значения двух переменных. Если переменных больше двух, то применяется дисперсионный анализ. Английское сокращение дисперсионного анализа - ANOVA (analysis of variation). Критерий Краскела-Уоллиса основан на рангах (а не на исходных наблюдениях) и предполагает, что рассматриваемая переменная непрерывна и измерена как минимум в порядковой шкале. Критерий проверяет гипотезу: имеют ли сравниваемые выборки одно и то же распределение или же распределения с одной и той же медианой. Таким образом, интерпретация критерия схожа с интерпретацией параметрической однофакторной ANOVA за исключением того, что этот критерий основан на рангах, а не на средних значениях. Медианный тест - это «грубая» версия критерия Краскела-Уоллиса. При нулевой гипотезе (все выборки извлечены из популяций с равными медианами) ожидается, что примерно 50% всех наблюдений в каждой выборке попадают выше (или ниже) общей медианы. Медианный тест особенно полезен, когда шкала содержит искусственные границы, и многие наблюдения попадают в ту или иную крайнюю точку (оказываются «вне шкалы»). Более подробно об использовании данных методов сравнения, Вы можете узнать из ВИДЕОКУРСА ПО СТАТИСТИКЕ «БАЗОВЫЙ УРОВЕНЬ» www.statwork.net 28 Тема 11. Непараметрические методы сравнения для зависимых выборок Глава 2. Методы проверки статистических гипотез. Корреляции и методы сравнения. Сравнение 2-х зависимых выборок Критерий знаков Это непараметрическая альтернатива t-критерию для зависимых выборок. Критерий применяется в ситуациях, когда исследователь проводит два измерения (например, при разных условиях) одних и тех же субъектов и желает установить наличие или отсутствие различия результатов. Для применения этого критерия требуются очень слабые предположения (например, однозначная определенность медианы для разности значений). Не нужно никаких предположений о природе или форме распределения. При нулевой гипотезе (отсутствие эффекта обработки) число положительных разностей имеет биномиальное распределение со средним, равным половине объема выборки (положительных разностей будет примерно столько же, сколько отрицательных). Основываясь на биномиальном распределении, можно вычислить критические значения. Критерий Вилкоксона Критерий Вилкоксона парных сравнений является непараметрической альтернативой t- критерию для зависимых выборок. После выбора опции на экране появится диалоговое окно, в котором можно выбрать переменные из двух списков. Каждая переменная первого списка сравнивается с каждой переменной второго списка. Это то же самое расположение данных, что и в F-критерии (зависимые выборки) в модуле Основные статистики и таблицы. Предполагается, что рассматриваемые переменные ранжированы. W - статистика Вилкоксона равна сумме рангов элементов второй выборки в общем вариационном ряду двух выборок. Итак, наблюдения двух групп объединяются, строится общий вариационный ряд и вычисляется сумма рангов второй группы в построенном ряде. www.statwork.net 29 Требования к критерию Вилкоксона более строгие, чем к критерию знаков. Однако если они удовлетворены, то критерий Вилкоксона имеет большую мощность, чем критерий знаков. Более подробно об использовании критерия Вилкоксона, Вы можете узнать из ВИДЕОКУРСА ПО СТАТИСТИКЕ «БАЗОВЫЙ УРОВЕНЬ» Сравнение более 2-х зависимых выборок Критерий χ 2 Фридмана и коэффициент конкордации (согласия) Кендалла χ 2 Фридмана - это непараметрическая альтернатива однофакторному дисперсионному анализу с повторными измерениями (ANOVA). Коэффициент конкордации (согласия) Кендалла - аналог R Спирмена (непараметрический коэффициент корреляции между двумя переменными), когда число переменных больше двух. Критерий χ 2 Фридмана может быть более эффективен, чем его метрический аналог ANOVA в случаях повторных измерений изучаемого признака на небольших выборках. Критерий χ 2 Фридмана основан на ранжировании ряда повторных измерений для каждого объекта выборки. Затем вычисляется сумма рангов для каждого из условий (повторных измерений). Если выполняется статистическая гипотеза об отсутствии различий между повторными измерениями, то можно ожидать примерное равенство сумм рангов для этих условий. Чем больше различаются зависимые выборки по изучаемому признаку, тем больше эмпирическое значение критерия Фридмана. www.statwork.net 30 Тема 12. Методы сравнения номинальных данных Глава 2. Методы проверки статистических гипотез. Корреляции и методы сравнения. χ 2 Пирсона (Chi-square или хи-квадрат Пирсона) или критерий согласия Данный метод сравнения используется, если Ваши данные измерены в номинальной шкале и имеют две и более градации. Однако, это не означает, что если ваши данные представлены в других шкалах, то этот метод использовать нельзя. При сопоставлении нескольких градаций чаще всего проверяют гипотезу о том, различаются ли по численности соответствующие доли совокупности. Таким образом, при выявлении достоверных различий, можно сделать вывод о том, что распределение предпочтений является неравномерным. Однако, при использовании более двух градаций, мы не можем утверждать о том, что в какой-то конкретной ячейке наблюдений больше, а в какой-то меньше. Для того, чтобы выявить в какой ячейке больше, а в какой меньше наблюдений, необходимо воспользоваться дополнительной статистической проверкой. Это касается не только данного метода сравнения. При использовании любых методов множественных сравнений (например, ANOVA Краскела-Уоллиса, χ 2 Фридмана) для конкретизации полученных результатов (подтвердилась гипотеза о не тождественности результатов) необходимо использовать парные сравнения величин. Распределение вероятных значений случайной величины χ 2 непрерывно и ассиметрично. Оно зависит от числа степеней свободы и приближается к нормальному распределению по мере увеличения числа наблюдений. Поэтому применение критерия χ 2 к оценке дискретных распределений сопряжено с некоторыми погрешностями, которые сказываются на его величине, особенно на малочисленных выборках. Для получения более точных оценок выборка, распределяемая в вариационный ряд, должна иметь не мене 50 вариант. Таблицы сопряженности Таблицы сопряженности или кросстабуляция - это процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка в построенной таблице представляется единственной комбинацией значений или уровней табулированных переменных. www.statwork.net 31 Каждая ячейка таблицы сопряженности содержит информацию о количестве объектов, попадающих в группу, определенную комбинацией двух значений. В применении к анализу опросных листов это означает, что исследователь может, например, получить информацию о количестве мужчин, имеющих информацию о товаре (количество человек, ответивших на вопрос о поле – "муж.", и на вопрос о известности товара – "известен"). Обычно используются категориальные или номинальные переменные или переменные с относительно небольшим числом значений. Если вы хотите табулировать непрерывную переменную (например, доход), то вначале ее следует перекодировать, разбив диапазон изменения на небольшое число интервалов (например, доход: низкий, средний, высокий). Простейшая форма кросстабуляции - это таблица сопряженности 2x2, в которой значения двух переменных "пересечены" (сопряжены) на разных уровнях и каждая переменная принимает только два значения, т.е. имеет два уровня. Результатом данного метода являются следующие показатели: 1) χ 2 Пирсона - это наиболее простой критерий проверки значимости связи между двумя категоризованными переменными. Критерий Пирсона основывается на том, что в двувходовой таблице ожидаемые частоты при гипотезе "между переменными нет зависимости" можно вычислить непосредственно. 2) Йетса χ 2 . Аппроксимация статистики χ 2 для таблиц 2x2 с малыми числом наблюдений в ячейках может быть улучшена уменьшением абсолютного значения разностей между ожидаемыми и наблюдаемыми частотами на величину 0,5 перед возведением в квадрат (это и есть поправка Йетса). Поправка Йетса, делающая оценку более умеренной, обычно применяется в тех случаях, когда таблицы содержат только малые частоты, например, когда некоторые ожидаемые частоты становятся меньше 10. 3) Точный критерий Фишера (критерий Фишера-Ирвина, точный метод Фишера). Этот критерий применим только для таблиц 2x2. Критерий основан на следующем рассуждении. Даны маргинальные частоты в таблице (частоты, расположенные по краям таблицы), предположим, что обе табулированные переменные независимы. Зададимся вопросом: какова вероятность получения наблюдаемых в таблице частот, исходя из заданных маргинальных? Таким образом, критерий Фишера вычисляет точную вероятность появления наблюдаемых частот при нулевой гипотезе (отсутствие связи между табулированными переменными). В таблице результатов приводятся как односторонние, так и двусторонние уровни. 4) Фи-квадрат представляет собой меру связи между двумя переменными в таблице 2x2. Его значения изменяются от 0 (нет зависимости между переменными; χ 2 = 0.0) до 1 (абсолютная зависимость между двумя факторами в таблице). 5) χ 2 Макнимара применяется, когда частоты в таблице 2x2 представляют зависимые выборки. Например, наблюдения одних и тех же индивидуумов до и после эксперимента. Вычисляются два значения χ 2 : A/D и B/C. A/D χ 2 проверяет гипотезу о том, что частоты в ячейках A и D www.statwork.net 32 (верхняя левая, нижняя правая) одинаковы. B/C χ 2 проверяет гипотезу о равенстве частот в ячейках B и C (верхняя правая, нижняя левая). Хотелось бы отметить, если Вам необходимо просто сравнить наблюдения в двух группах, то проще всего это сделать в программе Statistica, но если Вам необходимо провести более сложные сравнения, например, исследование влияние расы на количество детей в семье и времени обучения в средней школе, тогда Вам необходимо использовать программу SPSS. Q-критерий Кохрена Q-критерий Кохрена – это развитие критерия χ 2 Макнемара. Критерий проверяет, значимо или нет различаются между собой несколько сравниваемых переменных, принимающих значения 0- 1. |