Главная страница

математика. 26,27,28 матем. 26. Ранжирование. Непараметрическая мера связи между признаками


Скачать 66.72 Kb.
Название26. Ранжирование. Непараметрическая мера связи между признаками
Анкорматематика
Дата06.06.2021
Размер66.72 Kb.
Формат файлаdocx
Имя файла26,27,28 матем.docx
ТипДокументы
#214645

26.Ранжирование.Непараметрическая мера связи между признаками.


При ранжировании эксперт должен расположить оцениваемые элементы в порядке возрастания (убывания) и приписать каждому из них ранги(Ранг — это порядковый номер или место значений признака в ряду расположенных в порядке возрастания или убывания их величин) в виде натуральных чисел. При прямом ранжировании наиболее предпочтительный элемент имеет ранг 1 (иногда 0), а наименее предпочтительный — ранг m.

Точность выражения предпочтения путем ранжирования элементов существенно зависит от мощности множества предъявлений. Процедура ранжирования дает наиболее надежные результаты (по степени близости выявленного предпочтения и «истинного»), когда число оцениваемых элементов не более 10. Предельная мощность множества предъявления не должна превосходить 20.

Параметрические методы основаны на использовании таких основных количественных параметров распределения, как средние величины, дисперсии и отклонения.

Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными) признаками. Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей.

Если альтернативные признаки представлены только группами с противоположными (взаимоисключающими) характеристиками, тесноту связи в этом случае можно оценить, вычислив коэффициент ассоциации, предложенный английским статистиком Д. Юлом.

Для расчета коэффициента ассоциации строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:

а

Ь

а + b

с

d

c + d

а + с

b + d

а + b + с + d

Применительно к таблице данный коэффициент выражается формулой



Коэффициент ассоциации может изменяться в интервале от -1 до +1. Признаки будут связаны между собой тем сильнее, чем они будут ближе к +1 или -1.

Коэффициент контингенции, предложенный К. Пирсоном:



Коэффициент взаимной сопряженности К. Пирсона:

Более совершенным является коэффициент взаимной сопряженности АЛ. Чупрова. Он может быть вычислен по формуле



где к1 число возможных значений первой статистической величины (число групп по столбцам); к2 число возможных значений второй статистической величины (число групп по строкам); (р2 — показатель взаимной сопряженности, который определен как сумма отношений квадратов частот клетки таблицы распределения к произведению итоговых частот соответствующего столбца и строк минус единица.

Коэффициент Фехнера определяется на основе соотношения знаков отклонений значений исследуемых признаков х и у от их средних величин. Он рассчитывается по следующей формуле:



где а — число совпадений отклонений (Х,-х) и (у, - у) по знаку; b — число несовпадений отклонений (Д - х) и (у, - у) по знаку; (а + Ь) — общее количество значений признака.

Чем ближе величина коэффициента к 1, тем теснее взаимосвязи между изучаемыми признаками.

Коэффициент корреляции рангов (коэффициент Спирмена), предложенный в 1904 г., рассчитывается по формуле (для случая, когда нет связных рангов):



где di2 квадраты разности рангов; п — число наблюдений (число пар рангов).

Коэффициент Сиирмена принимает любые значения в интервале от-1 до+1.

Ранговый коэффициент корреляции Кенделла может также использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты.

Он рассчитывается по формуле



где п — число наблюдений; S — сумма разностей между числом последовательностей и числом инверсий по второму признаку (число инверсии является естественной мерой нарушения порядка объектов в одной последовательности относительно другой).

Рассмотренные ранговые коэффициенты корреляции имеют то преимущество, что с помощью их можно измерять и оценивать связи как между количественными, так и между атрибутивными признаками, которые поддаются ранжированию.

27. Проверка гипотезы о значимости выборочного коэффициента корреляции


Пусть из двумерной совокупности (X,Y) извлечена выборка объёма n и найден выборочный коэффициент корреляции Требуется проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции.

Если нулевая гипотеза принимается, то это означает, что X и Y некоррелированы. В противном случае – коррелированны.

Чтобы при уровне значимости a проверить гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе нужно вычислить наблюдаемое значение критерия



и по таблице критических точек распределения Стьюдента, по заданному уровню значимости a и числу степеней свободы найти критическую точку двусторонней критической области. Если | нет оснований отвергать нулевую гипотезу. Если | нулевую гипотезу отвергают.

В нашем случае a=0,05, k=14-2=12. Вычислим наблюдаемое значение критерия:



По таблице критических точек распределения Стьюдента находим критическую точку то нулевую гипотезу отвергаем. Значит, коэффициент корреляции значимо отличается от нуля и величины X и Y коррелированны.

Коэффициент детерминации: . Это означает, что на 93,8% производительность труда на рассматриваемых предприятиях зависит от уровня механизации работ, а на 6,2% производительность труда зависит от других факторов.

28. Задачи сравнения средних значений в зависимых совокупностях


Примеры зависимых выборок:

- первая и вторая выборки состоят из наблюдений типа «до – после»;

- первая выборка – совокупность значений времени самостоятельного выполнения задания, а вторая – совокупность значений времени выполнения задания под наблюдением и при руководстве преподавателя.

В практике психологических, педагогических, медицинских исследований часто используются так называемые парные сравнения. При парных сравнениях нельзя использовать методы для независимых выборок, поскольку это приведет к большим ошибкам.

Парные сравнения выгодно использовать, если удастся организовать эксперимент так, что будет устранено влияние мешающих факторов (эффект обучения, усталость и т.д.). При парных сравнениях нельзя использовать рассмотренные выше методы для независимых выборок, поскольку это приведет к большим ошибкам. Для сравнения средних значений здесь используется модификация -критерия для связанных выборок. Особенность в том, что гипотеза формулируется в отношении разностей сопряженных пар наблюдений.

 

Для сравнения средних значений здесь используется модификация -критерия Стьюдента для зависимых выборок.

Постановка задачи.Даныдве зависимыевыборки объема , то есть связанные пары наблюдений: , , …, . Проверяется гипотеза о равенстве математических ожиданий . Альтернативной гипотезой является гипотеза .

Условия применения -критерия для зависимых выборок

1. Измерение признака проведено в шкале интервалов и отношений.

2. Сравниваемые выборки случайно извлекаются из нормальных совокупностей с одинаковой дисперсией.

3. Предполагается, что разность связанных пар результатов измерения имеет нормальное распределение с параметрами и .

Критерий (правило) проверки гипотезы

1. Формулируем нулевую гипотезу : , что генеральные средние равны.

2. Формулируем альтернативную гипотезу .

3. Назначаем уровень значимости .

4. Делаем предположение о нормальном распределении разностей .

5. Вычисляется эмпирическое значение -критерия по формуле

,

где величины ; .

6. По таблице критических значений -критерия распределения Стьюдента находится критическое значение при уровне значимости и числе степеней свободы .

7. Сравниваем и . Если , то гипотеза отклоняется, так как попало в критическую область. Значит, наблюдаемое различие между средними значениями двух связанных выборок значимо на уровне значимости . Если , то различие между средними значениями двух связанных выборок статистически незначимо.


написать администратору сайта