математика. 26,27,28 матем. 26. Ранжирование. Непараметрическая мера связи между признаками
![]()
|
26.Ранжирование.Непараметрическая мера связи между признаками.При ранжировании эксперт должен расположить оцениваемые элементы в порядке возрастания (убывания) и приписать каждому из них ранги(Ранг — это порядковый номер или место значений признака в ряду расположенных в порядке возрастания или убывания их величин) в виде натуральных чисел. При прямом ранжировании наиболее предпочтительный элемент имеет ранг 1 (иногда 0), а наименее предпочтительный — ранг m. Точность выражения предпочтения путем ранжирования элементов существенно зависит от мощности множества предъявлений. Процедура ранжирования дает наиболее надежные результаты (по степени близости выявленного предпочтения и «истинного»), когда число оцениваемых элементов не более 10. Предельная мощность множества предъявления не должна превосходить 20. Параметрические методы основаны на использовании таких основных количественных параметров распределения, как средние величины, дисперсии и отклонения. Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными) признаками. Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. Если альтернативные признаки представлены только группами с противоположными (взаимоисключающими) характеристиками, тесноту связи в этом случае можно оценить, вычислив коэффициент ассоциации, предложенный английским статистиком Д. Юлом. Для расчета коэффициента ассоциации строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:
Применительно к таблице данный коэффициент выражается формулой ![]() Коэффициент ассоциации может изменяться в интервале от -1 до +1. Признаки будут связаны между собой тем сильнее, чем они будут ближе к +1 или -1. Коэффициент контингенции, предложенный К. Пирсоном: ![]() Коэффициент взаимной сопряженности К. Пирсона: Более совершенным является коэффициент взаимной сопряженности АЛ. Чупрова. Он может быть вычислен по формуле ![]() где к1 — число возможных значений первой статистической величины (число групп по столбцам); к2 — число возможных значений второй статистической величины (число групп по строкам); (р2 — показатель взаимной сопряженности, который определен как сумма отношений квадратов частот клетки таблицы распределения к произведению итоговых частот соответствующего столбца и строк минус единица. Коэффициент Фехнера определяется на основе соотношения знаков отклонений значений исследуемых признаков х и у от их средних величин. Он рассчитывается по следующей формуле: ![]() где а — число совпадений отклонений (Х,-х) и (у, - у) по знаку; b — число несовпадений отклонений (Д - х) и (у, - у) по знаку; (а + Ь) — общее количество значений признака. Чем ближе величина коэффициента к 1, тем теснее взаимосвязи между изучаемыми признаками. Коэффициент корреляции рангов (коэффициент Спирмена), предложенный в 1904 г., рассчитывается по формуле (для случая, когда нет связных рангов): ![]() где di2 — квадраты разности рангов; п — число наблюдений (число пар рангов). Коэффициент Сиирмена принимает любые значения в интервале от-1 до+1. Ранговый коэффициент корреляции Кенделла может также использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты. Он рассчитывается по формуле ![]() где п — число наблюдений; S — сумма разностей между числом последовательностей и числом инверсий по второму признаку (число инверсии является естественной мерой нарушения порядка объектов в одной последовательности относительно другой). Рассмотренные ранговые коэффициенты корреляции имеют то преимущество, что с помощью их можно измерять и оценивать связи как между количественными, так и между атрибутивными признаками, которые поддаются ранжированию. 27. Проверка гипотезы о значимости выборочного коэффициента корреляцииПусть из двумерной совокупности (X,Y) извлечена выборка объёма n и найден выборочный коэффициент корреляции ![]() ![]() Если нулевая гипотеза принимается, то это означает, что X и Y некоррелированы. В противном случае – коррелированны. Чтобы при уровне значимости a проверить гипотезу о равенстве нулю генерального коэффициента корреляции ![]() ![]() ![]() и по таблице критических точек распределения Стьюдента, по заданному уровню значимости a и числу степеней свободы ![]() ![]() ![]() ![]() В нашем случае a=0,05, k=14-2=12. Вычислим наблюдаемое значение критерия: ![]() По таблице критических точек распределения Стьюдента находим критическую точку ![]() ![]() Коэффициент детерминации: ![]() 28. Задачи сравнения средних значений в зависимых совокупностяхПримеры зависимых выборок: - первая и вторая выборки состоят из наблюдений типа «до – после»; - первая выборка – совокупность значений времени самостоятельного выполнения задания, а вторая – совокупность значений времени выполнения задания под наблюдением и при руководстве преподавателя. В практике психологических, педагогических, медицинских исследований часто используются так называемые парные сравнения. При парных сравнениях нельзя использовать методы для независимых выборок, поскольку это приведет к большим ошибкам. Парные сравнения выгодно использовать, если удастся организовать эксперимент так, что будет устранено влияние мешающих факторов (эффект обучения, усталость и т.д.). При парных сравнениях нельзя использовать рассмотренные выше методы для независимых выборок, поскольку это приведет к большим ошибкам. Для сравнения средних значений здесь используется модификация ![]() ![]() Для сравнения средних значений здесь используется модификация ![]() Постановка задачи.Даныдве зависимыевыборки объема ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Условия применения ![]() 1. Измерение признака проведено в шкале интервалов и отношений. 2. Сравниваемые выборки случайно извлекаются из нормальных совокупностей с одинаковой дисперсией. 3. Предполагается, что разность связанных пар результатов измерения ![]() ![]() ![]() Критерий (правило) проверки гипотезы 1. Формулируем нулевую гипотезу ![]() ![]() 2. Формулируем альтернативную гипотезу ![]() 3. Назначаем уровень значимости ![]() 4. Делаем предположение о нормальном распределении разностей ![]() 5. Вычисляется эмпирическое значение ![]() ![]() где величины ![]() ![]() 6. По таблице критических значений ![]() ![]() ![]() ![]() 7. Сравниваем ![]() ![]() ![]() ![]() |