Данные группируются по признаку. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет прямая связь или обратная линейная или нелинейная
Скачать 120.95 Kb.
|
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная. Так как в основание группировки положен непрерывный количественный признак, то число групп определяют одновременно с размером интервала. Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса: n = 1 + 3,322log n = 1 + 3,322log(25) = 6 Ширина интервала составит: Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
Аналитическая группировка по X и Y1.
Аналитическая группировка по X и Y2.
Итоговая аналитическая группировка.
Исходные данные
Тогда имеем 2 группы, для которых необходимо рассчитать групповую среднюю и внутригрупповые дисперсии. 1. Находим средние значения каждой группы. 2. Находим среднее квадратическое каждой группы. Результаты расчета сведем в таблицу:
3. Внутригрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака в пределах группы под действием на него всех факторов, кроме фактора, положенного в основание группировки: Среднюю из внутригрупповых дисперсий рассчитаем по формуле: 4. Межгрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него фактора (факторного признака), положенного в основание группировки. Межгрупповую дисперсию определим как: где Тогда Общая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него всех без исключения факторов (факторных признаков). Общая дисперсия будет равна: σ = 93.35 + 0.57 = 93.92 Общую дисперсию также можно рассчитать и по формуле: Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии: Определяем эмпирическое корреляционное отношение: Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < η < 0.3: слабая; 0.3 < η < 0.5: умеренная; 0.5 < η < 0.7: заметная; 0.7 < η < 0.9: высокая; 0.9 < η < 1: весьма высокая; В нашем примере связь между признаком Y фактором X слабая Коэффициент детерминации. Определим коэффициент детерминации: Таким образом, на 0.61% вариация обусловлена различиями между признаками, а на 99.39% – другими факторами. |