Курс лекций. Теория статистики Пособие для студентов, обучающихся по дистанционной системе Введение Статистика
Скачать 2.79 Mb.
|
Общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:, Логика этого закона проста: общая дисперсия, возникающая под воздействием всех факторов, формируется из дисперсии, возникающей за счет фактора группировки и дисперсии, возникающей под воздействием всех прочих факторов. С помощью закона сложения дисперсий можно оценить удельный вес факторов, лежащих в основе группировки, во всей совокупности факторов, воздействующих на результативный признак. Для этого применяется коэффициент детерминации, который рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака: Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением: . Эмпирическое корреляционное отношение показывает какую часть общей колеблемости результативного признака определяет изучаемый фактор, то есть характеризует влияние группировочного признака на результативный признак. Этот показатель принимает значения в интервале [0,1]. Если связь отсутствует, то = 0. В этом случае дисперсия групповых средних равна нулю (2 = 0), то есть все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х. Если связь функциональная, то = 1. В этом случае дисперсия групповых средних равна общей дисперсии (2 = 2), то есть не будет внутригрупповой дисперсии. Это означает, что группировочный признак полностью определяет вариацию изучаемого признака а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются по степени их близости к предельным. Качественная оценка связи между признаками
Пример. Рассчитать дисперсию, коэффициент детерминации и эмпирическое корреляционное отношение по данным таблицы. Группировка населения отдельных областей России по среднему размеру ежемесячных денежных льгот пенсионеров
Сначала найдем средний размер льгот по трем областям в целом: Вариация льгот по отдельным областям, обусловленная различием в местах проживания пенсионеров, характеризуется межгрупповой дисперсией: Средняя из групповых дисперсий дает обобщающую характеристику случайной вариации, обусловленную отдельными факторами, кроме места проживания пенсионеров (например, характером занятости, стажем работы и т.п.): Вариация льгот в изучаемых областях России, обусловленная влиянием всех факторов, вместе взятых, определяется общей дисперсией: отсюда Полученный коэффициент детерминации показывает, что дисперсия льгот зависит от места проживания пенсионеров на 32,5 %. Остальные 67,5% определяются множеством других неучтенных факторов. Полученное значение эмпирического корреляционного отношения позволяет утверждать, что существует заметная связь между местом проживания пенсионеров и размером льгот. Пример. Большая торговая компания заказала опрос, цель – выяснение влияния фактора повышения квалификации на результаты работы агентов по продажам. Опрос 8 торговых агентов дал следующие результаты:
Среднее число контрактов, заключенных агентами: . В данном примере переподготовка – факторный признак, а число заключаемых контрактов – результативный. Сгруппируем эти данные по признаку переобучения и рассчитаем средние по каждой группе.
, где n1 – число признаков в первой группе. Или по формуле для взвешенных вариант , где fi – частоты ряда. , где n2 – число признаков во второй группе. Рассчитаем дисперсию в каждой группе. Дисперсия числа заключенных контрактов у агентов, прошедших переобучение:
Дисперсия числа заключенных контрактов у агентов, не прошедших переобучение:
Рассчитаем среднюю из внутригрупповых дисперсий: Этот показатель характеризует влияние на результативный признак всех прочих факторных признаков за исключением признака, положенного в основу группировки. Очевидно, что различие в числе заключенных контрактов в двух группах вызвано тем, что брокеры первой группы прошли переобучение, а брокеры второй группы не прошли. Найдем дисперсию между группами (межгрупповую дисперсию). Согласно формуле : Этот показатель характеризует влияние на результативный признак факторного признака, положенного в основу группировки. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий: Проверим верность правила сложения дисперсий. Рассчитаем общую дисперсию числа заключенных контрактов
2 = 8/8 = 1,00 В самом деле, 1,00 = 0,5625 + 0,4375. По данным примера эмпирическое корреляционное отношение равно: Следовательно, фактор, положенный в основу группировки, существенно влияет на число заключаемых агентами контрактов, но существуют и другие факторы, влияние которых тоже заметно. |