8. Показатели вариации. 5. 1 Показатели вариации Понятие вариации. Расчет среднего линейного отклонения
Скачать 344 Kb.
|
5.1 Показатели вариации 1. Понятие вариации. Расчет среднего линейного отклонения Различие в индивидуальных значениях признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае. Средняя величина это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены они вблизи или значительно отклоняются от нее. В тех случаях, когда отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются, средняя хорошо представляет всю совокупность. В тех же случаях, когда отдельные значения совокупности далеко отстают от средней, средняя плохо представляет всю совокупность. Колеблемость отдельных значений характеризуют показатели вариации. Термин «вариация» произошел от латинского variatio изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием различных факторов. Различают случайную и систематическую вариации признака. Анализ систематической вариации позволяет оценить степень зависимости изменений в изучаемом признаке от определяющих его факторов. Например, изучая силу и характер вариации в выделяемой совокупности, можно оценить, насколько однородной является данная совокупность в количественном, а иногда и качественном отношении, а, следовательно, насколько характерной является исчисленная средняя величина. Степень близости данных отдельных единиц хi к средней измеряется рядом абсолютных, средних и относительных показателей. Для характеристики совокупностей и исчисленных величин важно знать, какая вариация изучаемого признака скрывается за средним. Для характеристики колеблемости признака используется ряд показателей. Наиболее простой из них размах вариации. Размах вариации (R) это разность между наибольшим (хmax) и наименьшим (хmin) значениями вариантов: R хmax хmin. Пример 1.1 Имеются следующие данные об объемах товарооборота предприятий: Определяем показатель размаха вариации: R 130 – 90 40 (млн руб.). Этот показатель улавливает только крайние отклонения и не отражает отклонений всех вариантов в ряду. Для того чтобы дать обобщающую характеристику распределению отклонений, исчисляют среднее линейное отклонение d, которое учитывает различие всех единиц изучаемой совокупности. Среднее линейное отклонение определяется как средняя арифметическая отклонений индивидуальных значений от средней без учета знака этих отклонений: Порядок расчета среднего линейного отклонения следующий: 1) по значениям признака исчисляется средняя арифметическая: 2) определяются отклонения каждого варианта хi от средней: 3) рассчитывается сумма абсолютных величин отклонений: 4) сумма абсолютных величин отклонений делится на число значений: Пример 1.2 Имеются следующие данные о производительности рабочих: Рассчитаем среднее линейное отклонение: Если данные наблюдения представлены в виде дискретного ряда распределения с частотами, среднее линейное отклонение исчисляется по формуле средней арифметической взвешенной: Порядок расчета среднего линейного отклонения взвешенного следующий: 1) вычисляется средняя арифметическая взвешенная: 2) определяются абсолютные отклонения вариантов от средней: 3) полученные отклонения умножаются на частоты: 4) находится сумма взвешенных отклонений без учета знака: 5) сумма взвешенных отклонений делится на сумму частот: 6.2. Расчет дисперсии и среднего квадратического отклонения по индивидуальным данным и в рядах распределения Основными обобщающими показателями вариации в статистике являются дисперсии и среднее квадратическое отклонение. Дисперсия это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклонений и обозначается 2. В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной: дисперсия невзвешенная (простая); дисперсия взвешенная. Среднее квадратическое отклонение это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т. д.). Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается : среднее квадратическое отклонение невзвешенное; среднее квадратическое отклонение взвешенное. Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность. Вычислению среднего квадратического отклонения предшествует расчет дисперсии. Порядок расчета дисперсии взвешенной следующий: 1) определяют среднюю арифметическую взвешенную: 2) рассчитывают отклонения вариантов от средней: 3) возводят в квадрат отклонение каждого варианта от средней: 4) умножают квадраты отклонений на веса (частоты): 5) суммируют полученные произведения: 6) полученную сумму делят на сумму весов: Пример 2.1 Имеются следующие данные о производительности труда рабочих: Исчислим среднюю арифметическую взвешенную: Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию: Среднее квадратическое отклонение будет равно: Если исходные данные представлены в виде интервального ряда распределения, то сначала нужно определить дискретное значение признака, а затем применить изложенный метод. Пример 2.2 Покажем расчет дисперсии для интервального ряда на данных о распределении посевной площади колхоза по урожайности пшеницы. Средняя арифметическая равна: Исчислим дисперсию: 6.3. Расчет дисперсии по формуле по индивидуальным данным Техника вычисления дисперсии сложна, а при больших значениях вариантов и частот может быть громоздкой. Расчеты можно упростить, используя свойства дисперсии. Дисперсия имеет следующие свойства. 1. Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсию не изменяет. 2. Уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину А дисперсию не изменяет. 3. Уменьшение или увеличение каждого значения признака в какое-то число раз k соответственно уменьшает или увеличивает дисперсию в k2 раз, а среднее квадратическое отклонение в k раз. 4. Дисперсия признака относительно произвольной величины всегда больше дисперсии относительно средней арифметической на квадрат разности между средней и произвольной величинами: Если А 0, то приходим к следующему равенству: т. е. дисперсия признака равна разности между средним квадратом значений признака и квадратом средней. Каждое свойство при расчете дисперсии может быть применено самостоятельно или в сочетании с другими. Порядок расчета дисперсии простой: 1) определяют среднюю арифметическую: 2) возводят в квадрат среднюю арифметическую: 3) возводят в квадрат отклонение каждого варианта ряда: хi2. 4) находят сумму квадратов вариантов: 5) делят сумму квадратов вариантов на их число, т. е. определяют средний квадрат: 6) определяют разность между средним квадратом признака и квадратом средней: Пример 3.1 Имеются следующие данные о производительности труда рабочих: Произведем следующие расчеты: Рассмотрим расчет дисперсии в интервальном ряду распределения. Порядок расчета дисперсии взвешенной (по формуле ) следующий: 1) определяют среднюю арифметическую: 2) возводят в квадрат полученную среднюю: 3) возводят в квадрат каждый вариант ряда: 4) умножают квадраты вариантов на частоты: 5) суммируют полученные произведения: 6) делят полученную сумму на сумму весов и получают средний квадрат признака: 7) определяют разность между средним значением квадратов и квадратом средней арифметической, т. е. дисперсию: Пример 3.2 Имеются следующие данные о распределении посевной площади колхоза по урожайности пшеницы: В подобных случаях прежде всего определяется дискретное значение признака в каждом интервале, а затем применяется рассмотренный метод расчета: Средняя величина отражает тенденцию развития, т. е. действие главных причин. Среднее квадратическое отклонение измеряет силу воздействия прочих факторов. 6.4. Показатели относительного рассеивания Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Показатель меры относительного рассеивания рассчитывается как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%. 1. Коэффициент осцилляции (Ко) отражает относительную колеблемость крайних значений признака вокруг средней: 2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины: 3. Коэффициент вариации (V): . Поскольку среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. Исходят из того, что если V больше 40%, то это говорит о большой колеблемости признака в изучаемой совокупности. Задачи и упражнения 1. Для характеристики производственного стажа работников одной из отраслей промышленности проведено обследование различных категорий работников. Результаты обследования систематизированы в виде таблицы: По данным таблицы определите: 1) размах вариации; 2) среднее линейное отклонение; 3) дисперсию (двумя способами); 4) среднее квадратическое отклонение; 5) коэффициент вариации стажа рабочих, мастеров, технологов. 2. Известны данные о распределении мужчин и женщин по возрастным группам по региону: Определите, какая из двух групп по полу более однородна. |