Лекции по статистике [Фляжникова]. Конспект лекций Дисциплина Статистика
![]()
|
3. Понятие вариации. Различия индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Это изменение возникает в результате того, что индивидуальные значения складываются по совокупным факторам, которые по-разному действуют на совокупность целого. Средняя величина – это абстрактная обобщающая характеристика признака изучаемой совокупности. Она не дает данные о том, как отдельные значения изучаемой совокупности группируются вокруг средней. Колеблимость отдельных значений характеризуют показатели вариации. Термин «вариация» происходит от латинского и обозначает – изменения, колеблимость. Под вариацией в статистике понимают такие количественные изменения в пределах одного признака в однородной совокупности, которые обусловлены и зависят от влияния различных факторов. Анализ статистической совокупности позволяет оценить степень зависимости изучаемой совокупности и ее признаков от ее факторов. Пример. Изучая вариацию можно определить однородность совокупности. Степень близости данных отдельных единиц x к средней измеряются рядом абсолютных, относительных и средних показателей вариации. 4. Показатели вариации. Несгрупированый ряд Сгруппированный ряд
5-ый показатель. Коэффициент вариации – это отношение седнего квадратического отклонения к среднему значению. ![]() Коэффициент вариации применяется в следующих случаях: когда необходимо определить и сравнить степени рассеивания 2-х или нескольких признаков, выраженных в различных единицах измерения для характеристики одной и той же совокупности; когда необходимо определить рассеивание одного и того же признака в разных единицах совокупности, имеющих разные единицы измерений и разные ср. величины. Если коэффициент вариации составляет более 0,40 то такая совокупность считается неоднородной. Пример. Имеются данные о стаже работы рабочих 3-х бригад: I бригада – 15, 18, 20, 22, 25 лет; II бригада – 10, 15, 20, 25, 30 лет; III бригада – 8, 12, 17, 25, 38 лет. Определить показатель вариации. 1. Размах вариации. ![]() 2. Среднее линейное отклонение. I. ![]() II. ![]() III. ![]() В I бригаде абсолютное отклонение каждого значения от средней величины 2,8 лет, во II бригаде – 6 лет, в III бригаде – 9,2 лет. 3. Дисперсия, средний квадрат отклонения. I. ![]() II. ![]() III. ![]() Чем больше ср. квадратическое отклонение, тем более высока вариация, т.е. более неточным будет среднее значение. 4. Коэффициент вариации. I. ![]() II. ![]() III. ![]() III бригада является неоднородной совокупностью, т.к. коэффициент вариации составляет более 0,40. 5. Показатели относительного рассеивания. Данные показатели позволяют охарактеризовать совокупность, а в частности колеблимость изучаемого признака. Показатели относительного рассеивания определяются путем деления меры относительного рассеивания на среднюю арифметическую величину и выражаются в %. К таким показателям относятся: 1). Коэффициент осцеляции – определяется как отношение размаха вариации к средней величине признака и характеризует относительную рассеянность или колеблимость крайних значений признака вокруг средней: ![]() где ![]() Если ![]() ![]() 2). Относительное линейное отклонение.-средние линейное отклонение делим на среднюю величину, ия: ![]() Пример. Рассчитать показатели вариации и показатели относительного рассеивания по данным таблицы.
![]() 6. Закон сложения дисперсии. Если статистическая совокупность разбита на несколько групп по одинаковому признаку, то средняя величина и дисперсия могут быть определены не только для всей совокупности, но и для отдельной ее части. В зависимости от этого можно выделить межгрупповую и внутригрупповую вариацию. А, следовательно, рассчитать среднюю величину и дисперсию, как межгрупповую, так и внутригрупповую. В зависимости от всех условий в совокупности определяют общую дисперсию, которая зависит от этих условий: ![]() где ![]() Межгрупповая дисперсия отражает вариацию признака изучаемой совокупности, изменение признака которой возникает под влиянием фактора, положенного в основу группировки. Межгрупповая дисперсия характеризует колеблимость групповых средних около общей средней: ![]() где ![]() ![]() Средняя внутригрупповая дисперсия характеризует случайную вариацию в каждой отдельной группе. Данная вариация возникает в зависимости от влияния других факторов, которые не учитываются при группировке. ![]() Между общей дисперсией и средней из групповой дисперсии и межгрупповой существует взаимосвязь: ![]() 7. Свойства дисперсии. Если из всех значений вариант вычесть какое-то постоянное число, то средний квадрат отклонений не изменится: ![]() Если все значения вариант разделить на какое-то постоянное число, то средний квадрат отклонений уменьшиться в а раз: ![]() Если средний квадрат отклонений от любой величины а – которая отличается от средней арифметической х, то он будет всегда больше среднего квадрата отклонений от средней арифметической: ![]() ![]() используя 2-ое свойство дисперсии в математической статистике можно рассчитать дисперсию способом моментов. Средний квадрат отклонений от средней величины имеет свойства min, т.е. дисперсия от средней всегда меньше дисперсий исчисляемых от других величин. В этом случае, если а – постоянное число = 0, то, следовательно, средний квадрат отклонений будет определяться по формуле: ![]() ![]() ![]() Значит, средний квадрат отклонений ![]() ![]() Также способ моментов называется способом отсчета от условного нуля. Данный способ можно применять только в тех случаях, если в вариационных интервальных рядах интервалы одинаковы. Используя 2-ое свойство дисперсии, разделив все варианты на величину интервала, получим формулу дисперсии: ![]() гдеi – величина интервала для данной совокупности ![]() ![]() Пример. Рассчитать все показатели вариации, доказать закон сложения дисперсии.
![]() Общая дисперсия ![]() В среднем по региону средний объем товарной продукции равен 18,14 млрд. руб.
![]() ![]() ![]() Ср. квадратное отклонение АО: ![]() ![]() ![]() ![]() ![]() Расчет межгрупповой дисперсии
![]() ![]() ![]() ![]() Если разделить дисперсию групповых средних на общую дисперсию, то получим коэффициент детерминации. ![]() ![]() 8. Дисперсия альтернативного признака. Среди варьирующих признаков, которые изучает статистика, встречаются признаки вариации, которые проявляются в том, что у одних единиц совокупности они встречаются, у других нет. Признаки, которыми обладают данные единицы и не обладают другие, называются альтернативными. Количественно вариация альтернативного признака в численности всей совокупности обозначается ![]() ![]() ![]() ![]() Среднее значение альтернативного признака равно доле, которая является обобщающей характеристикой совокупности по этому варьирующему признаку: ![]() Тогда дисперсия альтернативного признака равна: ![]() Таким образом, дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Т.к., ![]() 9. Приемы анализа вариационных рядов. Закономерные изменения частот за счет изменения варьирующего признака в вариационных рядах называется закономерностями распределения. Главной задачей анализа вариационных рядов является выявление закономерностей распределения и характера распределения. Например, распределение рабочих по уровню заработной платы зависит от условий: квалификации; нормы выработки; расценок; условий труда – это общее условие. Тип закономерности распределения – это отражение в вариационных рядах общих условий, определяющих распределение в однородной совокупности. Общие условия, определяющие тип закономерностей, познаются анализом сущности явления тех его свойств и условий, которые определяют изменчивость вариационного признака. Следовательно, должна быть построена кривая распределения. Кривая распределения – это графическое изображение частот варьирующего ряда в виде непрерывной линии, где частоты связаны с вариантами функционально. Существует теоретическая кривая распределения и фактическая. Теоретическая кривая выражает общую закономерность данного распределения в чистом виде исключающую влияния случайных условий. ![]() Рис. 4. Полигон распределения П ![]() В статистике наиболее часто для сопоставления фактических и теоретических кривых используют нормальный тип распределения, который имеет следующее уравнение: ![]() где ![]() ![]() ![]() В экономической статистике кривая нормального распределения (рис. 5) встречается достаточно редко, но нормальное распределение может служить моделью для выяснения степени и характера отклонения от нее фактического распределения. ![]() Рис. 5. Кривая нормального распределения Выравнивание фактического распределения по кривой нормального распределения. Cостоит из нескольких этапов: сравнивают фактические и теоретические частоты. По фактическим данным определяют теоретические частоты кривой нормального распределения, которая является функцией нормированного отклонения; проверяют на сколько распределение признака соответствует нормальному.
![]() ![]() ![]() ![]() Рис. 6. Кривые фактического и нормального распределения Критерии согласия. Математическая статистика дает несколько показателей, по которым можно судить, на сколько фактическое распределение согласуется с нормальным. Эти показатели называются критерии согласия. Критерий согласия Колмагорова (критерий ![]() ![]() n – число наблюдений. По приведенному примеру критерий ![]() ![]() По специальной таблице вероятности для критерия согласия ![]() ![]() 10. Асимметрия распределения и эксцесс. Эксцесс – высоковершинность или низковершинность фактической кривой распределения по сравнению с нормальным распределением. Высоковершинность означает положительный эксцесс и характеризуется скоплением частот в середине. В симметричном распределении средняя арифметическая равна моде и медиане, если этого равенства нет, то распределение считают асимметричным. Низковершинность означает отрицательный эксцесс и характеризуется большой разбросанностью частот ряда. Коэффициент асимметрии – отношение разности между средним значением и моды и среднему квадратическому отклонению. ![]() При симметричном отклонении разница между ср. значением и модой будет равно 0, тогда и коэффициент будет равен 0. Если ![]() ![]() ![]() ![]() Пример. Проверить по критерию согласия Колмагорова соответствие рядов распределения нормальному распределению по данным таблицы.
![]() Коэффициент асимметрии равен (114,375-113)/87,11=0,0158 |