Лекции по статистике [Фляжникова]. Конспект лекций Дисциплина Статистика
Скачать 1.67 Mb.
|
3. Понятие вариации. Различия индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Это изменение возникает в результате того, что индивидуальные значения складываются по совокупным факторам, которые по-разному действуют на совокупность целого. Средняя величина – это абстрактная обобщающая характеристика признака изучаемой совокупности. Она не дает данные о том, как отдельные значения изучаемой совокупности группируются вокруг средней. Колеблимость отдельных значений характеризуют показатели вариации. Термин «вариация» происходит от латинского и обозначает – изменения, колеблимость. Под вариацией в статистике понимают такие количественные изменения в пределах одного признака в однородной совокупности, которые обусловлены и зависят от влияния различных факторов. Анализ статистической совокупности позволяет оценить степень зависимости изучаемой совокупности и ее признаков от ее факторов. Пример. Изучая вариацию можно определить однородность совокупности. Степень близости данных отдельных единиц x к средней измеряются рядом абсолютных, относительных и средних показателей вариации. 4. Показатели вариации. Несгрупированый ряд Сгруппированный ряд
5-ый показатель. Коэффициент вариации – это отношение седнего квадратического отклонения к среднему значению. Коэффициент вариации применяется в следующих случаях: когда необходимо определить и сравнить степени рассеивания 2-х или нескольких признаков, выраженных в различных единицах измерения для характеристики одной и той же совокупности; когда необходимо определить рассеивание одного и того же признака в разных единицах совокупности, имеющих разные единицы измерений и разные ср. величины. Если коэффициент вариации составляет более 0,40 то такая совокупность считается неоднородной. Пример. Имеются данные о стаже работы рабочих 3-х бригад: I бригада – 15, 18, 20, 22, 25 лет; II бригада – 10, 15, 20, 25, 30 лет; III бригада – 8, 12, 17, 25, 38 лет. Определить показатель вариации. 1. Размах вариации. 2. Среднее линейное отклонение. I. II. III. В I бригаде абсолютное отклонение каждого значения от средней величины 2,8 лет, во II бригаде – 6 лет, в III бригаде – 9,2 лет. 3. Дисперсия, средний квадрат отклонения. I. II. III. Чем больше ср. квадратическое отклонение, тем более высока вариация, т.е. более неточным будет среднее значение. 4. Коэффициент вариации. I. II. III. III бригада является неоднородной совокупностью, т.к. коэффициент вариации составляет более 0,40. 5. Показатели относительного рассеивания. Данные показатели позволяют охарактеризовать совокупность, а в частности колеблимость изучаемого признака. Показатели относительного рассеивания определяются путем деления меры относительного рассеивания на среднюю арифметическую величину и выражаются в %. К таким показателям относятся: 1). Коэффициент осцеляции – определяется как отношение размаха вариации к средней величине признака и характеризует относительную рассеянность или колеблимость крайних значений признака вокруг средней: , где – размах вариации. Этот показатель показывает на сколько % отклоняется среднее от крайних значений вариации. Если >100, то (крайних значений признака) и наоборот. 2). Относительное линейное отклонение.-средние линейное отклонение делим на среднюю величину, ия: Пример. Рассчитать показатели вариации и показатели относительного рассеивания по данным таблицы.
6. Закон сложения дисперсии. Если статистическая совокупность разбита на несколько групп по одинаковому признаку, то средняя величина и дисперсия могут быть определены не только для всей совокупности, но и для отдельной ее части. В зависимости от этого можно выделить межгрупповую и внутригрупповую вариацию. А, следовательно, рассчитать среднюю величину и дисперсию, как межгрупповую, так и внутригрупповую. В зависимости от всех условий в совокупности определяют общую дисперсию, которая зависит от этих условий: где - общее среднее для всей изучаемой совокупности, т.е. среднее для всех групп, входящих в совокупность. Межгрупповая дисперсия отражает вариацию признака изучаемой совокупности, изменение признака которой возникает под влиянием фактора, положенного в основу группировки. Межгрупповая дисперсия характеризует колеблимость групповых средних около общей средней: где - средняя величина признака по относительным группам; - частота отдельных групп. Средняя внутригрупповая дисперсия характеризует случайную вариацию в каждой отдельной группе. Данная вариация возникает в зависимости от влияния других факторов, которые не учитываются при группировке. Между общей дисперсией и средней из групповой дисперсии и межгрупповой существует взаимосвязь: – закон сложения дисперсии 7. Свойства дисперсии. Если из всех значений вариант вычесть какое-то постоянное число, то средний квадрат отклонений не изменится: Если все значения вариант разделить на какое-то постоянное число, то средний квадрат отклонений уменьшиться в а раз: Если средний квадрат отклонений от любой величины а – которая отличается от средней арифметической х, то он будет всегда больше среднего квадрата отклонений от средней арифметической: , но больше на определенную величину, а эта величина определена, как квадрат разности между средней и этой, условно взятой величиной: используя 2-ое свойство дисперсии в математической статистике можно рассчитать дисперсию способом моментов. Средний квадрат отклонений от средней величины имеет свойства min, т.е. дисперсия от средней всегда меньше дисперсий исчисляемых от других величин. В этом случае, если а – постоянное число = 0, то, следовательно, средний квадрат отклонений будет определяться по формуле: - ср. квадрат значений признака; - квадрат среднего значения признака. Значит, средний квадрат отклонений равен разности между средним квадратом значения признака и квадратом ср. значения признака. Также способ моментов называется способом отсчета от условного нуля. Данный способ можно применять только в тех случаях, если в вариационных интервальных рядах интервалы одинаковы. Используя 2-ое свойство дисперсии, разделив все варианты на величину интервала, получим формулу дисперсии: гдеi – величина интервала для данной совокупности ; Пример. Рассчитать все показатели вариации, доказать закон сложения дисперсии.
Общая дисперсия В среднем по региону средний объем товарной продукции равен 18,14 млрд. руб.
, Ср. квадратное отклонение АО: по региону средний объем товарной продукции в регионе АО 16,82 , Расчет межгрупповой дисперсии
Закон сложения дисперсии доказан. Если разделить дисперсию групповых средних на общую дисперсию, то получим коэффициент детерминации. - дает эмпирическое корреляционное отношение, показывает тесноту между группировочным признаком и результативным. 8. Дисперсия альтернативного признака. Среди варьирующих признаков, которые изучает статистика, встречаются признаки вариации, которые проявляются в том, что у одних единиц совокупности они встречаются, у других нет. Признаки, которыми обладают данные единицы и не обладают другие, называются альтернативными. Количественно вариация альтернативного признака в численности всей совокупности обозначается а доля единиц, не обладающих признаком, обозначается и принимает значения , тогда: Среднее значение альтернативного признака равно доле, которая является обобщающей характеристикой совокупности по этому варьирующему признаку: Тогда дисперсия альтернативного признака равна: Таким образом, дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Т.к., , то средний квадрат отклонений не может быть больше 0,25. 9. Приемы анализа вариационных рядов. Закономерные изменения частот за счет изменения варьирующего признака в вариационных рядах называется закономерностями распределения. Главной задачей анализа вариационных рядов является выявление закономерностей распределения и характера распределения. Например, распределение рабочих по уровню заработной платы зависит от условий: квалификации; нормы выработки; расценок; условий труда – это общее условие. Тип закономерности распределения – это отражение в вариационных рядах общих условий, определяющих распределение в однородной совокупности. Общие условия, определяющие тип закономерностей, познаются анализом сущности явления тех его свойств и условий, которые определяют изменчивость вариационного признака. Следовательно, должна быть построена кривая распределения. Кривая распределения – это графическое изображение частот варьирующего ряда в виде непрерывной линии, где частоты связаны с вариантами функционально. Существует теоретическая кривая распределения и фактическая. Теоретическая кривая выражает общую закономерность данного распределения в чистом виде исключающую влияния случайных условий. Рис. 4. Полигон распределения П олигон распределения – непрерывная линия, характеризующая фактическую кривую распределения, поскольку в нем отражаются как общие, так и случайные условия, определяющие распределение. В статистике наиболее часто для сопоставления фактических и теоретических кривых используют нормальный тип распределения, который имеет следующее уравнение: где - ордината кривой нормального распределения /частость/, - это нормированное распределение . В экономической статистике кривая нормального распределения (рис. 5) встречается достаточно редко, но нормальное распределение может служить моделью для выяснения степени и характера отклонения от нее фактического распределения. Рис. 5. Кривая нормального распределения Выравнивание фактического распределения по кривой нормального распределения. Cостоит из нескольких этапов: сравнивают фактические и теоретические частоты. По фактическим данным определяют теоретические частоты кривой нормального распределения, которая является функцией нормированного отклонения; проверяют на сколько распределение признака соответствует нормальному.
; постоянное число 68,30 Рис. 6. Кривые фактического и нормального распределения Критерии согласия. Математическая статистика дает несколько показателей, по которым можно судить, на сколько фактическое распределение согласуется с нормальным. Эти показатели называются критерии согласия. Критерий согласия Колмагорова (критерий ) определяется путем деления max разности коммулятивных частот на корень квадратный из числа наблюдений: , где d – максимальное отклонение фактической частоты от фактической частоты; n – число наблюдений. По приведенному примеру критерий = По специальной таблице вероятности для критерия согласия определяют, что значение =0,59 соответствует вероятности 0,88. Это значит, что с вероятностью 0,88 можно судить об отклонении фактических частот от теоретических, которые являются случайными. 10. Асимметрия распределения и эксцесс. Эксцесс – высоковершинность или низковершинность фактической кривой распределения по сравнению с нормальным распределением. Высоковершинность означает положительный эксцесс и характеризуется скоплением частот в середине. В симметричном распределении средняя арифметическая равна моде и медиане, если этого равенства нет, то распределение считают асимметричным. Низковершинность означает отрицательный эксцесс и характеризуется большой разбросанностью частот ряда. Коэффициент асимметрии – отношение разности между средним значением и моды и среднему квадратическому отклонению. При симметричном отклонении разница между ср. значением и модой будет равно 0, тогда и коэффициент будет равен 0. Если , то и кривая распределения будет правосторонняя, если , то и кривая распределения будет левосторонняя. Пример. Проверить по критерию согласия Колмагорова соответствие рядов распределения нормальному распределению по данным таблицы.
Коэффициент асимметрии равен (114,375-113)/87,11=0,0158 |