Статистика. стат практ с отв к. Описательная статистика 3 Виды средних величин 3
Скачать 121.82 Kb.
|
наблюдений с самыми меныыими значениями признака от остальных 25 % наблюдений с большими значениями, для анализируемой совокупности следует рассчитать 75-% квартиль (или 3-й квартиль, Q3).Рис. 3. Квартили. Например, чтобы определить какой уровень признака является границей, отделяющей первые 75 % В случае дискретного ряда Q3 (75-% квартальное значение признака хг) определяется на основании накопленных частот. В задаче 1.25. из всей совокупности 1 620 граждан, упорядоченных по количеству совершаемых ими поездок, 75 % будет соответствовать 1 215 гражданин (1 620 • 0,75 = 215). По накопленным частотам найдем, что этот гражданин совершает 4 поездки в день, т.е. 75-% квартальное значение признака xt = 4 (Q3 = 4). В случае интервального ряда Q3 (или 75%-й квартиль) определяется по формуле: где Xq - нижняя граница интервала, в котором находится 3-й квартиль; hq3 - ширина 3-го квартального интервала; 37
38
Необходимо определить уровень себестоимости производства продукции, который отделяет 75 % предприятий с относительно невысокой себестоимостью от 25 % предприятий с более высокой себестоимостью. Впоследствии на 25 % предприятий с более высокой себестоимостью будут проведены оптимизационные мероприятия с целью снижения себестоимости производства продукции. В задаче требуется найти 75-% квартальное значение признака хг- - себестоимости производства продукции. Так как признак х,- задан интервальным рядом, определять Q3 будем по формуле (1.4). Первоначально определим интервал в который попадает Q3. У нас есть 100 значений признака х, (для каждого из предприятий указана себестоимость производства продукции), х,- упорядочены по возрастанию. Судя по столбцу накопленных частот признак, соответствующий 75 % всей совокупности (признак под номером 75), попадает в интервал 110 - 130, этот интервал и будет 3-м квартальным интервалом. По формуле (1.4) 75 -Y.fi- 1 0,75 -100-27 <2з = *„3 + Ч « 129,59 руб. Следовательно, у 75 % предприятий себестоимость не превышает руб. за единицу продукции. Оставшиеся 25 % предприятий производят продукцию по более высокой себестоимости, на этих предприятиях проведем оптимизационные мероприятия с целью снижения себестоимости производства единицы продукции. Задачи для самостоятельного решения по данной теме смотрите во втором параграфе третьей главы (задачи 3.7. - 3.12.). 39 Глава 2. АНАЛИТИЧЕСКАЯ СТАТИСТИКА § 1. Показатели вариации и способы их расчета Вариация - несовпадение (или различие) уровней одного и того же показателя у разных объектов. Например, рост Володи 176 см, Ольги 164 см, Ивана 193 см. Т.е. показатель «рост» у разных людей отличается. И это отличие нам необходимо измерить, охарактеризовать силу вариации, ее величину. Самая приблизительная оценка вариации может быть дана с помощью размаха (амплитуды) вариации (R): R Хтах Xmini где хтах и xmin - наибольшее и наименьшее значения варьирующего признака. Размах (амплитуда) вариации характеризует лишь максимальное различие значений признака, не учитывает вариацию между всеми значениями совокупности. Более строгие показатели вариации - показатели колеблемости относительно среднего уровня признака. К ним относятся: среднее линейное отклонение; дисперсия; среднее квадратическое отклонение; коэффициент вариации. Среднее линейное отклонение (а) - простейший показатель колеблемости относительно среднего уровня признака, вычисляется как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня: -х\ а = , п при повторяемости отдельных значений х, используют формулу: \Xi -x\ft а Zfi ' 40 где Xj - значение варьирующего признака в дискретном ряду или середина интервала в интервальном распределении; f - частота варьирующего признака; х - среднее значение варьирующего признака. Среднее линейное отклонение просто вычислить, удобно интерпретировать, но трудно использовать в математической статистике. Так как модули нельзя поставить в соответствие с каким-либо вероятностным законом. Потому, в статистике для измерения вариации чаще применяются среднее квадратическое отклонение (параметр нормального распределения) и показатель дисперсии. Дисперсия признака (<т) определяется на основе квадратической степенной средней11: _£(Xj-xУ 67 = П при повторяемости отдельных значений хг используют формулу: £(*; - x)2fi а2 = Zft Показатель а, равный у/а2 (квадратному корню из дисперсии), называется средним квадратическим отклонением, и вычисляется по формуле: о = 71 при повторяемости отдельных значений хг- используют формулу: YiXi - х)2 11 Формулу для расчета дисперсии можно преобразовать методом моментов, приведя к виду: <т2 = —— = х2 — (х)2 или а2 = — (^т^) = х2 — (х)2 п \ ть / 2и j i V 2j j i J (при повторяемости значений признака хг). Здесь х2 - среднее значение квадратов признака (или начальный момент второго порядка), х — среднее значение признака (или начальный момент первого порядка). 41
381 х = — 31,75 (тыс. тонн), т.е. в среднем каждая из 12-ти агрокомпаний собирает 31,75 тыс. тонн кукурузы. а = Л1 1106,25 |