Шмойлова_Теория статистики. Московская финансовопромышленная академия
Скачать 1.4 Mb.
|
Глава 6. Анализ вариации 6.1. Основные показатели вариации Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение. Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя как « выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств. Основными показателями, характеризующими вариацию, являются: • - размах, • - дисперсия, • - среднее квадратическое отклонение, • - коэффициент вариации. Для иллюстрации расчетов этих показателей воспользуемся следующими данными: Имеются данные о продаже основных марок холодильников: Таблица.6.1. Модель Цена ($) Объем продаж (шт.) Siemens 1000 30 Bosch 800 26 AEG Santo 900 24 Miele KF 1200 30 Gorenje 870 20 Haier 570 23 Samsung 760 30 Zanussi 700 20 Daewoo 460 20 Beko 650 25 Candy 480 20 Whirpool 470 21 Простейшим показателем, уже использованным выше при группировке данных, является размах вариации. Он представляет собой разность максимального и минимального значений признака: R = X max - X min R = 1200 – 460 = 740 $ Этот показатель служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных. Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака. Этого недостатка лишен другой показатель - дисперсия , рассчитываемый как средний квадрат отклонений значений признака от их средней величины. Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель. Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной: n х х I 2 2 ) ( ∑ − = σ невзвешенная форма ∑ − = ∑ i f f х х i I 2 2 ) ( σ взвешенная форма где i x - отдельные значения признака x - общая средняя i f - вес варианта признака в общей совокупности. По приведенным выше данным определим средневзвешенную цену холодильника и рассчитаем дисперсию: $ 763 21 24 26 30 21 470 24 900 26 800 30 1000 = + + + + + + + + = x x x x х 12 , 73500 21 20 24 26 30 21 ) 763 470 ( 26 ) 763 800 ( 30 ) 763 1000 ( 2 = + + + + + − + + − + − = σ Дисперсию в отдельных случаях удобнее рассчитывать по другой формуле: 2 2 2 ) ( х х − = σ , т.е. дисперсия равна разности средней из квадратов индивидуальных значений признака и квадратом средней величины. Эту формулу можно представить иначе: 2 2 2 − = ∑ ∑ n х n х i i σ - невзвешенная форма 2 2 2 − = ∑ ∑ ∑ ∑ i i i i i f f х f f х σ - взвешенная форма Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего на сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак: ( ) n х х i ∑ − = 2 σ - невзвешенная форма ( ) ∑ ∑ − = i i i f f х х 2 σ - взвешенная форма В нашем примере среднее квадратическое отклонение равно: 1 , 271 12 , 73500 = = σ $ Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1$ Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах. Коэффициент осцилляции ( r V ): r V = % 100 x R Линейный коэффициент вариации ( d V ): d V = % 100 x d Наиболее распространенным показателем является коэффициент вариации : % 100 x х V σ σ = Определим значение этого показателя по данным таблицы 1: % 5 , 35 % 100 763 1 , 271 = = х V σ Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному). Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине. Если исследуется вариация альтернативных признаков, т.е.признаков, которыми одни единицы совокупности обладают, а другие – нет, то дисперсия альтернативного признака определяется по формуле : pq = 2 σ , где p – доля единиц, обладающих данным признаком, q – доля единиц не обладающих данным признаком. Максимальное значение дисперсии доли равно 0,25 (когда p=q=0,5). Информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. При этом показатели рассчитанные по одной совокупности сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени. Например, исследуется динамика вариации на товары длительного пользования по месячным или ежегодным данным в одном и том же торговом предприятии или за один и тот же период времени , но по разным регионам. 6.2. Использование показателей вариации в анализе взаимосвязей Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака. При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным ( оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию). Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий. Общая дисперсия представляет собой сумму средней из внутригрупповой и межгрупповой и дисперсий: 2 2 2 δ σ σ + = о , где 2 о σ - общая дисперсия 2 σ - средняя из внутригрупповых дисперсий 2 δ - межгрупповая дисперсия Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности. ∑ − = ∑ i f f х х i I 2 2 ) ( σ , где i х - отдельные значения признака i х - общая средняя варьирующего признака i f - вес варианта признака в общей совокупности. Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки. ∑ − = ∑ j f n х х j j 2 2 ) ( δ , где х - общая средняя варьирующего признака j х - средняя j- ой группы j n - число единиц в j-ой группе ( ∑ ∑ = i j f n ) Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе. j n х х j j i 2 2 ) ( ∑ − = σ , где i х - значение признака у отдельных элементов j-ой группы j x - средняя j-ой группы j n - число единиц j-ой группы Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле: 2 σ = ∑ ∑ i j j f n 2 σ Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий: 2 2 2 δ σ σ + = о . Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности. Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения: 2 2 σ δ η = э Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций. Таблица 6.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности Форма собственности Количество предприятий Объем выполненных работ (млн.р.) Итого Государственная 4 10, 30, 20, 40 100 Негосударственная 6 20, 40, 60, 20, 50, 50 240 Итого 10 340 Решение: 1. Определяется средний объем выполненных работ для предприятий двух форм собственности. 34 10 340 = = Х млн.р. 2. Определяется средний объем выполненных работ для каждой формы собственности. 25 4 100 = = госуд Х млн.р. 40 6 240 = = негосуд Х млн.р. 3. Рассчитывается общая и внутригрупповые (т.е. для каждой группы) дисперсии. 8 , 243 10 ) 34 50 ( ) 34 20 ( ) 34 40 ( ) 34 20 ( ) 34 30 ( ) 34 10 ( 2 2 2 2 2 2 2 = − + + − + − + − + − + − = об σ 125 4 ) 25 40 ( ) 25 20 ( ) 25 30 ( ) 25 10 ( 2 2 2 2 2 = − + − + − + − = госуд σ 233 6 ) 40 50 ( ) 40 50 ( ) 40 20 ( ) 40 60 ( ) 40 40 ( ) 40 20 ( 2 2 2 2 2 2 2 ≈ − + − + − + − + − + − = негосуд σ 4. Определяется средняя из внутригрупповых и межгрупповая дисперсия. Для этого расчета полученные ранее данные заносятся в таблицу. Вспомогательная таблица Форма собственности Число предприятий Средняя по группе Внутригрупповые дисперсии Государственная 4 25 125 Негосударственная 6 40 233 Итого 10 • Средняя из внутригрупповых дисперсий 8 , 189 10 6 233 4 125 2 = + = х х σ • Межгрупповая дисперсия 54 10 6 ) 34 40 ( 4 ) 34 25 ( 2 2 2 = − + − = х х δ На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий: 54,0+189,8=243,8 Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8)х100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности., а на 78% [(189,8/243,8)х100%)] – от прочих факторов. Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения: 47 , 0 8 , 243 54 = = η Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика. Глава 7. Выборочное наблюдение 7.1. Цели и этапы выборочного наблюдения Выборочное наблюдение в настоящее время находит достаточно широкое применение в обследованиях промышленных и сельскохозяйственных предприятий, изучении цен на потребительском рынке, в обследованиях бюджетов и занятости населения. Выборочный метод является важнейшим источником информации в контроле качества продукции, в маркетинговых и социологических исследованиях. Выборочным наблюдением называется такое несплошное обследование, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность. Выборочное наблюдение нельзя отождествлять с несплошным обследованием вообще, так как оно является лишь одним из видов последнего, наиболее проработанным с методологической и организационной точек зрения. Помимо выборочного наблюдения несплошное обследование может осуществляться путем монографического описания, методом основного массива или на основе различных видов анкетирования, когда отсутствуют какие-либо специальные методы отбора респондентов и процент заполненных и возвращенных анкет заранее не известен. Преимущества выборочного наблюдения заключаются в существенной экономии различного вида ресурсов, а именно: а) финансовых средств, затрачиваемых на сбор и обработку данных, подготовку и оплату кадров; б) материально-технических ресурсов (канцелярские товары, оргтехника, расходные материалы, транспортное обслуживание и т.п.); в) трудовых ресурсов, привлекаемых к обследованию на всех его этапах; г) сокращении времени, затрачиваемого как на получение первичной информации, так и на ее последующую обработку вплоть до публикации итоговых материалов. В то же время, необходимо четко представлять, что выборочное наблюдение, как бы грамотно с методологической точки зрения оно не было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Поэтому, когда вариация регистрируемых признаков очень сильная и процент отбора для получения выборочных значений с заданной точностью достигает 20-25%, следует правильно оценить целесообразность несплошного обследования, сопоставив достаточно большие затраты всех ресурсов на такую объемную выборку и ожидаемые погрешности статистических характеристик. Вполне вероятно, что проведение сплошного обследования в подобных случаях будет более оправданным. В то же время, при решении ряда задач выборочное наблюдение является единственно возможным способом получения необходимой информации. Так, контроль многих видов продукции связан с их порчей, потерей товарного вида, нарушением герметизации и т.п. Например, нельзя проверить каждую производимую предприятием электролампу на соблюдение требований по продолжительности горения. Нельзя проверить на соответствие стандартам каждого пакета с соком или молочной продукцией, так как это связано с вскрытием их упаковки. В подобных случаях контроль качества может осуществляться только с использованием выборочного метода. Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей. |