Статистика синергия. Статистика. Литература по теме Практические задания
Скачать 1.83 Mb.
|
В процессе освоения темы акцентируйте внимание на следующих ключевых понятиях: · сводка; · группировка и ее виды; · группировочный признак; · интервал, границы интервала, ширина интервала; · ряд распределения, атрибутивные и вариационные ряды; · частоты, частости; · полигон распределения; · гистограмма распределения; · плотность распределения. Вопросы темы: 1. Статистическая сводка и группировка данных. 2. Ряды распределения. Теоретический материал по теме Вопрос 1. Статистическая сводка и группировка данных. Собранные данные необходимо систематизировать и подготовить к последующей обработке. Для упорядочивания исходных данных статистика применяет два основных метода – метод сводки и метод группировки. Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков (рис. 11). По глубине и точности обработки данных различают простую и сложную сводку. Данные можно обрабатывать централизовано – в одной организации или децентрализовано – последовательно передавая результаты сводки от территориальных органов в федеральные (как при обработке отчетности). Рис. 11. Виды статистических сводок Группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на более однородные группы. Группы могут различаться между собой по числу объектов и в качественном отношении. В соответствии с познавательными задачами различают три основных вида группировок (рис. 12). Рис. 12. Виды группировок Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на их основе устойчивых социально-экономических типов явлений. Например: группировка предприятий и организаций по формам собственности; группировка торговых предприятий по их принадлежности к сферам промышленных и продовольственных товаров. Структурная группировка предназначена для изучения состава совокупности по какому-либо признаку. Например: изучение возрастной структуры безработных в Российской Федерации (табл. 1). Таблица 1. Распределение численности безработных по возрастным группам и средний возраст безработных в 2011 г. (в среднем за год; в процентах к итогу)
Аналитическая группировка выявляет взаимосвязи между изучаемыми признаками. В статистике выделяют факторные и результативные признаки. Факторными называются признаки, под воздействием которых изменяются другие, результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного, и наоборот. При построении аналитической группировки, как правило, единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними величинами результативного признака. Пример аналитической группировки представлен в табл. 2. Таблица 2. Группировка зависимости суммы кредитов, выданных коммерческими банками, от размера процентной ставки
Данные табл. 2 показывают, что с ростом процентной ставки, под которую выдается кредит, средняя сумма кредита, выдаваемая одним банком, уменьшается. Это говорит о том, что между исследуемыми признаками существует обратная связь. По способу построения группировки бывают простые и комбинационные. Простой называется группировка, в которой группы образованы только по одному признаку. Комбинационной называется группировка, в которой образование групп производится по двум и более признакам, взятым в сочетании (комбинации). Рекомендуется сначала группировать единицы по качественным признакам, а затем – по количественным. Например, в группировке водителей автопарка по уровню квалификации (классу) и производительности труда вначале все водители делятся на две группы по классу, а затем внутри каждого класса производится деление по проценту выполнения плана (табл. 3). Таблица 3. Группировка водителей автопарка по классу и производительности труда
Построение статистических группировок включает следующие этапы: 1. Определение группировочного признака. 2. Определение числа групп. 3. Расчет ширины интервала группировки. 4. Выбор признаков, которые будут характеризовать выделенные группы. Группировочным признаком (или основанием группировки) называется количественный или качественный признак, по которому проводится разбиение единиц совокупности на группы. Число выделяемых групп зависит от вида группировочного показателя, степени его вариации и объема изучаемой совокупности. Если группировочный признак качественный, то число групп будет равно числу вариантов этого признака. Например, группируя сотрудников по полу, мы получим 2 группы: сотрудники-мужчины и сотрудники-женщины. При определении числа групп необходимо учесть размах вариации группировочного признака (R), который определяется по формуле: R = хmax – хmin, (1) где Хmax – максимальное значение группировочного признака; Хmin – минимальное значение группировочного признака. Чем больше размах вариации группировочного признака, тем большее число групп может быть образовано. Однако при слишком большом их числе возникает проблема «пустых» групп, т.е. не содержащих ни одного объекта. Число групп можно определить математически или экспертным путем. Математический способ предполагает использование формулы Стерджесса, которая дает хорошие результаты при большом объеме совокупности: m = 1 + 3,322 ´ lg n, (2) где m – число выделяемых групп; n – общее число единиц совокупности. Полученное в результате расчетов значение округляют до целого числа по стандартным правилам округления. Интервал – это значения признака, лежащие в определенных границах. Нижней границей называется наименьшее, а верхней границей – наибольшее значение признака в интервале. Ширина интервала – это разность между его верхней и нижней границами. По ширине интервалы группировки бывают равные (одинаковые) (табл. 4) и неравные (табл. 5). Таблица 4. Группы коммерческих банков по величине балансовой прибыли
Ширина каждого интервала составляет 200 млн руб: 400 – 200 = 600 – 400 = 800 – 600 = 200 Таблица 5. Группы фирм по объему инвестиций
Ширина интервалов неодинакова: · 20 – 10 = 10 млн руб. · 40 – 20 = 20 млн руб. · 80 – 40 = 40 млн руб. Ширина равного интервала h определяется по следующей формуле: , (3) где хmax, xmin – максимальное и минимальное значения признака в совокупности; m – число выделяемых в совокупности групп. Существуют следующие правила округления ширины интервала h: · Если h имеет один знак до запятой (например: 0,67; 1,487; 3,82), полученные значения округляют до десятых (0,7; 1,5; 3,8.). · Если h имеет две значащие цифры до запятой (например, 14,876), это значение округляют до целого числа (15). · В случае, когда h является трех-, четырех- или еще более значимым числом, его величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700. Интервалы группировки бывают также закрытыми (табл. 6.) и открытыми (табл. 7.). Таблица 6. Группировка страховых компаний по величине прибыли
Таблица 7. Группировка страховых компаний по величине прибыли
Если максимальные или минимальные значения сильно отличаются от других значений группировочного признака, то для определения ширины интервала используют значения, несколько превышающие минимум, и несколько меньшие, чем максимум. Полученную по формуле (3) величину округляют и используют в качестве ширины интервала, а первый и/или последний интервалы группировки открывают по верхней или нижней границе. Это делается для того, чтобы учесть в открытых интервалах единицы, имеющие аномально большие или малые значения группировочного признака. Если значение признака у какой-то единицы совпадает с верхней границей интервала (например, 40 млн руб. (табл. 6) – это верхняя граница первого интервала (20–40) и нижняя граница второго (40–60)), то такая единица, как правило, относится к следующему интервалу (ко второму, (40–60)). Если в основании группировки лежит дискретный признак, то нижняя граница каждого интервала (начиная со второго) берется равной верхней границе предыдущего интервала, увеличенной на 1. Например, группируя страховые компании по числу занятого персонала, можно выделить следующие группы (чел.): (100–150), (151–200), (201–300), (301–400). Пример. Произведем группировку единиц совокупности, включающей 30 крупнейших по величине страховых премий страховых компаний Российской Федерации за 2012 год (табл. 8, по данным ФСФР, источник: www.fcsm.ru): Для удобства восприятия страховые компании расположены по убыванию величины страховых премий. Таблица 8. Показатели деятельности крупнейших страховых компаний РФ за 2012 год (по данным ФСФР)
В качестве группировочного возьмем признак «размер страховых премий». Образуем четыре группы страховых компаний с равными интервалами. Величину интервала определим по формуле (3): Согласно правилам округления в качестве ширины интервала возьмем величину 23. Обозначим границы групп:
Теперь необходимо подсчитать количество страховых компаний в каждой группе. В 1-ю группу войдут 23 компании (№№ от 30 до 8 включительно по исходным данным табл. 8), во 2-ю – три компании (№№ 7–5), в 3-ю – две (№№ 4–3) и в 4-ю – две (№№ 2–1). Поскольку единичные и пустые группы в нашей группировке не обнаружены, можем переходить к завершающему этапу – построению итоговой группировочной таблицы, в которой все показатели будут приведены в разрезе построенных нами групп, а не по индивидуальным страховым компаниям, как в исходных данных. Для этого нужно просто суммировать индивидуальные значения показателей страховых компаний «страховые выплаты» и «количество заключенных договоров» по каждой группе и записать полученные суммы в соответствующие строки и столбцы итоговой таблицы (табл. 9). Таблица 9. Группировка крупнейших страховых компаний РФ по величине полученных страховых премий за 2012 год
Структурная группировка страховых организаций на основе данных таблицы 9 будет иметь вид: Таблица 10. Группировка крупнейших страховых компаний РФ по величине полученных страховых премий за 2012 год
Из таблицы 10 видно, что больше трети (36,50 %) всех страховых выплат и чуть менее половины всех заключенных договоров (44,87 %) приходится на группы страховых компаний с объемом страховых премий от 4,6 до 27,6 млрд руб. Аналитическая группировка (табл. 11) показывает, что размер страховых премий и количество заключенных договоров находятся между собой в прямой зависимости. А вот величина страховых выплат не имеет четкой прямой взаимосвязи с размером страховых премий, что можно объяснить различием подходов к оценке и возмещению страховых случаев, а также особенностями рыночных стратегий развития и привлечения клиентов у крупнейших страховых компаний. Таблица 11. Аналитическая группировка крупнейших страховых компаний РФ по величине полученных страховых премий за 2012 год
Вопрос 2. Ряды распределения. Ряд распределения представляет собой простейшую группировку, в которой каждая выделенная группа характеризуется только количеством входящих в нее единиц совокупности. В рассмотренном нами примере с группировкой страховых организаций по величине страховых премий мы также получили ряд распределения – он записан в графах А и 1 таблицы 11. Различают атрибутивные и вариационные ряды распределения (рис. 13). Рис. 13. Виды рядов распределения Атрибутивными называют ряды распределения, построенные по качественным признакам. Вариационными называют ряды распределения, построенные по количественному признаку. Вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака. Варианты признака обозначаются как Хi. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности и обозначаются через fi. Сумма всех частот определяет объем совокупности. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Дискретный вариационный ряд характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, группы студентов по баллу в сессию (табл. 12). таблица 12. Распределение студентов по баллам в сессию (данные условные)
Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак задан интервалами значений. Например, распределение консалтинговых фирм по величине прибыли (табл. 13). Таблица 13. Ряд распределение консалтинговых фирм по величине прибыли за 2012 г. (данные условные)
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строятполигон или гистограмму. Полигон используется для изображения дискретных вариационных рядов. По оси абсцисс (Х) в одинаковом масштабе откладываются значения признака, а по оси ординат (Y) – частоты. Полученные на пересечении осей X и Y точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном распределения (рис. 14). Рис. 14. Полигон распределения студентов по баллам в сессию (см. табл. 12) Гистограмма распределения применяется для изображения интервального вариационного ряда. При ее построении на оси Х откладываются величины интервалов, а на оси Y – частоты, которые изображаются прямоугольниками, построенными на соответствующих интервалах. Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями (рис. 15). При построении гистограммы распределения вариационного ряда с неравными интервалами по оси Y наносят не частоты, а плотность распределения признака в соответствующих интервалах. Плотность распределения – это частота, рассчитанная на единицу ширины интервала. Рис. 15. Гистограмма и полигон распределения консалтинговых фирм по величине прибыли за 2012 г. (см. табл. 13) Вопросы для самопроверки: 1. В чем заключается основная задача метода группировки? 2. Какие виды группировок применяются? 3. Что такое ряд распределения и чем он отличается от группировки? 4. Как можно определить число групп при группировке данных? 5. Может ли качественный признак являться основанием группировки? 6. В чем отличие ряда распределения от статистической групировки? 7. Можно ли построить гистограмму по данным о распределении семей по числу детей? Литература по теме: Основная литература: 1. Улитина Е.В. Статистика: учеб. пособие / Е.В. Улитина, О.В. Леднева, О.Л. Жирнова. – 3-е изд. – М.: МФПУ, 2013.– 312 с. – (Университетская серия). Дополнительная литература: 1. Общая теория статистики: статистическая методология в изучении коммерческой деятельности: учебник / Под ред. А.А. Спирина, О.Э. Башиной. – М.: Финансы и статистика, 2004. 2. Практикум по теории статистики: учеб. пособие / Под ред. проф. Р.А. Шмойловой. – М.: Финансы и статистика, 2004. 3. Шмойлова Р.А., Минашкин В.Г., Садовникова Н.А., Шувалова Е.Б. Теория статистики: учебник / Под ред. проф. Р.А. Шмойловой. – М.: Финансы и статистика, 2004. 4. Методологические положения по статистике. – М.: Госкомстат России, 2010. Практические задания: Задание 1. Вы начали кампанию по улучшению качества продукции на вашей бумажной фабрике и для этих целей собрали большое количество докладных записок о проблемах потребителей. Представленная в каждой докладной записке проблема кодируется следующим образом: А – отсутствие бумаги; Б – бумага слишком толстая; С – бумага слишком тонкая; D – ширина бумаги не соответствует стандарту; E – не тот цвет бумаги; F – края бумаги крупно обрезаны. Собранная информация приведена ниже: А, А, E, A, A, A, B, A, A, A, B, A, B, F, F, A, A, A, A, A, B, A, A, A, C, D, F, A, A, E, A, C, A, A, A, F, F, D. Обобщите этот набор данных, вычислив (с точностью до 0,01) процент проблем каждого вида в общем количестве проблем. Задание 2. По данным о ходе приватизации жилых помещений в РФ (табл. 14) постройте группировку областей Центрального федерального округа по % приватизированных жилых помещений от общего числа жилых помещений, подлежащих приватизации. Выделите три группы областей с равными по ширине интервалами. При помощи структурной группировки по каждой выделенной вами группе областей определите (с точностью до 0,01), долю (в %) приватизированных в 2011 году жилых помещений в целом по группе от общего числа приватизированных в 2011 году жилых помещений Центрального федерального округа. Результаты оформите в итоговой таблице 15, дав таблице название. Таблица 14. Приватизация жилых помещений в РФ по состоянию на 01 января 2012 г.
Таблица 15.
Задание 3. По данным табл. 14 постройте группировку областей Центрального федерального округа (ЦФО), выделив две группы областей – области, в которых % приватизированных жилых помещений ниже, чем в общем по ЦФО, и области, в которых % приватизированных жилых помещений выше, чем в общем по ЦФО. При помощи структурной группировки по каждой группе определите общее количество приватизированного жилья с начала приватизации (в тыс. ед. и в %) с точностью до 0,01. Результаты оформите в таблице 16, дав ей название. Таблица 16.
|