Лекци статистика. Лекции статистика. Курс лекций по статистике Тема Предмет, метод и задачи статистики Термин
Скачать 1.76 Mb.
|
СВОДКА И ГРУППИРОВКА ДАННЫХ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ Статистические сводки и группировки Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения. Проведение сводки включает 3 этапа: предварительный контроль материалов, т. е. проверку исходных данных; группировку данных по заданным признакам, определение производных показателей; оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации. Предварительный контроль включает логическую проверку данных, т. е. смысловую согласованность сведений, исключение «нелогичных» данных и арифметическую согласованность. Пример. Рассогласованные данные. В документах на предприятии обнаружены арифметическая и логическая рассогласованности:
Арифметическая — неправильно определена сумма заработной платы. В 3-й строке имеется логическая ошибка: человек 25-ти лет неможет иметь общего стажа 45 лет и, кроме того, непрерывна стаж, как часть общего, не может его превосходить. Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в доступном для восприятия виде. Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака. Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику ис-1?емой совокупности по одному или нескольким существен-I признакам, взаимосвязанным логикой анализа. Пример. Основа группированной таблицы. Название таблицы (общий заголовок). Группировочная таблица три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т. е. подлежащее. В зависимости от строения подлежащего все статистические таблицы можно разделить на три группы: простые или перечневые; групповые; комбинационные. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки (...; —; НС). Пример. Группировочная таблица. Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2003 г.). Сказуемое
Подлежащее Таким образом, группировка – это разделение единиц совокупности на группы по выбранным варьирующим признакам. Группировки различают: по задачам систематизации данных; по числу группировочных признаков; по используемой информации. Метод группировок применяется для решения задач, возникающих в ходе научного статистического исследования: выделения социально-экономических типов явлений; изучения структуры явления и структурных сдвигов, про исходящих в нем; выявления связей и зависимостей между отдельными признаками явления. Для решения этих задач применяют (соответственно) 3 вида группировок: типологические, структурные и аналитические (факторные). Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Структурные — разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха ж? квалификации. Аналитические — предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется. По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам — санированные и многомерные). Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками. Многомерные — строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в п-мерном пространстве. где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. При используемой информации различают первичные и вторичные группировки. Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений. Вторичные — результат объединения или расщепления первичной группировки. Правила оформления статистических таблиц Статистическая таблица обязательно имеет заголовок, в котором должны быть указаны цель построения таблицы, территория и время, к которому относятся данные. Если все единицы измерения одинаковы, то они указываются в заголовке таблицы. Если же они разные — в верхних или боковых заголовках таблицы. Разграфка таблицы должна включать как можно меньше линий — только горизонтальные линии, отделяющие таблицу от ее заголовка; заголовки граф от значений показателей; итоговую строку таблицы. Вертикальных линий вообще может не быть. Таблица не очерчивается рамкой, если она не включена в текст. Иногда графы сказуемого нумеруются. 4.2. Сводка и группировка материалов статистического наблюдения В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование, род занятий и другие признаки). Дальнейшая задача статистики заключается в том, чтобы привести эти материалы в определенный порядок, систематизировать, и на этой основе дать сводную характеристику всей совокупности фактов при помощи обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Это достигается в результате сводки — второй стадии статистического исследования. Статистическая сводка — научно организованная обработка материалов наблюдения, включающая в себя систематизацию группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее частей, осуществлять анализ и прогнозирование изучаемых процессов. Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например, для получения общей численности студентов высших учебных заведений России достаточно сложить данные о численности студентов всех высших учебных заведений (на начало 1995/96 учебного года в государственных вузах страны обучалось 2,66 млн. чел.). По технике или способу выполнения сводка может быть ручной либо механизированной (с помощью ЭВМ). Статистическая сводка должна проводиться по определенным программе и плану. Программа статистической сводки устанавливает следующие этапы: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка макетов статистических таблиц для представления результатов сводки. ПЛАН статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке изложения и представления результатов В сводке статистического материала отдельные единицы статистической совокупности объединяются в группы при почет ода группировок. Статистическая группировка — процесс образования однородных групп на основе расчленения статистической совокупностина части или объединения изучаемых единиц в частные совокупности по существенным для них признакам, каждая характеризуется системой статистических показателей. Например, группировка промышленных предприятий по формам собственности, населения по размеру среднедушевого дохода, коммерческих банков по сумме активов баланса и т.д. Особым видом группировок является классификация. Представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемого объекта. Классификация выступает в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени, например, ЕГРПО, Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП), классификация основных фондов в промышленном строительстве, капитальных вложений, затрат на производство и др. Метод статистических группировок позволяет разрабатывать первичный статистический материал. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Расчет сводных показателей в целом по совокупности позволяет изучить ее структуру. Кроме того, группировка создает основу для последующей сводки и анализа данных. Этим определяется роль группировок как научной основы сводки. Большие достижения в области применения метода группировок имеет современная отечественная статистика. Введение группировочных таблиц, содержащих показатели международной СНС, превращает группировки (классификации) в эффективный метод анализа и вскрытия резервов в экономике. 4.3. Выполнение группировки по количественному признаку При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки. Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т. е. он очерчивает количественные границы групп. Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе. Вопрос о числе групп и величине интервала следует решать с учетом обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т. д. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными. При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляет интерес и малочисленные группы: новое, передовое, пока не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их. Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп. Ориентировочно определить оптимальное количество групп с равнымиинтервалами можно по формуле американского ученого Стерджесса
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления. Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 чел., 100-200; 200-300; 300-500; 500-1000; 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах; изменение количества работающих на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных — не имеет. Группировки с равными интервалами целесообразны в тех , случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры — по урожайности). Для группировок с равными интервалами величина интервала I= (X max – X min) /n X max, X max – наибольшее и наименьшее значения признака, n- число групп. Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы рабочих, которая в 2006 г. колебалась в пределах от 600-до 7500 руб., и необходимо при этом выделить 5 групп, то величина интервала, в рублях, составит: I =(7500-6000) /5 = 300 Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую. Прибавляя к минимальному значению признака (в данном случае 6000 тыс. руб.) найденное значение интервала, получаем верхнюю границу первой группы, тыс. руб.: 6000 + 300 = 6300. Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы 6300 + 300 = 6600, и т. д. В результате получим такие группы рабочих по размеру заработной платы, руб.: 6000-6300; 6300-6600; 6600-6900; 6900-7200; 7200-7500. В этом распределении имеет место неопределенность: к группе, например, отнести рабочего с заработком в 6300 первой или второй? Для устранения неопределенности открывают един из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенные, а правое — не включает. Значит рабочий, получающий 6300 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп могут быть закрытыми, когда указаны верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «7500 и выше». И наоборот, чтобы значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более». Все сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки. Вторичная группировка — образование новых групп на основе ранее осуществленной группировки. Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности). Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рассмотрим, на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию в 1996 г. (по условным данным табл. 4.1). Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов на одну акцию, так как в этих районах имеется различное число групп акционеров, и, кроме того, различны величины интервалов. Необходимо ряды распределения привести к сопоставимому виду. За основу сравнения возьмем структуру распределения акционеров второго района (как наиболее крупную). Следовательно, по первому району нужно произвести вторичную группировку или перегруппировку акционеров, образовав такое же число групп и с теми же интервалами, как во втором районе. Пример построения интервального вариационного ряда Пусть измерен некоторый экономический показатель в 30 регионах: 23 29 35 7 11 18 23 30 36 18 11 8 13 20 25 27 14 30 20 20 24 19 21 26 22 16 26 25 33 27 Расставим экспериментальные данные в возрастающем порядке: 6 8 11 11 13 14 16 18 18 19 20 20 20 21 22 23 23 24 25 25 26 26 27 27 29 30 30 33 35 36 По таблице 1 определяем число классов |