Главная страница
Навигация по странице:

  • Группировка

  • Типологические

  • Структурные

  • Аналитические

  • Первичные группировки

  • Вторичные

  • Пример построения интервального вариационного ряда

  • Лекци статистика. Лекции статистика. Курс лекций по статистике Тема Предмет, метод и задачи статистики Термин


    Скачать 1.76 Mb.
    НазваниеКурс лекций по статистике Тема Предмет, метод и задачи статистики Термин
    АнкорЛекци статистика
    Дата13.09.2019
    Размер1.76 Mb.
    Формат файлаdoc
    Имя файлаЛекции статистика.doc
    ТипКурс лекций
    #86714
    страница4 из 32
    1   2   3   4   5   6   7   8   9   ...   32

    СВОДКА И ГРУППИРОВКА ДАННЫХ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
    Статистические сводки и группировки

    Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы стати­стического наблюдения. Проведение сводки включает 3 этапа:

    • предварительный контроль материалов, т. е. проверку исходных данных;

    • группировку данных по заданным признакам, определе­ние производных показателей;

    • оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.

    Предварительный контроль включает логическую проверку данных, т. е. смысловую согласованность сведений, исклю­чение «нелогичных» данных и арифметическую согласованность.

    Пример. Рассогласованные данные.

    В документах на предприятии обнаружены арифметическая и логическая рассогласованности:



    № п/п

    Заработная плата

    Возраст

    Общий стаж

    Непрерывный стаж

    1

    800

    22

    10

    8

    2

    1500

    42

    20

    2

    3

    1500

    25

    45

    55

    4

    2000

    35

    15

    10

    Итого

    5200











    Арифметическая — неправильно определена сумма зара­ботной платы.

    В 3-й строке имеется логическая ошибка: человек 25-ти лет неможет иметь общего стажа 45 лет и, кроме того, непрерыв­на стаж, как часть общего, не может его превосходить.

    Группировка данных производится в соответствии с програм­мой сводки для того, чтобы впоследствии представить полученную информацию в доступном для восприятия виде.

    Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака. Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику ис-1?емой совокупности по одному или нескольким существен-I признакам, взаимосвязанным логикой анализа.

    Пример. Основа группированной таблицы. Название таблицы (общий заголовок). Группировочная таблица три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.


    Содержание

    строк

    Наименования граф (верхние заголовки)

    А

    1

    2

    3

    4

    5



    Наименования строк

    (боковые заголовки)



















    Итоговая строка
















    Итого­вая графа


    Общий заголовок отражает содержание всей таблицы с ука­занием, к какому месту и времени она относится. Он распола­гается над макетом по центру и является внешним заголовком.

    Верхние заголовки характеризуют содержание граф (заго­ловки сказуемого), а боковые (заголовки подлежащего) — строк.

    Подлежащее статистической таблицы — объект, характе­ризующийся цифрами.

    Сказуемое — система показателей, которыми характеризу­ется объект изучения, т. е. подлежащее.

    В зависимости от строения подлежащего все статистиче­ские таблицы можно разделить на три группы:

    • простые или перечневые;

    • групповые;

    • комбинационные.

    Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специаль­ные пометки (...; —; НС).

    Пример. Группировочная таблица.

    Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2003 г.).

    Сказуемое




    Поддерживаю

    Не поддерживаю

    Безразлично

    Студенты 1-го курса

    2

    20

    3

    Студенты 2-го курса

    2

    25

    3

    Студенты 3-го курса

    1

    30

    2

    Студенты 4-го курса



    35



    Студенты 5-го курса



    25



    Итого

    5

    135

    8

    Подлежащее

    Таким образом, группировка – это разделение единиц совокупности на группы по выбранным варьирующим признакам.

    Группировки различают:

    по задачам систематизации данных;

    по числу группировочных признаков;

    по используемой информации.
    Метод группировок применяется для решения задач, воз­никающих в ходе научного статистического исследования:

    • выделения социально-экономических типов явлений;

    • изучения структуры явления и структурных сдвигов, про­
      исходящих в нем;

    • выявления связей и зависимостей между отдельными
      признаками явления.

    Для решения этих задач применяют (соответственно) 3 вида группировок: типологические, структурные и аналитические (факторные).

    Типологические группировки предназначаются для выяв­ления качественно однородных групп совокупностей, т.е. объек­тов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.

    Структурные — разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха ж? квалификации.

    Аналитические — предназначены для выявления зависи­мости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется. По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам — санированные и многомерные).

    Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.

    Многомерные — строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в п-мерном пространстве. где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек.

    При используемой информации различают первичные и вторичные группировки.

    Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

    Вторичные — результат объединения или расщепления первичной группировки.
    Правила оформления статистических таблиц

    Статистическая таблица обязательно имеет заголовок, в котором должны быть указаны цель построения таблицы, тер­ритория и время, к которому относятся данные. Если все еди­ницы измерения одинаковы, то они указываются в заголовке таблицы. Если же они разные — в верхних или боковых заго­ловках таблицы.

    Разграфка таблицы должна включать как можно меньше линий — только горизонтальные линии, отделяющие таблицу от ее заголовка; заголовки граф от значений показателей; ито­говую строку таблицы. Вертикальных линий вообще может не быть. Таблица не очерчивается рамкой, если она не включена в текст. Иногда графы сказуемого нумеруются.

    4.2. Сводка и группировка материалов статистического наблюдения

    В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую ин­формацию, представляющую собой большое количество пер­вичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, обра­зование, род занятий и другие признаки).

    Дальнейшая задача статистики заключается в том, чтобы привести эти материалы в определенный порядок, системати­зировать, и на этой основе дать сводную характеристику всей совокупности фактов при помощи обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Это достигается в результате сводки — второй стадии статистиче­ского исследования.

    Статистическая сводка — научно организованная обработка материалов наблюдения, включающая в себя систематизацию группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее час­тей, осуществлять анализ и прогнозирование изучаемых про­цессов.

    Если производится только подсчет общих итогов по изу­чаемой совокупности единиц наблюдения, то сводка называет­ся простой. Например, для получения общей численности сту­дентов высших учебных заведений России достаточно сложить данные о численности студентов всех высших учебных заведе­ний (на начало 1995/96 учебного года в государственных вузах страны обучалось 2,66 млн. чел.).

    По технике или способу выполнения сводка может быть ручной либо механизированной (с помощью ЭВМ).

    Статистическая сводка должна проводиться по опреде­ленным программе и плану.

    Программа статистической сводки устанавливает следующие этапы:

    • выбор группировочных признаков; определение порядка формирования групп;

    • разработка системы статистических показателей для ха­рактеристики групп и объекта в целом;

    • разработка макетов статистических таблиц для представ­ления результатов сводки.


    ПЛАН статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке изложения и представления результатов

    В сводке статистического материала отдельные единицы статистической совокупности объединяются в группы при по­чет ода группировок.

    Статистическая группировка — процесс образования однородных групп на основе расчленения статистической совокупностина части или объединения изучаемых единиц в частные совокупности по существенным для них признакам, каждая характеризуется системой статистических показателей. Например, группировка промышленных предприятий по формам собственности, населения по размеру среднедушевого дохода, коммерческих банков по сумме активов баланса и т.д.

    Особым видом группировок является классификация. Представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемо­го объекта. Классификация выступает в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени, например, ЕГРПО, Общероссийский клас­сификатор видов экономической деятельности, продукции и услуг (ОКДП), классификация основных фондов в промыш­ленном строительстве, капитальных вложений, затрат на про­изводство и др.

    Метод статистических группировок позволяет разрабаты­вать первичный статистический материал. На основе группи­ровки рассчитываются сводные показатели по группам, появля­ется возможность их сравнения, анализа причин различий меж­ду группами, изучения взаимосвязей между признаками. Рас­чет сводных показателей в целом по совокупности позволяет изучить ее структуру.

    Кроме того, группировка создает основу для последующей сводки и анализа данных. Этим определяется роль группировок как научной основы сводки.

    Большие достижения в области применения метода груп­пировок имеет современная отечественная статистика. Вве­дение группировочных таблиц, содержащих показатели меж­дународной СНС, превращает группировки (классификации) в эффективный метод анализа и вскрытия резервов в эконо­мике.

    4.3. Выполнение группировки по количественному признаку

    При составлении структурных группировок на основе варь­ирующих количественных признаков необходимо определить количество групп и интервалы группировки.

    Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т. е. он очерчивает количествен­ные границы групп.

    Как правило, величина интервала представляет собой раз­ность между максимальным и минимальным значениями при­знака в каждой группе.

    Вопрос о числе групп и величине интервала следует решать с учетом обстоятельств, прежде всего исходя из целей иссле­дования, значения изучаемого признака и т. д.

    Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц иссле­дуемого объекта и степени колеблемости группировочного при­знака. При небольшом объеме совокупности нельзя образовы­вать большое число групп, так как группы будут малочислен­ными.

    При определении количества групп необходимо стре­миться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представля­ет интерес и малочисленные группы: новое, передовое, пока не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их.

    Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.

    На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.

    Ориентировочно определить оптимальное количество групп с равнымиинтервалами можно по формуле американского ученого Стерджесса


    N

    15-24

    25-44

    45-89

    90-179

    180-359

    360-719

    n

    5

    6

    7

    8

    9

    10


    Формула Стерджесса пригодна при условии, что распре­деление единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интерва­лы в группах. Чтобы получить группы, адекватные действи­тельности, необходимо руководствоваться сущностью изучае­мого явления.

    Интервалы могут быть равные и неравные. При исследо­вании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) ин­тервалы. Так, например, по численности работающих про­мышленные предприятия могут быть разбиты на следующие группы: до 100 чел., 100-200; 200-300; 300-500; 500-1000; 1000 и более человек. Это объясняется тем, что количествен­ные изменения размера признака имеют неодинаковые зна­чения в низших и высших по размеру признака группах; из­менение количества работающих на 50-100 чел. имеет суще­ственное значение для мелких предприятий, а для крупных — не имеет.

    Группировки с равными интервалами целесообразны в тех , случаях, когда вариация проявляется в сравнительно узких гра­ницах и распределение является практически равномерным (на­пример, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры — по урожай­ности).

    Для группировок с равными интервалами величина ин­тервала

    I= (X max – X min) /n

    X max, X max – наибольшее и наименьшее значения признака, n- число групп.

    Если, например, требуется произвести группировку с рав­ными интервалами по данным об уровне месячной заработной платы рабочих, которая в 2006 г. колебалась в пределах от 600-до 7500 руб., и необходимо при этом выделить 5 групп, то ве­личина интервала, в рублях, составит:
    I =(7500-6000) /5 = 300

    Если в результате деления получится нецелое число и воз­никнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.

    Прибавляя к минимальному значению признака (в данном случае 6000 тыс. руб.) найденное значение интервала, получа­ем верхнюю границу первой группы, тыс. руб.:

    6000 + 300 = 6300.

    Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы

    6300 + 300 = 6600, и т. д.

    В результате получим такие группы рабочих по размеру заработной платы, руб.:

    6000-6300; 6300-6600; 6600-6900; 6900-7200; 7200-7500.

    В этом распределении имеет место неопределенность: к группе, например, отнести рабочего с заработком в 6300 первой или второй? Для устранения неопределенности открывают един из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенные, а правое — не включает. Значит рабочий, получающий 6300 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп могут быть закрытыми, когда указаны верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «7500 и выше». И наоборот, чтобы значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «ме­нее» и «более».

    Все сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имею­щимися группировками, которые не удовлетворяют требова­ниям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведе­ния таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группи­ровки.

    Вторичная группировка — образование новых групп на ос­нове ранее осуществленной группировки.

    Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначаль­ных интервалов (путем их укрупнения) и долевой перегруппи­ровкой (на основе закрепления за каждой группой определен­ной доли единиц совокупности).

    Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рас­смотрим, на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию в 1996 г. (по условным данным табл. 4.1).

    Приведенные данные не позволяют сравнить распределе­ние акционеров двух районов по размеру дивидендов на одну акцию, так как в этих районах имеется различное число групп акционеров, и, кроме того, различны величины интервалов.

    Необходимо ряды распределения привести к сопоста­вимому виду. За основу сравнения возьмем структуру рас­пределения акционеров второго района (как наиболее круп­ную). Следовательно, по первому району нужно произвести вторичную группировку или перегруппировку акционеров, образовав такое же число групп и с теми же интервалами, как во втором районе.
    Пример построения интервального вариационного ряда

    Пусть измерен некоторый экономический показатель в 30 регионах:

    23 29 35 7 11 18 23 30 36 18 11 8 13 20 25 27 14 30 20 20 24 19 21 26 22 16 26 25 33 27

    Расставим экспериментальные данные в возрастающем порядке:

    6 8 11 11 13 14 16 18 18 19 20 20 20 21 22 23 23 24 25 25 26 26 27 27 29 30 30 33 35 36

    По таблице 1 определяем число классов
    1   2   3   4   5   6   7   8   9   ...   32


    написать администратору сайта