Статистика (3-5 теми). Тема зведення, класифікації та групування статистичних даних
Скачать 333.56 Kb.
|
ТЕМА 3. ЗВЕДЕННЯ, КЛАСИФІКАЦІЇ ТА ГРУПУВАННЯ СТАТИСТИЧНИХ ДАНИХ
1. Суть та організація статистичного зведення Зареєстрований в процесі масового статистичного спостереження матеріал являє собою розрізнені початкові дані про окремі одиниці сукупності досліджуваного явища. Такі дані ще не характеризують явище в цілому: не дають уяви про величину (чисельність) явища, його склад, розмір характерних ознак, зв'язок з іншими явищами; у поодиноких відомостях поки що губиться загальне і відсутнє закономірне. Наприклад, при вивченні стану торгівлі району міста зібрані статистичні дані про комерційну діяльність окремих торгівельних підприємств дають відповідну оцінку роботи кожного з них. Узагальнюючу характеристику за торгівельними підприємствами в цілому по району можна отримати шляхом систематизації та узагальнення отриманої інформації. Перехід від одиничних даних статистичного спостереження, як першого етапу статистичного дослідження, до отримання узагальненого матеріалу про явище в цілому відбувається через зведення. Зведення, як другий етап статистичного дослідження - це наукова обробка даних спостереження для подальшого опису статистичної сукупності за узагальнюючими показниками. Суть статистичного зведення полягає в об'єднанні одиниць сукупності в групи, класи, типи і агрегуванні інформації про них як у межах груп, так і в цілому за сукупністю. Основне завдання зведення полягає у виявленні типових рис та закономірностей у сукупності. Статистичне зведення можна розглядати подвійно. З одного боку, у вузькому розумінні, зведення являє собою процес отримання підсумкових (узагальнюючих) даних про масове суспільне явище. З другого боку, в широкому розумінні, зведення є цілий комплекс статистичних операцій: об'єднання зареєстрованих при спостереженні початкових даних у групи, подібних в тому чи іншому відношенні; підрахунок результатів за виділеними групами і за всією сукупністю в цілому; отримання на основі цих результатів системи взаємопов'язаних показників, які характеризують досліджуване явище, і оформлення результатів у вигляді статистичних таблиць, графіків, рядів розподілу. Вся багатогранна та складна робота за статистичним зведенням складається з таких етапів:
Програма статистичного зведення встановлює такі види робіт:
• вибір способу зведення даних статистичного спостереження. План статистичного зведення містить в собі вказівки про послідовність і терміни виконання окремих частин зведення, її виконавцях і порядку викладання та представлення результатів. На сучасному етапі суспільного розвитку обробка даних спостереження здійснюється, в основному, автоматизовано з використанням ПК (персональних комп'ютерів). Тому додатковими складовими статистичного зведення при цьому є такі:
Статистичні зведення розрізняють за рядом ознак: за складністю побудови; організацією роботи; ступенем обробки даних. За складністю побудови зведення буває просте і складне. Просте зведення - це підбиття підсумків первинного матеріалу в цілому без будь-якої його систематизації. Складне зведення поєднує комплекс операцій: групування одиниць; підбиття групових і загальних підсумків; подання результатів зведення у формі статистичних таблиць, графіків, рядів розподілу. За організацією роботи визначають централізоване і децентралізоване зведення. При централізованому зведенні всі дані зосереджуються в одному місці (центрі), де й обробляються. Такий спосіб зведення використовується при переписах населення, одноразових статистичних обстеженнях, соціологічних опитуваннях. При децентралізованому зведенні обробка статистичної інформації здійснюється від нижчої до вищої ланки управління: звіти підприємств зводяться регіональними статистичними органами, підсумки за регіонами передаються в Держкомстат, де узагальнюються в цілому по країні. У вітчизняній статистичній практиці обробка інформації відбувається переважно децентралізовано. За ступенем автоматизації обробки даних зведення розрізняють на автоматизоване, яке проводиться на автоматизованих робочих місцях з використанням ПК, і ручне. З технічної точки зору процес зведення складається із ряду операцій:
В процесі зведення потрібен контроль отриманих даних. Перевірці підлягає матеріал обстеження та остаточний матеріал зведення. При децентралізованому зведенні така перевірка здійснюється на кожній наступній стадії узагальнення даних. Наукову основу статистичного зведення складають класифікації та групування. 2. Класифікації в економічній практиці На другому етапі статистичного дослідження здійснюється розподіл сукупності на групи, однорідні в тому чи іншому розумінні. При цьому використовується найважливіші положення такого розподілу: в одну групу об'єднуються елементи сукупностей, певною мірою подібні між собою; міра подібності між елементами одної групи значно вища, ніж між елементами, що належать до інших груп. У кожному конкретному статистичному дослідженні вирішують такі питання: що взяти за основу групування; скільки груп необхідно сформувати; як розмежувати групи. Основою розмежування елементів в сукупності на групи може бути будь-яка ознака (атрибутивна чи кількісна), що має якісно відмінну характеристику. Таку ознаку називають групувальною. Залежно від складності явища та мети дослідження групувальних ознак може бути декілька. Якщо розмежування елементів сукупності на групи здійснюється за атрибутивними ознаками, то такий вид групування називають класифікацією або номенклатурою. Вони розробляються міжнародними та національними статистичними органами і рекомендуються як статистичний стандарт. Класифікація у статистиці - це систематизований розподіл явищ та об'єктів на певні групи, класи, розряди на підставі їх збігу або різниці. Різновидом класифікацій є товарні номенклатури як стандартизований перелік об'єктів та груп. Розрізняють такі види статистичних класифікацій:
Прикладами діючих класифікацій національного рівня є такі, що повністю узгоджені з міжнародними стандартами:
Спільним у національних та міжнародних класифікаціях є те, що варіація їх ознак фіксується у певному системному вигляді з використанням кодів (шифрів) класифікуємих позицій. 3. Групування статистичних даних Групування взагалі, як основний елемент статистичного зведення, є розподіл сукупності масових явищ і процесів суспільного життя на типи і групи за найбільш характерними ознаками. Якщо ознаками виступають кількісні показники, то такий вид робіт (на відміну від класифікацій) називають у вузькому розумінні безпосередньо статистичним групуванням. Метою статистичного групування є поділ сукупностей на однорідні типові групи за існуючими для них кількісними ознаками з метою всебічної характеристики їхнього стану, розвитку і взаємодії. За допомогою групувань вирішують три важливі взаємопов'язані завдання: виділення різних соціально-економічних типів явищ (процесів) та всебічна їх характеристика; дослідження структури масової сукупності; вивчення взаємодії між окремими ознаками сукупності. Залежно від мети та завдань дослідження групування поділяють на такі їх види: типологічні; структурні; аналітичні. Групування, що приводять до виділення у складі масових явищ їх соціально-економічних типів (тобто однорідних частин за якістю та умовам розвитку, в яких діють одні ї теж закономірності факторів) називають типологічними. Прикладом цього виду групувань є групування населення за віковим складом, групування підприємств за формою власності тощо. Побудова цих групувань на тривалий час дозволяє простежити процес розвитку суспільства, форм власності. Групування, що направлені на вирішення даних задач, займають ведуче місце у вітчизняній статистиці. Структурні групування характеризують склад однорідної сукупності за будь-якою ознакою. З допомогою таких групувань аналізують структуру сукупності і структурні зрушення в розвитку соціально-економічних явищ і процесів. До них належать групування населення за статтю, віком, а на виробництві - групування робітників за виробничим стажем, рівнем кваліфікації тощо. Групування, які спрямовані на виявлення зв'язку між окремими ознаками явища, що вивчається, називаються аналітичними. Прикладом таких групувань можуть бути групування, в яких вивчаються взаємозв'язки між собівартістю та її факторами, продуктивністю праці та її факторами і т.д. За кількістю групувальних ознак, покладених в основу групування, розрізняють прості та комбінаційні групування. Простим називають групування, яке проводиться за однією ознакою. У разі поєднання двох і більше ознак групування є комбінаційним. У комбінаційних групуваннях групи з однією ознакою поділяються на підгрупи з іншою ознакою (наприклад, групування підприємств за формою власності, розміром прибутку, рівню рентабельності або за іншими ознаками - продуктивністю праці, фондовіддачею та ін.). Поряд з первинним групуванням, види якого розглянуті вище, у статистиці застосовують вторинне, яке проводять на основі раніше здійсненого. Воно використовується для кращої характеристики досліджуваного явища, якщо первинне групування не дає змоги чітко визначити характер розподілу одиниць сукупності. При використанні методу групування вирішують такі питання: а) вибір групувальної ознаки; б) визначення кількості груп та величини інтервалу; в) встановлення переліку показників, якими повинні характеризуватись виділені групи стосовно конкретного групування; г) складання макетів таблиць, де будуть представлені результати групування; д) обчислення абсолютних, відносних і середніх показників; ж) табличне і графічне оформлення результатів групування. Принципове значення при побудові групувань має вибір групувальної ознаки, на основі якої виділяють різні типи, групи і підгрупи. За групувальні приймають найістотніші ознаки. Групувальною ознакою може бути атрибутивна (якісна) або кількісна ознака.При групуванні атрибутивною ознакою виділяють стільки груп, скільки є найменувань ознаки. Таблиця 1. Розподіл земель міста за видами забудови
Перші три групи таблиці представляють основні види забудови, а четверта - об'єднує решту менш вагомих видів. Такий вид групування відноситься до структурного, яке в даному прикладі характеризує масштаби та вагомість окремих видів забудови на території міста. При складанні групувань на основі кількісних ознак (дискретних або неперервних) визначають кількість груп та інтервали групування. Для визначення кількості груп необхідно дотримуватись двох важливих умов побудови групувань: 1) виділені групи мають відрізнятися якісною однорідністю; 2) кількість одиниць у кожній групі має бути досить великою, що відповідає вимозі закону великих чисел. У масових сукупностях оптимальну кількість груп з рівними інтервалами приблизно можна визначити за формулою американського вченого Стерджеса: т = 1+3,322 Ign де т - кількість груп; п - обсяг сукупності. Формула Стерджеса може бути використана при умові, що розподіл одиниць сукупності за даною ознакою наближається до нормального закону розподілення. Інтервали, тобто проміжок між значеннями ознаки в групі одиниць, бувають рівні, нерівні, відкриті та закриті. Вибір виду інтервалу залежить від характеру розподілу одиниць досліджуваної сукупності. Рівні інтервали використовують у випадках, коли значення варіюючої ознаки х змінюються плавно, поступово, рівномірно. Ширина інтервалу h визначається за формулою: де хтах, хтіп- найбільше та найменше значення ознаки у сукупності. Наприклад, прибутковість активів комерційних банків коливається в межах від 5 до 45%. При прийнятті кількості груп т=4 ширина інтервалу = 10. Тоді межі інтервалів становлять відповідно: 5-15, 15-25, 25-35, 35-45. Оскільки межі інтервалів збігаються (15 - в перший та другий групі, 25 - в другій та третій, 35 - в третій і четвертій), то для виключення невизначеності віднесення межових значень ознаки до той чи іншої групи використовують правило: ліве число не включає в себе значення ознаки, праве -включає. Тоді, наприклад, число 15 повинно бути віднесено до другої групи, а не першої. Всі інтервали у даному прикладі називаються закритими. Наведений розподіл прибутковості активів банків може бути представлено у іншому вигляді: до 15, 15-25, 25-35, 35 і більше. Перший і останній інтервали мають лише одну межу і називаються відкритими. Нерівні інтервали використовуються у разі, коли діапазон значень ознаки надто широкий і розподіл сукупності за цією ознакою нерівномірний. Наприклад, розподіл селищ міського типу за кількістю жителів (тис. чол.): до 3; 3-4,9; 5-9,9; 20-49,9. 4. Ряди розподілу Особливим видом групувань в статистиці є ряди розподілу, які є найпростішим способом узагальнення статистичних даних. Рядом розподілу називають групування, яке характеризує склад (структуру) явища в даний період часу. В залежності від того, яка ознака (якісна чи кількісна) покладена в основу групування, ряди розподілу бувають атрибутивними (якісними) чи варіаційними (кількісними). Прикладом атрибутивних рядів може бути розподіл населення за статтю, зайнятістю, національністю, професією тощо. В табл. 2 наведено атрибутивний ряд розподілу студентів університету за економічними спеціальностями: Таблиця 2 Розподіл студентів університету за економічними спеціальностями на 01.09.212року
Елементами (характеристиками) цього ряду розподілу є: значення атрибутивної ознаки (перша графа таблиці); частотиfi - чисельні характеристики окремих значень ознаки, тобто числа, які показують, як часто зустрічається те чи інше значення ознаки в ряду (друга графа); частки — це частоти, виражені у відносних величинах (коефіцієнтах або процентах), що наведені у третій графі таблиці. Варіаційні ряди розподілу бувають дискретними та інтервальними. Дискретні варіаційні ряди засновані на величинах ознак, що мають цілі значення (наприклад, тарифний розряд робітників, кількість марок автомобілів тощо). Таблицею 3 ілюструється дискретний ряд розподілу сімей в населеному пункти за кількістю дітей. В інтервальних варіаційних рядах групувальна ознака може приймати любе значення (ціле, дрібне) в межах кожного інтервалу (наприклад, розподіл заробітної плати працюючих в організації, розподіл основних фондів підприємства тощо. В табл. 4 наведено інтервальний ряд розподілу комерційних банків у населеному пункті за величиною прибутку. До основних елементів варіаційних рядів розподілу відносяться: варіанти х, - числові значення кількісної ознаки в групуванні (перша графа таблиць), які можуть бути додатними, від'ємними, абсолютними, відносними; частоти fi -значення окремих варіантів (друга графа); частки щ (третя графа).
Окрім зазначених елементів варіаційних рядів до їх характеристик можуть бути віднесені такі показники: щільність частоти (h – ширина інтервалу), накопичена частка. Такі показники використовуються при розгляді побудованих рядів розподілу. В таблиці 5 наведено використання характеристик варіаційного інтервального ряду на прикладі розподілу сільських господарств області Таблиця 5 Розподіл господарств за поголів'ям крупної рогатої худоби за звітній період
5. Статистичні таблиці Результати статистичного зведення та групування, як правило, оформлюють у вигляді статистичних таблиць. Статистична таблиця - це форма раціонального та наочного представлення числових даних, які характеризують досліджувані явища і процеси. В статистичній практиці використовують таблиці різної складності в залежності від мети дослідження, особливостей об'єкта дослідження, обсягу наявної інформації. Таблиця за своїм логічним змістом розглядається як „статистичне речення", що має свій підмет і присудок. Підмет таблиці характеризує об'єкт дослідження, а присудок - це система показників, що відображує підмет як об'єкт. Залежно від структури підмета статистичні таблиці поділяють на прості, групові та комбінаційні. Підмет простої таблиці являє собою перелік одиниць явища чи процесу і в присудку відсутнє групування статистичних даних. Такі таблиці можуть бути переліковими, хронологічними, територіальними. Прикладом простої переліскової таблиці є інформація про наявність будівельних машин в будівельних управліннях регіону: Таблиця 6 Наявність будівельних машин у будівельних управліннях регіону за станом на 01.01.2012року
Підметом таблиці є вид машин, присудком - кількість різних їх видів. У групових статистичних таблицях підмет групується за однією ознакою (табл. 7), а у комбінаційних за двома і більше ознаками (табл. 8). У наведеній груповій таблиці підметом є магазини міста, які поділені на групи за рівнем продуктивності праці, присудком - показники цих організацій (кількість магазинів, фондовіддача, рентабельність). У прикладі комбінаційної таблиці підметом є магазини, розподілені на групи та підгрупи за часткою площі торгівельного зала та тривалістю робочого дня, у присудку наведено показники, які найбільш повно характеризують ефективність роботи магазинів. Складання статистичної таблиці здійснюється в два етапи. На першому етапі розробляється макет таблиці, на другому - заповнюється статистичними даними. Макет таблиці - це комбінація горизонтальних рядків та вертикальних граф (стовпців), на перетині яких утворюються клітини для запису відповідної інформації. Ліві бічні та верхні клітини призначені для словесних заголовків підмета та системи показників ,присудка. Інші клітини таблиці передбачені для числових статистичних даних. Основний зміст таблиці вказується у її назві. Таблиця 7 Групування магазинів за рівнем продуктивності праці працівників за звітний період
Таблиця 8 Групування продовольчих магазинів міста за часткою площі торгівельного зала та тривалості робочого дня за звітний період
Під час розробки і заповнення макетів таблиць необхідно додержуватись певних технічних правил, а саме:
даних, дають докладне тлумачення змісту окремих показників та інші пояснення. 6. Статистичні графіки Наочне представлення результатів спостереження та групування соціально-економічних явищ і процесів може бути надано на графіках. Статистичний графік - це масштабне зображення статистичних даних за допомогою ліній, геометричних фігур та інших наочних засобів. Графіки використовуються для характеристики зміни суспільних явищ і процесів у часі, дослідження структури та порівняння явищ, контролю виконання плану, зображення явищ у просторі та в інших випадках. Вони дають змогу візуальним способом охопити всю сукупність статистичних даних і скласти в цілому картину про вивчаєме явище чи процес. Наочне зображення досліджуваних даних сприяє кращому виявленню найхарактерніших зв'язків між факторами, дозволяє виявити тенденцію у зміні та розвитку окремих явищ. Значна роль графічної інформації у пропаганді передового досвіду, новітніх технологій, прогресивних тенденцій, в рекламних цілях тощо. Статистичні графіки відрізняються великою різноманітністю, їх можна поділити на дві великі групи: діаграми та статистичні карти. Найбільш поширеною групою є діаграми, на яких статистичні дані зображуються за допомогою геометричних знаків, ліній і фігур. В залежності від способу побудови розрізняють такі основні види діаграм: лінійні, радіальні, секторні, стовпчикові, стрічкові, фігурні та ін. Радіальні діаграми (рис. 2) використовують для зображення явищ, які періодично змінюються за часом (переважно сезонних коливань). Для їх побудови застосовують полярну систему координат. Круг поділяють на 12 рівних частин, кожна з яких означає певний місяць. На радіусі, починаючи з центра, в масштабі відкладають відрізки, що зображують місячні рівні ознаки. Кінці цих відрізків з'єднуються між собою, в наслідок чого створюється замкнута фігура - дванадцятигранник, який характеризує сезонні коливання досліджуваного явища. Динаміку (розвиток явищ у часі) найчастіше відображають за допомогою лінійних діаграм (рис. 1). їх будують в масштабі у прямокутній системі координат: на осі абсцис відкладають періоди або моменти часу, на осі ординат - числові значення показника. На перетині перпендикулярів відповідних значень досліджуваної ознаки і часових дат отримують точки. Ламана лінія, що їх з'єднує, характеризує зміну досліджувального явища у часі. Сезонні діаграми (рис. 3) характеризують структури явища. Для побудови секторної діаграми круг розділяється радіусами на сектори, площі яких пропорційні частинам досліджуваного явища в загальному обсязі зображуваного круга, що дорівнює 100% або 360°. Перед побудовою діаграми абсолютні значення величин ознаки переводять у проценти, а проценти - у градуси. Кожний процент дорівнює 3,6° (360:100). Рисунок 3. Структура ВВП країни за компонентами доходу Стовпчикові діаграми (рис. 4) використовують для наочного зіставлення обсягів вивчає мого явища за часом або у просторі Рисунок 4. Індекси реального доходу ВВП країни Вертикальні стовпчики в масштабі відповідають чисельним значенням ознаки. Стовпчики можуть розташовуватись один від одного на однаковій відстані або щільно. Зображення стовпчиків може бути площинним (див. рис. 4) або об'ємним. Якщо стовпчики розташовуються не вертикально, а горизонтально, то такі діаграми називаються стрічковими (смугастими). В статистиці, перш за все в рекламних цілях, використовують також фігурні діаграми. При їх побудові статистичні дані зображуються малюнками-символами (банки консервів, автомобілі тощо), площі яких пропорційні величинам відповідних ознак. Ці діаграми більш наочні, легше сприймаються і тому їх використовують для реклами окремих товарів. Другою групою статистичних графіків є статистичні карти. До статистичних карт належать картограми і картодіаграми. Картограми - це зображення певної ознаки на схематичній географічній карті різними забарвленням або штрихуванням. Наприклад, різна щільність населення країни може бути відображена різною інтенсивністю забарвлення території. Картограма являє собою поєднання схематичної географічної карти з однієї із згаданих вище діаграм. При цьому статистичні показники зображуються у вигляді стовпчиків, квадратів, трикутників, силуетів тощо. Особливе місце, у зв'язку із специфічністю, займає графічне зображення рядів розподілу. Такі графіки значно полегшують аналіз рядів розподілу, дозволяють отримати уявлення про форму розподілу. Для графічного зображення дискретного варіаційного ряду використовують полігон розподілу (рис.5). Його зображують у прямокутній системі координат, де на осі абсцис відкладають значення варіант х, а на осі ординат - частоти f . Одержані точки з координатами хiта fi з'єднують прямими лініями. Для замикання полігону кінцеві вершини з'єднують з точками на осі абсцис (див. преривні лінії на рис. 5), які відстоять на одну поділку від Хтах 1 Хmin Графічне зображення інтервального варіаційного ряду виконують у вигляді гістограми. Для рядів з рівними інтервалами будують гістограму в осях (рис. 6). Для незакритого першого інтервалу у якості х1беруть середнє значення другого інтервалу, а для незакритого останнього інтервалу - середнє значення пре достатнього xn-1. Рис. 5. Полігон розподілу Рис. 6. Гістограма для ряда з рівномірними інтервалами Для інтервальних рядів з нерівними інтервалами будують гістограму щільності розподілу (рис. 7) так як щільність дає уяву про наповненість інтервалу. Гістограму будують в осяхабо Слід звернути увагу, що площі окремих прямокутників пропорційні частотам (часткам) відповідних інтервалів. В ряді випадків для зображення варіаційних рядів використовується кумулята (рис. 8). Для її побудові на осі абсцис відкладають варіанти х, а на осі ординат - накопичені частоти (частки) F. Зображення варіаційного ряду у вигляді кумуляти зручно при зіставленні варіаційних рядів, а також в економічних дослідженнях (наприклад, для аналізу концентрації виробництва). Рис. 7. Гістограма для ряда з Рис. 8. Кумулята |