Главная страница
Навигация по странице:

  • Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

  • задание 1. Статистические методы сбора и обработки данных


    Скачать 381.38 Kb.
    НазваниеСтатистические методы сбора и обработки данных
    Дата11.05.2021
    Размер381.38 Kb.
    Формат файлаdocx
    Имя файлазадание 1.docx
    ТипЗадача
    #203745
    страница1 из 3
      1   2   3

    Выполнить по одному
    упражнению из каждой темы.

    СТАТИСТИЧЕСКИЕ МЕТОДЫ СБОРА

    И ОБРАБОТКИ ДАННЫХ

    Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ

    Задача 2.1. На участке месторождения 1000 скважин. Определите минимальный объем случайной бесповторной выборки, которая позволит с вероятностью 0,95 (t=1,96) оценить среднесуточный дебит с предельной ошибкой выборки 1 т/сут. Дисперсия среднесуточного дебита по данным предварительного обследования 34.

    Решение:

    Необходимый объем выборки для случая бесповторного отбора равен:



    где

    σ2 – выборочная (или генеральная) дисперсия;

    n – объем выборочной совокупности;

    N – объем генеральной совокупности;

    t – коэффициент доверия, определяемый в зависимости от уровня веро­ятности;

    Δ – предельная ошибка выборки;

    Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

    Задача 3.1. По данным о среднегодовой численности населения в странах мира в 2013 г. (млн. чел.): 1) постройте статистический ряд распределения; 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы и полигона, оцените характер распределения; 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы, полигона и кумуляты, оцените характер распределения; 3) вычислите характеристики вариационного ряда (размах, среднее значение, моду, медиану, дисперсию, среднее квадратическое отклонение (СКО), коэффициент, вариации, структурные характеристики вариационного ряда (децили и квартили), асимметрию (скос), эксцесс), перечисленные характеристики можно вычислить с помощью встроенных статистических функций в пакете MS Excel. Сформулируйте выводы.

    Страна

    Население

    Страна

    Население

    Страна

    Население

    Люксембург

    0,5

    Австрия

    8,5

    Испания

    46,0

    Эстония

    1,3

    Азербайджан

    9,4

    Республика Корея

    50,2

    Латвия

    2,0

    Беларусь

    9,5

    ЮАР

    53,0

    Респ. Македония

    2,1

    Швеция

    9,6

    Италия

    60,2

    Словения

    2,1

    Венгрия

    9,9

    Франция

    63,7

    Албания

    2,9

    Португалия

    10,5

    Великобритания

    63,9

    Литва

    3,0

    Чешская Респ.

    10,5

    Таиланд

    66,8

    Армения

    3,0

    Греция

    11,0

    Турция

    75,6

    Молдова

    3,6

    Бельгия

    11,2

    Иран

    77,1

    Новая Зеландия

    4,5

    Нидерланды

    16,8

    Германия

    82,0

    Ирландия

    4,6

    Казахстан

    17,0

    Египет

    84,6

    Норвегия

    5,1

    Чили

    17,6

    Вьетнам

    89,7

    Словакия

    5,4

    Румыния

    21,3

    Мексика

    118,4

    Финляндия

    5,4

    Австралия

    22,9

    Япония

    127,4

    Сингапур

    5,4

    Узбекистан

    30,0

    Россия

    143,5

    Дания

    5,6

    Марокко

    33,0

    Пакистан

    184,4

    Киргизия

    5,7

    Канада

    35,2

    Бразилия

    201,0

    Болгария

    7,3

    Алжир

    38,3

    Индонезия

    250,4

    Швейцария

    8,0

    Польша

    38,5

    США

    316,1

    Израиль

    8,1

    Аргентина

    41,7

    Индия

    1211,0

    Таджикистан

    8,1

    Украина

    45,3

    Китай

    1357,0

    Результаты построения статистического ряда распределения

    Группы стран по численности населения, млн. чел.

    Число стран

    Накопленная относительная частота, доли ед.

    Среднегодовая численность населения

    всего в группе (частота)

    в % к итогу (относительная частота)

    всего в группе, млн. чел.

    в среднем по группе, млн. чел.

    в % к итогу

    до 25

    35

    55,6

    55,6

    279,4

    8,0

    5,3

    от 25 до 50

    8

    12,7

    68,3

    308,0

    38,5

    5,9

    от 50 до 75

    6

    9,5

    77,8

    357,8

    59,6

    6,8

    от 75 до 100

    5

    7,9

    85,7

    409,0

    81,8

    7,8

    от 100 до 125

    1

    1,6

    87,3

    118,4

    118,4

    2,2

    от 125 до 150

    2

    3,2

    90,5

    270,9

    135,5

    5,1

    от 150 и более

    6

    9,5

    100

    3519,9

    586,86

    66,9

    Итого

    63

    100

    -

    5263,4

    83,5

    100

    Частота mi – это число наблюдений значения xi в выборке. Относительная частота (частость) wi– это отношение частоты mi к объему выборки n



    При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x, называется накопленной частотой: для xi


    Результаты расчета описательных статистик распределения

    Средняя

    83,55

    Квартиль-1

    11,75

    Мода

    14,61

    Квартиль-2

    23

    Медиана

    23

    Квартиль-3

    34,25

    Дисперсия

    1622184,06

    Дециль-1

    5

    СКО (Стандартное отклонение)

    1273,65

    Дециль-9

    41

    Коэффициент вариации

    1524,42

    Асимметрия

    0,05-0,09

    Размах

    1356,5

    Эксцесс

    0,51



    Группы стран по численности населения (xi), млн.чел.

    Количество единиц в группе ,fi

    Накопле-ная частота

    Середина интервала,



    xi -

    ׀ xi - ׀ · fi

    ׀ xi - ׀ 2

    ׀ xi - ׀ 2 · fi

    ( xi - ) 3· fi

    ( xi - ) 4· fi

    до 25

    35

    35

    11,7

    409,5

    -71,85

    2514,75

    5162,42

    180684,788

    -1418375,58

    -932771212,4

    от 25 до 50

    8

    43

    38

    304

    -45,55

    364,4

    2074,80

    16598,42

    -756058,03

    -34438443,3

    от 50 до 75

    6

    49

    58,5

    351

    -25,05

    150,3

    627,50

    3765,015

    -94313,63

    -2362556,33

    от 75 до 100

    5

    54

    78,25

    391,25

    -5,3

    26,5

    28,09

    140,45

    -744,39

    -3945,24

    от 100 до 125

    1

    55

    118,4

    118,4

    34,85

    34,85

    1214,53

    1214,5225

    42326,11

    1475064,9

    от 125 до 150

    2

    57

    135,35

    271

    51,8

    103,6

    2683,24

    5366,48

    277983,66

    14399553,8

    от 150 и более

    6

    63

    770,7

    4624,2

    687,15

    4122,9

    16998304,4

    101989826,4


    1946730812,56


    1337696077847,34

    Итого:

    63







    6469,35




    7317,3




    102197596

    1944781630,71

    1336742376308,78

    Средняя взвешенная





    Для расчёта моды в интервальном вариационном ряду сначала определяют модальный интервал (интервал, которому соответствует наибольшая плотность распределения), а затем рассчитывают моду по формуле:



    где X0- начало (нижняя граница) модального интервала;

    h- величина интервала;

    - частота модального интервала;

    - частота интервала, предшествующего модальному;

    - частота интервала, следующего за модальным;



    Наиболее часто встречающееся значение ряда 14,61

    Медиана е) - варианта, находящаяся в середине ряда распределения. Для ее определения достаточно проранжировать все варианты, т.е. расположить их в порядке возрастания или убывания. Для интервального ряда расчет медианы производится по формуле:



    где - начало (нижняя граница) медианного интервала;

    - сумма частот ряда;

    - накопленная частота интервала, предшествующего медианному:

    - частота медианного интервала:



    Таким образом, 50% единиц совокупности будут меньше по величине 23.

    Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).





    Среднее квадратическое отклонение является мерилом надёжности средней.



    Коэффициент вариации – отношение среднего квадратического отклонения к средней арифметической.

    Коэффициент вариации является наиболее распространённым показателем колеблемости, используемым для оценки типичности средних величин.



    Коэффициент вариации превышает 33%. Отсюда можно сделать вывод, что совокупность данных неоднородна.

    Размах вариации R характеризует, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака.



    Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3



    Таким образом, 25% единиц совокупности будут меньше по величине 11,75

    Q2 совпадает с медианой, Q2 = 23



    Остальные 25% превосходят значение 34,25.

    Децили (децентили).

    Децили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9



    Таким образом, 10% единиц совокупности будут меньше по величине 5



    Остальные 10% превосходят 41.

    Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.





    Положительная величина указывает на наличие правосторонней асимметрии

    Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.



    Ex > 0 - островершинное распределение

      1   2   3


    написать администратору сайта