Главная страница
Навигация по странице:

  • 1. Скопируем исходные данные

  • 2. Ранжировать ряд данных сортировкой

  • 3. Рассчитаем количество интервалов

  • 7 групп

  • 6,7. Рассчитаем частоты групп и получим интервальный ряд распределения

  • 8. Построим графики ряда распределения

  • 9. Вычислим среднее арифметическое, моду, медиану, квартили, децили

  • 85,38

  • 108,21

  • 188,25

  • 47,43

  • 41,0%

  • 193,6%

  • Итого 59 3855935,08

  • 0,612

  • -0,346

  • Статистика. МУ им.Витте РР Статистика Вар. 12. Задания для выполнения рейтинговой работы 3 Выполнение задания 3


    Скачать 314 Kb.
    НазваниеЗадания для выполнения рейтинговой работы 3 Выполнение задания 3
    АнкорСтатистика
    Дата22.04.2022
    Размер314 Kb.
    Формат файлаdoc
    Имя файлаМУ им.Витте РР Статистика Вар. 12.doc
    ТипДокументы
    #490283

    Титульный лист

    Статистика

    Рейтинговая работа

    Вариант 12

    Содержание

    Задания для выполнения рейтинговой работы 3

    Выполнение задания 3

    Список использованных источников 17


    Задания для выполнения рейтинговой работы


    1. Скопировать данные своего варианта.

    2. Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.

    3. Рассчитать количество интервалов по формуле Стерджеса, округлив вверх до целых единиц.

    4. Рассчитать величину интервала h, округлить до десятков.

    5. Рассчитать границы интервалов:

    6. Подсчитать количество единиц совокупности, принадлежащих каждому из интервалов.

    7. Построить интервальный вариационный ряд в виде таблицы

    8. Построить гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.

    9. Вычислить среднее арифметическое, моду, медиану, квартили, децили.

    10. Вычислить показатели вариации: R, dср, s2, s, Vr, Vd ,V. Вычислить асимметрию и эксцесс.

    11. Сделать вывод об однородности вариационного ряда, о симметричности и остро- или плоско-вершинности распределения.

    Выполнение задания


    1. Скопируем исходные данные

    Исходные данные приведены в таблице 1.

    Таблица 1 - Исходные данные для 12-го варианта

    125

    97

    122

    74

    65

    65

    121

    66

    154

    48

    125

    214

    101

    89

    50

    76

    151

    32

    63

    90

    154

    105

    105

    111

    85

    81

    143

    185

    93

    89

    150

    116

    146

    88

    78

    78

    145

    79

    184

    57

    150

    256

    121

    106

    60

    91

    181

    38

    75

    108

    184

    126

    126

    133

    102

    97

    171

    222

    111


    2. Ранжировать ряд данных сортировкой

    Ранжированный ряд представлен в таблице 2.

    Таблица 2 - Ранжированные данные

    32

    38

    48

    50

    57

    60

    63

    65

    65

    66

    74

    75

    76

    78

    78

    79

    81

    85

    88

    89

    89

    90

    91

    93

    97

    97

    101

    102

    105

    105

    106

    108

    111

    111

    116

    121

    121

    122

    125

    125

    126

    126

    133

    143

    145

    146

    150

    150

    151

    154

    154

    171

    181

    184

    184

    185

    214

    222

    256


    Число наблюдений п = 59.
    3. Рассчитаем количество интервалов по формуле Стерджеса:

    k= 1 + 3,322 × lg n = 1 + 3,322 × lg 59 = 6,883

    Округляем вверх до целых единиц. Таким образом, будем строить ряд, образовав 7 групп с равными интервалами.
    4. Определим величину интервала

    При построении интервального ряда с равными интервалами величина интервала h определяется по формуле:

    , где

    хmax и хmin – наибольшее и наименьшее значения признака в исследуемой совокупности;

    k- число групп интервального ряда.

    Расчет величины интервалов:



    Округляя до десятков, получаем h = 30.
    5. Рассчитаем границы интервалов

    Путем последовательного прибавления величины интервала h = 30 к нижней границе, получаем следующие границы интервалов ряда распределения:

    До 30 60 - 90 90 - 120 120 - 150

    150 - 180 180 - 210 210 и более
    6,7. Рассчитаем частоты групп и получим интервальный ряд распределения

    Определяем число единиц, входящих в каждую группу, используя принцип полуоткрытого интервала [ ), согласно которому единицы со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов, будем относить ко второму из смежных интервалов.

    Помимо количества единиц в абсолютном выражении (частот) в таблице 4 рассчитываем относительные частоты (частости) по формуле:

    .

    Таблица 3 - Интервальный ряд распределения

    Интервалы групп

    Число наблюдений

    в группе, единиц

    В % к итогу



    До 60

    5

    8,5

    60 - 90

    16

    27,1

    90 - 120

    14

    23,7

    120 - 150

    11

    18,6

    150 - 180

    6

    10,2

    180 - 210

    4

    6,8

    210 и более

    3

    5,1

    Итого

    59

    100,0


    Вывод. Распределение наблюдений по группам не является полностью равномерным. Преобладают наблюдения со значениями признака от 60 до 90 единиц. Это 16 наблюдений, доля которых составляет 27,01% от общего числа наблюдений.

    Самая малочисленная группа с наибольшим значением признака (свыше 210 единиц). В данную группу попадает 5,1% от общего числа наблюдений (3 единицы).
    8. Построим графики ряда распределения

    Гистограмма – столбиковая диаграмма, она позволяет визуально оценит симметричность распределения, его близость к нормальному. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения интервалов, а на оси ординат - значения частот или относительных частотГистограмма строится по 1-му и 2-му столбцу таблицы 3 и представлена на рисунке 1.



    Рисунок 1 – Гистограмма распределения

    Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты, а на оси ординат - значения частот или относительных частот. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю «левую» точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю «правую» точку также соединяют с точкой оси абсцисс. Для интервального ряда в качестве значений признака принимаем середины интервалов.

    Середину интервала находим как среднюю арифметическую из нижней и верхней границ интервалов:



    Расчет представлен в таблице 4. Таким образом, полигон строим по 2-му и 3-му столбцу таблицы 4.



    Рисунок 2 – Полигон распределения
    Кумулята строится по накопленным частотам (расчет представлен в таблице 4). Она начинается с нижней границы 1-го интервала (30), накопленная частота откладывается в верхней границе интервала:



    Рисунок 3 – Кумулята распределения
    9. Вычислим среднее арифметическое, моду, медиану, квартили, децили

    Для расчета показателей строим вспомогательную таблицу 4.

    Таблица 4 - Вспомогательная таблица для расчета показателей вариации и

    центра распределения

    Интервалы
    групп

    Число единиц в группе
    (частота)


    Середина интервала



     





    накопленная частота

    До 60

    5

    45

    225

    24976,87

    353,39

    5

    60 - 90

    16

    75

    1200

    26475,15

    650,85

    21

    90 - 120

    14

    105

    1470

    1596,27

    149,49

    35

    120 - 150

    11

    135

    1485

    4106,75

    212,54

    46

    150 - 180

    6

    165

    990

    14595,98

    295,93

    52

    180 - 210

    4

    195

    780

    25167,94

    317,29

    56

    210 и более

    3

    225

    675

    35853,92

    327,97

    59

    Итого

    59

     

    6825

    132772,88

    2307,46

    -


    Для расчета среднего в интервальном ряду используется формула средней арифметической взвешенной:



    Вывод. В рассматриваемой совокупности среднее значение признака составляет 115,68 единицы.

    Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.

    Мода Мо – значение признака, которое встречается наиболее часто в рассматриваемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту).

    Конкретное значение моды для интервального ряда рассчитывается по формуле:

    , где

    хМo – нижняя граница модального интервала,

    h – величина модального интервала,

    fMo– частота модального интервала,

    fMo-1 – частота интервала, предшествующего модальному,

    fMo+1 частота интервала, следующего за модальным.

    Согласно данным модальным интервалом ряда является интервал 60-90, так как его частота максимальна (f1= 16).

    Расчет моды:

    85,38

    Вывод. Для рассматриваемой совокупности наиболее часто встречаются значения признака равные 85,38 единиц.

    Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

    Конкретное значение медианы для интервального ряда рассчитывается по формуле:

    , где

    – нижняя граница медианного интервала,

    h – величина медианного интервала;

    сумма всех частот ряда;

    – частота медианного интервала;

    – сумма частот, накопившихся до начала медианного интервала.

    Медианным интервалом является интервал 90-120, так как именно в этом интервале накопленная частота S3 =35 впервые превышает величину, равную половине совокупности (0,5·59 = 29,5).

    Расчет медианы:

    108,21

    Вывод. В рассматриваемой совокупности половина значение признак не менее 108,21 единиц, а другая половина – не более 108,21 единиц.

    , следовательно, асимметрия правосторонняя, гистограмма сдвинута от центра влево. В совокупности преобладают единицы с более низкими значениями признака, чем среднее значение.

    Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1и Q2; 25% - между Q2и Q3; остальные 25% превосходят Q3.

    0-й квартиль – минимальное значение признака;

    2-й квартиль – медиана;

    1-й и 3-й квартиль рассчитываются аналогично медиане.

    Значение Q1 будет находиться в интервале 60-90, т.к. именно в этом интервале накопленная частота равна 21 впервые превышает четверть суммы частот .

    78,28

    Значение Q3 будет находиться в интервале 120-150, т.к. именно в этом интервале накопленная частота 46 впервые превышает три четверти суммы частот .

    145,23

    Децили делят совокупность на 10 равных частей. Рассчитываются аналогично медиане и квартилям.

    Интервалом 1-го дециля d1 будет является интервал 60-90, т.к. именно в этом интервале накопленная частота 21 впервые превышает 1/10 суммы частот .

    61,69

    Интервалом 9-го дециля d9 будет интервал 180-210, т.к. в этом интервале накопленная частота 56 впервые превышает 9/10 суммы частот .

    188,25
    10. Вычислим показатели вариации

    Вспомогательные расчеты приведены в таблице 5.

    Размах вариации характеризует амплитуду колебаний значений признака, рассчитывается как разность максимального и минимального значения признака. Рассчитываем размах по исходным данным:

    256 – 32 = 224

    Среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Для сгруппированных данных рассчитываем взвешенное среднее линейное отклонение:

    38,46

    Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Для интервального ряда используется формула взвешенной дисперсии:

    2212,88

    Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Однако является более точной характеристикой. Рассчитывается, как корень квадратный из дисперсии:

    47,04

    Расчет исправленной (скорректированной) дисперсии:

    2212,88×59/58 = 2249,76

    Расчет исправленного (скорректированного) среднего квадратического отклонения:

    47,43

    Вывод. Отклонение от среднего значения признака в ту или иную сторону составляет 47,43 единиц. Наиболее характерные значения признака в рассматриваемой совокупности находятся в пределах от 68,25 до 163,11 (диапазон ).

    Коэффициент вариации является мерой относительной колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности:

    41,0%

    Вывод. Значение коэффициента вариации превышает 40%, следовательно, вариация признака в исследуемой совокупности единиц умеренная и совокупность не является однородной. Найденное среднее значение признака не является типичной и надежной характеристикой среднего.

    Относительное линейное отклонение

    33,2%

    Коэффициент осцилляции по сгруппированным данным:

    = 193,6%

    Вывод. Доля среднего линейного отклонения в среднем значении признака составляет 33,2%. Доля размаха вариации в среднем значении – 193,6%.
    11. Рассчитаем показатели формы распределения

    К показателям формы распределения относятся коэффициент асимметрии и эксцесса.

    Для расчета показателей формы распределения строим вспомогательную таблицу 5.

    Рассчитываем центральный момент третьего порядка:



    Таблица 5 - Вспомогательная таблица для расчета показателей формы распределения

    Интервалы
    групп

    Число единиц
    в группе
    (частота)


    Середина интервала







    До 60

    5

    45

    -1765314,69

    124768851,57

    60 - 90

    16

    75

    -1076955,29

    43808350,68

    90 - 120

    14

    105

    -17044,87

    182004,53

    120 - 150

    11

    135

    79350,78

    1533218,48

    150 - 180

    6

    165

    719903,33

    35507096,44

    180 - 210

    4

    195

    1996372,21

    158356304,07

    210 и более

    3

    225

    3919623,60

    428501223,88

    Итого

    59

     

    3855935,08

    792657049,65


    Расчет коэффициента асимметрии:

    0,612

    Вывод. Значение коэффициента асимметрии положительное, что свидетельствует о правосторонней асимметрии распределения, т.е. в совокупности преобладают единицы со значением признака меньшие, чем среднее.

    Рассчитываем центральный момент четвертого порядка:



    Расчет коэффициента эксцесса:

    -0,346

    Вывод. Показатель эксцесса отрицательный, т.е. вершина кривой распределения лежит ниже вершины кривой нормального закона распределения, а форма кривой более пологая по сравнению с кривой нормального закона. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону.

    Список использованных источников


    1. Бережной В. И. Статистика в примерах и задачах [Электронный ресурс]: учебное пособие / В.И. Бережной, О.Б. Бигдай, О.В. Бережная, Киселева О.А. - М.: НИЦ ИНФРА-М, 2016. - 288 с.– Режим доступа: http://znanium.com/bookread2.php?book=502176

    2. Глинский, В. В. Статистика: учебник / В.В. Глинский, В.Г. Ионин, Л.К. Серга [и др.] ; под ред. В.Г. Ионина. — 4-е изд., перераб. и доп. — М. : ИНФРА-М, 2017. — 355 с. – Режим доступа: http://znanium.com/bookread2.php?book=552459

    3. Гужова, О.А. Статистика в управлении социально-экономическими процессами : учеб. пособие / О.А. Гужова, Ю.А. Токарев. — М. : ИНФРА-М, 2017. — 172 с. — Режим доступа: http://znanium.com/bookread2.php?book=556718

    4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики/ [Текст] Учебник. – М.: ИНФРА – М, 2015. – 416 с.

    5. Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. [Текст] 2-е изд. – сПб.: Питер, 2017. – 288 с.: ил.




    написать администратору сайта