Главная страница
Навигация по странице:

  • 191,76 1029,78 762,307

  • статистика задачи. статка зад 2 12 34 44 54. Задача 2 3 Задача 12 13 Задача 24 16 Задача 34 19 Задача 44 23 Задача 54 26 Список использованной литературы 28


    Скачать 226.11 Kb.
    НазваниеЗадача 2 3 Задача 12 13 Задача 24 16 Задача 34 19 Задача 44 23 Задача 54 26 Список использованной литературы 28
    Анкорстатистика задачи
    Дата19.12.2021
    Размер226.11 Kb.
    Формат файлаdocx
    Имя файластатка зад 2 12 34 44 54.docx
    ТипЗадача
    #309163
    страница1 из 5
      1   2   3   4   5

    СОДЕРЖАНИЕ





    Задача 2 3

    Задача 12 13

    Задача 24 16

    Задача 34 19

    Задача 44 23

    Задача 54 26

    Список использованной литературы 28






    Задача 2




    По исходным данным необходимо:

    1. построить интервальный вариационный ряд распределения, дать его графическое изображение;

    2. рассчитать показатели центра распределения: среднюю арифметическую, моду и медиану;

    3. определить абсолютные и относительные показатели вариации, сделать выводы об однородности совокупности;

    4. определить показатели формы распределения;

    5. проверить соответствие эмпирического распределения закону нормального распределения, используя критерий согласия Пирсона, изобразить эмпирическое и теоретическое распределения на одном и том же графике.


    Задача 2.

    11 9 2 8 11 5 10 8 4 9

    7 6 11 5 18 6 10 7 11 4

    12 14 13 8 9 12 5 17 13 17

    11 9 1 10 1 5 8 8 0 3

    17 3 8 7 4 15 16 3 16 1

    Решение
    1. Для построения интервального ряда вначале  определяем размер интервала:

    где xmax – максимальное значение признака в совокупности;

    xmin - минимальное значение признака в совокупности;

    m – число интервалов

    п = (18-0)/

    Количество  интервалов определим с помощью  формулы Стерджесса:


    где n – объем совокупности (количество исходных значений). В нашем случае n=50.



    Количество  интервалов обязательно должно быть целым числом. Поскольку формула  Стерджесса дает лишь приблизительную оценку количества интервалов, то можно принять либо m=6, либо m=7. Для удобства дальнейших вычислений примем  m=6.

    Тогда размер интервала будет равен:

    п= (18-0)/6=3

    Нижняя граница  первого интервала равна минимальному значению признака в совокупности, т.е. в нашем случае равна 0. Верхняя  граница первого интервала равна  нижней границе плюс размер интервала, т.е. 0+3=3.

    Нижняя граница второго интервала  равна верхней границе первого, т.е. 3. Верхняя граница второго  интервала равна нижней границе  второго интервала плюс размер интервала, т.е. 3+3=6 и т.д.

    В итоге получаем границы для шести интервалов. Заносим границы интервалов в  таблицу (табл. 1, колонка 2).

    Далее подсчитываем количество значений признака из заданной совокупности, попавших в  тот или иной интервал и заносим  это число в колонку «Частота». Если значение попадает на границу  между k-ым и (k+1)-ым интервалами, то его относят в (k+1)-ый интервал. Сумма всех частот обязательно должна совпадать с объемом совокупности (в нашем случае со значением 50).

    Вычисляем частости, т.е. частоты, выраженные в процентах к общему объему совокупности:

    Таблица 1 – Группировочная

    № интервала

    Интервал

    Частота (f)

    Частость(w), %

    Накопленная частота (S)

    Плотность распределения (ρ)

    1

    0-3

    5

    10

    5

    1,667

    2

    3-6

    10

    20

    15

    3,333

    3

    6-9

    11

    22

    26

    3,667

    4

    9-12

    12

    24

    38

    4

    5

    12-15

    5

    10

    43

    1,667

    6

    15-18

    7

    14

    50

    2,333

    итог




    50

    100








    Накопленная частота показывает, сколько единиц изучаемой совокупности имеет значение признака не более чем некоторое заданное.

    Последнее значение накопленной частоты должно быть равно объему совокупности.

    Плотность распределения показывает, сколько единиц совокупности приходятся на единицу длины интервала.

    Представим графически на рис. 1-2



    Рисунок 1- Гистограмма распределения

     


    Рисунок 2 – Накопленная частота
    Видим, что ряд имеет одну вершину в интервале 9-12, поэтому считаем, что распределение нормальное. Перегруппировывать не нужно.

    2. К показателям центра распределения  относятся: средняя арифметическая, мода и медиана.

    Таблица 2 – Расчет среднего значения

    № интервала

    Интервал

    Частота (f)

    Середина интервала, xi

    f*х

    Накопленная частота (S)

    1

    0--3

    5

    1,5

    7,5

    5

    2

    3--6

    10

    4,5

    45

    15

    3

    6--9

    11

    7,5

    82,5

    26

    4

    9--12

    12

    10,5

    126

    38

    5

    12--15

    5

    13,5

    67,5

    43

    6

    15--18

    7

    16,5

    115,5

    50

    итог

     

    50

     

    444

     


      Средняя арифметическая


    где xi –середина i-го интервала.



    Мода – наиболее часто встречающийся признак.



    – нижняя граница модального интервала;

    – величина модального интервала;

    – частота модального интервала;

    , – частоты интервалов предыдущего модальному и последующего за модальным.


    Медиана – середина упорядоченного ряда, делит ряд на две равные части.

    В интервальном ряду медиана рассчитывается так:



    – нижняя граница медианного интервала;

    – величина медианного интервала;

    – накопленная частота предшествующего медианному интервала;

    – частота медианного интервала.



    Т.к. не выполняется условие , то совокупность не считаем однородной, а распределение симметричным.

    Получается, что чаще всего встречается признак 9,375. Середина ряда – 8,727

    3. В статистике применяются следующие показатели вариации:

    Размах вариации R – разница между максимальным и минимальным значением вариационного ряда: =18-0=18

    Среднее линейное отклонение – средняя арифметическая из абсолютных значений отклонений отдельных вариантов от средней величины:

    для ряда с разными частотами:

    Таблица 3 – Расчет показателей вариации

    № интервала

    Интервал

    Частота (f)

    Середина интервала, xi

    f*х

     

     





    1

    0-3

    5

    1,5

    7,5

    36,9

    272,3220

    -2009,736

    14831,854

    2

    3--6

    10

    4,5

    45

    43,8

    191,8440

    -840,277

    3680,412

    3

    6--9

    11

    7,5

    82,5

    15,18

    20,9484

    -28,909

    39,894

    4

    9--12

    12

    10,5

    126

    19,44

    31,4928

    51,018

    82,650

    5

    12--15

    5

    13,5

    67,5

    23,1

    106,7220

    493,056

    2277,917

    6

    15--18

    7

    16,5

    115,5

    53,34

    406,4508

    3097,155

    23600,322

    итог

     

    50

     

    444

    191,76

    1029,78

    762,307

    44513,049

    средняя

     

     

     

    8,88

    3,8352

    20,5956

    15,246

    890,261


    Дисперсия – средний квадрат отклонений вариантов от среднего значения.

    Взвешенная: – для сгруппированных данных.

    Среднее квадратическое отклонение:

    Коэффициент вариации: .

    Поскольку коэффициент вариации больше 33%, то совокупность по изучаемому признаку является неоднородной.

    4. Распределение не симметрично, т.к. не выполняется условие

    Величина показателя асимметрии может быть положительной и отрицательной. Положительное значение свидетельствует о наличии правосторонней асимметрии, отрицательное – о наличии левосторонней асимметрии.

    Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка:

    ,

    Т.к. , асимметрия правосторонняя со смещением влево.

    Оценка степени точности этого показателя определяется с помощью средней квадратической ошибки, которая зависит от объема наблюдений.

    Эксцесс характеризует отклонение вершины эмпирического распределения вверх или вниз от вершины нормального распределения.

    Наиболее точным является показатель, основанный на определении момента четвертого порядка:



    Т.к. Eх<3 - распределение плосковершинное.

    Т.к. |As|<0,25, то асимметрия  считается незначительной
    5. Проверка соответствия эмпирического  распределения  нормальному  закону

    Теоретические частоты для нормального распределения  вычисляются  по формуле


    Σƒi—сумма накопленных (кумулятивных) эмпирических частот 

     h — разность между двумя соседними вариантами  

    σ — выборочное среднеквадратическое отклонение  t–нормированное (стандартизированное) отклонение

     φ(t)–функция плотности вероятности нормального распределения (находят по таблице значений локальной функции Лапласа для соответствующего значения t) 



    Рисунок 3 - Эмпирическое и теоретическое  распределения

    Критерий согласия Пирсона ( 2) «хи - квадрат»



    где f и - соответственно частоты эмпирического и теоретического распределений в і – ом интервале.

    Расчет проводим в табл 4



    Рассчитанные значения сравниваются с табличными при соответствующем числе степеней свободы и заданном уровне значимости (а) (величина а принимается 0,05 или 0,01).

    К= 6-2-1=3



    Т.к. , то это свидетельствует о близости эмпирического распределения нормальному.

    № интервала

    Интервал

    Частота (f)

    Середина интервала, xi



     

     









    1

    0-3

    5

    1,5

    7,38

    1,63

    0,1057

    4

    1

    1

    0,25

    2

    3--6

    10

    4,5

    4,38

    0,97

    0,2492

    9

    1

    1

    0,111

    3

    6--9

    11

    7,5

    1,38

    0,30

    0,3814

    13

    -2

    4

    0,308

    4

    9--12

    12

    10,5

    1,62

    0,36

    0,3739

    12

    0

    0

    0,000

    5

    12--15

    5

    13,5

    4,62

    1,02

    0,2371

    8

    -3

    9

    1,125

    6

    15--18

    7

    16,5

    7,62

    1,68

    0,0973

    4

    3

    9

    2,250

    итог

     

    50

     

     

     

     

    50

     

     

    4,044

    Таблица 4 – Данные для расчета критерия Пирсона

      1   2   3   4   5


    написать администратору сайта