Главная страница
Навигация по странице:

  • Определение числа групп

  • Функция распределения F(X)

  • Проверка гипотез о виде распределения . Проверим гипотезу о том, что Х распределено по нормальному закону

  • 4510321_Статистика. Вариант 2 Задача 1


    Скачать 80.9 Kb.
    НазваниеВариант 2 Задача 1
    Дата07.06.2020
    Размер80.9 Kb.
    Формат файлаdocx
    Имя файла4510321_Статистика.docx
    ТипЗадача
    #128691
    страница2 из 3
    1   2   3

    Задача 4.


    С целью изучения размера потребительских кредитов, выданных банком в одном из крупных магазинов электронной техники в течении последнего месяца по схеме собственно-случайной бесповторной выборки было отобрано 180 кредитов из 2500 выданных. Величины сумм выданных кредитов (тыс. руб.) представлены в таблице:

    22,9

    26,6

    18,0

    25,2

    28,9

    30,3

    21,1

    13,5

    15,7

    22,2

    18,6

    28,8

    11,5

    26,7

    31,6

    14,1

    26,7

    22,2

    19,9

    23,4

    16,0

    17,9

    17,0

    20,3

    10,5

    26,8

    13,9

    18,1

    19,6

    12,7

    20,7

    17,8

    19,5

    24,4

    21,8

    23,3

    18,6

    24,1

    19,6

    20,8

    15,8

    14,0

    20,5

    18,2

    17,8

    20,7

    21,9

    28,0

    17,5

    11,2

    12,2

    24,7

    14,9

    19,3

    23,6

    22,3

    20,1

    19,1

    21,9

    25,2

    22,2

    18,0

    16,3

    18,3

    18,6

    13,5

    28,0

    15,2

    22,1

    24,7

    20,1

    14,0

    17,3

    17,6

    18,9

    22,4

    20,9

    15,1

    11,9

    21,8

    23,4

    18,2

    21,0

    22,7

    23,2

    19,9

    26,1

    21,3

    21,2

    16,1

    27,6

    17,5

    18,1

    13,0

    23,9

    11,2

    22,5

    19,5

    19,2

    24,2

    29,7

    22,7

    12,7

    26,4

    16,8

    14,7

    21,3

    18,5

    22,3

    15,3

    14,0

    23,1

    25,8

    27,9

    17,5

    24,9

    25,6

    32,4

    17,9

    19,7

    11,9

    17,6

    15,0

    19,0

    22,1

    14,0

    27,5

    18,6

    19,5

    25,5

    19,5

    25,3

    27,9

    24,9

    15,5

    13,8

    24,2

    23,8

    25,8

    18,9

    8,3

    24,6

    18,7

    24,2

    16,3

    18,9

    22,4

    15,6

    25,6

    16,6

    19,6

    20,0

    20,2

    9,9

    22,0

    19,2

    14,5

    12,6

    13,0

    20,1

    22,7

    20,7

    20,2

    12,9

    21,1

    19,0

    20,2

    28,0

    20,2

    21,8

    14,8

    17,3

    17,4

    14,1

    13,8

    19,2

    17,0

    22,0

    17,1

    17,2


    Составить интервальный вариационный ряд. Записать эмпирическую функцию распределения и построить ее график. На одном чертеже изобразить гистограмму и полигон частот.

    По сгруппированным данным вычислить выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.

    Заменив параметры генеральной совокупности соответственно их наилучшими выборочными числовыми характеристиками и используя - критерий Пирсона, на уровне значимости а=0,05 проверить две гипотезы о том, что изучаемая случайная величина ξ - величина выданных кредитов - распределена:

    а) по нормальному закону распределения;

    б) по равномерному закону распределения.

    Построить на чертеже, на котором изображена гистограмма эмпирического распределения и соответствующие графики равномерного и нормального распределений.
    Определение числа групп.

    Число групп приближенно определяется по формуле Стэрджесса

    n = 1 + 3,2log n = 1 + 3,2log(180) = 8

    Ширина интервала составит:
    xmax - максимальное значение группировочного признака в совокупности.

    xmin - минимальное значение группировочного признака.
    Таблица для расчета показателей.

    Группы

    Середина интервала, xцентр

    Кол-во, fi

    xi·fi

    Накопленная частота, S

    |x-xср|·fi

    (x-xср)2·fi

    Относительная частота, fi/f

    8,3 - 11,3

    9,8

    5

    49

    5

    50,422

    508,48

    0,0278

    11,3 - 14,3

    12,8

    21

    268,8

    26

    148,773

    1053,976

    0,117

    14,3 - 17,3

    15,8

    22

    347,6

    48

    89,858

    367,019

    0,122

    17,3 - 20,3

    18,8

    53

    996,4

    101

    57,476

    62,329

    0,294

    20,3 - 23,3

    21,8

    36

    784,8

    137

    68,96

    132,097

    0,2

    23,3 - 26,3

    24,8

    25

    620

    162

    122,889

    604,067

    0,139

    26,3 - 29,3

    27,8

    14

    389,2

    176

    110,818

    877,184

    0,0778

    29,3 - 32,4

    30,85

    4

    123,4

    180

    43,862

    480,974

    0,0222

    Итого



    180

    3579,2



    693,058

    4086,126

    1




    Рис. 1 Гистограмма и полигон
    Эмпирическая функция распределения.

    xi

    9.8

    12.8

    15.8

    18.8

    21.8

    24.8

    27.8

    30.85

    pi

    0.028

    0.12

    0.12

    0.29

    0.2

    0.14

    0.078

    0.022


    Математическое ожидание находим по формуле m = ∑xipi.

    Математическое ожидание M[X].

    M[x] = 9.8*0.0278 + 12.8*0.117 + 15.8*0.122 + 18.8*0.294 + 21.8*0.2 + 24.8*0.139 + 27.8*0.0778 + 30.85*0.0222 = 19.884

    Дисперсию находим по формуле d = ∑x2ipi - M[x]2.

    Дисперсия D[X].

    D[X] = 9.82*0.0278 + 12.82*0.117 + 15.82*0.122 + 18.82*0.294 + 21.82*0.2 + 24.82*0.139 + 27.82*0.0778 + 30.852*0.0222 - 19.8842 = 22.701

    Среднее квадратическое отклонение σ(x).
    Функция распределения F(X).

    F(x≤9.8) = 0

    F(9.8< x ≤12.8) = 0.0278

    F(12.8< x ≤15.8) = 0.117 + 0.0278 = 0.144

    F(15.8< x ≤18.8) = 0.122 + 0.144 = 0.267

    F(18.8< x ≤21.8) = 0.294 + 0.267 = 0.561

    F(21.8< x ≤24.8) = 0.2 + 0.561 = 0.761

    F(24.8< x ≤27.8) = 0.139 + 0.761 = 0.9

    F(27.8< x ≤30.85) = 0.0778 + 0.9 = 0.978

    F(x>30.85) = 1



    Рис. 2 Эмпирическая функция распределения
    Для оценки ряда распределения найдем следующие показатели:

    Средняя взвешенная (выборочная средняя)

    = 19,884

    Мода.

    Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
    где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

    Выбираем в качестве начала интервала 17.3, так как именно на этот интервал приходится наибольшее количество.
    Наиболее часто встречающееся значение ряда – 19.2

    Медиана.

    Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

    В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 17.3 - 20.3, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

    Таким образом, 50% единиц совокупности будут меньше по величине 19.7.

    Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
    Каждое значение ряда отличается от другого в среднем на 3.9

    Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
    Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

    =

    Среднее квадратическое отклонение.
    Каждое значение ряда отличается от среднего значения 19.9 в среднем на 4.765

    Оценка среднеквадратического отклонения.
    Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
    Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

    Степень асимметрии.

    Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

    Расчет центральных моментов проводим в аналитической таблице:

    Группы

    Середина интервала, xцентр

    Кол-во, fi

    (x-xср)3·fi

    (x-xср)4·fi

    8.3 - 11.3

    9.8

    5

    -5127.7

    51710.4

    11.3 - 14.3

    12.8

    21

    -7466.8

    52898.4

    14.3 - 17.3

    15.8

    22

    -1499.1

    6122.9

    17.3 - 20.3

    18.8

    53

    -67.6

    73.3

    20.3 - 23.3

    21.8

    36

    253

    484.7

    23.3 - 26.3

    24.8

    25

    2969.3

    14595.9

    26.3 - 29.3

    27.8

    14

    6943.4

    54960.9

    29.3 - 32.4

    30.9

    4

    5274.1

    57833.9

    Итого



    180

    1278.7

    238680.3


    Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.

    As = M3/s3

    где M3 - центральный момент третьего порядка.

    s - среднеквадратическое отклонение.

    M3 = 1278.67/180 = 7.1
    Положительная величина указывает на наличие правосторонней асимметрии

    Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.

    Чаще всего эксцесс оценивается с помощью показателя:
    Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) - отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3.

    M4 = 238680.34/180 = 1326
    Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен нулю. Островершинные кривые обладают положительным эксцессом, кривые более плосковершинные - отрицательным эксцессом.

    Ex < 0 - плосковершинное распределение
    Проверка гипотез о виде распределения.

    Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
    где pi - вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону

    Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
    где

    s = 4.765, xср = 19.9

    Теоретическая (ожидаемая) частота равна fi = fpi, где f = 180

    Вероятность попадания в i-й интервал: pi = Ф(x2) - Ф(x1)


    xi÷xi+1

    fi

    x1 = (xi - xср)/s

    x2 = (xi+1 - xср)/s

    Ф(x1)

    Ф(x2)

    pi=Ф(x2)-Ф(x1)

    Ожидаемая частота, 180pi

    Слагаемые статистики Пирсона, Ki

    8,3 - 11,3

    5

    -2,4246

    -1,7967

    -0,4927

    -0,4641

    0,0286

    5,148

    0,00425

    11,3 - 14,3

    21

    -1,7967

    -1,1688

    -0,4641

    -0,379

    0,0851

    15,318

    2,1077

    14,3 - 17,3

    22

    -1,1688

    -0,5409

    -0,379

    -0,2088

    0,1702

    30,636

    2,4344

    17,3 - 20,3

    53

    -0,5409

    0,08698

    -0,2088

    0,0359

    0,2447

    44,046

    1,8202

    20,3 - 23,3

    36

    0,08698

    0,7149

    0,0359

    0,2642

    0,2283

    41,094

    0,6315

    23,3 - 26,3

    25

    0,7149

    1,3428

    0,2642

    0,4115

    0,1473

    26,514

    0,08645

    26,3 - 29,3

    14

    1,3428

    1,9707

    0,4115

    0,4761

    0,0646

    11,628

    0,4839

    29,3 - 32,4

    4

    1,9707

    2,6195

    0,4761

    0,4956

    0,0195

    3,51

    0,0684




    180













    7,6367


    Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.

    Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).

    Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).

    Kkp = χ2(8-2-1;0.05) = 11.07050; Kнабл = 7.64

    Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.

    Проверим гипотезу о том, что Х распределено по нормальному закону с помощью правила 3-х сигм.

    Если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал:
    В нашем случае этот интервал составит:

    (19.9-3*4.765;19.9-3*4.765) = (5.605;34.195)

    Все значения величин попадают в интервал, так как xmin=8.3; xmax=32.4
    Проверка гипотезы о равномерном распределении генеральной совокупности.

    Для того чтобы проверить гипотезу о равномерном распределении X,т.е. по закону: f(x) = 1/(b-a) в интервале (a,b)

    надо:

    1. Оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через знак * обозначены оценки параметров):





    2. Найти плотность вероятности предполагаемого распределения f(x) = 1/(b* - a*)

    3. Найти теоретические частоты:

    n1 = nP1 = n[f(x)*(x1 - a*)] = n*1/(b* - a*)*(x1 - a*)

    n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

    ns = n*1/(b* - a*)*(b* - xs-1)

    4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-3, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.

    1. Найдем оценки параметров a* и b* равномерного распределения по формулам:





    a* = 11,63; b* = 28,14

    2. Найдем плотность предполагаемого равномерного распределения:

    f(x) = 1/(b* - a*) = 1/(28.14 - 11.63) = 0.0606

    3. Найдем теоретические частоты:

    n1 = n*f(x)(x1 - a*) = 180 * 0.0606(11.3-11.63) = -3.62

    Поскольку получилось отрицательное значение, то n1 = 0

    n8 = n*f(x)(b* - x7) = 180 * 0.0606(28.14-29.3) = -12.69

    Поскольку получилось отрицательное значение, то n8 = 0

    Остальные ns будут равны:

    ns = n*f(x)(xi - xi-1)

    i

    ni

    n*i

    ni - n*i

    (ni - n*i)2

    (ni - n*i)2/n*i

    1

    5

    0

    5

    25




    2

    21

    32.7178

    -11.7178

    137.3058

    4.1967

    3

    22

    32.7178

    -10.7178

    114.8703

    3.5109

    4

    53

    32.7178

    20.2822

    411.3695

    12.5733

    5

    36

    32.7178

    3.2822

    10.7731

    0.3293

    6

    25

    32.7178

    -7.7178

    59.5637

    1.8205

    7

    14

    32.7178

    -18.7178

    350.3543

    10.7084

    8

    4

    0

    4

    16




    Итого

    180







    33.1391


    Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.

    Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).

    Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры a и b).

    Kkp(5,0.05) = 11.07050; Kнабл = 33.14

    Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по равномерному закону.

    1   2   3


    написать администратору сайта