Главная страница
Навигация по странице:

  • Решение типовых примеров

  • Пример 5

  • Точечные оценки параметров распределения

  • Оценка для дисперсии случайной величины

  • Примеры задач. Примеры решения задач. 1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма


    Скачать 0.96 Mb.
    Название1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма
    АнкорПримеры задач
    Дата05.06.2022
    Размер0.96 Mb.
    Формат файлаpdf
    Имя файлаПримеры решения задач.pdf
    ТипДокументы
    #571091
    страница1 из 4
      1   2   3   4


    1. Генеральная совокупность и выборка. Статистический ряд.
    Статистическая функция распределения. Гистограмма
    В математической статистике изучение случайной величины связано с выполнением ряда независимых опытов, в которых она принимает опреде- ленные значения. Полученные значения случайной величины представляют собой статистическую совокупность или статистический ряд, подлежа- щий осмыслению, обработке и научному анализу.
    Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.
    Выборочной совокупностью, или просто выборкой, называют совокуп- ность случайно отобранных объектов.
    Генеральной совокупностью называют совокупность объектов, из кото- рой производится выборка. Объемом совокупности (генеральной или выбо- рочной) называют число объектов этой совокупности. Например, если из 100 000 деталей отобрано для исследования 100 деталей, то объем генеральной совокупности N = 100 000, а объем выборочной совокупности n=100. Для то- го чтобы выборка правильно представляла пропорции генеральной совокуп- ности она должна быть репрезентативной. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществ- лять случайно: каждый объект выборки отобран случайно из генеральной со- вокупности, иначе, все объекты имеют одинаковую вероятность попасть в выборку. Выборка может быть бесповторной, если отобранные объекты не возвращаются в генеральную совокупность. Выборка называется повторной,
    если отобранный объект (перед отбором следующего) возвращается в гене- ральную совокупность.
    Пусть из генеральной совокупности извлечена выборка, причем
    x
    1
    на- блюдалось
    n
    1
    раз,
    x
    n
    2 2

    раз и т.д.
    x
    n
    k
    k

    раз и


    k
    i
    n
    n
    1
    - объем выборки.
    Наблюдаемые значения
    i
    x
    называются вариантами; последователь- ность вариант, записанных, в порядке возрастания называют вариационным
    рядом.
    Числа наблюдений
    x
    i
    обозначены
    n
    i
    и называются частотами, а вели- чины
    n
    n
    W
    i
    i
    /

    - относительными частотами. Статистическим распределе-
    нием выборки называется перечень вариант
    x
    i
    и соответствующих частот
    n
    i
    (или относительных частот
    W
    i
    ):
    Х
    1
    x
    2
    x
    k
    x
    n
    x
    1
    n
    2
    n
    k
    n
    W
    x
    1
    W
    2
    W
    k
    W

    В случае большого количества вариант и непрерывного распределения признака статистическое распределение выборки задают в виде последова- тельности интервалов и соответствующих им частот. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на оп- ределенное число частичных интервалов (x
    0
    ,x
    1
    ), (x
    1
    ,x
    2
    ), …,(x
    k-1
    ,x
    k
    ) длиной

    х
    i
    и находят для каждого интервала n
    i
    – сумму частот вариант, попавших в i-й интервал. Таким образом получают интервальное статистическое распре-
    деление выборки:
    Статистическое распределение выборки называют также статистическим
    рядом.
    Для графического изображения статистического ряда используют поли-
    гоны и гистограммы.
    Для построения полигона на оси Ох откладывают значения вариант, на оси Оу – значения частот
    n
    i
    (или относительных частот
    W
    i
    ). Построенную таким образом ломаную, отрезки, которой соединяют точки (
    x n
    i
    i
    ,
    )
    или
    ( ,
    )
    x W
    i
    i
    называют полигоном частот или полигоном относительных час-
    тот соответственно.
    В случае непрерывного распределения признака на основании интерваль- ного статического распределения (2) использует гистограмму, устанавли- вающую зависимость частот от разрядов интервалов, в которые попадают значения случайной величины. Предполагаем, что длины интервалов равны

    x
    x
    x
    h
    i
    i
    i




    1
    (h – шаг распределения). На оси Ox отметим точки
    x x
    x
    k
    1 2
    ,
    ,...,
    , с шагом
    h
    друг от друга. На каждом частичном интервале строим прямо- угольник высотой
    n
    h
    i
    /
    (плотность частоты). Гистограммой частот назы- вают ступенчатую фигуру, состоящую из вышеупомянутых прямоугольни- ков. Поскольку площадь i-го частичного прямоугольника равна
    hn
    h
    n
    i
    i
    /

    , то
    площадь гистограммы частот равна сумме всех частот, т.е. объему вы-
    борки n.
    Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а а высоты равны отношению
    W
    h
    i
    /
    (плотность относи- тельной частоты). Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят прямо- угольники высотой
    W
    h
    i
    /
    . Площадь i-го прямоугольника равна
    hW
    h
    W
    i
    i
    /

    - относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относитель- ных частот, т.е. единице. Поэтому, гистограмма относительных частот явля-
    Интервал Х
    (x
    0
    ,x
    1
    ) (x
    1
    ,x
    2
    )

    (x
    k-1
    ,x
    k
    ) n
    x
    n
    1
    n
    2

    n
    k
    W
    x
    W
    1
    W
    2

    W
    k
    ется статистическим аналогом плотности распределения случайной величи- ны X.
    Пусть теперь изучается случайная величина X, закон распределения ко- торой неизвестен. Требуется определить закон распределения на основании статистических данных.
    Определение. Статистической (эмпирической) функцией распределения
    (иначе функцией распределения выборки) называют функцию
    F x
    *
    ( )
    , опреде- ляющую для каждого значения х относительную частоту события
    {
    }
    X
    x

    :
    F x
    n
    n
    x
    *
    ( )
    /

    (3) где
    n
    x
    - число наблюдений, при которых значение признака X меньше x; n
    - объем выборки.
    В отличие от эмпирической функции распределения
    F x
    *
    ( )
    выборки функция распределения
    F x
    ( )
    генеральной совокупности называется теоре-
    тической функцией распределения. Различие между эмпирической
    F x
    *
    ( )
    и теоретической
    F x
    ( )
    функциями распределения состоит в том, что
    F x
    ( )
    опре- деляет вероятность события
    {
    }
    X
    x

    , а
    F x
    *
    ( )
    относительную частоту этого же события. Поэтому
    F x
    *
    ( )
    можно использовать для приближенного представ- ления теоретической функции распределения генеральной совокупности.
    Функция
    F x
    *
    ( )
    обладает свойствами
    F x
    ( )
    :
    1) Значения эмпирической функции распределения принадлежат отрезку
    [0,1];
    2)
    F x
    *
    ( )
    является неубывающей функцией на промежутке
    (
    ,
    )
     
    ;
    3) если
    x
    1
    - наименьшая варианта, то
    F x
    *
    ( )
    = 0 при
    x
    x

    1
    ; если
    x
    k
    - наибольшая варианта, то
    F x
    *
    ( )
    = 1 при
    x
    x
    k

    Решение типовых примеров
    Пример 1. В результате испытания случайная величина Х приняла сле- дующие значения:

    1
    = 2,

    2
    = 5,

    3
    = 7,

    4
    = 1,

    5
    = 10,

    6
    = 5,

    7
    = 9,

    8
    = 6,

    9
    = 8,

    10
    = 6,

    11
    = 2,

    12
    = 3,

    13
    = 7,

    14
    = 6,

    15
    = 8,

    16
    = 3,

    17
    = 8,

    18
    = 10,

    19
    = 6,

    20
    = 7,

    21
    = 3,

    22
    = 9,

    23
    = 4,

    24
    = 5,

    25
    = 6.
    Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и ее частотами;
    2) построить статистическое распределение; 3) изобразить полигон рас- пределения.
    Решение. 1) Найдем объем выборки: n = 25. Составим таблицу:
    Х 1 2
    3 4
    5 6
    7 8
    9 10
    n
    x
    1 2
    3 1
    3 5
    3 3
    2 2
    2) Статистическое распределение имеет вид:

    Х 1 2
    3 4
    5 6
    7 8
    9 10
    W 1/25 2/25 3/25 1/25 3/25 5/25 3/25 3/25 2/25 2/25
    Контроль:
    1 2
    3 1
    3 5
    3 3
    2 2
    1.
    25 25 25 25 25 25 25 25 25 25










    Последнюю таблицу можно переписать в виде:
    Х 1 2
    3 4
    5 6
    7 8
    9 10
    W 0,04 0,08 0,12 0,04 0,12 0,2 0,12 0,12 0,08 0,08 3) Возьмем на плоскости xOw точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д. По- следовательно соединив эти точки прямолинейными отрезками, получим по- лигон распределения случайной величины Х.
    W
    0,24 0,2 0,16 0,12 0,08 0,04 0
    0 1 2 3 4 5 6 7 8 9 10
    X
    Пример 2. В результате испытания случайная величина Х приняла сле- дующие значения:

    1
    = 16,

    2
    = 17,

    3
    = 9,

    4
    = 13,

    5
    = 21,

    6
    = 11,

    7
    = 7,

    8
    = 7,

    9
    = 19,

    10
    = 8,

    11
    = 17,

    12
    = 5,

    13
    = 20,

    14
    = 18,

    15
    = 11,

    16
    = 4,

    17
    = 6,

    18
    = 22,

    19
    = 21,

    20
    = 15,

    21
    = 18,

    22
    = 23,

    23
    = 19,

    24
    = 25,

    25
    = 1.
    Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25] на пять участков, имеющих одинаковые длины; постро- ить гистограмму частот и относительных частот.
    Решение. Предварительно составим таблицу:
    I
    (0-5]
    (5-10]
    (10-15]
    (15-20]
    (20-25]
    n
    x
    3 5
    4 8
    5
    Построим гистограмму частот и гистограмму относительных частот ста- тистического ряда.
    Построим статистический ряд относительных частот
    I
    0-5 5-10 10-15 15-20 20-25
    W
    x
    0,12 0,2 0,16 0,32 0,2

    X
    n x
    5 10 15 20 25 1
    2 3
    4 5
    6 7
    8
    (а)
    X
    W
    x
    5 10 15 20 25 0,04 0,08 0,12 0,16 0,20 0,24 0,28 0,32
    (б)
    Гистограмма частот изображена на рисунке (а) а гистограмма относительных частот – на рисунке (б).
    Пример 3.Имеется распределение восьмидесяти предприятий по числу занятых на них рабочих:
    i
    x
    150 250 350 450 550 650 750
    i
    m 1 3
    7 30 19 15 5
    Построить полигон частот.
    Решение: Признак Х – число рабочих на предприятиях. В данной зада- че признак Х является дискретным. Поскольку различных значений признака сравнительно немного – k = 7, применять интервальный ряд для представле- ния статистического распределения нецелесообразно, (хотя в прикладной статистике в подобных задачах часто используют именно интер- вальный ряд). Ряд распределения
    – дискретный. Построим поли- гон распределения частот
    0 5
    10 15 20 25 30 35 0
    100 200 300 400 500 600 700 800
    x
    m
    Пример 4 .Дано возрастное распределение 100 сотрудников (лет). По- строить гистограмму частот.
    x
    i–1
    –x
    i
    22–24 24–26 26–28 28–30 30–32 32–34
    i
    m
    2 12 34 40 10 2
    Решение:. Признак Х – Возраст сотрудника (лет), непрерывный, ряд распределения – интервальный. Построим гистограмму частот, предвари- тельно определив
    2 6
    22 34 0





    )
    (
    k
    )
    x
    (x
    h
    k
    (k = 6) и плотность час- тоты
    h
    m
    i
    :
    x
    i–1
    –x
    i
    22–24 24–26 26–28 28–30 30–32 32–34
    h
    m
    i
    1 6
    17 20 5
    1

    0 5
    10 15 20 24 28 22 26 34 32 30
    x
    m /h
    Пример 5. Построить эмпирическую функцию распределения по стати- стическому распределению
    X
    11 12 13 14
    W
    x
    0,4 0,1 0,3 0,2
    Решение. Имеем:




    


















    14 2
    ,
    0 3
    ,
    0 1
    ,
    0 4
    ,
    0 14 13 3
    ,
    0 1
    ,
    0 4
    ,
    0 13 12 1
    ,
    0 4
    ,
    0 12 11 4
    ,
    0 11 0
    )
    (
    *
    x
    x
    x
    x
    x
    x
    F




    












    14 1
    14 13 8
    ,
    0 13 12 5
    ,
    0 12 11 4
    ,
    0 11 0
    )
    (
    *
    x
    x
    x
    x
    x
    x
    F
    Точечные оценки параметров распределения
    Оценка для математического ожидания
    Пусть исследуется случайная величина X с математическим ожиданием
    x
    m
    . Обозначим через x
    1
    , x
    2
    , ... , x
    n значения случайной величины, полученные в результате n независимых равноточных опытов, т.е. измерений, которые проводились в одинаковых условиях. В качестве оценки для
    x
    m примем среднее арифметическое наблюдаемых значений, которое принято называть
    выборочной средней:


    n
    i
    x
    n
    x
    1 1
    Эта оценка является несмещенной и состоятельной. Эффективность оценки выполняется лишь для узкого класса распределений, в частности, для нор- мального распределения
    )
    ,
    (

    a
    N
    (подробнее см. в разделе «Теоретический материал»)
    Оценка для дисперсии случайной величины
    В качестве оценки для дисперсии рассмотрим следующую величину:


    (
    )
    D
    n x
    x x
    i n



    1 2
    1

    Данную оценку принято называть выборочной дисперсией.
    Выборочная дисперсия является смещенной оценкой. Однако если умножить величину

    D
    x
    на
    n
    n

    1
    , то мы получим для дисперсии
    D
    x
    оценку, обладающую свойством несмещенности. Эту оценку принято называть «исправленной»
    выборочной дисперсией и определять формулой:
    S
    n
    n
    D
    n
    X
    x
    x
    i
    n
    2 2
    1 1
    1 1







    (
    )
    Величину
    2
    S
    S

    называют «исправленным» средним квадратическим от-
    клонением.
    Пример 6 . Имеется статистический ряд для случайной величины X.
    I
    x
    0-2 2-4 4-6 6-8 8-10
    n
    i
    3 4
    10 5
    3
    Найти выборочную среднюю, выборочную дисперсию, «исправленную» вы- борочную дисперсию, «исправленное» среднее квадратическое отклонение.
    Решение. Заметим, что n = 25.
    i
    x
    – середины интервалов. Для удобства вычислений составим таблицу
    i
    x

    n
    n
    W
    i
    x
    /

    i
    x

    W
    i
    )
    (
    x
    x
    i


    2
    )
    (
    x
    x
    i


    i
    i
    W
    x
    x
    2
    )
    (


    1 0,12 0,12
    -4,08 16,65 1,988 3
    0,16 0,48
    -2,08 4,33 0,693 5
    0,40 2,00
    -0,08 0,01 0,04 7
    0,20 1,40 1,92 3,69 0,738 9
    0,12 1,08 3,92 15,37 1,844
    x
    =5,08 303
    ,
    5

    B
    D
    Значения
    x
    и
    B
    D получены из таблицы. Имеем
     


     




    k
    i
    i
    i
    k
    i
    i
    i
    W
    x
    n
    x
    n
    x
    1 1
    1












    k
    i
    i
    i
    k
    i
    i
    i
    W
    x
    x
    n
    x
    x
    n
    D
    1 2
    в
    1 2
    в в
    )
    (
    )
    (
    1
    B
    D
    n
    n
    s
    1 2


    57
    ,
    2 63
    ,
    6
    ,
    63
    ,
    6 303
    ,
    5 4
    5
    ,
    303
    ,
    5
    ,
    08
    ,
    5 2







    s
    s
    D
    x
    B
      1   2   3   4


    написать администратору сайта