Главная страница
Навигация по странице:

  • По выполнению Лабораторной работы 2.1 Лабораторная работа № 1 «Первичная обработка статистических данных»

  • Эмпирической функцией распределения (функцией распределения выборки)

  • 2) Составим вариационный ряд, для чего всю последовательность выборки расположим в порядке возрастания

  • Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии

  • Несмещенной

  • Интервальной

  • Доверительным

  • Лабораторная работа 1-3. Теория и образец выполнения. Лабораторная работа 1 Первичная обработка статистических данных


    Скачать 0.75 Mb.
    НазваниеЛабораторная работа 1 Первичная обработка статистических данных
    Дата28.03.2023
    Размер0.75 Mb.
    Формат файлаdoc
    Имя файлаЛабораторная работа 1-3. Теория и образец выполнения.doc
    ТипЛабораторная работа
    #1022449
    страница1 из 3
      1   2   3

    Математическая статистика»

    Методические указания для студентов

    По выполнению Лабораторной работы

    2.1 Лабораторная работа № 1


    «Первичная обработка статистических данных»
    Из данных, входящих в выборку (табл.1.1) находим и , соответственно наименьшее и наибольшее значения выборки, и вычисляем число , называемое размахом выборки. Размах выборки – это длина основного интервала, в который попадают все значения выборки. Далее значения , называемые вариантами можно упорядочить, то есть расположить в порядке возрастания. Тогда выборка , записанная по возрастанию, называется вариационным рядом. По формуле

    ,

    (2.1)

    где целая часть числа , определим число . Данное число задает количество подынтервалов, на которые разбиваем основной интервал . Вычисляем длину подынтервалов по формуле



    (2.2)

    и затем – границы подынтервалов:

    .

    (2.3)

    Находим частоты относительные частоты попадания значений выборки в й подынтервал. Причем должно быть

    .

    В результате проведенных расчетов, получаем две таблицы:
    Таблица 2.1













     








    Таблица 2.2













     

     






    Далее, если найти середины подынтервалов:

    , то получим еще одну таблицу. ω

    Таблица 2.3













     

     





    В целях наглядности полученных в табл. 2.1, 2.2, 2.3 данных пользуются различными способами их графического изображения. К ним относятся гистограмма и полигон.

    Для построения гистограммы относительных частот используем данные табл.2.2. В декартовой системе координат на оси находим значения и и тем самым находим границы основного интервала, в который попадают все значения выборки. Затем на этом интервале откладываем границы подынтервалов. По оси откладываем величины (плотности вероятностей) . Тогда гистограммой относительных частот назовем ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные подынтервалы длины , а высоты равны числам (плотности вероятностей) . Аналогично, по данным табл. 2.1, строится гистограмма частот.

    Для построения полигона относительных частот используем данные табл. 2.3. В декартовой системе координат на оси находим и , то есть изображаем границы основного интервала. Затем наносим значения середин подынтервалов . По оси откладываем значения, соответствующие относительным частотам .

    Полигоном относительных частот называют ломаную, отрезки которой соединяют точки .

    Данные табл. 2.3 представляют эмпирический закон распределения выборки, а полигон относительных частот есть его визуальное представление.

    Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события .

    Таким образом, , где число вариант, меньших , объем выборки.

    Для каждой реализации выборки эмпирическая функция распределения однозначно определена и обладает всеми свойствами теоретической функции распределения:

    1) значения эмпирической функции принадлежат отрезку ;

    2) не убывающая функция;

    3) если наименьшая варианта, то при ; если наибольшая варианта, то при .

    Эмпирическая функция распределения выборки является оценкой теоретической функции распределения генеральной совокупности.

    ПРИМЕР 2.1.

    Дана выборка из генеральной совокупности объема n=100.

    Таблица 2.4

    254

    1158

    522

    524

    972

    736

    401

    347

    208

    368

    1485

    812

    1032

    226

    428

    368

    676

    671

    587

    701

    701

    1171

    443

    683

    786

    895

    267

    597

    51

    941

    659

    400

    484

    876

    570

    241

    678

    127

    728

    903

    424

    245

    531

    986

    1017

    429

    732

    1021

    430

    153

    513

    520

    221

    1074

    826

    65

    389

    1180

    504

    325

    294

    447

    1459

    589

    307

    461

    1434

    559

    837

    743

    382

    387

    967

    446

    763

    767

    349

    853

    578

    652

    285

    628

    688

    517

    380

    375

    878

    409

    109

    621

    712

    476

    432

    721

    1300

    577

    580

    909

    690

    757

    1) Находим из выборки и , рассчитываем размах выборки :

    ; ; .

    2) Составим вариационный ряд, для чего всю последовательность выборки расположим в порядке возрастания

    51

    65

    109

    127

    153

    208

    221

    226

    241

    245

    254

    267

    285

    294

    307

    325

    347

    349

    368

    368

    375

    380

    382

    387

    389

    400

    401

    409

    424

    428

    429

    430

    432

    443

    446

    447

    461

    476

    484

    504

    513

    517

    520

    522

    524

    531

    559

    570

    577

    578

    580

    587

    589

    597

    621

    628

    652

    659

    671

    676

    678

    683

    688

    690

    701

    701

    712

    721

    728

    732

    736

    743

    757

    763

    767

    786

    812

    826

    837

    853

    876

    878

    895

    903

    909

    941

    967

    972

    986

    1017

    1021

    1032

    1074

    1158

    1171

    1180

    1300

    1434

    1459

    1485


    3) Задаем число количество частичных подынтервалов, на которое разбиваем нашу выборку : . Исходя из этого вычисляем длину подынтервалов и границы подынтервалов ,

    ;

    ;

    ;

    ;

    ;

    ;

    ;

    ;

    .

    4) Рассчитываем частоты – число попаданий в подынтервалы значений из выборки, то есть .

















    .

    Контроль: .

    На основе полученных данных, заполняем таблицу





    [51; 210,333)

    [210,333; 369,666)

    [369,666; 528,999)

    [528,999; 688,332)

    [688,332; 847,665)



    6

    14

    25

    18

    16






    [847,665; 1006,998)

    [1006,998; 1166,331)

    [1166,331; 1325,664)

    [1325,664; 1485]



    10

    5

    3

    3


    5) Считаем середины подынтервалов и относительные

    частоты .

    ; ;

















    .

    Относительные частоты:






















    Контроль:

    .
    В результате имеем таблицу:

    Таблица 2.5



    130,6

    290

    449,3

    608,6

    768

    927,3

    1086,6

    1246

    1405



    0,06

    0,14

    0,25

    0,18

    0,16

    0,1

    0,05

    0,03

    0,03


    6) Из данных табл. 2.5, получим эмпирический закон распределения относительных частот и визуальное его представление, то есть строим гистограмму (рис. 2.1) и полигон распределения относительных частот (рис. 2.2).



    Рис. 2.1

    7

    Рис. 2.2
    ) Составим эмпирическую функцию распределения. По определению, для группированного статистического ряда , имеет вид


    Построим график .




    2.2 ЛАБОРАТОРНАЯ РАБОТА № 2


    Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии
    Пусть некоторый параметр генеральной совокупности, который невозможно вычислить. Но знать его значение (хотя бы приближенное, оценочное) надо! Поэтому по выборочным данным производят расчет статистических оценок данного генерального параметра.

    Точечной называют статистическую оценку генерального параметра , которая определяется одним числом . Точечная оценка может быть несмещенной и смещенной.

    Несмещенной называют такую точечную оценку , математическое ожидание которой равно оцениваемому генеральному параметру при любом объеме выборки, то есть

    .

    (2.4)

    Если равенство (2.4) нарушается, то в этом случае точечная оценка называется смещенной.

    Несмещенной оценкой генеральной средней (математического ожидания генеральной совокупности) служит выборочная средняя:

    ,

    (2.5)

    которую считаем по данным таблицы 2.3.

    Смещенной оценкой генеральной дисперсии служит выборочная дисперсия:

    ,

    (2.6)

    где из таблицы 2.3. Иногда более удобно пользоваться другой формулой для вычисления выборочной дисперсии:

    .

    (2.6а)

    Замечание. Поскольку является смещенной оценкой, то ее «исправляют» следующим образом:

    .

    (2.7)

    Полученная оценка это несмещенная дисперсия, а выборочное среднее квадратическое отклонение.

    При выборке малого объема точечная оценка может значительно отличаться от оцениваемого генерального параметра, то есть приводит к грубым ошибкам, поэтому при небольшом объеме выборки следует пользоваться интервальными оценками.

    Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый генеральный параметр .

    Доверительным называют интервал, который с заданной надежностью (доверительной вероятностью) покрывает оцениваемый генеральный параметр, то есть с которой осуществляется неравенство .

    Обычно надежность оценки (доверительная вероятность ) задается. Причем в качестве берут число, близкое к единице (0,95; 0,99; 0,999).

    Итак, пусть вероятность того, что равна , то есть

    ,

    (2.8)

    или

    ,

    (2.8а)

    тогда интервал и есть доверительный интервал.

    Для оценки математического ожидания нормально распределенной генеральной совокупности по выборочной средней при известном среднем квадратическом отклонении служит доверительный интервал.

    ,

    (2.9)

    где точность оценки; объем выборки; это такое значение аргумента функции Лапласа (приложение 1), при котором .
    Для оценки математического ожидания нормально распределенной генеральной совокупности по выборочной средней при неизвестном среднем квадратическом отклонении и (при объеме выборки ) служит доверительный интервал

    ,

    (2.10)

    где находим по таблице (приложение 2) по заданным и .

    Для оценки среднего квадратического отклонения нормально распределенной генеральной совокупности с доверительной вероятностью служат доверительные интервалы:



    (2.11)

    где находим по таблице (приложение 3) при заданных и .

    Замечание. Для m предлагается построить доверительные интервалы для двух значений вероятности . Провести анализ, как меняются границы интервалов с увеличением доверительной вероятности.
      1   2   3


    написать администратору сайта