Главная страница
Навигация по странице:

  • Перечень информационного обеспечения: основной и дополнительной литературы, учебно-методических пособий, электронных ресурсов

  • Тема лекции: Математическая статистика План

  • Основные понятия математической статистики

  • Выборкой объема

  • Графическое изображение выборки Графически табл. 1 изображается полигоном частот

  • Точечные оценки параметров распределения

  • Несмещенной и состоятельной оценкой математического ожидания

  • Несмещенная и состоятельная оценка дисперсии

  • Для оценки среднего квадратического отклонения

  • Пример 2.

  • Задачи на закрепление материала

  • Определение

  • Интервальная оценка математического ожидания нормального распределения

  • Интервальная оценка среднего квадратического отклонения нормального распределения

  • 3.Интервальная оценка вероятности события

  • Лекции Элементы Высшей маьтематики. Лекции. Эмпирическая функция распределения. Полигон и гистограмма. В результате изучения темы студент должен


    Скачать 208.61 Kb.
    НазваниеЭмпирическая функция распределения. Полигон и гистограмма. В результате изучения темы студент должен
    АнкорЛекции Элементы Высшей маьтематики
    Дата11.04.2023
    Размер208.61 Kb.
    Формат файлаdocx
    Имя файлаЛекции.docx
    ТипДокументы
    #1054231

    Эмпирическая функция распределения. Полигон и гистограмма.

    В результате изучения темы студент должен:

    - знать геометрическое изображение выборки: полигон и гистограмма, эмпирическую функцию распределения выборки, числовые характеристики выборки

    [1], [3], [4]

    Статистические оценки параметров распределения

    В результате изучения темы студент должен:

    - знать понятие точечной оценки

    - знать понятие интервальной оценки

    [1], [3], [4]


    Перечень информационного обеспечения:

    основной и дополнительной литературы, учебно-методических пособий,

    электронных ресурсов


    № п/п.

    Автор

    Наименование

    Издательство

    Год издания

    1

    И. И. Валуцэ, Г. Д. Дилигул

    Математика для техникумов

    М. : Наука

    1989

    2

    Данко П.Е., Попов А.Г., Кожевникова Т.Я.

    Высшая математика в задачах и упражнениях

    М. : «Высшая школа»

    1999

    3

    А. Г. Мякишев


    Теория вероятностей. Элективный курс

    М. :Издательство: Илекса

    2012

    4

    М. С. Спирина, П. А. Спирин

    Теория вероятностей и математическая статистика: учебник

    М. : ИЦ "Академия"

    2014

    5

    М. С. Спирина, П. А. Спирин

    Теория вероятностей и математическая статистика. Сборник задач: учебное пособие

    М. : ИЦ "Академия"

    2014



    Тема лекции: Математическая статистика
    План:

    1. Основные понятия математической статистики

    2. Графическое изображение выборки

    3. Точечные оценки параметров распределения




    1. Основные понятия математической статистики


    На практике функция распределения случайной величины бывает неизвестна и ее определяют по результатам наблюдений или, как говорят, по выборке. Выборкой объема n для случайной величины называется последовательность независимых наблюдений этой величины, где – совокупность значений, принятых независимыми случайными величинами , имеющими тот же закон распределения , что и величина X. В этом случае говорят, что выборка взята из генеральной совокупности величины X, а под законом распределения генеральной совокупности понимают закон распределения случайной величины X. Значения называют выборочными значениями или вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Число, указывающее, сколько раз наблюдается данная варианта, называется частотой варианты, а отношение частоты варианты к объему выборки – относительной частотой.
    Если – вариационный ряд, а x – произвольное число, и nx – количество выборочных значений, меньших x, то – частота попадания выборочных значений левее точки x в данной выбоке объема n, т. е. частота события .
    Эта частота является функцией от x и называется эмпирической функцией распределения случайной величины X, полученной по данной выборке. Если обозначить эту функцию через , то по определению

    .

    Эмпирическая функция распределения обладает всеми свойствами функции распределения . Так как частота события в n независимых опытах является оценкой вероятности этого события, то значение эмпирической функции распределения в точке x есть оценка вероятности события , то есть оценка теоретической функции распределения :

    .

    Статистическим рядом распределения называется таблица, которая содержит вариационный ряд и соответствующие частоты или относительные частоты членов этого ряда (табл. 1).

    ,

    , .

    Таблица 1 Таблица 2

    x1

    x2

    ...

    xk








    ...



    n1

    n2

    ...

    nk




    n1

    n2

    ...

    nk

    w1

    w2

    ...

    wk




    w1

    w2

    ...

    wk

    В случае непрерывного распределения величины X статистический ряд распределения представляет собой таблицу, в которой заданы интервалы значений величины X и соответствующие им частоты или относительные частоты, причем интервалы располагаются в порядке возрастания величины X (табл. 2).

    Второй случай легко сводится к первому, если в качестве вариант брать середины интервалов:

    , .


    1. Графическое изображение выборки


    Графически табл. 1 изображается полигоном частот, представляющим собой ломаную, отрезки которой соединяют на плоскости соседние точки и или и , если строится полигон относительных частот.

    В случае табл. 2 исходный интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество равных интервалов длины . После этого строится гистограмма частот – ступенчатая фигура, состоящая из прямоугольников, основания которых равны h, а высоты равны отношению (или для гистограммы относительных частот).

    Гистограмма относительных частот является аналогом функции плотности, так как площадь под ней равна единице. Число интервалов разбиения находят по формуле , где n – объем выборки. Тогда длина каждого интервала , где и – максимальное и минимальное значение выборки соответственно.


    1. Точечные оценки параметров распределения


    По аналогии с такими числовыми характеристиками случайной величины, как математическое ожидание, дисперсия и среднее квадратическое отклонение, для выборки случайной величины X и для статистического ряда определяются следующие числовые характеристики:

    выборочная средняя ,

    где k – число вариант и ;

    выборочная дисперсия

    или , ;

    выборочное среднее квадратическое отклонение
    Во многих случаях бывает заранее известно, что функция распределения принадлежит к определенному классу функций распределения, зависящих от одного или нескольких параметров: . В этом случае определение неизвестной функции распределения сводится к оценке неизвестных параметров по результатам выборки. Следует заметить, что ни при каких n нельзя определить по выборке точное значение неизвестного параметра, а можно найти его приближенное значение, которое называется оценкой по выборке неизвестного параметра. Всякая оценка по выборке является функцией от выборочных значений , так как она меняется от выборки к выборке. Функцию подбирают так, чтобы случайная величина по возможности более точно аппроксимировала неслучайное неизвестное число a.
    Для выполнения данного условия накладывают следующие требования на оценку: несмещенность оценки, ее эффективность и состоятельность. Наиболее часто применяемыми метода получения оценок являются метод моментов и метод максимального правдоподобия.
    Несмещенной и состоятельной оценкой математического ожидания является выборочная средняя .
    Несмещенная и состоятельная оценка дисперсии вычисляется по формуле:

    .

    где  – исправленная дисперсия.
    Для оценки среднего квадратического отклонения используется величина S, равная квадратному корню из исправленной дисперсии, которая называется исправленным средним квадратическим отклонением.
    Рассмотренные оценки характеризуются одним числом и называются точечными.
    Пример 1. По заданному статистическому ряду (табл. 1) требуется:

    а) построить гистограмму относительных частот;

    б) перейти к вариантам и построить полигон относительных частот;

    в) построить эмпирическую функцию распределения.

    Таблица 1



    12 –15

    15 – 18

    18 – 21

    21 – 24

    24 – 27

    27 – 30



    2

    6

    12

    19

    7

    4


    Решение

    а) Объем выборки .

    Определяем относительные частоты и составляем табл. 2 с относительными частотами:

    Таблица 2



    12 –15

    15 – 18

    18 – 21

    21 – 24

    24 – 27

    27 – 30



    0,04

    0,12

    0,24

    0,38

    0,14

    0,08

    Для построения гистограммы относительных частот на оси абсцисс откладываются частичные интервалы длины , а над ними проводятся горизонтальные отрезки на расстоянии (рис. 1).



    б) Перейдем к вариантам, положив их равными серединам частичных интервалов , где , – концы интервалов. Тогда табл. 2 превратится в табл. 3:

    Таблица 3



    13,5

    16,5

    19,5

    22,5

    25,5

    28,5



    0,04

    0,12

    0,24

    0,38

    0,14

    0,08

    Отметим на плоскости точки и, соединив соседние точки, получим полигон относительных частот (рис. 2).



    в) Эмпирическая функция распределения строится по закону:



    В нашем случае получаем:



    График функции представлен на рис. 3.

    Пример 2.В условиях примера 1 найти статистические оценки.

    Решение Обратимся к табл. 3: ; ; .
    Контрольные вопросы:


    1. Что такое выборка?

    2. Что такое варианта выборки и частота?

    3. Как графически изображается выборка?

    4. Точечные оценки выборки.


    Задачи на закрепление материала
    Статистический ряд задан таблицей. Требуется:

    а) построить гистограмму относительных частот;

    б) перейти к вариантам и построить полигон относительных частот;

    в) записать эмпирическую функцию распределения и построить ее график;

    г) найти точечные оценки , , ;

    1.

    (–6; –4)

    (–4; –2)

    (–2; 0)

    (0; 2)

    (2; 4)

    (4; 6)

    2

    6

    17

    18

    4

    3




    2.

    (0; 2)

    (2; 4)

    (4; 6)

    (6; 8)

    (8; 10)

    (10; 12)

    1

    3

    19

    21

    4

    2




    3.

    (–4; –2)

    (–2; 0)

    (0; 2)

    (2; 4)

    (4; 6)

    (6; 8)

    3

    8

    14

    15

    9

    1




    4.

    (–2; 0)

    (0; 2)

    (2; 4)

    (4; 6)

    (6; 8)

    (8; 10)

    1

    4

    20

    19

    4

    2






    Тема лекции: Интервальные оценки параметров распределения
    План:

    1. Интервальная оценка математического ожидания нормального распределения.

    2. Интервальная оценка среднего квадратического отклонения нормального распределения.

    3. Интервальная оценка вероятности события



    Определение: Интервальнойназывают оценку, которая определяется двумя числами – концами интервала.

    Так как любая оценка есть некоторое приближение оцениваемой величины a, то возникает вопрос об оценке точности данного приближения, т. е. можно ли утверждать, что для некоторого .

    Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству . Можно лишь говорить о вероятности наступления события, заключающегося в том, что мы получили оценку с точностью : . Эта вероятность называется доверительной вероятностью (или надежностью), а интервал доверительным интервалом. Вероятность того, что интервал заключает в себе неизвестный параметр a, равна . Обычно надежность выбирают близкой к единице (0,95; 0,99; 0,999).


    1. Интервальная оценка математического ожидания нормального распределения


    Если случайная величина распределена нормально и среднее квадратическое отклонение известно, то доверительный интервал для оценки математического ожидания a

    , (1)

    где n – объем выборки, t находится из равенства по таблице значений функции Лапласа .
    Если неизвестно, то в формуле (1) оно заменяется на исправленное среднее квадратическое отклонение S, t заменяется на  , которое находится по таблице (приложение )

    . (2)


    1. Интервальная оценка среднего квадратического отклонения нормального распределения


    Доверительный интервал для оценки среднего квадратического отклонения нормального распределения с заданной надежностью находится по формуле

    , (3)

    где находится по таблице (приложение ).
    Пример 1. Дано распределение частот выборки (табл. 1). Найти доверительные интервалы для математического ожидания a и среднего квадратического отклонения с доверительной вероятностью  = 0,95, если известно, что генеральная совокупность распределена по нормальному закону
    Таблица 1



    12 –15

    15 – 18

    18 – 21

    21 – 24

    24 – 27

    27 – 30



    2

    6

    12

    19

    7

    4


    Решение

    Имеем: , , . Так как объем выборки , то находим

    .

    По таблице приложения  находим

    .

    Подставляя полученные значения S и t в формулу (2), получим



    или

    .

    По таблице приложения  найдем .

    Подставляя значения S и q в формулу (3), получим



    или

    .
    3.Интервальная оценка вероятности события
    Интервальной оценкой (с надежностью ) неизвестной вероятности р биномиального распределения по относительной частоте служит доверительный интервал (с приближенными концами р1 и р2) ,

    где

    n- общее число испытаний;

    m- число появления события;

    - относительная частота, равная отношению m/n;

    t- значение аргумента функции Лапласа, при котором . ( - заданная надежность).
    Замечание: При больших значениях n (порядка сотен) можно принять в качестве приближенных границ доверительного интервала


    Пример: Производятся независимые испытания с одинаковой, но неизвестной вероятностью р появления события А в каждом испытании. Найти доверительный интервал для оценки вероятности р с надежностью 0,95, если в 60 испытаниях событие А появилось 15 раз.
    Решение: По условию, n=60, m=15, =0.95. Найдем относительную частоту появления события А: .

    Найдем t из соотношения . По таблице функции Лапласа находим t=1,96.

    Найдем границы искомого доверительного интервала:



    Подставив в эти формулы n=60, , t=1,96, получим р1=0,16, р2=0,37.

    Итак, искомый доверительный интервал .
    Пример: Изготовлен экспериментальный игровой автомат, который должен обеспечить появление выигрыша в одном случае из 100 бросаний монеты в автомат. Для проверки пригодности автомата произведено 400 испытаний, причем выигрыш появился 5 раз. Найти доверительный интервал, покрывающий неизвестную вероятность появления выигрыша с надежностью =0.999.
    Решение: Найдем относительную частоту появления выигрыша .

    Найдем t из соотношения . По таблице функции Лапласа находим t=3,3.

    Учитывая, что n=400 велико, используем для отыскания границ доверительного интервала приближенные формулы:

    Подставив в эти формулы n=400, , t=3,3,

    получим р1= -0,0058, р2= 0,0308.

    Итак, искомый доверительный интервал .


    написать администратору сайта