Главная страница
Навигация по странице:

  • Основные формулы

  • Выборочный метод. Общие вопросы.

  • Эмпирическая функция распределения.

  • Эмпирическая функция F*(x).

  • учебное пособие для заочников 2 курс. Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования


    Скачать 3.16 Mb.
    НазваниеФедеральное государственное бюджетное образовательное учреждение высшего профессионального образования
    Анкоручебное пособие для заочников 2 курс.docx
    Дата14.05.2017
    Размер3.16 Mb.
    Формат файлаdocx
    Имя файлаучебное пособие для заочников 2 курс.docx
    ТипПрограмма дисциплины
    #7562
    страница10 из 22
    1   ...   6   7   8   9   10   11   12   13   ...   22

    6.6. Математическая статистика

    Вариационные ряды

    Данная тема подробно изучается в курсе статистики. Однако ее основные вопросы будут неоднократно использоваться в дальнейшем. Поэтому их необходимо повторить перед ознакомлением с последующими темами. Кроме того, при изучении таких абстрактных понятий, как распределение дискретной случайной величины, математическое ожидание и дисперсия случайной величины, существенную помощь может оказать аналогия с распределением признака в виде вариационного ряда.

    Основные формулы

    Вариационный ряд (дискретный)

    Таблица 6.6.1

    x1

    x1

    x2



    x1



    xm

    Всего

    n1

    n1

    n2



    n1



    nm

    n


    Средняя арифметическая дисперсия:

    Формулы для упрощенных вычислений:

    где k и c –произвольные числа.

    Выборочный метод. Общие вопросы.

    Выборочный метод широко применяется на практике. Однако значение этой темы значительно шире, поскольку концепция выборки лежит в основе методологии математической статистики. Соотношение между характеристиками выборочной и генеральной совокупностей есть соотношение между опытными данными (результат наблюдений) и теоретической моделью. Основная идея выборки (выборочного наблюдения) заключается в следующем: определить неизвестные характеристики генеральной совокупности (генеральную), долю признака , генеральную среднюю и генеральную дисперсию с помощью данных выборочного распределения.

    Рассматривается вероятность

    где X-выборочная доля () или выборочная средняя (xВ);

    a-их математические ожидания (генеральная доля или генеральная средняя );

    -предельная ошибка выборки;

    P-доверительная вероятность;

    X-, X+-доверительные границы;

     средняя квадратическая ошибка.

    Эмпирическая функция распределения.

    Как известно из теории вероятностей, функция распределения вероятностей случайной величины «X», определяемая соотношением является универсальной формой задания закона распределения, как для дискретных, так и для случайных непрерывных величин.

    Поэтому, используя теорему сложения вероятностей и заменяя теоретические вероятности pi на их оценки , мы получаем следующую эмпирическую функцию распределения Fn(x) для случая дискретной исследуемой случайной величины:




    0

    при

    1

    при

    1+2

    при

    ………



    при

    В случае непрерывной исследуемой величины Х при извлечении выборки для случайного события мы опять имеем классическую схему Бернулли, поэтому теоретическая вероятность события «Аi», определяемая в теории вероятностей как , оценивается относительной частотой попадания точки выборки в i-й класс. Припишем эту вероятность середине i-го класса, т.е значению ,

    далее строим эмпирическую функцию так же, как и для случая дискретной случайной величины, в результате мы получим:




    0

    при

    1

    при

    1+2

    при

    ………



    при

    Полученные таким образом функции являются оценкой теоретической функции распределения F(x); из теоремы Бернулли следует, что Fn(x) сходится по вероятности при объеме выборки n к F(x), т.е. для любого положительного числа  и любого числа -




    0

    при

    1/10

    при

    3/10

    при

    5/10

    при

    7/10

    при

    8/10

    при

    9/10

    при

    1

    при

    Пример 6.6.1 Результаты проверки 10тиоднотипных приборов на длительность работы представлены следующей таблицей.
    Таблица 6.6.2


    i(номер прибора)

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    x1(время работы в часах)

    200

    350

    600

    450

    400

    400

    500

    350

    450

    550

    Статическое распределение частот

    Таблица 6.6.3

    x1

    200

    350

    400

    450

    500

    550

    600

    n1

    1

    2

    2

    2

    1

    1

    1

    1

    1/10

    2/10

    2/10

    2/10

    1/10

    1/10

    1/10


    Эмпирическая функция F*(x).
    Чтобы найти значение F*(x), нужно подсчитать число вариант, меньших х и разделить на общее число вариант:
    График функций F*(x)

    1

    0,9

























    0,8

























    0,7

























    0,6

























    0,5

























    0,4

























    0,3

























    0,2

























    0,1

























    0

























    0 100 200 300 400 500 600 700 800

    Рис. 6.6.1.

    Гистограмма

    На практике имеет распространение и другое графическое представление выборки, известное под названием гистограммы выборки.

    Предварительно выборка подвергается группировке. Для этого весь интервал числовой оси, в который попадают значения выборки , разбивают на несколько частичных интервалов (обычно 10-20) длиною h и находят для каждого частичного интервала ni-сумму частот вариант, попавших в i-тый интервал. Над каждым из интервалов, как на основании, строится прямоугольник высотой ni/h (плотность частоты).
    Оценка генеральной доли признака

    В этих темах условные обозначения Х, а, P будем понимать точно так, как они были использованы и разъяснены в предыдущей теме, а -общее обозначение для средних квадратических ошибок x, `x, , `, которые вычисляются по формулам (6.6.1).

    Доверительная вероятность P для заданных предельной ошибке  и средней квадратической ошибке (в зависимости от вида и цели выборки это будет x, `x, , `) вычисляется по формуле (6.6.1)

    (6.6.1)

    Средняя квадратическая ошибка (т.е. x, или `x, или , или `) вычисляется по одной из следующих формул:


    Выборка

    Приказ

    Повторная

    Бесповторная

    для

    средней

    (а)



    (б)

    (6.6.3)

    для

    доли

    (в)



    (г)



    Иногда для удобства вычислений выражение обозначается одной буквой t.

    . (6.6.2)

    Откуда .

    Объем выборки n при фиксированных предельной ошибке  и доверительной вероятности P вычисляется в зависимости от вида и цели выборки по одной из следующих четырех формул:

    таблица 6.6.4


    Выборка

    Приказ

    Повторная

    Бесповторная

    Для

    Средней

    (а)



    (б)

    (6.6.4)

    Для

    Доли

    (в)



    (г)



    Рассмотрим решение трех типов задач.

    I.Даны P, n и X; требуется определить предельную ошибку выборки  или доверительные границы и .

    Решение: 1.По заданной величине P с помощью таблицы значений функции Ф(t) находим аргумент t (выполняя, если требуется, интерполирование).

    2.Вычисляем среднюю квадратическую ошибку выборки  по одной из формул (6.6.1).

    3.Из выражения (6.6.2) находим предельную ошибку выборки

    .

    4.Определяем доверительные границы и .

    II.Дана предельная ошибка выборки , n и X; требуется определить доверительную вероятность P.

    Решение: 1.Вычисляем среднюю квадратическую ошибку выборки  по одной из формул (6.6.1).
    2.Вычисляем аргумент t по формуле (6.6.2);

    3.Для найденного значения t определяем по таблице значение функции Лапласа Ф(t)=P.

    III.Даны P,  и X. Требуется определить необходимый объем выборки n.

    Решение: 1.По заданному значению доверительной вероятности P= Ф(t) определяем по таблице приложений значение t.

    2.Вычисляем требуемый объем выборки n

    Пример 6.6.2 По схеме собственно случайной бесповоротной выборки из общего числа 400 стальных проволок были отобраны 100 проволок и проведены испытания их на прочность.

    Результаты испытаний приведены в следующей таблице:
    таблица 6.6.4

    Разрывное усилие, Н/м

    40-42

    42-44

    44-46

    46-48

    48-50

    Итого

    Количество проволок

    7

    24

    38

    19

    12

    100


    Найти: 1) вероятность того, что среднее разрывное усилие всех 400 проволок отличается от среднего разрывного усилия проволок в выборке не более чем на 0,31 (по абсолютной величине); 2) границы, в которых с вероятностью 0,9975 заключено среднее разрывное усилие проволок всей партии; 3) объем выборки, для которой доверительные границы с предельной ошибкой =0,42 имели бы место с доверительной вероятностью P=0,9961.

    Решение. 1.Прежде всего нужно подсчитать выборочную среднюю и выборочную дисперсию данной выборки. Согласно этим вычислениям подсчитаем теперь среднюю квадратическую ошибку выборочной средней, учитывая, что по условию выборка бесповоротная, а оценивает-

    ся генеральная средняя:

    Чтобы получить ответ на первый вопрос условия, подставляем найденные значения в формулу (6.6.1):

    2.Сначала по таблице значений функции Ф(x) найдем такое значение аргумента t, для которого Ф(t)=0,9975. Это t3,02. Тогда предельная ошибка выборки:

    3,020,1890,57 (Н/мм2).

    Поэтому доверительные границы будут

    3.Для получения ответа на третий вопрос условия, нужно применить формулы (6.6.3). Предварительно по таблице значений функции Ф(x) найдем значение аргумента t, при котором Ф(t)=0,9961. Получаем t=2,89. По условию выборка бесповоротная, а оценивается генеральная средняя. Подсчитаем сначала по формуле (4) объем повторной выборке при тех же значениях t, 2 и :

    а затем по формуле (6.6.3) в тех же условиях необходимый объем бесповоротной выборки:

    Ответ. 1.Вероятность того, что среднее разрывное усилие проволок во всей партии отличается от среднего разрывного усилия проволок в выборке не более чем на 0,31 (по абсолютной величине) равна  0,8990. 2.С вероятностью 0,9975 можно утверждать, что среднее разрывное усилие проволок всей партии находится в границах от 44,53 до 45,67 (Н/мм2). 3.Для того, чтобы с доверительной вероятностью P=0,9961 гарантировать доверительные границы с предельной ошибкой =0,42, нужно образовать бесповторную выборку из 144 проволок.

    Пример 6.6.3 По данным задачи 1 найти: 1) доверительные границы, в которых с вероятностью P=0,9545 во всей партии находится доля проволок с разрывным усилием, не меньшим 0,46; 2) каким должен быть объем выборки, чтобы с той же вероятностью 0,9545 можно было гарантировать доверительные границы с предельной ошибкой 0,05?

    Решение. Находим выборочную долю

    Так как оценивается генеральная доля, а выборка бесповоротная, то по формуле (1-г) подсчитаем среднюю квадратическую ошибку выборочную доли:

    Теперь по таблице находим значение аргумента t из соотношения Ф(t)=0,9545. Получаем t=2. Из формулы (6.6.2) следует, что

    а доверительные границы равны:

    Для ответа на второй вопрос применим формулу (6.6.4-а), но сначала по формуле (6.6.4-в) находим объем повторной выборки при заданных значениях , t и , учитывая, что оценивается генеральная доля:

    а затем по формуле (3-г) необходимый объем бесповоротной выборки:
    1   ...   6   7   8   9   10   11   12   13   ...   22


    написать администратору сайта