учебное пособие для заочников 2 курс. Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
Скачать 3.16 Mb.
|
6.6. Математическая статистика Вариационные ряды Данная тема подробно изучается в курсе статистики. Однако ее основные вопросы будут неоднократно использоваться в дальнейшем. Поэтому их необходимо повторить перед ознакомлением с последующими темами. Кроме того, при изучении таких абстрактных понятий, как распределение дискретной случайной величины, математическое ожидание и дисперсия случайной величины, существенную помощь может оказать аналогия с распределением признака в виде вариационного ряда. Основные формулы Вариационный ряд (дискретный) Таблица 6.6.1
Средняя арифметическая дисперсия: Формулы для упрощенных вычислений: где k и c –произвольные числа. Выборочный метод. Общие вопросы. Выборочный метод широко применяется на практике. Однако значение этой темы значительно шире, поскольку концепция выборки лежит в основе методологии математической статистики. Соотношение между характеристиками выборочной и генеральной совокупностей есть соотношение между опытными данными (результат наблюдений) и теоретической моделью. Основная идея выборки (выборочного наблюдения) заключается в следующем: определить неизвестные характеристики генеральной совокупности (генеральную), долю признака , генеральную среднюю и генеральную дисперсию с помощью данных выборочного распределения. Рассматривается вероятность где X-выборочная доля () или выборочная средняя (xВ); a-их математические ожидания (генеральная доля или генеральная средняя ); -предельная ошибка выборки; P-доверительная вероятность; X-, X+-доверительные границы; средняя квадратическая ошибка. Эмпирическая функция распределения. Как известно из теории вероятностей, функция распределения вероятностей случайной величины «X», определяемая соотношением является универсальной формой задания закона распределения, как для дискретных, так и для случайных непрерывных величин. Поэтому, используя теорему сложения вероятностей и заменяя теоретические вероятности pi на их оценки , мы получаем следующую эмпирическую функцию распределения Fn(x) для случая дискретной исследуемой случайной величины:
В случае непрерывной исследуемой величины Х при извлечении выборки для случайного события мы опять имеем классическую схему Бернулли, поэтому теоретическая вероятность события «Аi», определяемая в теории вероятностей как , оценивается относительной частотой попадания точки выборки в i-й класс. Припишем эту вероятность середине i-го класса, т.е значению , далее строим эмпирическую функцию так же, как и для случая дискретной случайной величины, в результате мы получим:
Полученные таким образом функции являются оценкой теоретической функции распределения F(x); из теоремы Бернулли следует, что Fn(x) сходится по вероятности при объеме выборки n к F(x), т.е. для любого положительного числа и любого числа -
Пример 6.6.1 Результаты проверки 10тиоднотипных приборов на длительность работы представлены следующей таблицей. Таблица 6.6.2
Статическое распределение частот Таблица 6.6.3
Эмпирическая функция F*(x). Чтобы найти значение F*(x), нужно подсчитать число вариант, меньших х и разделить на общее число вариант: График функций F*(x) 1
0 100 200 300 400 500 600 700 800 Рис. 6.6.1. Гистограмма На практике имеет распространение и другое графическое представление выборки, известное под названием гистограммы выборки. Предварительно выборка подвергается группировке. Для этого весь интервал числовой оси, в который попадают значения выборки , разбивают на несколько частичных интервалов (обычно 10-20) длиною h и находят для каждого частичного интервала ni-сумму частот вариант, попавших в i-тый интервал. Над каждым из интервалов, как на основании, строится прямоугольник высотой ni/h (плотность частоты). Оценка генеральной доли признака В этих темах условные обозначения Х, а, P будем понимать точно так, как они были использованы и разъяснены в предыдущей теме, а -общее обозначение для средних квадратических ошибок x, `x, , `, которые вычисляются по формулам (6.6.1). Доверительная вероятность P для заданных предельной ошибке и средней квадратической ошибке (в зависимости от вида и цели выборки это будет x, `x, , `) вычисляется по формуле (6.6.1) (6.6.1) Средняя квадратическая ошибка (т.е. x, или `x, или , или `) вычисляется по одной из следующих формул:
Иногда для удобства вычислений выражение обозначается одной буквой t. . (6.6.2) Откуда . Объем выборки n при фиксированных предельной ошибке и доверительной вероятности P вычисляется в зависимости от вида и цели выборки по одной из следующих четырех формул: таблица 6.6.4
Рассмотрим решение трех типов задач. I.Даны P, n и X; требуется определить предельную ошибку выборки или доверительные границы и . Решение: 1.По заданной величине P с помощью таблицы значений функции Ф(t) находим аргумент t (выполняя, если требуется, интерполирование). 2.Вычисляем среднюю квадратическую ошибку выборки по одной из формул (6.6.1). 3.Из выражения (6.6.2) находим предельную ошибку выборки . 4.Определяем доверительные границы и . II.Дана предельная ошибка выборки , n и X; требуется определить доверительную вероятность P. Решение: 1.Вычисляем среднюю квадратическую ошибку выборки по одной из формул (6.6.1). 2.Вычисляем аргумент t по формуле (6.6.2); 3.Для найденного значения t определяем по таблице значение функции Лапласа Ф(t)=P. III.Даны P, и X. Требуется определить необходимый объем выборки n. Решение: 1.По заданному значению доверительной вероятности P= Ф(t) определяем по таблице приложений значение t. 2.Вычисляем требуемый объем выборки n Пример 6.6.2 По схеме собственно случайной бесповоротной выборки из общего числа 400 стальных проволок были отобраны 100 проволок и проведены испытания их на прочность. Результаты испытаний приведены в следующей таблице: таблица 6.6.4
Найти: 1) вероятность того, что среднее разрывное усилие всех 400 проволок отличается от среднего разрывного усилия проволок в выборке не более чем на 0,31 (по абсолютной величине); 2) границы, в которых с вероятностью 0,9975 заключено среднее разрывное усилие проволок всей партии; 3) объем выборки, для которой доверительные границы с предельной ошибкой =0,42 имели бы место с доверительной вероятностью P=0,9961. Решение. 1.Прежде всего нужно подсчитать выборочную среднюю и выборочную дисперсию данной выборки. Согласно этим вычислениям подсчитаем теперь среднюю квадратическую ошибку выборочной средней, учитывая, что по условию выборка бесповоротная, а оценивает- ся генеральная средняя: Чтобы получить ответ на первый вопрос условия, подставляем найденные значения в формулу (6.6.1): 2.Сначала по таблице значений функции Ф(x) найдем такое значение аргумента t, для которого Ф(t)=0,9975. Это t3,02. Тогда предельная ошибка выборки: 3,020,1890,57 (Н/мм2). Поэтому доверительные границы будут 3.Для получения ответа на третий вопрос условия, нужно применить формулы (6.6.3). Предварительно по таблице значений функции Ф(x) найдем значение аргумента t, при котором Ф(t)=0,9961. Получаем t=2,89. По условию выборка бесповоротная, а оценивается генеральная средняя. Подсчитаем сначала по формуле (4) объем повторной выборке при тех же значениях t, 2 и : а затем по формуле (6.6.3) в тех же условиях необходимый объем бесповоротной выборки: Ответ. 1.Вероятность того, что среднее разрывное усилие проволок во всей партии отличается от среднего разрывного усилия проволок в выборке не более чем на 0,31 (по абсолютной величине) равна 0,8990. 2.С вероятностью 0,9975 можно утверждать, что среднее разрывное усилие проволок всей партии находится в границах от 44,53 до 45,67 (Н/мм2). 3.Для того, чтобы с доверительной вероятностью P=0,9961 гарантировать доверительные границы с предельной ошибкой =0,42, нужно образовать бесповторную выборку из 144 проволок. Пример 6.6.3 По данным задачи 1 найти: 1) доверительные границы, в которых с вероятностью P=0,9545 во всей партии находится доля проволок с разрывным усилием, не меньшим 0,46; 2) каким должен быть объем выборки, чтобы с той же вероятностью 0,9545 можно было гарантировать доверительные границы с предельной ошибкой 0,05? Решение. Находим выборочную долю Так как оценивается генеральная доля, а выборка бесповоротная, то по формуле (1-г) подсчитаем среднюю квадратическую ошибку выборочную доли: Теперь по таблице находим значение аргумента t из соотношения Ф(t)=0,9545. Получаем t=2. Из формулы (6.6.2) следует, что а доверительные границы равны: Для ответа на второй вопрос применим формулу (6.6.4-а), но сначала по формуле (6.6.4-в) находим объем повторной выборки при заданных значениях , t и , учитывая, что оценивается генеральная доля: а затем по формуле (3-г) необходимый объем бесповоротной выборки: |