Лекции Элементы Высшей маьтематики. Лекции. Эмпирическая функция распределения. Полигон и гистограмма. В результате изучения темы студент должен
Скачать 208.61 Kb.
|
Перечень информационного обеспечения: основной и дополнительной литературы, учебно-методических пособий, электронных ресурсов
Тема лекции: Математическая статистика План: Основные понятия математической статистики Графическое изображение выборки Точечные оценки параметров распределения Основные понятия математической статистики На практике функция распределения случайной величины бывает неизвестна и ее определяют по результатам наблюдений или, как говорят, по выборке. Выборкой объема n для случайной величины называется последовательность независимых наблюдений этой величины, где – совокупность значений, принятых независимыми случайными величинами , имеющими тот же закон распределения , что и величина X. В этом случае говорят, что выборка взята из генеральной совокупности величины X, а под законом распределения генеральной совокупности понимают закон распределения случайной величины X. Значения называют выборочными значениями или вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Число, указывающее, сколько раз наблюдается данная варианта, называется частотой варианты, а отношение частоты варианты к объему выборки – относительной частотой. Если – вариационный ряд, а x – произвольное число, и nx – количество выборочных значений, меньших x, то – частота попадания выборочных значений левее точки x в данной выбоке объема n, т. е. частота события . Эта частота является функцией от x и называется эмпирической функцией распределения случайной величины X, полученной по данной выборке. Если обозначить эту функцию через , то по определению . Эмпирическая функция распределения обладает всеми свойствами функции распределения . Так как частота события в n независимых опытах является оценкой вероятности этого события, то значение эмпирической функции распределения в точке x есть оценка вероятности события , то есть оценка теоретической функции распределения : . Статистическим рядом распределения называется таблица, которая содержит вариационный ряд и соответствующие частоты или относительные частоты членов этого ряда (табл. 1). , , . Таблица 1 Таблица 2
В случае непрерывного распределения величины X статистический ряд распределения представляет собой таблицу, в которой заданы интервалы значений величины X и соответствующие им частоты или относительные частоты, причем интервалы располагаются в порядке возрастания величины X (табл. 2). Второй случай легко сводится к первому, если в качестве вариант брать середины интервалов: , . Графическое изображение выборки Графически табл. 1 изображается полигоном частот, представляющим собой ломаную, отрезки которой соединяют на плоскости соседние точки и или и , если строится полигон относительных частот. В случае табл. 2 исходный интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество равных интервалов длины . После этого строится гистограмма частот – ступенчатая фигура, состоящая из прямоугольников, основания которых равны h, а высоты равны отношению (или для гистограммы относительных частот). Гистограмма относительных частот является аналогом функции плотности, так как площадь под ней равна единице. Число интервалов разбиения находят по формуле , где n – объем выборки. Тогда длина каждого интервала , где и – максимальное и минимальное значение выборки соответственно. Точечные оценки параметров распределения По аналогии с такими числовыми характеристиками случайной величины, как математическое ожидание, дисперсия и среднее квадратическое отклонение, для выборки случайной величины X и для статистического ряда определяются следующие числовые характеристики: выборочная средняя , где k – число вариант и ; выборочная дисперсия или , ; выборочное среднее квадратическое отклонение Во многих случаях бывает заранее известно, что функция распределения принадлежит к определенному классу функций распределения, зависящих от одного или нескольких параметров: . В этом случае определение неизвестной функции распределения сводится к оценке неизвестных параметров по результатам выборки. Следует заметить, что ни при каких n нельзя определить по выборке точное значение неизвестного параметра, а можно найти его приближенное значение, которое называется оценкой по выборке неизвестного параметра. Всякая оценка по выборке является функцией от выборочных значений , так как она меняется от выборки к выборке. Функцию подбирают так, чтобы случайная величина по возможности более точно аппроксимировала неслучайное неизвестное число a. Для выполнения данного условия накладывают следующие требования на оценку: несмещенность оценки, ее эффективность и состоятельность. Наиболее часто применяемыми метода получения оценок являются метод моментов и метод максимального правдоподобия. Несмещенной и состоятельной оценкой математического ожидания является выборочная средняя . Несмещенная и состоятельная оценка дисперсии вычисляется по формуле: . где – исправленная дисперсия. Для оценки среднего квадратического отклонения используется величина S, равная квадратному корню из исправленной дисперсии, которая называется исправленным средним квадратическим отклонением. Рассмотренные оценки характеризуются одним числом и называются точечными. Пример 1. По заданному статистическому ряду (табл. 1) требуется: а) построить гистограмму относительных частот; б) перейти к вариантам и построить полигон относительных частот; в) построить эмпирическую функцию распределения. Таблица 1
Решение а) Объем выборки . Определяем относительные частоты и составляем табл. 2 с относительными частотами: Таблица 2
Для построения гистограммы относительных частот на оси абсцисс откладываются частичные интервалы длины , а над ними проводятся горизонтальные отрезки на расстоянии (рис. 1). б) Перейдем к вариантам, положив их равными серединам частичных интервалов , где , – концы интервалов. Тогда табл. 2 превратится в табл. 3: Таблица 3
Отметим на плоскости точки и, соединив соседние точки, получим полигон относительных частот (рис. 2). в) Эмпирическая функция распределения строится по закону: В нашем случае получаем: График функции представлен на рис. 3. Пример 2.В условиях примера 1 найти статистические оценки. Решение Обратимся к табл. 3: ; ; . Контрольные вопросы: Что такое выборка? Что такое варианта выборки и частота? Как графически изображается выборка? Точечные оценки выборки. Задачи на закрепление материала Статистический ряд задан таблицей. Требуется: а) построить гистограмму относительных частот; б) перейти к вариантам и построить полигон относительных частот; в) записать эмпирическую функцию распределения и построить ее график; г) найти точечные оценки , , ;
Тема лекции: Интервальные оценки параметров распределения План: Интервальная оценка математического ожидания нормального распределения. Интервальная оценка среднего квадратического отклонения нормального распределения. Интервальная оценка вероятности события Определение: Интервальнойназывают оценку, которая определяется двумя числами – концами интервала. Так как любая оценка есть некоторое приближение оцениваемой величины a, то возникает вопрос об оценке точности данного приближения, т. е. можно ли утверждать, что для некоторого . Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству . Можно лишь говорить о вероятности наступления события, заключающегося в том, что мы получили оценку с точностью : . Эта вероятность называется доверительной вероятностью (или надежностью), а интервал – доверительным интервалом. Вероятность того, что интервал заключает в себе неизвестный параметр a, равна . Обычно надежность выбирают близкой к единице (0,95; 0,99; 0,999). Интервальная оценка математического ожидания нормального распределения Если случайная величина распределена нормально и среднее квадратическое отклонение известно, то доверительный интервал для оценки математического ожидания a , (1) где n – объем выборки, t находится из равенства по таблице значений функции Лапласа . Если неизвестно, то в формуле (1) оно заменяется на исправленное среднее квадратическое отклонение S, t заменяется на , которое находится по таблице (приложение ) . (2) Интервальная оценка среднего квадратического отклонения нормального распределения Доверительный интервал для оценки среднего квадратического отклонения нормального распределения с заданной надежностью находится по формуле , (3) где находится по таблице (приложение ). Пример 1. Дано распределение частот выборки (табл. 1). Найти доверительные интервалы для математического ожидания a и среднего квадратического отклонения с доверительной вероятностью = 0,95, если известно, что генеральная совокупность распределена по нормальному закону Таблица 1
Решение Имеем: , , . Так как объем выборки , то находим . По таблице приложения находим . Подставляя полученные значения S и t в формулу (2), получим или . По таблице приложения найдем . Подставляя значения S и q в формулу (3), получим или . 3.Интервальная оценка вероятности события Интервальной оценкой (с надежностью ) неизвестной вероятности р биномиального распределения по относительной частоте служит доверительный интервал (с приближенными концами р1 и р2) , где n- общее число испытаний; m- число появления события; - относительная частота, равная отношению m/n; t- значение аргумента функции Лапласа, при котором . ( - заданная надежность). Замечание: При больших значениях n (порядка сотен) можно принять в качестве приближенных границ доверительного интервала Пример: Производятся независимые испытания с одинаковой, но неизвестной вероятностью р появления события А в каждом испытании. Найти доверительный интервал для оценки вероятности р с надежностью 0,95, если в 60 испытаниях событие А появилось 15 раз. Решение: По условию, n=60, m=15, =0.95. Найдем относительную частоту появления события А: . Найдем t из соотношения . По таблице функции Лапласа находим t=1,96. Найдем границы искомого доверительного интервала: Подставив в эти формулы n=60, , t=1,96, получим р1=0,16, р2=0,37. Итак, искомый доверительный интервал . Пример: Изготовлен экспериментальный игровой автомат, который должен обеспечить появление выигрыша в одном случае из 100 бросаний монеты в автомат. Для проверки пригодности автомата произведено 400 испытаний, причем выигрыш появился 5 раз. Найти доверительный интервал, покрывающий неизвестную вероятность появления выигрыша с надежностью =0.999. Решение: Найдем относительную частоту появления выигрыша . Найдем t из соотношения . По таблице функции Лапласа находим t=3,3. Учитывая, что n=400 велико, используем для отыскания границ доверительного интервала приближенные формулы: Подставив в эти формулы n=400, , t=3,3, получим р1= -0,0058, р2= 0,0308. Итак, искомый доверительный интервал . |