Лабораторная работа 1-3. Теория и образец выполнения. Лабораторная работа 1 Первичная обработка статистических данных
Скачать 0.75 Mb.
|
Математическая статистика» Методические указания для студентов По выполнению Лабораторной работы 2.1 Лабораторная работа № 1«Первичная обработка статистических данных» Из данных, входящих в выборку (табл.1.1) находим и , соответственно наименьшее и наибольшее значения выборки, и вычисляем число , называемое размахом выборки. Размах выборки – это длина основного интервала, в который попадают все значения выборки. Далее значения , называемые вариантами можно упорядочить, то есть расположить в порядке возрастания. Тогда выборка , записанная по возрастанию, называется вариационным рядом. По формуле
где целая часть числа , определим число . Данное число задает количество подынтервалов, на которые разбиваем основной интервал . Вычисляем длину подынтервалов по формуле
и затем – границы подынтервалов:
Находим частоты относительные частоты попадания значений выборки в й подынтервал. Причем должно быть . В результате проведенных расчетов, получаем две таблицы: Таблица 2.1
Таблица 2.2
Далее, если найти середины подынтервалов: , то получим еще одну таблицу. ω Таблица 2.3
В целях наглядности полученных в табл. 2.1, 2.2, 2.3 данных пользуются различными способами их графического изображения. К ним относятся гистограмма и полигон. Для построения гистограммы относительных частот используем данные табл.2.2. В декартовой системе координат на оси находим значения и и тем самым находим границы основного интервала, в который попадают все значения выборки. Затем на этом интервале откладываем границы подынтервалов. По оси откладываем величины (плотности вероятностей) . Тогда гистограммой относительных частот назовем ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные подынтервалы длины , а высоты равны числам (плотности вероятностей) . Аналогично, по данным табл. 2.1, строится гистограмма частот. Для построения полигона относительных частот используем данные табл. 2.3. В декартовой системе координат на оси находим и , то есть изображаем границы основного интервала. Затем наносим значения середин подынтервалов . По оси откладываем значения, соответствующие относительным частотам . Полигоном относительных частот называют ломаную, отрезки которой соединяют точки . Данные табл. 2.3 представляют эмпирический закон распределения выборки, а полигон относительных частот есть его визуальное представление. Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события . Таким образом, , где число вариант, меньших , объем выборки. Для каждой реализации выборки эмпирическая функция распределения однозначно определена и обладает всеми свойствами теоретической функции распределения: 1) значения эмпирической функции принадлежат отрезку ; 2) не убывающая функция; 3) если наименьшая варианта, то при ; если наибольшая варианта, то при . Эмпирическая функция распределения выборки является оценкой теоретической функции распределения генеральной совокупности. ПРИМЕР 2.1. Дана выборка из генеральной совокупности объема n=100. Таблица 2.4
1) Находим из выборки и , рассчитываем размах выборки : ; ; . 2) Составим вариационный ряд, для чего всю последовательность выборки расположим в порядке возрастания
3) Задаем число количество частичных подынтервалов, на которое разбиваем нашу выборку : . Исходя из этого вычисляем длину подынтервалов и границы подынтервалов , ; ; ; ; ; ; ; ; . 4) Рассчитываем частоты – число попаданий в подынтервалы значений из выборки, то есть . . Контроль: . На основе полученных данных, заполняем таблицу
5) Считаем середины подынтервалов и относительные частоты . ; ; . Относительные частоты: Контроль: . В результате имеем таблицу: Таблица 2.5
6) Из данных табл. 2.5, получим эмпирический закон распределения относительных частот и визуальное его представление, то есть строим гистограмму (рис. 2.1) и полигон распределения относительных частот (рис. 2.2). Рис. 2.1 7 Рис. 2.2 ) Составим эмпирическую функцию распределения. По определению, для группированного статистического ряда , имеет вид Построим график . 2.2 ЛАБОРАТОРНАЯ РАБОТА № 2Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии Пусть некоторый параметр генеральной совокупности, который невозможно вычислить. Но знать его значение (хотя бы приближенное, оценочное) надо! Поэтому по выборочным данным производят расчет статистических оценок данного генерального параметра. Точечной называют статистическую оценку генерального параметра , которая определяется одним числом . Точечная оценка может быть несмещенной и смещенной. Несмещенной называют такую точечную оценку , математическое ожидание которой равно оцениваемому генеральному параметру при любом объеме выборки, то есть
Если равенство (2.4) нарушается, то в этом случае точечная оценка называется смещенной. Несмещенной оценкой генеральной средней (математического ожидания генеральной совокупности) служит выборочная средняя:
которую считаем по данным таблицы 2.3. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия:
где из таблицы 2.3. Иногда более удобно пользоваться другой формулой для вычисления выборочной дисперсии:
Замечание. Поскольку является смещенной оценкой, то ее «исправляют» следующим образом:
Полученная оценка это несмещенная дисперсия, а выборочное среднее квадратическое отклонение. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого генерального параметра, то есть приводит к грубым ошибкам, поэтому при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый генеральный параметр . Доверительным называют интервал, который с заданной надежностью (доверительной вероятностью) покрывает оцениваемый генеральный параметр, то есть с которой осуществляется неравенство . Обычно надежность оценки (доверительная вероятность ) задается. Причем в качестве берут число, близкое к единице (0,95; 0,99; 0,999). Итак, пусть вероятность того, что равна , то есть
или
тогда интервал и есть доверительный интервал. Для оценки математического ожидания нормально распределенной генеральной совокупности по выборочной средней при известном среднем квадратическом отклонении служит доверительный интервал.
где точность оценки; объем выборки; это такое значение аргумента функции Лапласа (приложение 1), при котором . Для оценки математического ожидания нормально распределенной генеральной совокупности по выборочной средней при неизвестном среднем квадратическом отклонении и (при объеме выборки ) служит доверительный интервал
где находим по таблице (приложение 2) по заданным и . Для оценки среднего квадратического отклонения нормально распределенной генеральной совокупности с доверительной вероятностью служат доверительные интервалы:
где находим по таблице (приложение 3) при заданных и . Замечание. Для m предлагается построить доверительные интервалы для двух значений вероятности . Провести анализ, как меняются границы интервалов с увеличением доверительной вероятности. |