Отчёт по 1 л.р. (1). Лабораторная работа 1 Подбор закона распределения по опытным данным и проверка его согласия по критериям 2 и Колмогорова
Скачать 73.11 Kb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Пермский национальный исследовательский политехнический университет Кафедра прикладной математике Лабораторная работа № 1 Подбор закона распределения по опытным данным и проверка его согласия по критериям χ2 и Колмогорова Работу выполнил Гр. РНГМв-12 Работу принял Карандашов В.П. Пермь 2012 Исходные данныеВ таблице 1 приведена выборка результатов измерения веса 100 студентов обучающихся на 1ом курсе в педагогическом институте. Измерения проводились с точностью до 1 кг: Таблица 1 Выборка случайной величины объёмом n=100
1.1 Исключение ложных результатов в выборкеДля исключения из экспериментальных данных грубых ошибок (ложных результатов) воспользуемся критерием Стьюдента где – математическое ожидание случайной величины x, – среднее квадратичное отклонение т.е. корень квадратный дисперсии, – критерий Стьюдента берётся из таблице. Поскольку, выборка объёмом 100, то для исключения ложных результатов удобней воспользоваться методом вычисления максимального относительного отклонения: где – крайний (наибольший или наименьший) элемент выборки. Таким образом, для выделения аномального значения вычисляют τ, которое сравнивают с табличным значением . Если неравенство соблюдается, то наблюдение не отсеивают, если не соблюдается, то наблюдение исключают. Максимальное значение в данной выборке равняется Xmax=94, а минимальное значение Xmin=63. Рассчитаем математическое ожидание: И среднее квадратичное отклонение: Для рассчитываются по формуле (1) τ Далее из выбирают наибольшее. Для отсева грубых погрешностей удобно максимальные относительные отклонения разделить на три неравенства: Из таблицы распределения Стьюдента: , Подставляя найденные значения τ при , получаем, что выполняется неравенство (5), следовательно, рассматриваемые значения не исключаем, так как весомых аргументов в их ошибочности нет. Оценка числовых характеристик распределения:Среднее арифметическое рассчитывается по формуле (2) и принимает значение равное 77.78 Эмпирическая дисперсия: Среднеквадратическое отклонение рассчитывается по формуле (3) и принимает значение = 6.941 Выборочное значение коэффициент вариации, является мерой относительной изменчивости наблюдаемой случайной величины в %, вычисляют по формуле: Выборочный коэффициент асимметрии (скошенности) это количественная характеристика показывающая сходство с нормальным распределением и рассчитываемая по формуле: Коэффициент асимметрии положителен, т.е. плотность распределения обладает положительной асимметрией Выборочный коэффициент эксцесса (островершинности) это количественная характеристика островершинности распределения, которая вычисляется по формуле: Эксцесс отрицателен, следовательно, вершина более пологая. Статистическая проверка случайности и независимости результатов наблюденийРассмотрим критерий серий, основанный на медиане выборки. Так как значение n – чётное, то выборочное значение медианы принимает вид В исходной выборке вместо каждого хi будем ставить "+", если хi>xmed(n), "-", если хi < xmed(n). Если хi = xmed(n), то не ставится никакой знак. Полученная последовательность "+" и "-" может характеризоваться количеством серий (n) и длиной самой длинной серии (n). При этом под серией понимается последовательность подряд идущих "+" или "-". Серия может состоять только из одного "+" или "-". Длина серии – количество подряд идущих "+" или "-". Если выборка стохастически независима (выборка случайна), то чередование плюсов и минусов в последовательности должно быть случайно. Таким образом, в данном критерии рассматриваются две критические статистики . где в квадратных скобках неравенства обозначена […] – целая часть, - число серий, τ(n) – длина самой длинной серии. Рассмотрим второй критерий - Критерий «восходящих» и «нисходящих» серий. По аналогии с критерием серий, основанном на медиане выборки, в ранговом критерии «восходящих» и «нисходящих» серий также формируется последовательность серий "+" и "-". Для этого в исходной выборке из генеральной совокупности xi, i = на месте i-го элемента ставят "+" если хi+1 > xi, и "-" если хi+1 < xi. Если хi+1 = xi, то в серии ничего не проставляется. При уровне значимости q=0.05 количественное выражение этого правила примет вид: где - число серий, τ(n) – длина самой длинной серии, – принимает значение 6 так как объём выборке удовлетворяет неравенству 26<n<153. Проверка нормальности распределенияКритерий, основанный на вычислении среднего абсолютного отклонения (САО).Для выборки n > 120 среднее абсолютное отклонение вычисляется по формуле: Для выборки, имеющий приближенно нормальный закон распределения, должно быть справедливо выражение: Подставляя значения в данное неравенство получаем , следовательно неравенство выполнено выборка имеет приближённо нормальный закон распределения. Критерий, основанный на анализе показателей асимметрии и эксцесса.В случаи нормального распределения характеристики асимметрии и эксцесса должны быть нулевыми. Вычислим выборочные характеристики асимметрии по формуле 7 и эксцесса по формуле 8. Далее определим среднеквадратическое отклонение выборочных асимметрий и эксцесс соответственно: Если выполняются два неравенства, то гипотеза о нормальном законе распределения рассматриваемой случайной величины принимается. Подставляя полученные значения в неравенство (9) получаем: Гипотеза о нормальном законе может быть принята. Построение гистограммы, полигона и кумулянты.Разделим данные выборки на классы и построим полигон, гистограмму и кумулянту частот. Гистограмма и полигон дают графическое представление об эмпирической функции плотности этой переменной, а кумулятивная кривая – о её эмпирической функции распределения. Для этого выполним следующие преобразования: 1) находим xmin=63 и xmax=94, Размах выборки R= xmax- xmin = 31; 2) n=100 наблюдений; 3) Определяем длину интервала разбиений: Длину интервала принимаем равной 4.0, число интервалов возьмём 8. 4) Разбиваем массив данных на интервалы и вычисляем частоту. Результаты этой операции представлены в таблице 2. Таблица 2.
5) После составления таблицы строим полигон, гистограмму и кумулянту распределения результатов наблюдения: Рис.1. Полигон распределения Рис.2. Гистограмма распределения Рис. 3. Кумулянта распределения По виду гистограммы подбираем закон распределения случайной величины. В данной работе имеем гистограмму близкую к гистограмме нормального закона распределения. Нормальный закон: , Проверим по критериям согласия, будут ли опытные данные согласоваться с нормальным законом распределения. Проверка согласия опытных данных с нормальным законом распределения по критериюУсловие: где r – число интервалов, на которые разбиты исходные опытные данные; ni – число опытных данных, попавших в i-ый интервал (абсолютная частота); - теоретическое число, попавшее в i-ый интервал. где n- объём выборки. В случае нормального закона распределения где (значения данной функции берутся из таблицы её значений). Для первого интервала левый конец изменим на - , а для последнего интервала правый конец на + . Таким образом, первый интервал будет (- ; 66), а последний (90; + ). Расчёт приведён в табл. 3; 4; 5. Таблица 3
Таблица 4
Таблица 5
Столбцы и служат для контроля вычисления по формуле: . Вычисления произведены правильно. По таблице критических точек распределения χ2, по уровню значимости α=0.01 и числу степеней свободы k=S-3=8-3=5 (S-число интервалов, 3-количество неизвестных параметров нормального закона распределения), находим критическую точку Имеем , следовательно, выдвинутая гипотеза о нормальном законе распределения принимается, т.е. опытные данные согласуются с нормальным законом распределения. Проверка согласия опытных данных с нормальным законом распределения по критерию Колмогорова.λ=D , где n-объём выборки; Необходимо вычислить где и теоретическая и эмпирическая функции распределения. Расчёты согласия по критерию Колмогорова приведены в таблице 6, где nx и -суммы опытных и теоретических данных меньших x. Таблица 6
D = 0.0788; при n=100; λ=D = 0.0788· = 0.788; При α = 0.2, λкр = 1.073; Имеем λ < λкр , следовательно, по критерию Колмогорова имеем, что опытные данные согласуются с нормальным законом распределения. Графики функций плотности и распределения. |