Главная страница

Реферат математика. Определение законов распределения случайных величин на основе опытных данных


Скачать 44.01 Kb.
НазваниеОпределение законов распределения случайных величин на основе опытных данных
Дата06.02.2023
Размер44.01 Kb.
Формат файлаdocx
Имя файлаРеферат математика.docx
ТипРеферат
#923415

Автономная некоммерческая образовательная организация высшего образования «Сибирский институт бизнеса и информационных технологий»

Письменная работа № 1

третьего семестра

Дисциплина: Высшая математика




Реферат

Тема: Определение законов распределения случайных величин на основе опытных данных



Выполнил: ___Миночкин Константин Николаевич___ Менеджмент, 1621(2)

Проверил(а): _____________________________ (Ф.И.О. преподавателя) 02.02.23 Омск 20___ г

Содержание

Введение……………………………………………………………………….3

1. Закон распределения случайной величины и его основные характеристики………………………………………………………………...4

1.1 Генеральная совокупность и выборка, статистический ряд и гистограмма…………………………………………………………………….4

1.2 Числовые характеристики статистического ряда………………………6

1.3 Выравнивание (сглаживание) статистического ряда и статистической функции распределения с помощью нормального закона…………………...7

1.4 Точечные и интервальные оценки параметров распределения………..7-8

1.5 Точность статистической оценки. Доверительная вероятность (надежность оценки), доверительный интервал………………………………………8-9

2. Критерии согласия……………………………………………………………9-12


Заключение………………………………………………………………………13

Список использованной литературы…………………………………………...14




Введение

Подобно другим математическим наукам, теория вероятности развилась из потребностей практики. Начало систематического исследования задач, относящихся к массовым случайным явлениям, и появление соответствующего математического аппарата относятся к XVII веку. В начале XVII века знаменитый физик Галилей уже пытался подвергнуть научному исследованию ошибки физических измерений, рассматривая их как случайные и оценивая их вероятности. К этому же времени относятся первые попытки создания общей теории страхования, основанной на анализе закономерностей в таких массовых случайных явлениях как заболеваемость, смертность, статистика несчастных случаев и т. д. Необходимость создания математического аппарата, специально приспособленного для анализа случайных явлений, вытекала и из потребностей обработки и обобщения обширного статистического материала во всех областях науки. В разнообразных видах практической деятельности встречается такая задача. Наблюдается некоторая случайная величина Х, закон распределения которой неизвестен. Требуется определить этот закон из опыта или проверить гипотезу о том, что эта случайная величина подчинена определенному закону распределения. В результате наблюдения (эксперимента, исследований) имеется ряд значений случайной величины. В данном реферате представлен поэтапное определение закона распределения случайной величины по статистическим данным на основании опыта. Целью данного реферата является изучить этапы определения закона распределения случайной величины на основании опытных данных. Задачами данного реферата являются: актуализировать основные понятия по данной теме; рассмотреть порядок определения закона распределения случайной величины; изучить правила согласия.




1. Закон распределения случайной величины и его основные характеристики

1.1 Генеральная совокупность и выборка, статистический ряд и гистограмма


Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Закон распределения может иметь разные формы: нормальный закон распределения (закон Гаусса); логарифмически нормальное распределение; гамма-распределение; экспоненциальный закон распределение; распределение Вейбула; равномерный закон распределения; распределение хи-квадрат ; распределение Стьюдента; распределение Фишера. Генеральной совокупностью называется совокупность всех подлежащих изучению объектов или возможных результатов всех наблюдений, производимых в одинаковых условиях над одним объектом. Выборочной совокупностью или выборкой называется совокупность объектов или результатов наблюдения над объектом, отобранных случайным образом из генеральной совокупности. Объемом выборки называется число объектов или наблюдений в выборке. Конкретные значения выборки называются наблюдаемыми значениями случайной величины Х. Наблюдаемые значения заносятся в протокол. Протокол представляет собой таблицу. Составленный протокол является первичной формой записи обработки полученного материала. Для получения достоверных, надежных выводов выборка должна быть достаточно представительной по объему. Большая выборка – это неупорядоченное множество чисел. Для исследования выборку приводят к наглядному упорядоченному виду. Для этого в протоколе находят наибольшее и наименьшее значения случайной величины. Размахом выборки называется разность между наибольшим и наименьшим значением случайной величины Х: . Размах выборки разбивают на k интервалов – разрядов. Число разрядов устанавливают в зависимости от величины размаха выборки от 8 до 25. Длина интервала находится по формуле: . В протоколе подсчитывается число наблюдаемых значений, попавших в каждый интервал, обозначая их m1, m2,…,m10. Назовем mi частотой попадания случайной величины в i интервал. Если какое-либо наблюдаемое значение случайной величины совпадает с концом интервала, то это значение случайной величины по договоренности относят в один из интервалов. После того как определили частоты mi, определяются частоты случайной величины, т.е. находится отношение частот mi к общему числу наблюдаемых значений n: — частоты, условие полноты – Находится середина каждого интервала: . Таблица значений границ интервалов и соответствующих частот , где i = 1, 2, 3, …, k, называется статистическим рядом. Статистический ряд оформляется графически в виде так называемой гистограммы. Она строится следующим образом. По оси абсцисс откладываются, а на каждом из интервалов как основании строится прямоугольник, площадь которого равна частоте данного интервала. Для построения гистограммы нужно частоту каждого интервала разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине интервалов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная ее площадь равна единице. Статистической функцией распределения называется частота случайной величины, не превосходящая заданного значения Х: . Для дискретной случайной величины Х статистическая функция распределения находится по формуле: . Записывается обычно статистическая функция распределения в развернутом виде: , где — это середина интервала i, а — это соответствующие частоты, где i=1, 2,…, k. График статистической функции распределения есть ступенчатая линия, точками разрыва которой являются середины интервалов, а конечные скачки равны соответствующим частотам .

1.2 Числовые характеристики статистического ряда


Числовые характеристики статистического ряда: — статистическое математическое ожидание, — статистическая дисперсия, — статистическое среднеквадратическое отклонение. Статистическим математическим ожиданием или статистическим средним называется среднеарифметическое наблюдаемых значений случайной величины Х: (1). Статистической дисперсией называется среднеарифметическое значение величины или: (2). При большом объеме выборки вычисления по формулам (1) и (2) приводят к громоздким выкладкам. Для упрощения расчетов используют статистический ряд с границами и частотами , где i = 1, 2, 3, …, k, находят середины интервалов , а затем все элементы выборки , которые попали в интервал , заменяют единственным значением , тогда таких значений будет в каждом интервале . , где — среднее значение соответствующего интервала ; — частот интервала , , , . Вычисление числовых характеристик статистического ряда сводятся в таблицу. определяет положение центра группировки наблюдаемых значений случайной величины. , характеризуют рассеяние наблюдаемых значений случайной величины вокруг .

1.3 Выравнивание (сглаживание) статистического ряда и статистической функции распределения с помощью нормального закона


Во всяком статистическом распределении неизбежно присутствуют элементы случайности. Однако при очень большом числе наблюдений эти случайности сглаживаются, и случайные явления обнаруживают присущую ему закономерность. При обработке статистического материала приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую. Эта теоретическая кривая распределения должна выражать существенные черты статистического распределения – эта задача называется задачей сглаживания или выравнивания статистического ряда. Иногда общий вид распределения случайной величины Х вытекает из самой природы этой случайной величины. Пусть случайная величина Х – это результат измерения некоторой физической величины прибора. Х = точное значение физической величины + ошибка прибора. Случайная ошибка прибора при измерении имеет суммарную природу и распределена по нормальному закону. Следовательно, такое же распределение имеет случайная величина Х, т.е. нормальное распределение с плотностью вероятности: , где , , . Параметры и определяются так, чтобы числовые характеристики теоретического распределения были равны соответствующим числовым характеристикам статистического распределения. При нормальном распределении полагают, что , , тогда функция нормального распределения примет вид: . Далее, вычисления сводятся в таблицу и теоретическую нормальную кривую строят по точкам на одном графике с гистограммой статистического ряда (пример – приложение 2). Далее переходят к выравниванию статистической функции распределения . Статистическую функцию распределения выравнивают функцией распределения нормального закона: , где , , — функция Лапласа. Вычисления сводятся в таблицу и строится график теоретической функции распределения по точкам вместе с графиком статистической функции распределения.











1.4 Точечные и интервальные оценки параметров распределения


Пусть изучается случайная величина Х с математическим ожиданием и дисперсией , оба параметра неизвестны. Пусть х1, х2, х3, …, хn – выборка, полученная в результате проведения n независимых наблюдений случайной величины Х. Чтобы подчеркнуть случайный характер величин х1, х2, х3, …, хn перепишем их в виде: Х1, Х2, Х3, …, Хn, где Хi – значение случайной величины Х в i-ом опыте. Требуется на основании этих опытных данных оценить математическое ожидание и дисперсию случайной величины. Такие оценки называются точечными, в качестве оценки m и D можно принять статистическое математическое ожидание и статистическую дисперсию , где , . До проведения опыта выборка Х1, Х2, Х3, …, Хn есть совокупность независимых случайных величин, которые имеют математическое ожидание и дисперсию, а значит распределение вероятности такие же как и сама случайная величина Х. Таким образом: , , где i = 1, 2, 3, …, n. Исходя из этого, находится математическое ожидание и дисперсия случайной величины (пользуясь свойствами математического ожидания). , . Таким образом, математическое ожидание статистического среднего равно точному значению математического ожидания m измеряемой величины, а дисперсия статистического среднего в n раз меньше дисперсии отдельных результатов измерений: при . Это значит, что при большом объеме выборки N статистическое средние является величиной почти неслучайной, оно лишь незначительно отклоняется от точного значения случайной величины m. Этот закон называется законом больших чисел Чебышева.

1.5 Точность статистической оценки. Доверительная вероятность (надежность оценки), доверительный интервал.


Точечные оценки неизвестных значений математического ожидания и дисперсии имеют большое значение на первоначальном этапе обработки статических данных. Их недостаток в том, что неизвестно с кокой точностью они дают оцениваемый параметр. Пусть по данной выборке Х1, Х2, Х3, …, Хn получены точные статистические оценки и , тогда числовые характеристики случайной величины Х будут приближенно равны . При решении практических задач требуется найти приближенные значения m и D, а также оценить их точность и надежность. Пусть , где — это точечная оценка для m. Очевидно, что тем точнее определяет m, чем меньше модуль разности . Пусть , где ε>0, тогда, чем меньше ε, тем точнее оценка m. Таким образом, ε>0 характеризует точность оценки параметра. Однако статистические методы не позволяют категорически утверждать, что оценка истинного значения m удовлетворяет , можно лишь говорить о вероятности α, с которой это неравенство выполняется: . Значит, α — это доверительная вероятность или надежность оценки, значения α выбираются заранее в зависимости от того, какая задача решается. Принято α выбирать за 0.9; 0.95; 0.99; 0.999. Такая вероятность делает события практически достоверными. По заданной доверительной вероятности можно найти число ε>0 из . Тогда получается интервал ,который накрывает с вероятностью α истинное значение математического ожидания m, длина этого интервала равна 2ε. Этот интервал называется доверительным интервалом. А такой способ оценки неизвестного параметра m – интервальным (Рис. 2). Рис. 2 Доверительный интервал для математического ожидания нормального распределения случайной величины при известном σ. Пусть дана выборка Х1, Х2, Х3, …, Хn, и пусть по этой выборке найдено , , . Требуется найти доверительный интервал для математического ожидания m с доверительной вероятностью α. Величина есть величина случайная с математическим ожиданием , . Случайная величина имеет суммарную природу, при большом объеме выборки она распределена по закону близкому к нормальному. Тогда вероятность попадания случайной величины в интервал будет равна: ,где (3), где — функция Лапласа. Из формулы (3) и таблиц функции Лапласа находим число ε>0 и записываем доверительный интервал для точного значения случайной величины Х с надежностью α.

2. Критерии согласия


Во многих случаях закон распределения случайной величины неизвестен, но на основании опытных данных делается предположение о виде закона распределения случайной величины Х. Однако для окончательного решения вопроса о виде распределения следует проверить согласуются ли результаты наблюдения с высказанным предположением. При этом, если даже предположение о виде распределения сделано правильно, закон распределения наблюдаемой случайной величины будет отличаться от теоретического закона, т.к. число наблюдений ограничено. Поэтому следует выяснить: является ли расхождение между статистическим и теоретическим законами распределения только следствием ограниченного числа наблюдений, или оно является чем-то более существенным. Для этого используются критерии согласия. Критерий Пирсона Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый критерий χ2 (критерий Пирсона). Он требуется для проверки согласования экспериментальных данных статистического ряда с гипотезой о том, что случайная величина X имеет данный закон распределения, соответствующей выбранной нами теоретической функции распределения F(x) или плотности распределения вероятности f(x). Схема применения критерия Пирсона к оценке согласованности теоретического и статистического распределений сводится к следующему: определяются оценки среднего арифметического значения «x» ̅ и среднего квадратического отклонения (СКО) σ по формулам x ̅=∑_(i=1)^n▒〖x_i/n〗, σ=√((∑_(i=1)^n▒〖(x_i-x ̅)〗^2 )/(n-1)). Группируются результаты измерений (наблюдений) по интервалам длиной h, число которых определяют так же, как и при построении гистограммы. Определяются границы интервалов xi, xi+1. Для каждого интервала находятся вероятности попадания в него наблюдений. Если в качестве теоретического используется нормальное распределение вероятностей случайно величины X, то используются формулы p*i = Ф^* ((x_(i+1)-M^*)/σ^* )-Ф^* ((x_i-M^*)/σ^* ), где Ф.(t) – функция Лапласа, при t=((x_(i+1)-x ̅)/σ) и t=((x_i-x ̅)/σ). Для распределений, отличающихся от нормального, используют другие формулы. Определяется количество наблюдений mi, попавших в каждый i-й интервал. Если в какой-либо интервал попадает меньше 5 наблюдений, то его объединяют с соседними. Заполняется таблица на основе таблицы, используемой при построении статистического ряда Определяется мера расхождения χ2 по ранее приведенной формуле Определяется число степеней свободы r, и задается вероятность P, которая обычно выбирается равной 0,95 или 0,9 По числу степеней свободы и вероятности находится критическое значение χкр2 Сравнивается рассчитанное χ2 и критическое значение χкр2, найденное по таблице, если при этом χ2<χкр2, то гипотеза о соответствии выбранной теоретической функции распределения F(x) и статистической F*(x) с вероятностью P принимается, и функцию F(x) можно использовать для описания статистического распределения. Если χ2>χкр2, то гипотеза с вероятностью P отвергается и выбранную теоретическую функцию распределения F(x) нельзя использовать для описания статистического распределения. Критерий Колмогорова. Пусть точно известна теоретическая функция распределения F(x) и выборка не группирована. В качестве меры расхождения теоретического распределения и выборочных данных возьмем максимальное значение модуля разности между F(x) и статистической функцией распределения F*(x): (4) Такая мера расхождения позволяет построить критерий с исключительно простыми свойствами распределения величины критерия. А именно, А. Н. Колмогоров показал, что если взять величину критерия в виде , то вероятность неравенства не зависит от вида и параметров теоретической функции распределения F(x) и при стремится к пределу (5) Таблица 1. P( ) P( ) P( ) 0.0 1.000 0.7 0.711 1.4 0.040 0.1 1.000 0.8 0.544 1.5 0.022 0.2 1.000 0.9 0.393 1.6 0.012 0.3 1.000 1.0 0.270 1.7 0.006 0.4 0.997 1.1 0.178 1.8 0.003 0.5 0.964 1.2 0.112 1.9 0.002 0.6 0.864 1.3 0.068 2.0 0.001 Рисунок 3. Значения этого предела, рассчитанные по (5), приведены в табл. 1, график функции показан на рис.3. Алгоритм применения критерия Колмогорова для проверки согласия теоретического распределения F(x) с выборочными данными сводится к следующему. 1) Строится теоретическая функция распределения F(x). 2) Строится статистическая функция распределения F*(x). Напомним, что F*(x) обладает всеми свойствами функции распределения дискретной СВ, у которой значения совпадают с выборочными значениями, а все вероятности равны 1/n. 3) Находится D как максимум модуля разности между F(x) и F*(x), согласно (4). 4) Задается критическая вероятность. 5) По табл. 1 (существуют таблицы с более мелким шагом), или по формуле (5) (на компьютере) находится вероятность того, что по чисто случайным причинам величина U превзойдет наблюденную величину критерия . 6) Вероятность сравнивается с критической вероятностью pcr и принимается решение: если , то принимается решение «отвергнуть гипотезуН0», т. е. считать, что теоретическое распределение с функцией распределения F(x) не согласуется с выборочными данными»; если , то принимается решение «не отвергать гипотезуН0», т. е. «нет существенных оснований считать, что теоретическое распределение не согласуется с выборочными данными». Сравним критерий согласия А. Н. Колмогорова с критерием согласия хи-квадрат К. Пирсона. 1) Как и критерий хи-квадрат, критерий Колмогорова не может доказать (обосновать) согласованность теоретического распределения с выборочными данными, он только может в некоторых случаях отвергнуть Н0 или не найти для этого оснований. 2) Так же, как и в предыдущем случае, необходимо критическую вероятность задавать до того, как найдена вероятность . 3) И на этот раз применение критерия связано с асимптотическим значением вероятности превышения наблюденного значения критерия, поэтому необходимо, чтобы n было достаточно большим (практически — несколько сотен). 4) И этот критерий достаточно прост в применении. 5) В отличие от критерия хи-квадрат, критерий Колмогорова можно применять только если гипотетическая теоретическая функция распределения F(x) полностью известна заранее из каких-то внешних, например, физических соображений, т. е. когда известен не только вид функции распределения, но и все ее параметры. Такая ситуация редко встречается на практике. Обычно из теоретических соображений известен только общий вид теоретической функции распределения, а ее параметры приходится оценивать по выборочным данным. При применении критерия хи-квадрат это обстоятельство учитывается уменьшением числа степеней свободы на число оцененных параметров. Критерий Колмогорова такого согласования не предусматривает. Если все же применять этот критерий в тех случаях, когда параметры теоретического распределения оцениваются по выборочным данным, критерий дает заведомо завышенные значения вероятности ; поэтому возникает риск принятьН0 в ситуации, когда предполагаемое теоретическое распределение плохо согласуется с выборочными данными. Составной критерий Для проверки соответствия распределения данных нормальному распределению используют составной критерий. Если гипотеза о нормальности отвергается хотя бы по одному из критериев, считают, что распределение результатов измерения отлично от нормального. Критерий 1. Вычисляют отношение : , где S* — смещенная оценка среднего квадратического отклонения, вычисляемая по формуле: Результаты наблюдений группы можно считать распределенными нормально, если , где и — квантили распределения. Критерий 2. Можно считать, что результаты наблюдений принадлежат нормальному распределению, если не более m разностей превзошли значение zp/2 S, где S — оценка среднего квадратического отклонения, вычисляемая по формуле: , где zp/2 — верхний квантиль распределения нормированной функции Лапласа, отвечающий вероятности Р/2. Значения Р определяются по выбранному уровню значимости q2 и числу результатов наблюдений n. При уровне значимости, отличном от предусмотренных, значение Р находят путем линейной интерполяции. В случае, если при проверке нормальности распределения результатов наблюдений группы для критерия 1 выбран уровень значимости q1, а для критерия 2 — q2, то результирующий уровень значимости составного критерия q ≤ q1 + q2. Если хотя бы один из критериев не соблюдается, считают, что распределение результатов наблюдений группы не соответствует нормальному.

Заключение


Каждая из случайных переменных имеет ряд возможных значений, могущих возникнуть с определенной вероятностью. Случайные переменные величины могут носить прерывный (дискретный) и непрерывный характер. Возможные значения прерывной случайной переменной отделены друг от друга конечными интервалами. Возможные значения непрерывной случайной переменной не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток. Примерами прерывных случайных переменных могут служить: число попаданий при п выстрелах, если известна вероятность попадания при 1 выстреле. Число попаданий может быть 0, 1, 2…..n; число появлений герба при n бросаниях монеты. Примеры непрерывных случайных переменных: ошибка измерения; дальность полета снаряда. Если перечислить все возможные значения случайной переменной и указать вероятности этих значений, то получится распределение случайной переменной. Распределение случайной переменной указывает на соотношение между отдельными значениями случайной величины и их вероятностями. Распределение случайной переменной будет задано законом распределения, если точно указать, какой вероятностью обладает каждое значение случайной переменной. При расчетно-графических работах на определение закона распределения наблюдаемой случайной величины в конце происходит проверка статистического и теоретического закона распределения. Если данные теории согласуются, то нормальное распределение может быть принято в качестве аппроксимирующего закона.

Список использованной литературы


Вентцель Е.С. Теория вероятностей: Учебник / Под ред. А. П. Баева, В. В. Данченко – М.: 1969. — 576 с.: ил. Вуколов Э. А. Сборник задач по математике для втузов. Ч. 3. Теория вероятностей и математическая статистика: Учеб. пособие для втузов / Под. ред. А. В. Ефимова, В. Н. Земсков и др. – 2-е изд., перераб. и доп. – М.: Наука. Гл. ред. физ.-мат. лит., 1990. – 428 с. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для студентов вузов / В. Е. Гмурман. — 4-е изд., стер. — М.: Высш. Шк., 1997. – 400 с.: ил. Гмурман В. Е. Теория вероятностей и математическая статистика: Учеб. пособие для втузов / В. Е. Гмурман. — 9-е изд., стер. — М.: Высш. шк., 2003. — 479 с.: ил. Данко П. Е. Высшая математика в упражнениях и задачах: Учеб. пособие для студентов вузов / П. Е. Данко, А. Г. Попов. — В 2-х ч. Ч. 1. — 4-е изд., испр. и доп. — М.: Высш. шк., 1986. — 304 с.: ил. Пискунов Н. С. Дифференциальное и интегральное исчисления для вузов, т.2: Учеб. пособие для вузов / Н. С. Пискунов — 13-е изд. — М.: Наука, Главная редакция физико-математической литературы, 1985. — 560 с. Критерий согласия А.Н.Колмогорова [Электронный ресурс] URL: https://studfile.net/preview/3653134/page:3/


написать администратору сайта