статистическая обработка данных. основы статистической обработки опытных даных. Учебнометодическое пособие Нижний Новгород 2011 Трегубова Е. В. Основы статистической обработки опытных данных. Учебнометодическое пособие
Скачать 1.63 Mb.
|
НИЖЕГОРОДСКАЯ ГОСУДАРСТВЕННАЯ СЕЛЬСКОХОЗЯЙСТВЕННАЯ АКАДЕМИЯ Трегубова Е.В. Основы статистической обработки опытных данных Учебно-методическое пособие Нижний Новгород 2011 Трегубова Е.В. Основы статистической обработки опытных данных. Учебно-методическое пособие. Рецензенты: Пендина Т.П. – к.ф.-м.н., доцент кафедры «Математики и информатики» Волжского Государственного Инженерно-Педагогического Университета. Учебное пособие предназначается студентам инженерного факультета НГСХА для выполнения работ по курсу «Теория вероятностей и математическая статистика», а также может быть использовано в качестве справочника при изучении дисциплин «Надежность технических систем» и «Машины и оборудование в растеневодстве». В пособии излагаются основы теории математической статистики, необходимой для обработки и анализа опытных данных, приведены основные виды распределений, варианты заданий. © НГСХА, 2011. ©Трегубова Е.В., 2011 Введение. Задача любой науки, в конечном счете, состоит в выявлении и исследовании закономерностей, которым подчиняются реальные процессы и явления. Найденные закономерности имеют не только теоретическую и познавательную ценность, но и широко применяются в естествознании, технике, планировании, управлении и прогнозировании. В основе научных знаний лежит наблюдение. Для обнаружения общей закономерности, которой подчиняется явление, необходимо многократно его наблюдать в одинаковых условиях. Многие явления окружающего мира взаимно связаны и влияют одно на другое. Проследить все связи и определить влияние каждой из них на то или иное явление не всегда представляется возможным. Поэтому ограничиваются изучением влияния лишь основных факторов, определяющих течение явления. Под одинаковыми условиями наблюдений и понимается соблюдение практически одинаковых значений основных факторов. Рассмотрим пример. Станок, хорошо отлаженный в начале работы, со временем теряет настройку, режущий инструмент затупляется, что и приводит к ухудшению качества обработки изделий. Поставлена задача: определить момент, когда следует остановить станок и провести его подналадку или сменить инструмент. Для определения этого момента проверяют качество изготовленных деталей. Наблюдение, проведенное после двух часов работы станка, показало, что изделие не отвечает установленным требованиям. Причиной может быть качество заготовки, случайные изменения режима работы станка. По единичному замеру нельзя принимать решение об остановке станка. Нужны дополнительные замеры. Сколько должно быть проведено наблюдений? Как обработать результаты наблюдений и сделать обоснованные практические выводы? Получить ответы на эти вопросы позволяет математическая статистика. Рассмотрим еще один пример. Исследователя интересует зависимость урожайности определенной культуры от количества внесенных удобрений и качества обработки почвы. Для выявления этой зависимости собраны сведения об урожайности, количестве внесенных удобрений и качестве обработки по достаточно большому числу одинаковых участков (примерно с одинаковыми почвами, климатическими условиями, организацией работы по сбору урожая и т.д.). Как, используя эти сведения, количественно оценить складывающуюся в среднем зависимость урожайности от количества внесенных удобрений и качества обработки почвы и использовать ее для предвидения урожайности? На этот вопрос также дает ответ математическая статистика. Математическая статистика – наука, изучающая методы обработки результатов наблюдений массовых случайных явлений, обладающих статистической устойчивостью, закономерностью, с целью выявления этой закономерности. Выводы о закономерностях, которым подчиняются явления, изучаемые методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений. При большем числе наблюдений эти выводы могут оказаться иными. Для вынесения более определенного заключения о закономерностях явления математическая статистика опирается на теорию вероятностей. В отличие от математической статистики, имеющей дело с результатами наблюдений случайных явлений, теория вероятностей формально-логически изучает закономерности случайных явлений и имеет дело с математическими моделями случайных явлений. Обработав результаты наблюдений, исследователь выдвигает ряд гипотез, предположений о том, что рассматриваемое явление можно описать той или иной вероятностной теоретической моделью. Далее, используя математико-статистические методы, можно дать ответ на вопрос, какую из гипотез или моделей следует принять. Именно эта модель и считается закономерностью изучаемого явления. Правомерен такой вывод или нет, покажет практика использования выбранной модели. Таков типичный путь математико-статистического исследования. Данное методическое пособие имеет своей целью дать необходимые сведения по методике математической обработки результатов экспериментальных исследований и кратко осветить теоретические положения, необходимые для обработки результатов. Пособие состоит из 4 частей. Первая часть содержит сведения из курса теории вероятностей о видах распределений случайной величины. Вторая часть включает в себя основные понятия и факты из курса математической статистики и содержит сведения о критерии согласия хи-квадрат Пирсона и о критерии Колмогорова, которые являются наиболее употребляемыми критериями для проверки гипотезы о виде распределения. В третьей части содержатся примеры полного анализа опытных данных с целью определения закона распределения и приведены задания для отработки навыков обработки экспериментальных данных. Четвертая часть дает представление о применении элементов математической статистики при оценке надежности машин и при обосновании параметров зерноочистительных машин. В приложении содержится ряд таблиц. Часть 1. Элементы теории вероятностей. § 1. Случайная величина. Задание законов ее распределения. Одним из важнейших понятий в теории вероятностей является понятие случайной величины. Величина называется случайной, если в результате опыта она может принимать любые заранее неизвестные значения. Случайные величины делятся на дискретные и непрерывные. Дискретной называется такая случайная величина, которая принимает конечное или бесконечное счетное множество значений. Например, число ежемесячно продаваемых в салоне автомашин является дискретной случайной величиной. Непрерывной называется такая случайная величина, которая может принимать любые значения из некоторого конечного или бесконечного интервала. Очевидно, что возможных значений непрерывной случайной величины бесконечно. Примером непрерывной случайной величины является время заправки автомашины на автозаправочной станции. Для задания случайной величины недостаточно перечислить все ее возможные значения. Необходимо также знать, как часто могут появляться те или иные ее значения в результате испытаний при одних и тех же условиях, т.е. нужно знать вероятности их появления. Совокупность всех возможных значений случайной величины и соответствующих им вероятностей составляет распределение случайной величины. Законом распределения случайной величины называется всякое соответствие между возможными значениями случайной величины и соответствующими им вероятностями. Про случайную величину говорят, что она подчиняется данному закону распределения. Закон распределения случайной величины может быть задан в виде таблицы, в виде функции распределения и в виде плотности распределения. Табличное задание закона распределения может быть использовано только для дискретной случайной величины. Непрерывная случайная величина имеет бесчисленное множество возможных значений, поэтому перечислить их в таблице невозможно. Табличная форма задания закона случайной величины называется также рядом распределения. При графическом изображении ряда распределения в прямоугольной системе координат по оси абсцисс откладывают все возможные значения случайной величины , а по оси ординат – соответствующие вероятности. Затем строят точки и соединяют их отрезками прямых. Полученная фигура называется многоугольником распределения. Функция распределения является наиболее общей формой задания закона распределения. Она используется для задания как дискретных, так и непрерывных случайных величин. Обычно ее обозначают через . Функция распределения определяет вероятность того, что случайная величина примет значение, меньшее фиксированного действительного числа , т.е. . Вероятность того, что зависит от , следовательно, является функцией от . Поэтому и называется функцией распределения. В литературе встречаются также термины: интегральная функция распределения и интегральный закон распределения. Геометрическая интерпретация функции распределения очень проста. Если случайную величину рассматривать как случайную точку оси , которая в результате испытания может занять то или иное положение на этой оси, то функция распределения есть вероятность того, что случайная точка в результате испытания попадет левее точки . Для дискретной случайной величины , которая может принимать значения , функция распределения имеет вид , где неравенство под знаком суммы означает, что суммирование распространяется на все те значения , которые по своей величине меньше . График функции распределения дискретной случайной величины есть разрывная ступенчатая ломаная линия (рис.1). Функция распределения имеет скачек в тех точках, в которых случайная величина принимает конкретное значение, указанное в ряде распределения. В интервалах между значениями случайной величины функция постоянна. Сумма всех скачков функции распределения равна единице. Непрерывная случайная величина имеет непрерывную функцию распределения; график этой функции имеет форму плавной кривой (рис.2). Рис.1 x Рис.2 Свойства функции распределения. 1. 2. Вероятность попадания случайной величины в интервал равна разности значений функции распределения на концах этого интервала: Следствие: Вероятность любого отдельного значения непрерывной случайной величины равна нулю. 3. Функция распределения случайной величины есть неубывающая функция. 4. Непрерывную случайную величину можно задать не только интегральной функцией распределения, но и дифференциальной функцией. Дифференциальной функцией распределения называется производная от интегральной функции. Иногда функцию называют дифференциальным законом распределения случайной величины или плотностью распределения вероятности. Для описания распределения вероятностей дискретной случайной величины дифференциальная функция неприменима. Кривая, изображающая дифференциальную функцию распределения случайной величины, называется кривой распределения. Свойства дифференциальной функции распределения. 1. 2. Вероятность попадания непрерывной случайной величины в интервал равна определенному интегралу от дифференциальной функции, взятому в пределах от до : 3. Интегральная функция распределения может быть выражена через дифференциальную по формуле 4. § 2. Числовые характеристики случайной величины. Закон распределения полностью характеризует случайную величину с вероятностной точки зрения. Но при решении ряда практических задач нет необходимости знать все возможные значения случайной величины и соответствующие им вероятности, а удобнее пользоваться некоторыми количественными показателями, которые давали бы в сжатой форме достаточную информацию о случайной величине. Такие показатели называются числовыми характеристиками случайной величины. Основными из них являются математическое ожидание, дисперсия, среднее квадратическое отклонение, мода и медиана. Математическое ожидание характеризует положение случайной величины на числовой оси, определяя собой некоторое среднее значение, около которого сосредоточены все возможные значения случайной величины. Поэтому математическое ожидание иногда называют просто средним значением случайной величины. Математическим ожиданием дискретной случайной величины называется сумма произведений всех ее возможных значений на их вероятности: Если дискретная случайная величина принимает бесконечное счетное множество значений, то ее математическое ожидание выражается формулой Причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно. Математическим ожиданием непрерывной случайной величины , возможные значения которой принадлежат отрезку , называется определенный интеграл , т.е. . Если возможные значения случайной величины распределены по всей оси , то . Здесь предполагается, что несобственный интеграл, стоящий в правой части, сходится абсолютно, т.е. существует. Свойства математического ожидания. 1. Математическое ожидание постоянной величины равно этой постоянной. 2. Постоянный множитель можно выносить за знак математического ожидания. 3. Математическое ожидание суммы конечного числа случайных величин равно сумме их математических ожиданий. 4. Математическое ожидание произведения конечного числа независимых случайных величин равно произведению их математических ожиданий. . 5. Математическое ожидание отклонения случайной величины от ее математического ожидания равно нулю . К характеристикам положения случайной величины кроме математического ожидания относятся также мода и медиана. Модой дискретной случайной величины называется наиболее вероятное ее значение. Модой непрерывной случайной величины называется такое ее значение, при котором плотность распределения имеет максимум. Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными. Медианой случайной величины называется такое ее значение, для которой справедливо равенство , т.е. равновероятно, что случайная величина окажется меньше или больше медианы. С геометрической точки зрения медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам. Так как вся площадь, ограниченная кривой распределения и осью абсцисс, равна единице, то функция распределения в точке, соответствующей медиане, равна 0,5: . Следует отметить, что если распределение одномодально и симметрично, то математическое ожидание, мода и медиана совпадают. С помощью таких характеристик как дисперсия и среднее квадратическое отклонение можно судить о рассеивании случайной величины вокруг математического ожидания. Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания . Для дискретной случайной величины дисперсия равна сумме произведений квадратов отклонений значений случайной величины от ее математического ожидания на соответствующие вероятности . Для непрерывной случайной величины, закон распределения которой задан в виде плотности вероятности , дисперсия . Недостатком дисперсии является то, что она имеет размерность квадрата случайной величины и ее нельзя геометрически интерпретировать. Этого недостатка лишено среднее квадратическое отклонение случайной величины. Средним квадратическим отклонением случайной величины называется арифметическое значение квадратного корня из ее дисперсии . Свойства дисперсии. 1. Дисперсия постоянной величины равна нулю . 2. Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат: . 3. Дисперсия случайной величины равна разности матема-тического ожидания ее квадрата и квадрата математического ожидания самой величины: . 4. Дисперсия суммы конечного числа независимых случайных величин равна сумме их дисперсий: 5. Дисперсия разности конечного числа независимых случайных величин равна сумме их дисперсий: . Если бы величина Х имела несколько больших и маловероятных значений, то переход к величине Х2, а тем более к величинам Х3, Х4 и т.д., позволил бы еще больше «усилить роль» этих больших, о маловероятных возможных значений. Вот почему оказывается целесообразным рассматривать математическое ожидание целой положительной степени случайной величины (как дискретной, так и непрерывной). Начальным моментом порядка k случайной величины Х называется математическое ожидание величины Xk: . В частности, . Пользуясь этими моментами, формулу для вычисления дисперсии можно записать так: . Кроме моментов случайной величины Х целесообразно рассматривать моменты отклонения . Центральным моментом порядка k случайной величины Х называется математическое ожидание величины : . В частности, , . Нетрудно, исходя из определения центрального момента и пользуясь свойствами математического ожидания, получить формулы: , , . Моменты более высоких порядков применяются редко. Замечание. Моменты рассмотренные здесь, называются теоретическими. В отличие от теоретических моментов, моменты, которые вычисляются по данным наблюдений, называются эмпирическими. Определения эмпирических моментов даны в части 2. § 3. Законы распределения вероятностей дискретных случайных величин. Равномерное распределение вероятностей дискретной случайной величины. Дискретная случайная величина, принимающая значений, распределена равномерно, если вероятность того, что примет определенное значение выражается формулой . Например, равномерному закону распределения подчиняется случайная величина, означающая число появлений герба при одном подбрасывании монеты 2. Биномиальное распределение вероятностей дискретной случайной величины. Биномиальным распределением является распределение вероятностей появления числа событий в независимых испытаниях, в каждом из которых вероятность появления события постоянна и равна . Вероятность возможного числа появления события вычисляется по формуле Бернулли , где Постоянные и , входящие в это выражение, являются параметрами биномиального закона. Биномиальное распределение описывает распределение вероятностей только дискретных случайных величин. Возможными значениями случайной величины являются . Биномиальному распределению подчиняется, например, число бракованных изделий в выборках из неограниченной партии продукции. Биномиальное распределение может быть задано в виде таблицы:
Таблица 1 и в виде функции распределения Если случайная величина имеет биномиальное распределение, то Особенностью биномиальных распределений является то, что вероятность сначала возрастает при увеличении и достигает наибольшего значения при некотором наивероятнейшем значении , которое можно определить из неравенства . Значение является модой биномиального закона. Если имеются два наивероятнейших значения, то распределение является бимодальным. Отметим, что для любого биномиального распределения расстояние между математическим ожиданием и модой не превосходит единицы. Если - целое число, то математическое ожидание и мода совпадают. После достижения наивероятнейшего значения вероятность начинает убывать. Распределение, вообще, ассиметрично, за исключением случая, когда . 3. Закон распределения Пуассона. Дискретная случайная величина распределена по закону Пуассона, если вероятность того, что примет определенное значение выражается формулой Закон Пуассона описывает число событий , происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью. При этом число испытаний велико, а вероятность появления события в каждом испытании мала. Поэтому закон Пуассона называется еще законом распределения редких явлений. Параметром распределения Пуассона является величина , характеризующая интенсивность появления событий в испытаниях ( ). Пуассоновским распределением хорошо описывается число требований на выплату страховых сумм за год, число вызовов, поступивших на телефонную станцию за определенное время суток. Закон распределения Пуассона может быть задан в виде ряда:
Таблица 2 Если случайная величина имеет пуассоновское распределение, то 4. Гипергеометрическое распределение вероятностей дискретной случайной величины. Дискретная случайная величина распределена по гипергеометрическому закону, если вероятность того, что примет определенное значение , выражается формулой Здесь – число различных элементов множества, из которых элементов обладают определенным свойством; - число элементов выборки, а – число элементов, обладающих этим же свойством и оказавшихся в выборке, причем может принимать следующие значения , если . Гипергеометрическому закону распределения подчиняется случайная величина, означающая число извлеченных красных карандашей при извлечении наудачу 3 карандашей из коробки имеющей 7 карандашей, среди которых 4 красных. 5. Геометрическое распределение вероятностей дискретной случайной величины. Геометрическое распределение вероятностей дискретной случайной величины , значениями которой являются возможные значения числа проведенных испытаний, удовлетворяющих схеме Бернулли (причем опыт прекращается после первого же испытания, в котором рассматриваемое событие появилось), задается формулой где . Если случайная величина имеет геометрическое распределение, то § 4. Законы распределения вероятностей непрерывных случайных величин. 1. Равномерное распределение вероятностей непрерывной случайной величины. Непрерывная случайная величина имеет равномерное распределение на отрезке , если на этом отрезке плотность распределения случайной величины постоянна, а вне его равна нулю, т.е. если График плотности вероятности равномерного распределения имеет вид: 0 Рис.3 Если непрерывная случайная величина имеет равномерное распределение, то , моды равномерное распределение не имеет. Функция распределения равномерного распределения имеет вид: График функции изображен на рисунке Рис.4 Примером случайной величины, имеющей равномерное распределение вероятностей, может служить ошибка при снятии показаний с измерительных приборов, если производится округление отсчета до ближайшего целого деления. 2. Экспоненциальное (показательное) распределение вероятностей непрерывной случайной величины. Экспоненциальным (показательным) распределением непрерывной случайной величины называется такое распределение, которое описывается следующим выражением для плотности вероятности: где λ – постоянная положительная величина. Величина промежутка времени между появлениями двух последовательных редких событий подчиняется зачастую показательному распределению. Показательное распределение определяется только одним параметром λ. Функция распределения вероятностей в этом случае имеет вид: Графики дифференциальной и интегральной функций показательного распределения изображены соответственно на рисунках: Рис.5 Рис.6 Если непрерывная случайная величина имеет показательное распределение, то Показательное распределение широко применяется в приложениях, в частности в теории надежности, одним из основных понятий которой является функция надежности. Пусть элемент начинает работать в момент времени , а по истечении времени длительностью происходит отказ. Обозначим через непрерывную случайную величину - длительность времени безотказной работы элемента. Если элемент проработал безотказно (до наступления отказа) время, меньшее , то, следовательно, за время длительностью наступит отказ. Таким образом, функция распределения определяет вероятность отказа за время длительностью . Следовательно, вероятность безотказной работы за это же время длительностью , т.е. вероятность противоположного события , равна Функцией надежности называют функцию, определяющую вероятность безотказной работы элемента за время длительности : Часто длительность времени безотказной работы элемента имеет показательное распределение, функция распределения которого . Следовательно, функция надежности в случае показательного распределения времени безотказной работы элемента имеет вид . Показательным законом надежности называют функцию надежности, определяемую равенством , где λ – интенсивность отказов. 3. Нормальное распределение вероятностей непрерывной случайной величины. Нормальное распределение – наиболее часто встречающийся вид распределения. С ним приходится сталкиваться при анализе производственных погрешностей, контроле технологических процессов и режимов, а также при анализе и прогнозировании различных явлений в биологии, медицине и других областях знаний. Нормальное распределение впервые открыто Муавром в 1733 году. Нормальное распределение часто называют законом Гаусса-Лапласа, по имени математиков, открывших этот закон независимо от работ Муавра. Нормальному закону распределения подчиняются только непрерывные случайные величины. Нормальным называется такое распределение случайной величины , плотность вероятности которого описывается формулой , где - математическое ожидание, т.е , σ - среднее квадратическое отклонение случайной величины. График плотности нормального распределения называется нормальной кривой и представляет собой колоколообразную фигуру, симметричную относительно прямой и асимптотически приближающуюся к оси абсцисс при . Рис.7 Свойства нормального распределения. 1. Функция плотности нормального распределения определена на всей оси , т.е. каждому значению соответствует вполне определенное значение функции. 2. При всех значениях (как положительных, так и отрицательных) функция плотности принимает положительные значения, т.е. нормальная кривая расположена над осью . 3. Предел функции плотности при неограниченном изменении равен нулю: 4. Функция плотности нормального распределения в точке имеет максимум, равный . Поэтому, с возрастанием σ максимальная ордината нормальной кривой убывает, а сама кривая становится более пологой, т.е. сжимается к оси ; при убывании σ нормальная кривая становится более «островершинной» и растягивается в положительном направлении оси . 5. График функции плотности симметричен относительно прямой . Изменение величины параметра не изменяет формы нормальной кривой, а приводит лишь к ее сдвигу вдоль оси : вправо, если возрастает, и влево, если убывает. 6. Кривая распределения имеет две точки перегиба с координатами . Можно показать, что практически рассеяние нормально распределенной случайной величины укладывается на участке . Вероятность того, что случайная величина попадет за этот участок очень мала, а именно равно 0,0027, т.е. это событие может произойти лишь в 0,27% случаев. Такие события можно считать практически невозможными. На приведенном рассуждении основано правило трех сигм которое формулируется следующим образом: если случайная величина имеет нормальное распределение, то отклонение этой величины от её математического ожидания по абсолютной величине не превосходит утроенного среднего квадратического отклонения. Используя это правило, ориентировочно оценивают среднее квадратическое отклонение. Для этого из ряда наблюдений выбирают максимальное и минимальное значения и их разность делят на шесть. Полученное число является грубой оценкой среднего квадратического отклонения при условии, что распределение признака нормально. Функция плотности нормального распределения с параметрами =0, σ=1 называется плотностью стандартной нормальной случайной величины или нормированной плотностью, а ее график – стандартной кривой Гаусса или нормированной нормальной кривой. Справедлива теорема: алгебраическая сумма независимых нормально распределенных случайных величин имеет нормальный закон распределения с математическим ожиданием, равным алгебраической сумме математических ожиданий слагаемых, и дисперсией, равной сумме дисперсий слагаемых. 4. Распределения, связанные с нормальным распределением. Распределение Пирсона. Пусть независимые случайные величины являются стандартными нормально распределенными величинами. Распределение случайной величины называется распределением хи-квадрат с степенями свободы, а сама величина - величиной хи-квадрат с степенями свободы. Распределение Стьюдента (t-распределение). Пусть - стандартная нормально распределенная случайная величина, а - случайная величина, имеющая хи-квадрат-распределение с степенями свободы, причем и - независимые величины. Распределение случайной величины называется t-распределением с степенями свободы или -распределением, а сама величина t-величиной с степенями свободы или -величиной. Распределение Фишера (F-распределение). Пусть и - независимые случайные величины, имеющие -распределение соответственно с k и l степенями свободы. Распределение случайной величины называется F-распределением с k и l степенями свободы или - распределением, а сама величина - величиной. 5. Распределение Вейбулла. Дифференциальный закон распределения Вейбулла определяется двумя параметрами и . Плотность распределения имеет вид: где >0 и >0. Интегральная функция распределения имеет вид: Параметры и связаны с и формулами: , , где и являются функциями . Для и составлена таблица, которая приведена в Приложение 6. Распределению Вейбулла подчиняются времена безотказной работы многих технических устройств. В задачах данного профиля важной характеристикой является интенсивность отказа исследуемых элементов возраста t, определяемый соотношением . Если α=1, то распределение Вейбулла превращается в экспоненциальное распределение, а если α=2, то в так называемое распределение Релея. Для справки. В середине 30-х годов ХХ века шведский инженер и математик Вейбулл, анализируя отказы, связанные с износом шарикоподшипников, предложил простую и удобную математическую модель для их описания, которая известна теперь как распределение Вейбулла. Вскоре выдающийся русский математик Б.Гнеденко нашел три класса предельных распределений, один из которых совпадает с распределением Вейбулла. Распределение Вейбулла хорошо описывает распределение времени безотказной работы многих элементов радиоэлектрической аппаратуры, в случае если отказ этих элементов рассматривается как выход какого-либо их параметра за установленные пределы. Вероятностные и статистические методы применяются также при моделировании надежности и риска сложных проектов, долгосрочных программ и их портфелей. Поэтому для количественного анализа надежности как в технических системах машиностроения, радиоэлектроники, приборостроения, энергетики, так и для управления риском в сложных крупномасштабных проектах и долгосрочных целевых программах, а также в метеорологии может быть использовано описание одномерной случайной величины в виде распределения Вейбулла и на этой основе построена комплексная математическая модель для указанных областей приложения. Существуют и другие законы распределения, такие как распределение Коши, распределение Шарлье, распределение скоростей молекул газа, логарифмически-нормальное распределение, распределение Релея, гамма-распределение. § 5. Оценка отклонения теоретического распределения от нормального. Асимметрия и эксцесс. Эмпирическим называется распределение относительных частот. Эмпирические распределения изучает математическая статистика. Теоретическим называется распределение вероятностей. Теоретические распределения изучает теория вероятностей. В этом параграфе рассматриваются теоретические распределения. При изучении распределений, отличных от нормального, возникает необходимость количественно оценить это различие. С этой целью вводят специальные характеристики, в частности асимметрию и эксцесс. Для нормального распределения эти характеристики равны нулю. Поэтому если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения, то можно предположить близость этого распределения к нормальному. Наоборот, большие значения асимметрии и эксцесса указывают на значительные отклонения от нормального. Можно доказать, что для симметричного распределения (график такого распределения симметричен относительно прямой ) каждый центральный момент нечетного порядка равен нулю. Для несимметричных распределений центральные моменты нечетного порядка отличны от нуля. Поэтому любой из этих моментов (кроме момента первого порядка, который равен нулю для любого распределения) может служить для оценки асимметрии. Естественно выбрать простейший из них, т.е. момент третьего порядка . Однако, принять этот момент для оценки асимметрии неудобно потому, что его величина зависит от единиц, в которых измеряется случайная величина. Чтобы устранить этот недостаток, делят на и таким образом получают безразмерную характеристику. Асимметрией теоретического распределения называется отношение центрального момента третьего порядка к кубу среднего квадратического отклонения: . Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой распределения расположена слева от математического ожидания. Практически определяют знак асимметрии по расположения кривой распределения относительно моды (точки максимума дифференциальной функции): если «длинная часть» кривой расположена правее моды, то асимметрия положительна, если слева – отрицательна. As <0 f(x) f(x) As>0 . М0(Х) . М0(Х) x x Рис.8 Рис.9 Для оценки «крутости», т.е. большего или меньшего подъема кривой теоретического распределения по сравнению с нормальной кривой, пользуются характеристикой – эксцессом. Эксцессом теоретического распределения называют характеристику, которая определяется равенством . Нормальная кривая Нормальная кривая Ек<0 Ек>0 x x f(x) f(x) Рис. 10 Рис. 11 Для нормального распределения ; следовательно, эксцесс равен нулю. Поэтому если эксцесс некоторого распределения отличен от нуля, то кривая этого распределения отличается от нормальной кривой: если эксцесс положительный, то кривая имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая. При этом предполагается, что нормальное и теоретическое распределения имеют одинаковые математические ожидания и дисперсии. |