МЕТОДЫ ПЛАНИРОВАНИЯ. Металлургия Екатеринбург 2015
Скачать 7.01 Mb.
|
Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. Случайные величины и параметры их распределений Поскольку из-за влияния неконтролируемых факторов отклик — это всегда случайная величина, при обработке результатов эксперимента широко используется аппарат теории вероятностей и математической статистики, поэтому напомним некоторые основные понятия и определения этого раздела математики. Случайное событие — событие, реализацию которого при определенном комплексе условий невозможно заранее предсказать. Например, реализацию такого события, как пять остановок доменной печи в течение месяца, невозможно предсказать заранее, поскольку остановок может быть и три, и семьи четыре, и т.д. Случайная величина — величина, которая может принимать какое-либо значение из установленного множества, и с которой связано вероятностное распределение. Случайная величина может быть дискретной или непрерывной. Дискретная случайная величина — случайная величина, которая может принимать значения только из конечного или счетного множества действительных чисел. Непрерывная случайная величина — случайная величина, которая может принимать любые значения из конечного или бесконечного интервала. Если при фиксированном наборе уровней всех контролируемых факторов провести n измерений отклика X, тов результате будет получен ряд хотя и близких, но отличающихся друг от друга значений , ..., , 2 , 1 n i x i (2.1) где x i — е измерение величины X; x 1 , x 2 ,..., x n — реализация случайной величины X. Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 19 П р им ер. В результате изучения работы доменной печи на протяжении полутора лет было зарегистрировано следующее количество ее остановок в течение каждого месяца (табл. 2.1). В данном примере число остановок доменной печи в течение месяца — это дискретная случайная величина. В первом из n = 18 измерений этой величины было получено значение x 1 = 3, во втором — x 2 = 4 и т.д., до x 18 = 7. Приведенные в табл. 2.1 значения — это реализация такой случайной величины, как число остановок доменной печи в течение месяца. Таблица Число остановок доменной печи по месяцам общее число наблюдений n = 18) Месяц 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Число остановок 3 4 3 5 5 5 6 4 6 5 5 2 4 6 7 5 6 7 Каждому значению дискретной случайной величины X (любому из событий А когда случайная величина X принимает какое-либо строго определенное значение x), можно поставить в соответствие следующее отношение , n m W (2.2) где m — число наблюдений, в которых дискретная случайная величина оказалась равна x; n — общее количество наблюдений.Величину W называют частотой реализации события А. В примере 2.1, в шести наблюдениях i = 4, 5, 6, 10, 11 и 16, количество остановок доменной печи в течение месяца X оказалось равным пяти (X = 5), следовательно, частота реализации такого события, как пять остановок, равна 6/18 = 0,33. Частоты реализаций для других событий (две, три, четыре и т.д. остановки) приведены в табл. 2.2. Если продолжить наблюдения за работой доменной печи в течение еще полутора лет, то, конечно же, совершенно необязательно, что на протяжении следующих восемнадцати месяцев пять остановок Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 20 будет снова зарегистрировано ровно в 6 случаях из 18 наблюдений, а частота реализации этого события опять окажется равной 0,33. Таблица Частота остановок доменной печи Число остановок x 2 3 4 5 6 7 Количество наблюдений m, в которых реализовалось событие X = x 1 2 3 6 4 2 Частота реализации, W = m / n 0,06 0,11 0,17 0,33 0,22 0,11 Однако при возрастании числа повторений одного итого же комплекса условий частота реализации такого события, как, например, пять остановок печи в течение месяца, будет принимать все более и более устойчивое значение. Так, если подсчитать частоту реализации данного события за 36 месяцев, то она уже практически небу- дет отличаться оттого значения, которое затем можно будет получить за четыре с половиной года (при условии, что за все это время наблюдений в работе доменной печи не произойдет никаких существенных изменений. Предел, к которому стремится отношение m/n при неограниченном возрастании числа опытов n, называется вероятностью случайного события. Вероятность А) события А — число от нуля до единицы, которое представляет собой предел частоты реализации события А при неограниченном числе повторений одного итого же комплекса условий. Для дискретной случайной величины можно указать вероятность, с которой она принимает каждое из своих возможных значений конечного или счетного множества действительных чисел. Для непрерывной случайной величины задают вероятность ее попадания в один из заданных интервалов области ее определения поскольку вероятность того, что она примет какое-либо конкретное свое значение, стремится к нулю. Полностью свойства случайной величины описываются законом ее распределения, под которым понимают связь между возможными значениями случайной величины и соответствующими им вероятностями Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 21 Распределение случайной величины — функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу. В математике используют два способа описания распределений случайных величин интегральный функция распределения) и дифференциальный (плотность распределения. Функция распределения F(x) — функция, определяющая для всех действительных х вероятность того, что случайная величина Х принимает значение не больше, чем х. x X P x F (2.3) Функция распределения F(x) имеет следующие свойства риса. Ее ордината, соответствующая произвольной точке х, представляет собой вероятность того, что случайная величина X будет меньше, чем х, те. F(x 1 ) = Х ≤ x 1 ). 2. Функция распределения принимает значение, заключенное между нулем и единицей 1 0 x F (2.4) 3. Функция распределения стремится к нулю при неограниченном уменьшении хи стремится к единице при неограниченном возрастании х, те. x F x F x x 1 lim , 0 lim (2.5) 4. Функция распределения представляет собой монотонно возрастающую кривую, те. F(x 2 ) > F(x 1 ), если х > ха Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 5. Ее приращение на произвольном отрезке (х х) равновероятно- сти того, что случайная величина X попадет в данный интервал ) ( ) ( ) ( 2 1 1 2 1 2 x X x P x X P x X P x F x F (2.6) Рассмотрим, какие особенности имеют функции распределения дискретных случайных величин. Пусть Х — дискретная случайная величина, принимающая возможные значениях, х, х с вероятностями Р, Р, …, Р n Функция распределения вероятностей этой случайной величины Х равна где производится суммирование вероятностей всех возможных значений случайной величины Х, меньших чем х Такая функция всегда 0,5 1,0 x F(x) x 1 x 2 M e F(x 2 ) F(x 1 ) Рис. 2.1. Интегральный закон распределения — функция распределения а – непрерывной случайной величины б – дискретной случайной величины а 1,0 x F(x) x 2 x 3 P n P 2 P 1 … x 1 x n-1 x n б Р Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 23 разрывная, ступенчатая (рис. 2.1 бот дох включительно функция равна нулю, в точке х происходит скачок на величину Р, и функция остается постоянной дох включительно и т.д., то есть возможным значениям случайной величины соответствуют скачки функции, равные вероятностям этих значений. Последний скачок на Р n происходит в точке хи функция равна единице от х n до . Таким образом, сумма всех скачков равна единице. Плотность распределения f(x) — первая производная (если она существует) функции распределения. dx x dF x f (2.7) Плотность функции распределения f(x) имеет следующие свойства (рис. 2.2): Рис. 2.2. Дифференциальный закон распределения – плотность распределения f(x) 1. Плотность распределения вероятностей является неотрицательной функцией, те. 0 x f (2.8) x f(x) M x M 0 M e f(x) x 1 x 2 dx Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 24 Это свойство справедливо, так как F(x) есть неубывающая функция. 2. Функция распределения случайной величины Х равна определенному интегралу от плотности распределения вероятностей в пределах, х ) ( x dx x f x F (2.9) 3. Вероятность события, состоящая в том, что случайная величина Х примет значение, заключенное в полуинтервале [x 1 , x 2 ], равна определенному интегралу от плотности распределения вероятностей на этом полуинтервале ) ( 2 1 1 2 2 1 x x dx x f x F x F x X x P (2.10) 4. Интеграл плотности распределения в бесконечно большом интервале) равен единице , 1 X P dx x f (2.11) так как попадание случайной величины в интервал Х есть достоверное событие. В большинстве случаев при обработке экспериментальных данных, основываясь на тех или иных предположениях (гипотезах) относительно свойств исследуемой случайной величины, удается записать функцию ее распределения (а следовательно, и плотность распределения как первую производную от функции распределения) с точностью до некоторых неизвестных параметров. Например, для случайной величины, которая удовлетворяет так называемому нормальному закону распределения (закону распределения Гаусса, функцию распределения можно записать в виде Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 1 ) ( 2 2 2 2 dx e x F x M x x x x (2.12) а для случайной величины, имеющей, например, распределение Вейбула-Гнеденко (используемое для описания результатов экспериментов в случае хрупкого разрушения металла, а также в испытаниях на многоцикловую усталость, функция распределения определяется следующим выражением , 1 ) ( b H c x x e x F при Х > х н , F(x) = 0, при Х ≤ х н . (2.13) В функциях (2.12) и (2.13) константы M x , σ x 2 и с, b, х н являются параметрами распределений, причем первое из этих двух выражений относится к двухпараметрическому виду закона распределения, а второе, соответственно, — к трехпараметрическому. Параметр распределения — постоянная, от которой зависит функция распределения. Следовательно, если известен вид функции распределения (каким-либо образом установлено, что случайная величина не противоречит тому или иному закону распределения, то для того, чтобы однозначно охарактеризовать случайную величину, достаточно задать только лишь параметры ее распределения. Важнейшими параметрами распределения, задающими случайную величину Х, являются ее математическое ожидание M x (характеризует центр рассеивания) и дисперсия σ x 2 (характеризует степень рассеивания. Математическое ожидание M x — среднее взвешенное по вероятностям значение случайной величины. Часто математическое ожидание называют момент ого порядка. Для дискретной случайной величины математическое ожидание определяется выражением , i i i x p x M (2.14) Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 26 где х — значения дискретной случайной величины, ах Если в условиях примера 2.1 предположить, что p i ≈ см. табл. 2.2), то для математического ожидания такой дискретной случайной величины, как число остановок доменной печи в течение месяца, можно получить следующее значение M x = 2·0,06 + 3·0,11 + 4·0,17 + 5·0,33 + 6·0,22 + 7·0,11 = 4,87. Для непрерывной случайной величины математическое ожидание определяется интегралом , dx x xf M x (2.15) где f(x) — плотность распределения непрерывной случайной величины. Можно отметить, что геометрический смысл математического ожидания непрерывной случайной величины — это абсцисса центра тяжести фигуры под кривой плотности распределения f(x). Сказанное проиллюстрируем на рис. 2.2, где видно, что произведение f(x)dx есть площадь элементарного участка под кривой f(x), а x — абсцисса этого участка, те. расстояние от начала координат. Следовательно, интеграл) дает абсциссу центра тяжести всей площади фигуры под кривой f(x). Кроме математического ожидания центр рассеивания случайной величины можно еще охарактеризовать такими параметрами ее распределения, как мода и медиана. Мода Мо — значение случайной величины, соответствующее локальному максимуму плотности вероятностей для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины. Для примера 2.1 (см. табл. 2.2), при условии, что p i ≈ W i , мода Мо числа остановок доменной печи равна 5, поскольку именно этому значению данной дискретной случайной величины соответствует локальный максимум вероятности, равный 0,33. Медиана Ме — значение случайной величины, для которого функция распределения принимает значение ½, или имеет место Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 27 «скачок» со значения, меньшего чем ½, до значения, большего чем ½. Таким образом, для дифференциального закона распределения медиана есть такое значение непрерывной случайной величины Х, которое делит пополам площадь под кривой плотности распределения В примере 2.1, если предположить, что функция распределения от четырех остановок F(4) (вероятность того, что число остановок доменной печи в течение месяца будет не более четырех) равна 0,06 + 0,11 + 0,17 = 0,34 , а функция распределения F(5) = 0,34 + + 0,33 = 0,67, то медианой Ме такой дискретной случайной величины, как число остановок доменной печи в течение месяца, будет значение Ме = 5. Дисперсия случайной величины σ x 2 — математическое ожидание случайной величины (Х – M x ) 2 или, другими словами, центральный момент второго порядка. Для дискретной случайной величины дисперсия определяется следующим математическим выражением ) ( 1 2 2 n i i x i x x p M x (2.16) В примере 2.1 (опять же, если предположить, что p i ≈ W i ) значение дисперсии числа остановок доменной печи равно σ x 2 = (2 – 4,87) 2 · 0,06 + (3 – 4,87) 2 · 0,11 + (4 – 4,87) 2 · 0,17 + (5 – – 4,87) 2 · 0,33 + (6 – 4,87) 2 · 0,22 + (7 – 4,87) 2 ·0,11 = 1,7931. Для непрерывной случайной величины дисперсия определяется выражением , ) ( 2 2 dx x f M x x x (2.17) где х — значения непрерывной случайной величины Х х — плотность распределения M x — математическое ожидание. Дисперсия имеет размерность квадрата единицы измерения случайной величины, а положительное значение квадратного корня из Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 28 дисперсии называется средним квадратичным отклонением. Среднее квадратичное отклонение σ x — неотрицательный квадратный корень из дисперсии. 2 x x (2.18) Для примера 2.1 среднее квадратичное отклонение числа остановок доменной печи в течение месяца равно 34 , 1 Дадим определение еще одного важного параметра распределения случайной величины, который носит название квантиль. Квантиль порядка P, х р — значение случайной величины, для которого функция распределения принимает значение P или имеет место скачок со значения, меньшего чем P, до значения, большего чем P: F(x p ) = P. (2.19) Из этого определения квантиля следует, что медиана Ме — это квантиль порядка ½, те. Мех Вероятность попадания случайной величины Х в интервал х, х равна ) ( ) ( ) ( 1 2 1 2 1 2 2 1 P P x F x F x X P x X P x X x P P P P P P P (2.20) В примере 2.1 квантиль порядка 0,95 числа остановок доменной печи скорее всего равен семи х 0,95 ≈ 7, поскольку F(6) ≈ 0,06 + 0,11 + + 0,17 + 0,33 + 0,22 = 0,89, а F(7) ≈ 0,89 + 0,11 = 1,00. 2.2. Нормальный закон распределения Функция распределения F(x) и соответствующая ей плотность распределения f(x) представляют собой некоторую математическую модель свойств исследуемой случайной величины (отклика, значения которой регистрируются входе эксперимента. Поэтому одной из основных задач статистической обработки опытных данных является нахождение таких функций распределения, которые, с одной Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 29 стороны, достаточно хорошо описывали бы наблюдаемые значения случайной величины, ас другой — были бы удобны для дальнейшего статистического анализа. При этом вид функции распределения предпочтительно выбирать на основе представлений о физической природе рассматриваемого явления, так как в этом случае исключаются возможные погрешности при распространении найденных закономерностей за пределы изучаемого в эксперименте интервала варьирования (изменения) случайной величины (отклика. Из всех изученных к настоящему времени случайных величин при обработке экспериментальных данных исследователи чаще всего оперируют со случайными величинами, которые имеют так называемое нормальное (Гауссово) распределение (рис. 2.3). x x M x z F(z) 0,5 1,0 3 3 в x f(x) M x , M 0 , е f(x) max = 2 x 2 а x F(x) 0,5 1,0 M x , M 0 , M е x2 x1 б Рис. 2.3. Плотность распределения (а, г) и функция распределения (б, в) при нормальном законе распределения случайных величин f(z) x x M x z 0,4 3 3 г S 1 -z S 2 S 3 +z Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 30 Не вдаваясь в подробные математические выкладки, отметим, что, согласно центральной предельной теореме математической статистики при определенных условиях распределение нормированной суммы n независимых случайных величин, распределенных по произвольному закону, стремится к нормальному, когда n стремится к бесконечности. Необходимые условия, при которых эта теорема оказывается справедливой, состоят в том, что различные случайные величины должны иметь конечные дисперсии и дисперсия любой случайной величины не должна быть слишком большой по сравнению с дисперсиями других. При обработке экспериментальных данных эта теорема имеет очень большое значение, поскольку отклик становится случайной величиной в результате влияния неконтролируемых факторов, число которых скорее всего стремится к бесконечности. Кроме того, если при проведении опытов все наиболее существенные факторы контролируются, то воздействие на отклик каждого из неконтролируемых факторов не должно быть слишком большим по сравнению с остальными неконтролируемыми факторами. Другими словами, та дисперсия (рассеивание) отклика, которую вызывает какой-либо из неконтролируемых факторов, не должна сильно отличаться от дисперсий, связанных с влиянием остальных неконтролируемых факторов. В противном случае фактор, дисперсия от которого существенно отличается от других, обязательно должен быть переведен в разряд контролируемых. Следовательно, если при планировании эксперимента учтены все наиболее существенные факторы и затем, при проведении опытов, они контролируются, то при обработке экспериментальных данных можно предполагать, что отклик не должен противоречить нормальному распределению. Как правило, нормальному закону подчиняются результаты испытаний стали на прочность, производительность многих металлургических агрегатов, составы сырья, топлива, сплавов, массы слитков, отлитых в однотипные изложницы, случайные ошибки измерений и т.п., поэтому при обработке результатов наблюдений исследователи, прежде всего, предполагают именно нормальное распределение отклика. Большинство других распределений, которые используются Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 31 в математической статистике (Стьюдента, Фишера, Пирсона, Кохре- на, а также распределения, по которым составлены различные крите- риальные таблицы, получены на основе нормального распределения. Нельзя, однако, абсолютизировать значение нормального распределения. Не все случайные величины распределены по нормальному закону. Тем не менее на практике, если явление подвержено действию многих случайных факторов, их суммарное воздействие вполне оправданно можно описать с помощью нормального закона. Как уже было отмечено, для случайной величины, которая не противоречит нормальному закону, функция распределения (2.12) и соответствующая ей плотность распределения 2 2 2 2 2 1 ) ( x x M x x e x f (2.21) определяются двумя параметрами М — математическим ожиданием и x 2 — дисперсией. Отметим некоторые свойства нормального закона распределения. Кривая плотности распределения симметрична относительно значения М, называемого иногда центром распределения. 2. При бóльших значениях x 2 кривая f(x) более пологая, те. x 2 является мерой величины рассеивания значения случайной величины около значений М. Приуменьшении параметра x 2 кривая нормального распределения сжимается вдоль оси ОХ и вытягивается вдоль f(x). 3. Максимум ординаты кривой плотности распределения определяется выражением , 2 1 2 max x f (2.22) что при x 2 = соответствует значению примерно 0,4. 4. Для нормального распределения математическое ожидание, мода и медиана совпадают Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ) В ряде случаев рассматривается не сама случайная величина Ха ее отклонение от математического ожидания M X Y (2.24) Такая случайная величина Y называется центрированной. Отношение случайной величины Х к ее среднему квадратичному отклонению x X V (2.25) называется нормированной случайной величиной. Таким образом, центрированная случайная величина — разность между данной случайной величиной и ее математическим ожиданием, а нормированная случайная величина — отношение данной случайной величины к ее среднему квадратичному отклонению. Очевидно, что математическое ожидание центрированной случайной величины равно нулю, M y = 0, а дисперсия нормированной случайной величины равна единице, σ V 2 = 1. Приведенная случайная величина — центрированная и нормированная случайная величина x x M X Z (2.26) Математическое ожидание и дисперсия приведенной случайной величины Z равны соответственно нулю, M z = 0, и единице, σ z 2 = 1. Нормальное распределение с параметрами M z = 0 и σ z 2 = 1 называется стандартным (нормированным Для приведенной случайной величины нормальное стандартное распределение принимает вид z dz e 2 1 ) z ( F z 2 z 2 , (2.27) Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ z e 2 1 ) z ( f 2 z 2 (2.28) Графики этих функций показаны на рис. 2.3 в, г, причем Ф – z) = 1 – Ф, (2.29) ). z ( ) z ( (2.30) Покажем справедливость соотношения (2.29). Рассмотрим график плотности стандартного нормального распределения (см. рис. 2.3 г. Обозначим площадь под ним левее точки –z через S 1 ; площадь между –z и z — через S 2 , оставшуюся площадь (правее z) — через. Тогда, во-первых, из симметричности графика плотности следует, что S 1 = S 3 . Во-вторых, S 1 +S 2 +S 3 = 1 или S 1 + (S 1 + S 2 ) = 1 (вся площадь под графиком плотности равна единице. По смыслу функции распределения S 1 = Ф, S 1 + S 2 = Ф. Следовательно, Ф) + Ф) = 1, откуда и следует равенство (2.29). Значения нормированной функции (2.27) нормального распределения (функции Лапласа) и значения плотности нормированного нормального распределения (2.28) табулированы и приведены враз- личных учебниках и справочниках по математической статистике наиболее подробные таблицы см. [11]). В списке статистических функций электронных таблиц Microsoft Excel им соответствуют НОРМ.РАСП(x; 0; 1; ИСТИНА) или НОРМ.СТ.РАСП(z, ИСТИНА) — для (2.27) и НОРМ.РАСП(x; 0; 1; ЛОЖЬ) или НОРМ.СТ.РАСП(z, ЛОЖЬ) — для (2.28). Геометрически функция Лапласа представляет площадь под кривой f(z) в интервале от до некоторой конкретной величины z. Заметим, что иногда вместо функции Ф) табулируется функция Ф dz e z z z 0 2 0 2 2 1 , равная площади под графиком стандартного нормального распределения от 0 до z (см. рис. 2.3 г. Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 34 В силу симметрии 2 / 1 2 1 0 2 Поэтому между функциями и существует простая зависимость Ф ½+ Ф. Функция Ф) нечетна: Ф) = - Ф. В самом деле, Ф) = Ф) – ½ = 1 - Ф) – ½ = ½-(1/2+ Ф) = - Ф. В соответствии с (2.19) квантиль р порядка р, нормированного нормального закона распределения - это такое значение приведенной случайной величины Z, для которого функция распределения (2.27) принимает значение РФ) При определении квантили р необходимо решать задачу, обратную задаче определения значений функции Лапласа, те. по известному значению Р этой функции (2.27) находить соответствующее ему значение аргумента z р Для этого можно либо воспользоваться табулированными значениями функции Лапласа (например, поскольку Фа Ф) = 0,9505, то z 0,95 ≈ 1,645 ), либо воспользоваться таблицами для функции, обратной функции Лапласа, те. табулированными значениями квантилей нормированного нормального закона распределения (см. [11] или приложение. Определение квантили z p в электронных таблицах Microsoft Excel сводится к вычислению статистической функции НОРМ.ОБР(Р; 0; 1) или НОРМ.СТ.ОБР(Р) Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 35 (например, НОРМ.ОБР(0,95; 0; 1) = НОРМ.СТ.ОБР(0,95) = = 1,644853). Для квантили стандартного нормального распределения справедливо следующее равенство z 1 – p = - z p (2.32) Рассмотрим график плотности стандартного нормального распределения (рис. 2.4). Площадь под графиком левее квантили z p по определению равна Значит, площадь правее этой точки равна 1 – p. Такая же площадь расположена левее точки z 1 –p Итак, площади левее z 1 –p иправее z p равны. Поскольку график симметричен относительно оси ординат, из этого следует, что эти точки расположены на одинаковом расстоянии от нуля. Зная квантиль р порядка р нормированного нормального закона распределения (M z = 0 и σ z 2 = 1), всегда можно найти квантиль р соответствующего порядка р для нормального распределения с произвольными параметрами M x и σ x 2 Поскольку то p x x p z M x и, следовательно, (z) z 1-p 1-p 1-p z p Рис. 2.4. Квантиль стандартного нормального распределения z Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 36 x p x p z M x (2.32а) В ряде случаев важно знать вероятность того, что случайная величина Х, подчиняющаяся нормальному закону распределения, не будет отличаться от своего математического ожидания М больше чем на величину ± = ε·σ x (см. рис. 2.3 г. x x x x x x x x x x x x M M M X M M P M X M P ) ( 2 1 2 1 ) ( 2 2 2 2 dz e dz e Z P z z 1 2 ) 1 ( (2.33) Так, при = x (ε = 1) получаем, что , 1 а поскольку по таблицам например, см. табл. [11) Фили в Microsoft Excel НОРМ.РАСП(1;0;1;ИСТИНА) = НОРМ.СТ.РАСП(1;ИСТИНА) = = 0,84135), то для случайной величины с нормальным законом распределения вероятность того, что она примет такое значение, которое не будет отличаться от ее математического ожидания более чем на одно среднее квадратическое отклонение, равна 2 0,84135–1=0,68. Иными словами, при нормальном распределении примерно 2/3 всех значений случайной величины (отклика) лежит в интервале M x Аналогично можно подсчитать, что интервалу M x 1,96 x M x 2 x соответствует вероятность 0,95 (Фа интервалу (Ф) = 0,99865). Отметим дополнительно, что 90% значений случайной величины лежат в диапазоне M x 1,64 x Ф) = 0,949497). Следовательно, отличие какого-либо из значений случайной величины с нормальным законом распределения от ее математического ожидания не превосходит утроенного среднего квадратичного отклонения с вероятностью 0,997. Это свойство в математической статистике носит название правило трех сигм. Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 37 Чем больше величина интервала M x , тем с большей вероятностью случайная величина X попадает в этот интервал. Рассмотрим небольшой пример. Пример. Предположим, что математическое ожидание содержания кремния в чугуне равно M Si = 0,6%, а среднеквадратичное отклонение Si = 0,15%. В этом случае мы можем быть уверены в том, что величина фактически измеренного значения процентного содержания кремния в чугуне будет находиться в интервалах 0,6 1,00 0,15 = 0,6 0,15 с вероятностью 0,68; 0,6 1,64 0,15 = 0,6 0,25 с вероятностью 0,90; 0,6 1,96 0,15 = 0,6 0,29 с вероятностью 0,95; 0,6 3,00 0,15 = 0,6 0,45 с вероятностью 0,997, те. из 1000 проб только 3 пробы по содержанию кремния в чугуне будут выходить из диапазона от 0,15 до 1,05%. Заметим, однако при рассмотрении примера 2.2 мы предполагали, что процентное содержание кремния в чугуне не противоречит нормальному закону распределения, а также то, что нам изначально были известны математическое ожидание M x и среднеквадратичное отклонение x этой случайной величины те. было выполнено большое (в пределе бесконечное) число измерений. Как же работать со случайными величинами в реальных условиях проведения эксперимента, когда число измерений весьма ограничено К рассмотрению методологии решения подобных задач мы и перейдем в следующем разделе. 2.3. Контрольные вопросы 1. Что такое случайная величина В чем заключаются отличия дискретной величины от непрерывной случайной величины Приведите примеры. 2. Какие вероятностные характеристики используют для описания распределений случайных величин Глава 2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 3. С какой целью используют законы распределения при обработке данных экспериментальных исследований 4. Почему нормальный закон распределения наиболее применим в экспериментальной практике 5. Какие параметры и свойства характерны для нормального закона распределения 6. Дайте определения следующим характеристикам случайных величин центрированная, нормированная и приведенная. Глава 3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 39 |