Теория вероятностей методичка. Министерство образования Российской Федерации Казанский государственный технический университет им. А. Н. Туполева Теория вероятностей (Учебное пособие)
Скачать 3.28 Mb.
|
Раздел 5. Системы случайных величин (случайные векторы).15.1. Понятие о системе случайных величин.В практических приложениях теории вероятностей очень часто приходится сталкиваться с задачами, в которых результат опыта описывается двумя или более случайными величинами, образующими системуили вектор. Например, при стрельбе группой из пвыстрелов совокупность точек попадания на плоскости может рассматриваться как система 2n случайных величин: пабсцисс и пординат точек попадания. Условимся систему нескольких случайных величинназывать случайным вектором и обозначать Х= (X1, Х2,....,Хn). Свойства системы случайных величин (или случайного вектора) не исчерпываются свойствами отдельных компонент: помимо этого, они включают также взаимные связи (зависимости) между случайными компонентами. При рассмотрении вопросов, связанных с системами случайных величин, удобно пользоваться геометрической интерпретацией системы. Например, систему двух случайных величин (X,Y) можно изображать случайной точкой на плоскости с координатами Xи Y(рис. 5.1.1). Аналогично система трех случайных величин может быть изображена случайной точкой в трехмерном пространстве. Часто бывает удобно говорить о системе пслучайных величин как о «случайной точке в пространстве пизмерений». Вместо образа случайной точки для геометрической интерпретации системы случайных величин пользуются образом случайного вектора. Систему двух случайных величин при этом рассматривают как случайный вектор на плоскости хОу, составляющие которого по осям представляют собой случайные величины X, Y(рис. 5.1.2). При этом теория систем случайных величин рассматривается как теория случайных векторов. В данном курсе мы будем в зависимости от удобства изложения пользоваться как одной, так и другой интерпретацией. Занимаясь изучением свойств случайных векторов, мы будем рассматривать как полные, исчерпывающие вероятностные характеристики — законы распределения, так и неполные — числовые характеристики. Изложение начнем с наиболее простого случая системы двух случайных величин(двухмерного случайного вектора). 25.2. Функция распределения системы двух случайных величин.Функцией распределения системы двух случайных величин (X,Y) называется вероятность совместного выполнения двух неравенств X<хи Y<у: (5.2.1)Если пользоваться для геометрической интерпретации системы образом случайной точки (случайного вектора), то функция распределения F(х,у) есть не что иное, как вероятность попадания случайной точки (X,Y) в бесконечный квадрант с вершиной в точке (х,у), лежащий левее и ниже ее (рис. 5.2.1). Сформулируем свойства функции распределения системы случайных величин. 1. Функция распределения F(x,у) есть неубывающая функция обоих своих аргументов, т. е. В этом свойстве функции F(х) можно наглядно убедиться, пользуясь геометрической интерпретацией функции распределения как вероятности попадания в квадрант с вершиной (х,у) (рис. 5.2.1). Действительно, увеличивая х (смещая правую границу квадранта вправо) или увеличивая у(смещая верхнюю границу вверх), мы, очевидно, не можем уменьшить вероятность попадания в этот квадрант. 2. Повсюду на функция распределения равна нулю: F(x, ) = F(, y) = F(,) = 0. В этом свойстве мы наглядно убеждаемся, неограниченно отодвигая влево правую границу квадранта (x ) или вниз его верхнюю границу (у) или делая это одновременно с обеими границами; при этом вероятность попадания в квадрант стремится к нулю. 3. При одном из аргументов, равном , функция распределения системы превращается в маргинальную функцию распределения случайной величины, соответствующей другому аргументу: F (x, ) = Fl (x), F(, у) = F2(у), где F1(x), F2(y) — соответственно маргинальные функции распределения случайных величин Xи Y. 4. Если оба аргумента равны , функция распределения системы равна единице: F(,) = 1 Действительно, при x, y квадрант с вершиной (х,у) в пределе обращается во всю плоскость хОу, попадание в которую есть достоверное событие. Условимся событие, состоящее в попадании случайной точки (X, Y) в область D, обозначать символом (X, Y)D. Вероятность попадания случайной точки в заданную область выражается наиболее просто в том случае, когда эта область представляет собой прямоугольник со сторонами, параллельными координатным осям. Выразим через функцию распределения системы вероятность попадания случайной точки (X, Y) в прямоугольник R, ограниченный абсциссами и ординатами и (рис. 5.2.2). Тогда событие (X,Y)Rбудет равносильно произведению двух событий: Хи Х. Выразим вероятность этого события через функцию распределения системы. Для этого рассмотрим на плоскости хОучетыре бесконечных квадранта с вершинами в точках рис. 5.2.3. Очевидно, вероятность попадания в прямоугольник Rравна вероятности попадания в квадрант минус вероятность попадания в квадрант минус вероятность попадания в квадрант плюс вероятность попадания в квадрант (так как мы дважды вычли вероятность попадания в этот квадрант). Отсюда получаем формулу, выражающую вероятность попадания в прямоугольник через функцию распределения системы: 3(5.2.2)5.3. Плотность распределения системы двух случайных величин.Важное практическое значение имеют системы непрерывных случайных величин(непрерывные случайные векторы). Пусть имеется система двух непрерывных случайных величин (X, Y), которая интерпретируется случайной точкой на плоскости хОу. Рассмотрим на этой плоскости малый прямоугольник со сторонами и , примыкающий к точке с координатами (х,у) (рис. 5.3.1). Вероятность попадания в этот прямоугольник равна Разделим вероятность попадания в прямоугольник на площадь этого прямоугольника и перейдем к пределу при и : Предположим, что функция F(x, у) не только непрерывна, но и дифференцируема; тогда правая часть формулы представляет собой вторуюсмешаннуючастнуюпроизводнуюфункции F(x, у) по хи у. Обозначим эту производную f(x, у): (5.3.1)Функция f(х,у) называется плотностьюсовместногораспределениясистемы. Геометрически функцию f(x,у) можно изобразить некоторой поверхностью (рис. 5.3.2). Эта поверхность аналогична кривой распределения для одной случайной величины и называется поверхностьюраспределения. Если пересечь поверхность распределения f(х,у) плоскостью, параллельной плоскости хОу, и спроектировать полученное сечение на плоскость хОу, получится кривая, в каждой точке которой плотность распределения постоянна. Такие кривые называются кривымиравнойплотности. Кривые равной плотности, очевидно, представляют собой горизонталиповерхности распределения. Рассматривая плотность распределения f(х) для одной случайной величины, мы ввели понятие «элемента вероятности» f(x)dx.. Аналогичное понятие «элемента вероятности» вводится и для системы двух случайных величин. Элементом вероятности в данном случае называется выражение (5.3.2)Очевидно, элемент вероятности есть не что иное, как вероятность попадания в элементарный прямоугольник со сторонами dx,dy, примыкающий к точке (х,у) (рис. 5.3.1). Эта вероятность равна объему элементарного параллелепипеда, ограниченного сверху поверхностью f(x,у) и опирающегося на элементарный прямоугольник dxdy(рис. 5.3.3). Пользуясь понятием элемента вероятности, выведем выражение для вероятности попадания случайной точки в произвольную область D. Эта вероятность, очевидно, может быть получена суммированием (интегрированием) элементов вероятности по всей области D: (5.3.3)Геометрически вероятность попадания в область D изображается объемом цилиндрического тела С, ограниченного сверху поверхностью распределения и опирающегося на область D(рис. 5.3.4). Из обшей формулы (5.3.3) вытекает формула для вероятности попадания в прямоугольник R, ограниченный абсциссами и и ординатами и (5.2.2): Функция распределения F(x,у) есть вероятность попадания в бесконечный квадрант; последний можно рассматривать как прямоугольник, ограниченный абсциссами и хи ординатами и у. Легко убедиться в следующих свойствах плотности распределения системы: 1. Плотность распределения системы есть функция неотрицательная: Это ясно из того, что функция распределения является неубывающей функцией своих аргументов. 2. Двойной интеграл в бесконечных пределах от плотности распределения системы равен единице: 45.4. Законы распределения отдельных компонент, входящих в систему. Условные законы распределения.Зная закон распределения системы двух случайных величин, можно всегда определить законы распределения отдельных компонент (маргинальные законы распределения), входящих в систему. (5.4.1)Выразим теперь маргинальные плотности распределения каждой из величин, входящих в систему, через плотность распределения системы. (5.4.2)дифференцируя по х соотношение (5.4.2), получим выражение для плотности распределения величины X: (5.4.3)Аналогично (5.4.4)Таким образом, для того чтобы получить плотность распределения одной из величин, входящих в систему, нужно плотность совместного распределения системы проинтегрировать в бесконечных пределах по аргументу, соответствующему другой случайной величине. Зная закон распределения системы (заданный в виде функции распределения или плотности распределения), можно найти законы распределения отдельных величин, входящих в систему. Естественно, возникает вопрос об обратной задаче: нельзя ли по маргинальным законам распределения отдельных величин, входящих в систему, восстановить закон распределения системы? Оказывается, что в общем случае этого сделать нельзя, так как неизвестна зависимость между случайными компонентами. Эта зависимость может быть охарактеризована с помощью условныхзаконовраспределения. Определение 1. Условным законом распределения величины X, входящей в систему (X,Y), называется ее закон распределения, определенный при условии, что другая случайная величина Yприняла значение у. Условная функция распределения, обозначается F(x|y), условная плотность распределения f(x|y). Чтобы усвоить понятие условного закона распределения, рассмотрим пример. Система случайных величин Lи Q представляет собой длину и вес осколка снаряда. Пусть нас интересует длина осколка Lбезотносительно к его весу; это есть случайная величина, подчиненная закону распределения с плотностью f1(l). Этот закон распределения мы можем исследовать, рассматривая все без исключения, осколки и оценивая их только по длине; f1(l) есть безусловный закон распределения длины осколка. Однако нас может интересовать и закон распределения длины осколка вполне определенного веса, например 10 г. Для того чтобы его определить, мы будем исследовать не все осколки, а только определенную весовую группу, в которой вес приблизительно равен 10 г, и получим условный закон распределения длины осколка при весе 10 г с плотностью f1(l|q) при q = 10. Этот условный закон распределения вообще отличается от безусловного f1(l); очевидно, более тяжелые осколки должны в среднем обладать и большей длиной; следовательно, условный закон распределения длины осколка существенно зависит от веса q. Зная закон распределения одной из величин, входящих в систему, и условный закон распределения второй, можно определить закон распределения системы. Для этого воспользуемся понятием элемента вероятности. Рассмотрим прилежащий к точке (х,у) элементарный прямоугольник Rdсо сторонами dx,dy(рис. 5.4.1). Вероятность попадания в этот прямоугольник — элемент вероятности f(x,у)dxdy— равна вероятности одновременного попадания случайной точки (X,Y) в элементарную полосу I, опирающуюся на отрезок dx, и в полосу II, опирающуюся на отрезок dy: Вероятность произведения этих двух событий, по теореме умножения вероятностей, равна вероятности попадания в элементарную полосу I, умноженной на условную вероятность попадания в элементарную полосу II, вычисленную при условии, что первое событие имело место. Это условие в пределе равносильно условию X= х; следовательно, откуда (5.4.5)т. е. плотность распределения системы двух величин равна плотности распределения одной из величин, входящих в систему, умноженной на условную плотность распределения другой величины, вычисленную при условии, что первая величина приняла заданное значение. Формулу (5.4.5) часто называют теоремойумножениязаконовраспределения. Эта теорема в схеме случайных величин аналогична теореме умножения вероятностей в схеме событий. Очевидно, формуле (5.4.5) можно придать другой вид, если задать значение не величины X, а величины Y: , (5.4.6)Разрешая формулы (5.4.5) и (5.4.6) относительно f(y|x) и f(x|y), получим выражения условных законов распределения через безусловные: (5.4.7)или 5(5.4.8)5.5. Зависимые и независимые случайные величины.При изучении систем случайных величин всегда следует обращать внимание на степень и характер их зависимости. Эта зависимость может быть более или менее тесной. Понятие о независимых случайных величинах — одно из важных понятий теории вероятностей. Определение 1. Случайная величина Yназывается независимой от случайной величины X, если закон распределения величины Yне зависит от того, какое значение приняла величина X. Для непрерывных случайных величин условие независимости Yот Xможет быть записано в виде: (5.5.1)Напротив, в случае, если Yзависит от X, то (5.5.2)Докажем, что зависимостьилинезависимостьслучайныхвеличинвсегдавзаимны: если величина Yне зависит от X, то и величина Xне зависит от Y. Действительно, пусть Yне зависит от X, тогда Плотность совместного распределения согласно (5.4.5) и (5.4.6) можно записать (5.5.3)откуда, получим: что и требовалось доказать. Так как зависимость и независимость случайных величин всегда взаимны, можно дать новое определение независимых случайных величин. Определение 2. Случайные величины X и Y называются независимыми, если закон распределения каждой из них не зависит от того, какое значение приняла другая.В противном случае величины Xи Yназываются зависимыми. Для независимых непрерывных случайных величин теорема умножения законов распределения принимает вид: (5.5.4)т.е. плотностьраспределениясистемынезависимыхслучайныхвеличинравнапроизведениюплотностейраспределенияотдельныхвеличин, входящихвсистему. Остановимся, несколько подробнее на важных понятиях о «зависимости» и «независимости» случайных величин. Понятие «зависимости» случайных величин, которым мы пользуемся в теории вероятностей, несколько отличается от обычного понятия «зависимости» величин, которым мы оперируем в математике. Действительно, обычно под «зависимостью» величин подразумевают только один тип зависимости—полную, жесткую, так называемую функциональнуюзависимость. Две величины Xи Yназываются функционально зависимыми, если, зная значение одной из них, можно точно указать значение другой. В теории вероятностей мы встречаемся с другим, более общим, типом зависимости — с вероятностнойили «стохастической» зависимостью. Если величина Yсвязана с величиной Xвероятностной зависимостью, то, зная значение X, нельзя указать точно значение Y, а можно указать только ее закон распределения, зависящий от того, какое значение приняла величина X. Вероятностная зависимость между случайными величинами очень часто встречается на практике. Если случайные величины Xи Yнаходятся в вероятностной зависимости, это не означает, что с изменением величины Xвеличина Yизменяется вполне определенным образом; это лишь означает, что с изменением величины Xвеличина Yимеет тенденцию также изменяться (например, возрастать или убывать при возрастании X). Рассмотрим, например, две такие случайные величины: X— рост наугад взятого человека, Y— его вес. Очевидно, величины Xи Yнаходятся в определенной вероятностной зависимости; она выражается в том, что в общем люди с большим ростом имеют больший вес. 65.6. Числовые характеристики системы двух случайных величин.Ранее в разделе 3.4. были введены числовые характеристики случайной величины важнейшими из которых являются моменты. Аналогичные числовые характеристики можно ввести и для системы двух случайных величин. Начальныммоментомпорядка k,sсистемы (X,Y) называется математическое ожидание произведения Xkна Ys: Центральныммоментомпорядка k, s системы (X,Y) называется математическое ожидание произведения k-й и s-й степени соответствующих центрированных величин: где Запишем формулы для непосредственного подсчета моментов. Для дискретных случайных величин где — вероятность того, что система (X,Y) примет значения , а суммирование распространяется по всем возможным значениям случайных величин X,Y. Для непрерывных случайных величин: где f(x, у) — плотность распределения системы. Помимо чисел kи s,характеризующих порядок момента по отношению к отдельным величинам, рассматривается еще суммарный порядок момента k+s, равный сумме показателей степеней при Xи Y. Соответственно суммарному порядку моменты классифицируются на первые, вторые и т. д. На практике обычно применяются только первые и вторые моменты. Первые начальные моменты представляют собой уже известные нам математические ожидания величин Xи Y, входящих в систему: Совокупность математических ожиданий тх, тупредставляет собой характеристикуположениясистемы. Геометрически это координаты точки на плоскости, вокруг которой происходит рассеивание случайных точек (X,Y) будем называть вектором математических ожиданий. Кроме первых начальных моментов, на практике широко применяются еще вторыецентральныемоментысистемы. Два из них представляют собой уже известные нам дисперсии, величин Xи Y. характеризующие рассеиваниеслучайной точки в направлении осей Охи Оу, относительно вектора математических ожиданий. Особую роль как характеристика системы играет второйсмешанныйцентральныймомент: т.е. математическое ожидание произведения центрированных случайных величин. Ввиду того, что этот момент играет важную роль в теории систем случайных величин, введем для него особое обозначение: Характеристика Кхуназывается корреляционныммоментом(иначе — «моментом связи») случайных величин X, Y. Для дискретных случайных величин корреляционный момент выражается формулой а для непрерывных — формулой Выясним смысл и назначение этой характеристики. Корреляционный момент есть характеристика системы случайных величин, описывающая рассеивание случайных величин Xи Y, а так жевероятностную связь между ними. Для того чтобы убедиться в этом, докажем, что длянезависимыхслучайныхвеличинкорреляционныймоментравеннулю. Доказательство проведем для непрерывных случайных величин. Пусть X, Y— независимые непрерывные случайные величины с плотностью распределения f(x,у).Для независимых случайных величин где — плотности распределения соответственно величин Xи Y. Интеграл представляет собой не что иное, как первый центральный момент величины X, и, следовательно, равен нулю; по той же причине равен нулю и второй сомножитель; следовательно, для независимых случайных величин . Таким образом, из независимости случайных величин X и Y следует их некоррелированность, если корреляционный момент двух случайных величин отличен от нуля, это есть признак наличия зависимости между ними. Корреляционный момент характеризует не только зависимость величин, но и их рассеивание. Действительно, если, например, одна из величин (X,Y) весьма мало отклоняется от своего математического ожидания (почти не случайна), то корреляционный момент будет мал, какой бы тесной зависимостью ни были связаны величины (X,Y).Поэтому для характеристики связи между величинами (X,Y) в чистом виде переходят от момента Кхук безразмерной характеристике где — среднеквадратические отклонения величин X,Y. Эта характеристика называется коэффициентомкорреляциивеличин Xи Y. Очевидно, коэффициент корреляции обращается в нуль одновременно с корреляционным моментом; следовательно, длянезависимыхслучайныхвеличин, коэффициенткорреляцииравеннулю. Случайные величины, для которых корреляционный момент (а значит, и коэффициент корреляции) равен нулю, называются некоррелированными(иногда — «несвязанными»). Выясним, эквивалентно ли понятие некоррелированности случайных величин понятию независимости. Выше мы доказали, что две независимые случайные величины всегда являются некоррелированными. Остается выяснить: справедливо ли обратное положение, вытекает ли из некоррелированности величин их независимость? Оказывается — нет. Можно построить примеры таких случайных величин, которые являются некоррелированными, но зависимыми. Равенство нулю коэффициента корреляции — необходимое, но не достаточное условие независимости случайных величин. Из некоррелированности величин еще не следует их независимость. Условие независимости случайных величин — более жесткое, чем условие некоррелированности. Убедимся в этом на примере. Рассмотрим систему случайных величин (X,Y), распределенную с равномерной плотностью внутри круга Срадиуса rс центром в начале координат (рис. 5.6.1). Плотность распределения величин (X, Y) выражается формулой тогда (5.6.12)Нетрудно убедиться, что в данном примере величины являются зависимыми. Действительно, если величина Xприняла, например, значение 0, то величина Yможет с равной вероятностью принимать все значения от -r до +r, если же величина Xприняла значение r, то величина Yможет принять только одно единственное значение, в точности равное нулю; вообще, диапазон возможных значений Yзависит от того, какое значение приняла X. Таким образом, мы видим, что из некоррелированности случайных величин не всегда следует их независимость. Коэффициент корреляции характеризует не всякую зависимость, а только так называемую линейнуюзависимость. Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или же убывать) по линейному закону. Коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами. Если случайные величины Xи Yсвязаны линейной функциональной зависимостью: , то , причем знак «плюс» или «минус» берется в зависимости от того, положителен или отрицателен коэффициент а. В общем случае, когда величины Xи Y связаны произвольной вероятностной зависимостью, коэффициент корреляции может иметь значение в пределах: . В случае говорят о положительнойкорреляциивеличин Xи Y, в случае — об отрицательнойкорреляции. Положительная корреляция между случайными величинами означает, что при возрастании одной из них другая имеет тенденцию в среднем возрастать; отрицательная корреляция означает, что при возрастании одной из случайных величин другая имеет тенденцию в среднем убывать. 75.7. Система произвольного числа случайных величин (случайные вектора).Определение 1. Функцией распределения системы пслучайных величин называется вероятность совместного выполнения пнеравенств вида , то есть : (5.7.1)Определение 2. Плотностью распределения системы пнепрерывных случайных величин называется n-я смешанная частная производная функции , взятая один раз по каждому аргументу: (5.7.2)Зная закон распределения системы, можно определить законы распределения отдельных величин, входящих в систему. Функция распределения каждой из величин, входящих в систему, получится, если в функции распределения системы положить все остальные аргументы равными : (5.7.3)Если выделить из системы величин подсистему , то функция распределения этой подсистемы определяется по формуле (5.7.4)Плотность распределения каждой из величин, входящих в систему, получится, если плотность распределения системы проинтегрировать в бесконечных пределах по всем остальным аргументам: (5.7.5)Плотность распределения подсистемы , выделенной из системы , равна: (5.7.6)Определение 3. Условным законом распределения подсистемы называется ее закон распределения, вычисленный при условии, что остальные величины приняли значения . Условная плотность распределения ее может быть вычислена по формуле: (5.7.7)Случайные величины называются независимыми, если закон распределения каждой частной подсистемы, выделенной из системы , не зависит от того, какие значения приняли остальные случайные величины. Плотность распределения системы независимых случайных величин равна произведению плотностей распределения отдельных величин, входящих в систему: (5.7.8)Вероятность попадания случайной точки в пределы n-мерной области Dвыражается n-кратным интегралом: (5.7.9)Эта формула по существу является основной формулой для вычисления вероятностей событий, не сводящихся к схеме случаев. 85.8. Числовые характеристики системы нескольких случайных величин.Закон распределения системы (заданный функцией распределения или плотностью распределения) является полной, исчерпывающей характеристикой системы нескольких случайных величин. Иногда ограниченность экспериментального материала не дает возможности построить закон распределения системы. В других случаях исследование вопроса с помощью сравнительно громоздкого аппарата законов распределения не оправдывает себя в связи с невысокими требованиями к точности результата. Во всех таких случаях вместо законов распределения применяют неполное, приближенное описание системы случайных величин с помощью минимального количества числовых характеристик. Минимальное число характеристик, с помощью которых может быть охарактеризована система пслучайных величин , сводится к следующему: 1) векторматематических ожиданий: (5.8.1)характеризующий средние значения компонент; Здесь 2) вектордисперсий (5.8.2)характеризующий рассеивание компонент; Здесь 3) корреляционных моментов где характеризующих по парную корреляцию всех величин, входящих в систему. Заметим, что дисперсия каждой из случайных величин Хiесть, по существу, не что иное, как частный случай корреляционного момента, а именно: (5.8.3)Все корреляционные моменты и дисперсии удобно расположить в виде прямоугольной таблицы (называемой матрицей): (5.8.4)Эта таблица называется корреляционнойматрицейсистемы случайных величин . Очевидно, что не все члены корреляционной матрицы различны. Из определения корреляционного момента ясно, что , т. е. элементыкорреляционнойматрицы, расположенныесимметричнопоотношениюкглавнойдиагонали, равны. В связи с этим часто заполняется не вся корреляционная матрица, а лишь ее половина, считая от главной диагонали: (5.8.5)Корреляционную матрицу, составленную из элементов , часто сокращенно обозначают символом . По главной диагонали корреляционной матрицы стоят дисперсии случайных величин . В случае, когда случайные величины некоррелированны, все элементы корреляционной матрицы, кроме диагональных, равны нулю: Такая матрица называется диагональной. В целях наглядности суждения именно о коррелированности случайных величинпользуются нормированнойкорреляционнойматрицей, составленной не из корреляционных моментов, а из коэффициентов корреляции: ; . Все диагональные элементы этой матрицы, естественно, равны единице. Нормированная корреляционная матрица имеет вид: (5.8.6)Введем понятие о некоррелированных системах случайных величин.Рассмотрим две системы случайных величин: ; или два случайных вектора в n-мерном пространстве: Xс составляющими и Yс составляющими . Случайные векторы Xи Yназываются некоррелированными, если каждая из составляющих вектора Xнекоррелированная с каждой из составляющих вектора Y: |