СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU го непростых обстоятельств. Но в прагматическом плане дело обстоит достаточно просто. Понятно, что у одномерного винеровского процесса должен быть многомер- ный аналог. И этот аналог строится достаточно просто: вот вы хотите построить векторный винеровский процесс и он состоит из набора независимых винеровских процессов, отвечающих каждой координате:
W t = (W 1 t , W 2 t , ..., W n t ) для каждого из них математическое ожидание равно нулю. Среднее значение < W it W jt >= δ ij t и тензор δ ij является изотропным, т.е. он пре- образуется в себя при вращении системы координат. Этот подход решает вопрос в прагматическом плане, т.е. конструкция прямо просматривается. Естественно, у этой конструкции также есть плотность вероятности и она как раз является фун- даментальным решением многомерного уравнения теплопроводности. Однако также необходимо сказать, что наряду с вопросами, которые нужно об- суждать, эта теория содержит также и простые задачи, доступные человеческому рассудку. Плотность распределения вероятности достижения точки Реализация винеровского процесса - непрерывная функция. Она проходит через всякие промежуточные значения и поэтому можно ввести величину, которая назы- вается временем первого достижения точки x: τ x - некоторая функция от x. То, что она является случайной, требует доказательства того, что это измеримая функция, но реально мы вычислим её функцию распределения, что и будет доказательством. Вычисление её плотности вероятности или функции распределения можно прове- сти достаточно просто обычными методами. Оно становится яснее, если включить в него явно выписанный коэффициент диффузии. Если ξ t ≥ x , то это значит одновременно, что τ x ≤ t . А это значит, что мы можем вычислить условную вероятность P {ξ t ≥ x|τ x ≤ t} = P {ξ t ≥x} P {τ x ≤x} . А с другой стороны, эту условную вероятность можно вычислить из соображений симметрии - она будет равна 1 2 Тогда получаем: P {τ x ≤ x} = 2 √ 2π P {ξ x ≥ x} = 2 R ∞ x σ √ t e − z2 2 dz Плостность P τ = e − x2 2σ2t x σt 3/2 11 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU Максимум винеровского процесса на промежутке от 0 до t Можно построить другую случайную величину, которая также характеризует траекторию винеровского процесса: Есть винеровский процесс ξ t с непрерывной траекторией. Следовательно, можно рассмотреть max ξ s при 0 ≤ s ≤ t. Это, очевидно, тоже некая случайная величина. Обозначим её как ˆξ t . У неё тоже есть функция вероятности и плотность распреде- ления: P { ˆ ξ t ≥ x} = P {max 0≤s≤t ξ s ≥ x} = P {τ x ≤ t} Функция распределения F ξ (t) = 1 − P { ˆ ξ t ≥ x} = q 2 π R x σ √ t 0 e − z2 2 dz . Вся проблема состоит в том, что когда мы изучали плотность вероятности P {τ x ≤ t} , мы должны были дифференцировать по x, а при P {ˆξ t ≥ x} вопрос сформулирован так, что мы должны дифференцировать по t, т.е.: P ( ˆ ξ(x) = dF ξ (t) dx = 1 σ q 2 πt e − x2 2σ2t 12 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU Лекция 3 Теорема Колмогорова о продолжении меры Мы сегодня будем говорить о доказательной базе теории случайных процессов и эта доказательная база основана на теореме Колмогорова о продолжении меры. Для того, чтобы наш разговор был содержательным, нужно вспомнить, как устро- ена мера Жордана и чем она нам не нравится. Если говорить идейно, то мера Жордана - это то, что изучают в школе, только там не произносят нужных слов. И если вы хотите ответить на вопрос "Что такое площадь круга? то тот ответ, ко- торый находится в школьных учебниках, основан на идеях Жордана. Первое, из чего исходит изложение, - это то, что мы понимаем, что такое мно- гоугольник, многогранник и что такое, соответственно, площадь многоугольника, объем многогранника и т.д. Дальше выясняется, что, на самом деле, можно рассматривать вместо многогран- ников фигуры, которые состоят из конечного числа прямоугольных параллелепи- педов. Тогда дело становится понятным, однако теряется уверенность в том, что площадь и объем являются инвариантами движения - но это можно доказать. Но, в целом, дело сводится к следующему: есть некий объект, для которого мы хотим ввести площадь. Мы рассматриваем впи- санные и описанные многоугольники Q и P , для которых мы знаем площади S(P ) и S(Q), которые связаны соотношением S(P ) ≤ S(Q). Тогда мы рассматриваем sup S(Q) = S и inf S(P ) = S, которые называются нижней и верхней площадью Жордана соответственно. И в случае, когда S = S, объект называется измеримым по Жордану и, соответственно, возникают понятия площади, объема и т.д. Мы избегаем использования слова «фигура» , т.к. в некоторых учебниках площадь и объем бывают у фигур, а в некоторых - у множеств. В чём тут проблема: есть простейший пример множества, не измеримого по Жордану. Он состоит в следую- щем: мы берём единичный квадрат и рассматриваем множество точек с рациональными координатами. Это множество всюду плотно заполняет квадрат. Когда мы рассмат- риваем по Жордану верхнюю площадь, то это 1 - меньше ничего не впишешь. А нижняя площадь Жордана - это 0, т.к. нельзя вписать ничего большего, чем точ- ка. Это простейший пример. На этом месте возникает вот какая проблема: граница этого множества - весь квадрат. Со многих точек зрения этот объект нельзя рас- сматривать как фигуру, однако для того, что нас интересует, этот пример подходит вполне. 13 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU Мера Лебега обходит эту проблему с помощью того, что мы покрываем не конеч- ным набором прямоугольников или симплексов, а счётным набором. Множество этих точек с рациональными координатами счётно, т.е. их можно перенумеровать, каждую из них можно покрыть объектами и подобрать меры этих объектов так, чтобы ряд сходился. И когда размер этого объекта стремится к нулю, то и сумма ряда также будет стремиться к нулю - эта идея была у Лебега. При построении меры и интеграла Лебега заодно решается другой вопрос, кото- рый сейчас выдвинулся на первый план. Во-первых, множества, которые всюду плотно заполнены какими-то исключительными точками, они постоянно встреча- ются при изучении бесконечномерных объектов, потому что для бесконечномерного пространства расщипляются понятия линейного многообразия и подпространства - там постоянно встречаются объекты, которые всюду плотно заполняют нечто и при этом являются неполными. Построение интеграла Римана и меры Жордана опирается на представление о том, что мы очень хорошо знаем пространство, в котором задана функция. Допустим, что мы имеем дело с пространством C. Разложим фигурирующие там функции в ряды Фурье и будем брать конечные куски ряда Фурье и будем рассматривать n- мерное пространство, которое аппроксимирует наши функции из ряда Фурье. Там у нас возникнет понятие N-мерного куба с ребром a. Его объем V = a N . Если мы задумаем делать предельный переход при N 7→ ∞, то мы не получим ничего хоро- шего, т.к. у этой функции нет разумного предела при N 7→ ∞: если ребро меньше 1 , то предел равен 0, если ребро больше 1, предел равен ∞. Т.е. когда мы пытаемся от конечномерных интегралов перейти к бесконечномерным, этот путь совершенно закрыт. А если мы собираемся заняться случайными процессами, то это должно быть что-то вероятностное, а в теории вероятностей постоянно возникают какие-то интегралы. Это должно быть что-то, связанное с функциональными пространства- ми, они бесконечномерные и мы должны по ним брать интегралы, а мы явно просто транслировать идею конечномерных интегралов в бесконечномерные не можем. Теорема Колмогорова решает эту проблему. Для того, чтобы понять как она ре- шает эту проблему, необходимо понять, что делается при построении интеграла Лебега. Мера, как известно, это числовая функция множества. Наша мера µ долж- на быть задана на какой-то системе множеств A. Для каждого множества B ∈ A будет задана числовая функция µ(B). Эта числовая функция является аддитив- ной. Вопрос о том, в какой мере она является аддитивной, разделяет меру Лебега и меру Жордана: аддитивная функция - это функция, удовлетворяющая условию A = S A i , т.е. множество A представимо в виде объединения множеств A i , мно- жества A i ∩ A j = 0 при i 6= j, тогда µ(A) = P i µ(A i ) . Вопрос в том, какой набор значений может пробегать этот индекс: для меры Жордана он может пробегать 14 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU конечный набор значений, а для меры Лебега он может пробегать и счётный набор значений. Меры вида µ(A) = P ∞ i=1 µ(A i ) называются счётно-аддитивными. Это то, что отличает меру Лебега от меры Жордана. Итак, что же мы хотим от множества A? Мы хотим, чтобы оно было борелевской алгеброй. Это значит, что мы в этом множестве можем проводить операции теории множеств в счётном количестве. На самом деле, также имеется тонкость, которая состоит в том, что там должно быть стандартное единичное множество, которое так- же принадлежит этой алгебре. Это не выполняется для обычной плоскости, потому что у нее мера равна бесконечности и поэтому для объяснения понятия интеграла по неограниченной неограниченной фигуре на плоскости приходится вводить кон- струкцию, которая называется σ-конечные меры. Она состоит в том, что плоскость режется на счетное число кусков, например, на единичные квадраты, и мы гово- рим, что в каждом из этих квадратов вводится своя мера и далее наше множество разделяется на соответствующие элементы и суммируется то, что получится. И по- казывается, что от разбиения ничего не зависит. Этот аспект проблемы для нас не актуален, т.к. мы работаем на вероятностном пространстве, а у него полная мера равна 1. Далее мы можем построить понятия измеримой функции, интеграла Лебега и дальше этот интеграл Лебега будет об- ладать гораздо лучшими свойствами, чем интеграл Римана. В частности, понятно как переходить к пределу под знаком интеграла, что не будет связано с понятием непрерывности, как в интеграле Римана. Когда мы строим меру Лебега на плоскости, мы понимаем, что есть площадь пря- моугольника, дальше мы покрываем наше множество счётным числом прямоуголь- ников, считаем сумму площадей этих прямоугольников P k m(P k ) - это тоже ме- ра. Далее вводим понятие верхней меры µ ∗ (A) = inf ( P k m(P k )) и нижней меры µ ∗ (A) = 1 − µ ∗ (E \ A) . Если µ ∗ (A) = µ ∗ (A) , то множество A будет измеримым и дальше оно обладает нужными свойствами. Сама эта конструкция очень похожа на меру Жордана с различием только в том, что число прямоугольников будет счётным. Понятие полукольца. Мера Бореля Во всех теоремах, как известно, используются не все возможные свойства объек- тов, а какие-то. Реально нам необходимо следующее: чтобы была некоторая система множеств G. Эти множества обладают следующим свойством - опишем его на при- мере прямоугольников: 15 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU Если есть один прямоугольник со сторонами, параллельными осям координат, и есть другой прямоугольник, также параллельный осям координат и пересекающий первый, то их пересечение - также прямоугольник. Для того, чтобы это свойство было выполнено, мы должны считать, что границы этих многоугольников могут как включаться, так и не включаться. Второе свойство состоит в следующем: если у нас есть один большой прямоугольникA и маленький прямоугольник A 1 ∈ A , такой, что его стороны параллельны сторо- нам A, то если мы продолжим стороны прямоугольника A 1 до пересечения со сторо- нами прямоугольника A, то образуется множество прямоугольников A 1 , A 2 , . . . , A k , т.ч. A = ∪ N n=1 A n , где множество A n - множество непересекающихся прямоугольни- ков. Такая система множеств называется полукольцом. Оно входит в состав борелев- ской алгебры, которая строится по нему, и ограничения счётно-аддитивной меры µ на полукольцо совпадает с мерой полукольца m. Это и есть теорема о продолже- нии меры, которую доказывали на примере конкретного полукольца. Но при этом доказательстве нигде свойства прямоугольников не используются. И дальше ока- зывается, что если у нас есть какое-то полукольцо и счётно-аддитивная мера, то можно с помощью этого полукольца построить борелевскую алгебру и на ней за- дать меру Лебега. Здесь есть одна маленькая тонкость. Можно принять такую точку зрения, что мы будем продолжать меру таким образом, что мера счётного объединения непересе- кающихся множеств была бы равна ряду, составленному из этих мер, т.е. чтобы мера была автоматически задана на борелевской алгебре. Конструкция, которая получается таким способом, называется мерой Бореля. Однако в этой конструкции не получается обеспечить полноту меры. Теперь на примере винеровского процесса посмотрим, как работает эта теория. Речь идёт о том, что мы в пространстве C хотим ввести меру, которая связана с понятием винеровского процесса. Нам для этого нужно указать полукольцо, нужно указать меру на нём. Сама конструкция меры на пространстве C принадлежит Винеру. Квазиинтервал. Мера на квазиинтервалах Винер придумал конструкцию, которая называется квазиинтервал. Пусть наша функция зависит от t и задана на полупрямой. И мы на оси времени выбираем t 1 , t 2 , . . . , t N и ставим в соответствие каждой точке отрезок a 1 b 1 , a 2 b 2 , . . . , a N b N , пер- пендикулярный оси времени, каждый из которых может находиться как сверху, так 16 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU и снизу оси t. У нас возникает множество функций, которые могут как угодно про- ходить через эти отрезки и пересекать ось времени - аналогия с игрой в крокет. По- нятие квазиинтервала определяется набором Q[t 1 , . . . , t N , a 1 , . . . , a N , b 1 , . . . , b N ] . Эти квазиинтервалы образуют полукольцо. А теперь необходимо ввести меру на квази- интервалах: мы знаем, что хотим построить винеровский процесс. Для конечного набора времён t у винеровского процесса можно построить плотность вероятности и вычислить вероятность того, что траектория винеровского процесса принадлежит квазиинтервалу m(Q) = P {W t ∈ Q} . Это будет n-кратный интеграл, в котором будут интегралы вида R b a e −αx 2 dx , где α - положительное число, зависящее от того, какое время прошло между t i и t i+1 . Эта мера счётно-аддитивная. Это связано с тем, что интеграл R +∞ −∞ e −x 2 dx абсолютно сходящийся. А продолжение этой меры - это мера Винера, т.е. то, что задает винеровский процесс. Это и есть доказательство существования винеровского процесса. 17 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА СЛУЧАЙНЫЕ ПРОЦЕССЫ • СОКОЛОВ ДМИТРИЙ ДМИТРИЕВИЧ КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU Лекция 4 Введение в теорему Бохнера-Хинчина Теорема Бохнера-Хинчина абсолютно практическая - она совершенно общеиз- вестна в мире механиков и доказательство в этой теореме того, что интересно ме- ханикам, занимает одну строчку и проблем не представляет. Всё остальное - это объяснение того, зачем нужна эта теорема и в чём её смысл. История начинается с того, что мы должны обдумать, что мы хотим узнать про случайные процессы. Тут возможны разные ответы, но что мы прежде всего хотим знать про случайную величину - математическое ожидание и дисперсию. Для того, чтобы выдержать математические стандарты статистики, требуется до- статочно большое количество измерений. Понятно, что при переходе от случайной величины к случайному процессу ситуация только ухудшается. Для того, чтобы как-либо соблюдать баланс между возможным и желаемым, возникает идея рас- сматривать стационарные случайные процессы, т.е. случайные процессы, которые как-либо меняются с течением времени, однако их статистические свойства остают- ся постоянными. Понятно, что у этой идеи должна быть математическая форму- лировка. Более строгая заключается в том, что все конечномерные распределения вероятностей случайного процесса, т.е. многомерные функции распределения, вы- численные в разные моменты времени, должны быть независимы от того, где эти моменты помещаются на шкале времени. Это возможно как теоретическое требо- вание, однако практически это проверить нельзя. Разумное требование, которое применяется на практике, - это то, что первый и второй моменты и всё, что с ними связано, не зависит от времени. Соответственно, возникает представление о стационарном случайном процессе в строгом и в более широком смысле. И, опять же, как упоминалось ранее, случайный процесс - это отображение вероятностного пространства в какое-то функциональное. И возника- ет вопрос о том, в какое именно функциональное пространство. И здесь возникает возможность не фиксировать это функциональное пространство, но, по крайней мере, это пространство должно носить те структуры, которые представляют для нас интерес. Следующее соображение состоит в том, что изначально теория слу- чайных процессов носила прикладной характер. А нам необходимо будет пользо- ваться преобразованием Фурье, т.е. наше функциональное пространство - что-то вроде L 2 . Однако есть такой момент, что требование стационарности и требование принадлежности L 2 несовместимы друг с другом. Рассмотрим L 2 (−∞, +∞) : функ- ция f(x) = 1 не принадлежит этому пространству, т.к. интеграл от её квадрата расходится. С точки зрения пространства L 2 эта функция обобщенная. 18 МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ МГУ ИМЕНИ М.В. ЛОМОНОСОВА |