Программам высшего профессионального образо вания по специальности Программное обеспечение вычислительной техники и автоматизированных систем
Скачать 0.95 Mb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования «Оренбургский государственный университет» В.Н. КОСТИН, Н.А. ТИШИНА СТАТИСТИЧЕСКИЕ МЕТОДЫ И МОДЕЛИ Рекомендовано Ученым советом государственного образовательного уч- реждения высшего профессионального образования «Оренбургский го- сударственный университет» в качестве учебного пособия для студен- тов, обучающихся по программам высшего профессионального образо- вания по специальности «Программное обеспечение вычислительной техники и автоматизированных систем» Оренбург 2004 2 ББК 22.172Я73 К72 УДК 519.23/.24(075.8) Рецензент кандидат технических наук, доцент Пивоваров Ю.Н. Костин В.Н., Тишина Н.А. К 72 Статистические методы и модели: Учебное пособие. – Оренбург: ГОУ ОГУ, 2004. – 138 с. ISBN. . . . . . . . . . Учебное пособие предназначено для студентов, обучающихся по программам высшего профессионального образования по специальности 220400, при изучении дисциплины «Статистические методы и модели» К 1602090000 ББК 22.172Я73 © Костин В.Н., 2004. © Тишина Н.А., 2004. © ГОУ ОГУ, 2004. ISBN. . . . . . . . . . . 3 Введение Характерным для современного этапа развития естественных и техни- ческих наук является весьма широкое и плодотворное применение статисти- ческих методов во всех областях знания. Задача любой науки состоит в вы- явлении и исследовании закономерностей, которым подчиняются реальные процессы. Найденные закономерности имеют не только теоретическую цен- ность, они широко применяются на практике – в планировании, управлении и прогнозировании. Математическая статистика – раздел математики, изучающий ма- тематические методы сбора, систематизации, обработки и интерпретации ре- зультатов наблюдений с целью выявления статистических закономерностей. Математическая статистика по наблюденным значениям (выборке) оценивает вероятности событий либо осуществляет проверку предположений (гипотез) относительно этих вероятностей. Изучение вероятностных моделей дает возможность понять различ- ные свойства случайных явлений на абстрактном и обобщенном уровне, не прибегая к эксперименту. В математической статистике, наоборот, исследо- вание связано с конкретными данными и идет от практики (наблюдения) к гипотезе и ее проверке. При большом числе наблюдений случайные воздействия в значитель- ной мере погашаются (нейтрализуются) и получаемый результат оказывается практически неслучайным, предсказуемым. Это утверждение (принцип) и является базой для практического использования вероятностных и математи- ко-статистических методов исследования. Цель указанных методов состоит в том, чтобы, минуя сложное (а зачастую и невозможное) исследование от- дельного случайного явления, изучить закономерности массовых случайных явлений, прогнозировать их характеристики, влиять на ход этих явлений, контролировать их, ограничивать область действия случайности. Результаты эксперимента для инженера-исследователя были и оста- ются главным критерием при решении практических задач и при проверке теоретических гипотез. Однако при этом важно не только умело спланиро- вать и поставить эксперимент, но и грамотно обработать его результаты. Этому вопросу часто не уделяется должного внимания, и нередки случаи, ко- гда результаты дорогостоящих экспериментов не подвергают даже простей- шей обработке; при этом, как следствие, теряется огромное количество по- лезной информации. Следует также подчеркнуть, что обработке экспериментальных дан- ных с целью построения моделей «сложных систем» (эмпирических зависи- мостей) должна предшествовать предварительная обработка, содержание ко- торой, в основном, состоит в отсеивании грубых погрешностей измерений и в проверке соответствия распределения результатов нормальному закону. Следует помнить, что только после выполнения предварительной обработки можно с наибольшей эффективностью, а главное корректно, использовать более сложные экспериментально-статистические методы, позволяющие по- 4 лучать математические модели даже таких процессов, строгое детерминиро- ванное описание которых вообще отсутствует. 5 1 Статистическое моделирование систем Далеко не всегда можно построить аналитическую модель, как функ- циональную зависимость выходного параметра системы от входных пара- метров. В этих случаях пользуются построением статистических моделей. Под статистическим моделированием понимается воспроизведение с помощью электронно-вычислительных машин (ЭВМ) функционирования ве- роятностной модели некоторого объекта. Статистические модели получили развитие как метод Монте-Карло. Методами Монте-Карло обычно называют методы решения всевозможных задач, основанные по моделированию случайных величин на ЭВМ. Задачи статистического моделирования состоят в том, чтобы, исполь- зуя ЭВМ воспроизводить поведение статистических моделей, устанавливая связь алгоритмов моделирования с алгоритмами решения задач вычисли- тельной математики с помощью метода Монте-Карло и на этой основе стро- ить удобные в вычислительном отношении модели, позволяющие получать необходимые характеристики объекта. Для этого необходимо научиться: - с помощью специальных методов и средств вырабатывать програм- мы реализации случайных чисел; - с помощью этих чисел получать реализацию случайных величин или случайных процессов с более сложными законами распределе- ния; - с помощью полученных реализаций вычислять значения величин, характеризующих модель, и производить обработку результатов экспериментов. Моделирование случайных процессов строится на основе базовых распределений случайных величин. 1.1 Сущность метода статистических испытаний Метод статистических испытаний применяется для моделирования сложных систем, в которых не возможно или не целесообразно получить аналитические модели, описывающие протекающие процессы. Данный ме- тод также используется в случаях, когда реальные испытания системы ока- зываются дорогостоящими или их не возможно проводить по причинам со- циального, военного и других смыслов. Например, необходимо определить вероятность попадания ракеты в цель. Для этого необходимо произвести 1000 пусков – это дорого. Поэтому строят математический аналог системы, проводят испытания и обрабатывают полученные результаты. Суть метода заключается в замене эксперимента с реальной системой, экспериментом с ее математическим аналогом и имитацией работы системы (имитационное моделирование). Метод статистических испытаний основан на законах больших чисел, а именно на двух предельных теоремах Чебышева и Бернулли. 6 Теорема Чебышева: при неограниченном проведении опытов среднее арифметическое y по вероятности стремится к математическому ожиданию y m [ ] 1 lim 0 = < − ∞ → → ε ε y m y p N , (1.1) где 0 > ε Теорема Бернулли: при неограниченном увеличении опытов частота события q сходится по вероятности к его вероятности p [ ] 1 lim 0 = < − ∞ → → ε ε p q p N , (1.2) где 0 > ε Теорема Бернулли позволяет определить вероятность совершения некоторого события. Испытания проводятся следующим образом. Известна некоторая сис- тема S (рисунок 1.1). В кибернетике – это, как правило, черный ящик. Систе- ма S имеет множество входов X и один выход Y. Рисунок 1.1 – Система S Множество входов n x x ... 1 - случайные величины. О каждой случайной величине известно: - функция распределения; - математическое ожидание и дисперсия распределения. Нас интересует выходная величина Y, которая не известна, но мы зна- ем, что выходная величина Y каким-то образом зависит от входных парамет- ров X, однако сами функциональные зависимости нам неизвестны. Чтобы построить математический аналог системы, надо разработать алгоритм функционирования системы. Систему представляют как совокуп- ность взаимосвязанных подсистем, на вход которых поступают величины n x x ... 1 , распределенные по определенному закону. Эти случайные величины должны пройти определенное количество блоков, чтобы попасть на выход системы. Процесс моделирования заключается в многократном повторении опытов над системой. Результат получается следующим образом. Y х 1 х n S х 2 7 1 Каждая случайная величина получает некоторое случайное значение и тогда, выходная величина Y принимает также определенное случайное зна- чение: = 1 1 2 1 1 1 ,..., , n x x x f Y 2 Далее все повторяется, и мы получаем: = 2 2 2 2 1 ,..., , 2 n x x x f Y N Получаем последнее случайное значение выходной величины: = N n N N N x x x f Y ,..., , 2 1 Результат моделирования получаем как среднее значение случайных величин на выходе системы: N y y N i i ∑ = =1 . (1.3) Причем, при ∞ → N среднее значение (случайная величина) y схо- дится по вероятности к ее математическому ожиданию y m согласно предель- ной теореме Чебышева. Таким образом, моделирование содержит три этапа: 1 Разработка и ввод в ЭВМ моделирующего алгоритма. 2 Генерирование входных случайных величин с заданными функция- ми и параметрами распределения и многократное повторение опытов. 3 Статистическая обработка результатов моделирования. 1.2 Формирование случайных величин с заданными законами рас- пределения Существуют различные способы «порождать» случайные числа с по- мощью ЭВМ. Например, метод обратных функций, метод суперпозиции. Важно понять, что для получения значений случайных величин с про- извольной функцией распределения достаточно уметь находить значения ка- кой-нибудь одной «стандартной» случайной величины, так как всегда можно подобрать такую функцию от этой случайной величины, которая имела бы требуемый закон распределения. В качестве такой случайной величины обычно берут случайную величину R, имеющую равномерное распределение 8 на отрезке [ ] 1 , 0 . Формирование случайных величин с заданным законом рас- пределения будем осуществлять методом обратного преобразования. Сфор- мулируем правила метода обратных функций. Правило 1. Для того чтобы разыграть возможное значение x i непре- рывной случайной величины Х, зная ее функцию распределения F(x), надо выбрать случайное число r i , приравнять его функции распределения и ре- шить относительно x i полученное уравнение F(x i )=r i Если известна плотность вероятности f(x), то используют правило 2. Правило 2. Для того чтобы разыграть возможное значение x i непре- рывной случайной величины Х, зная ее плотность вероятности f(x), надо вы- брать случайное число r i и решить относительно x i уравнение ∫ ∞ − = i x i r dx x f ) ( , или уравнение ∫ = i x a i r dx x f ) ( , где α – наименьшее конечное возможное значение Х. Рассмотрим более подробно данный метод. Необходимо сформиро- вать случайную величину Х, для которой задана функция распределения: ( ) ( ) ( ) ( ) ∫ = < < ∞ − = < = ∞ − x dx x f x X p x X p x F . (1.4) Интегральная функция ( ) x F изменяется от 0 до 1. Приравняв функ- цию ( ) R x F = можно путем обратного преобразования построить величину ( ) R F x 1 − = , которая будет соответствовать заданной функции. Построим гра- фик обратного преобразования для равномерного закона распределения (ри- сунок 1.2). Рисунок 1.2 – Обратное преобразование ( ) x F x 1 R 0 a в ( ) x f x а в − 1 0 a в 1 9 Формируем случайную величину R в интервале от 0 до 1 и путем об- ратного преобразования оказываемся в интервале [ ] в a , . Определим аналитические выражения для осуществления обратного преобразования. 1 Формирование случайного числа по равномерному закону. Плотность распределения для равномерного закона имеет вид: ( ) , 1 а в x f − = (1.5) где x – принимает любое значение от a до в . Запишем интегральный закон распределения: ( ) 1 0 1 1 1 a в a x dx a в dx a в dx a в dx a в x F x a x a x − − = ∫ − + = = ∫ − + ∫ − = ∫ − = ∞ − ∞ − α (1.6) Приравниваем F(x) значению R и, решая уравнение относительно x , получим ( ) , a в R a x R a в a x − ⋅ + = = − − (1.7) В выражении (1.7) величина x равномерно распределена в интервале от a до в в соответствии с заданной функцией (1.5). 2 Формирование случайного числа по экспоненциальному закону. Плотность распределения для экспоненциального закона имеет вид (рисунок 1.3) ( ) ∞ ≤ ≤ ⋅ = ⋅ − x x f x 0 , λ λ l (1.8) Рисунок 1.3 – Экспоненциальный закон распределения ( ) x f x λ 0 ( ) x F x 1 0 10 Интегральная функция ( ) x x x x x x x F ⋅ − ⋅ − ∞ − ⋅ − ∞ − ⋅ − − + = ⋅ ⋅ = ⋅ = ∫ ∫ ∫ + λ λ λ λ λ λ λ l l l l 1 0 0 0 . (1.9) Приравниваем полученное выражение R и решим полученное уравне- ние относительно x . , 1 1 R R x x − = = − ⋅ − ⋅ − λ λ l l (1.10) Логарифмируем левую и правую часть, получаем выражение ( ) ( ) 1 1 ln 1 1 ln 1 , 1 ln R R x R x − = − − = − = − λ λ λ (1.11) Если сформировать случайное число R и по формуле (1.11) опреде- лить x , тогда вычисленное значение будет распределено по экспоненциаль- ному закону с заданной интенсивностью λ 3 Формирование случайного числа по нормальному закону. Согласно центральной предельной теореме Ляпунова закон распреде- ления суммы m независимых случайных величин, имеющих один и тот же произвольный закон распределения при необратимом увеличении числа сла- гаемых m, приближается к нормальному закону. При сумме двух равномерно распределенных случайных величин в интервале [ ] в a, получаем треугольное распределение в интервале [ ] в a 2 , 2 При сумме трех случайно распределенных величин в интервале [ ] в a , получа- ем распределение в интервале [ ] в a 3 , 3 , которое приближается к нормальному закону распределения (рисунок 1.4). Рисунок 1.4 – Композиция случайных величин Сумма m равномерно распределенных в интервале от a до в незави- симых случайных величин стремится к нормальному распределению. ( ) x f x а 0 2а 3а в 2 в 3 в 11 Математическое ожидание и дисперсия для суммы равномерных за- конов на интервале [ ] в a , имеет вид: ( ) ( ) ( ) ( ) 12 , 2 2 2 a в m x в a m x M − = + = σ (1.12) Если выбрать интервал [ ] 1 , 0 , то математическое ожидание и диспер- сия будут оцениваться по зависимостям: ( ) ( ) 12 , 2 2 m R m R M = = σ (1.13) Для получения последовательности нормально распределенных слу- чайных величин с заданными ( ) x M и D ( x ) мы должны использовать вели- чину Z i , которая будет являться нормально распределенной случайной вели- чиной, с параметрами N(0,1). Тогда случайная величина i x будет определять- ся по формуле: ( ) ( ) i i Z x x M x ⋅ + = σ Пусть m ξ ξ ξ ..., , , 2 1 – независимые случайные величины, равномерно- распределенные на отрезке [ ] 1 , 0 , с ( ) 5 , 0 = i M ξ ; ( ) 12 1 2 = i ξ σ . Просуммируем независимые случайные величины: ∑ = ⋅ + = m i i i Z m m 1 12 2 ξ , (1.14) отсюда нормированная величина будет иметь вид: ∑ = − = m i m m Z i i 1 2 12 ξ , (1.15) где m – количество реализаций. При ∞ → m случайная величина Z i стремится к стандартной нормально распределенной случайной величине с нулевым математическим ожиданием и дисперсией равной 1. На практике обычно берут m = 12, поэтому: ∑ − = = 12 1 6 i i i Z ξ . (1.16) 12 Таким образом, моделирование случайной величины χ =N( σ , a ), имеющее нормальное распределение с параметрами а и σ , основано на ис- пользовании зависимости: i i Z a x ⋅ + = σ , (1.17) где Z i = N(0,1). |