Главная страница
Навигация по странице:

  • Распределение

  • Статистическая обработка результатов эксперимента в MathCAD. Законы распределения случайных чисел Для непрерывных случайных величин


    Скачать 2.86 Mb.
    НазваниеЗаконы распределения случайных чисел Для непрерывных случайных величин
    Дата17.09.2022
    Размер2.86 Mb.
    Формат файлаpdf
    Имя файлаСтатистическая обработка результатов эксперимента в MathCAD.pdf
    ТипЗакон
    #682126

    Статистическая обработка результатов эксперимента в MathCAD
    методические рекомендации

    1. Законы распределения случайных чисел
    Распределение случайной величины – это функция, позволяющая определить вероятность появления заданного значения случайной величины.
    • В теории вероятностей сформулировано несколько законов распределения как для дискретных, так и для непрерывных случайных величин.
    • Наблюдаемые на практике случайные величины часто не вполне соответствуют теоретическим распределениям, но с некоторой точностью могут быть приближенно ими представлены.

    Законы распределения случайных чисел
    Для непрерывных случайных величин
    рассмотрим следующие законы:
    • Равномерное распределение
    • Нормальное распределение
    Экспоненциальное распределение
    • Гамма-распределение

    Равномерное распределение
    2 параметра:
    a, b – границы отрезка a = min(X
    i
    )
    b = max(X
    i
    )
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    dunif x 5
     15
    
    (
    )
    dunif x 7
     12
    
    (
    )
    x
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    punif x 5
     15
    
    (
    )
    punif x 7
     12
    
    (
    )
    x
    Плотность вероятности
    Интегральная функция распределения

    Равномерное распределение t
    0 1000
    
    
    Y1
    t runif 1 5
     15
    
    (
    )
    0
    
    Y2
    t runif 1 5
     15
    
    (
    )
    0
    
    0 5
    10 15 20 0
    5 10 15 20
    Y2
    Y1

    Нормальное распределение




    n
    i
    i
    X
    n
    X
    1 1

     
     




    n
    i
    i
    X
    n
    X
    1 2
    2 1

    2 параметра:
    μ – мат. ожидание
    σ – стандартное, или среднеквадратическое, отклонение
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    dnorm x 10
    
    2
    
    (
    )
    dnorm x 10
    
    1
    
    (
    )
    dnorm x 10
    
    5
    
    (
    )
    x
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    pnorm x 10
    
    2
    
    (
    )
    pnorm x 10
    
    1
    
    (
    )
    pnorm x 10
    
    5
    
    (
    )
    x

    Нормальное распределение
    0 5
    10 15 20 0
    5 10 15 20 16.24 3.277
    rnorm 1000 10
    
    2.2
    
    (
    )
    17.847 3.086
    rnorm 1000 10
    
    2.2
    
    (
    )
    t
    0 1000
    
    

    Экспоненциальное распределение
    1 параметр масштаба λ
    λ = 1 / μ
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    dexp x 0.5
    
    (
    )
    dexp x 1
    
    (
    )
    dexp x 2
    
    (
    )
    x
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    pexp x 0.5
    
    (
    )
    pexp x 1
    
    (
    )
    pexp x 2
    
    (
    )
    x

    Экспоненциальное распределение
    0 5
    10 15 20 0
    5 10 15 13.65 2.029 10 3


    rexp 1000 0.5
    
    (
    )
    15.395 2.175 10 3


    rexp 1000 0.5
    
    (
    )
    t
    0 1000
    
    

    Гамма-распределение






    2
    k
    2 параметра:
    k – параметр формы
    θ – параметр масштаба
    При k = 1 получается экспоненциальное распределение, где λ = 1 / θ
    При k → ∞ получается нормальное распределение с параметрами k∙θ и k∙θ
    2 0
    5 10 15 20 0
    0.2 0.4 0.6 0.8 1
    2
    dgamma x
    2 4
    







    1 2
    dgamma x
    2 1.5
    







    1 1
    dgamma x
    1 4
    







    x
    0 5
    10 15 20 0
    0.2 0.4 0.6 0.8
    pgamma x
    2 4
    






    pgamma x
    2 1.5
    






    pgamma x
    1 4
    






    x

    Гамма-распределение t
    0 1000
    
    
    Y1
    t rgamma 3 5
    
    (
    )
    0
    
    Y2
    t rgamma 3 5
    
    (
    )
    0
    
    0 5
    10 15 20 0
    5 10 15 20
    Y2
    Y1

    2. Построение гистограмм плотности вероятности и интегральной функции распределения
    Исходный вектор значений случайной величины:
    i
    0 99
    
    
    X
    i rnd 1
    ( ) rnorm 1 1
     0.7
    
    (
    )
    0

    
    0 20 40 60 80 100 1

    0 1
    2 3
    X
    i i

    Построение гистограмм плотности вероятности и интегральной функции распределения
    Построение гистограммы плотности вероятности:
    1

    0 1
    2 3
    0 0.1 0.2 0.3 0.4 1
    100
    histogram 5 X
    
    (
    )
    1
     

    1 100
    histogram 10 X
    
    (
    )
    1
     

    1 100
    histogram 20 X
    
    (
    )
    1
     

    histogram 5 X
    
    (
    )
    0
     
    histogram 10 X
    
    (
    )
    0
     
    
    histogram 20 X
    
    (
    )
    0
     
    

    Построение гистограмм плотности вероятности и интегральной функции распределения
    Для выбора числа интервалов (бинов) у гистограммы рекомендуется использовать формулу Стерджесса
    Ширина каждого из интервалов
    Ширину интервалов рекомендуется округлять.
    Функция histogram выбирает ширину автоматически.

    Построение гистограмм плотности вероятности и интегральной функции распределения
    Построение гистограммы интегральной функции распределения:
    j
    0 length histogram 15 X
    
    (
    )
    0
     


    1

    
    
    1

    0 1
    2 3
    0 0.2 0.4 0.6 0.8 1
    1 100 0
    j k
    histogram 15 X
    
    (
    )
    1
     


    k



    histogram 15 X
    
    (
    )
    0
     


    j

    4. Вычисление математического ожидания, стандартного отклонения, дисперсии
    • Математическое ожидание случайной величины вычисляется как её среднее значение, в mathCad вычисляется функцией mean
    • Среднеквадратическое (стандартное) отклонение – корень из дисперсии, в mathCad вычисляется функцией stdev
    Обозначается σ
    • Дисперсия – среднее значение квадрата отклонений от среднего значения (σ
    2
    ), в mathCad вычисляется функцией var
    mean X
    ( )
    0.486

    var X
    ( )
    0.225

    stdev X
    ( )
    0.475


    5. Критерии достоверности гипотез
    Гипотеза – предположение о виде или параметрах неизвестного распределения.
    Например: гипотеза «случайная величина X
    подчиняется нормальному закону распределения»
    Для каждой гипотезы есть вероятность p, что она верна, и вероятность 1 – p, что гипотеза ошибочна.
    При проверке гипотез заранее задают уровень
    значимости α = 1 – p, то есть вероятность недостоверности гипотезы.

    Критерии достоверности гипотез
    Для проверки гипотез вычисляют значение
    критерия, зависящее от значений проверяемой случайной величины, и проверяют его на нахождение в области значений, соответствующей достоверности гипотезы при заданном уровне значимости.
    Наиболее часто используют критерий
    Колмогорова и критерий Пирсона (критерий
    «хи-квадрат» - χ
    2
    ).

    Использование критерия
    Колмогорова
    • Упорядочить случайные числа по возрастанию.
    • Вычислить значения D
    i и выбрать максимальное из них D
    Значение критерия λ = D √n
    • Найти вероятность совпадения законов распределения P(λ).

    Использование критерия Колмогорова при заданном уровне значимости
    • Задавшись α и зная n, выбрать критическое значение критерия D
    кр
    • Упорядочить случайные числа по возрастанию.
    • Вычислить значения критерия D
    i и выбрать максимальное из них D
    • Гипотезу о принадлежности случайной величины распределению можно принять, если D < D
    кр

    Поиск критической точки для критерия Колмогорова
    Для нахождения критической величины критерия D
    кр надо знать уровень значимости
    α и число опытов n
    Для заданного α выбираем λ
    кр
    :
    2.03 1.95 1.73 1.63 1.48 1.36 1.22 1.07 0.97 0.89 0.0005 0.001 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.4
    кр


    1
    кр


    n
    D
    кр

    При больших n
    (n > 35)
    Для малых n пользоваться табличными значениями D
    кр

    Критерий Колмогорова: пример
    Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал своё время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 мин.
    Проверить гипотезу о том, что время ожидания автобуса равномерно распределено на отрезке [0; 10] на уровне значимости 0,05.

    Решение

    Решение задачи в MathCAD

    Использование критерия
    Пирсона
    Критерий используется для дискретных величин, либо непрерывных величин, разбитых на интервалы.
    Например, он может быть использован, если построена гистограмма результатов эксперимента.

    Использование критерия
    Пирсона
    • Определить число степеней свободы
    k = l – r – 1, где l – число интервалов гистограммы r – число параметров предполагаемого распределения, оцениваемых по выборке
    (2 для нормального, 1 для экспоненциального…)
    • Найти критическое значение критерия:
    χ
    2
    кр
    = qchisq(1 – α, k)
    • Вычислить критерий χ
    2
    по экспериментальным данным. Гипотеза верна, если
    χ
    2
    <
    χ
    2
    кр

    Использование критерия
    Пирсона
    Вычисление χ
    2
    :
    где
    n
    i
    – эмпирические частоты (фактическое количество попаданий случайной величины в заданный интервал гистограммы)
    np
    i
    – теоретические частоты (количество попаданий случайной величины в заданный интервал гистограммы, вычисленное по предполагаемому закону её распределения)




    l
    i
    i
    i
    i
    np
    np
    n
    1 2
    2
    )
    (


    Пример
    Измерены интервалы в минутах между 100 поездами метро, прибывшими на станцию.
    Результаты измерений представлены статистическим рядом:
    На уровне значимости проверить гипотезу о том, что интервалы можно описать нормальным распределением.
    05
    ,
    0



    Неравенство
    χ
    2
    <
    χ
    2
    кр
    выполнено, гипотезу можно принять.

    6. Коэффициент линейной корреляции
    Коэффициент линейной корреляции – величина, показывающая наличие линейной связи между значениями двух случайных величин.
    Для линейно зависящих величин он равен 1 или -1, для независимых величин – 0.
    В MathCad вычисляется как функция от двух векторов случайных чисел.
    X
    rgamma 100 2
    
    (
    )
    
    X1
    rgamma 100 2
    
    (
    )
    
    corr X 2X
    5

    
    (
    )
    1

    corr X1
    X1

    
    (
    )
    1


    corr X X1
    
    (
    )
    0.151

    corr X X
    2
    


    0.948

    corr X1 X1 2
    


    0.948

    corr X X
    3
    


    0.868

    corr X1 X1 3
    


    0.863

    corr X exp X
    ( )
    
    (
    )
    0.686

    corr X1 exp X1
    (
    )
    
    (
    )
    0.661

    corr X sin X
    ( )
    
    (
    )
    0.468


    corr X1 sin X1
    (
    )
    
    (
    )
    0.547




    написать администратору сайта