Главная страница
Навигация по странице:

  • Рис. 11. К проверке гипотезы H 0 : β1 = 0

  • Рис. 12. К понятию «точность» линейной регрессионной модели

  • Нелинейная регрессия.

  • МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ И АППАРАТОВ ХИМИЧЕСКИХ, ПИЩЕВЫХ И БИОТЕХНОЛОГИЧЕСКИХ ПРОИЗВОДСТВ. Д. С. Дворецкий, С. И. Дворецкий, Е. В. Пешкова, М. С. Темнов математическое моделирование


    Скачать 0.96 Mb.
    НазваниеД. С. Дворецкий, С. И. Дворецкий, Е. В. Пешкова, М. С. Темнов математическое моделирование
    АнкорМАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ И АППАРАТОВ ХИМИЧЕСКИХ, ПИЩЕВЫХ И БИОТЕХНОЛОГИЧЕСКИХ ПРОИЗВОДСТВ
    Дата25.05.2023
    Размер0.96 Mb.
    Формат файлаpdf
    Имя файлаdvorecky.pdf
    ТипУчебное пособие
    #1158302
    страница5 из 10
    1   2   3   4   5   6   7   8   9   10

    30
    симая переменная примет вполне определённое значение. Однако, по- скольку понятие статистической зависимости относится к осреднённым условиям, прогнозы не могут быть безошибочными. Применяя вероят- ностные методы, как будет показано далее, можно вычислить вероят- ность того, что ошибка прогноза не выйдет за определённые границы.
    Уравнения регрессии классифицируют на линейные (корреляцион- ные) и нелинейные.
    Уравнение линейной регрессии (истинное) запишем в следующем виде
    )
    (
    }
    |
    {
    1 0
    x
    x
    Y
    M
    x
    X

    β
    +
    β
    =
    η
    =
    =
    (7.1)
    Оценки истинных параметров модели
    0
    β
    и
    1
    β
    обозначим через b
    0
    и
    b
    1
    , а оценку
    η
    через
    yˆ
    . Подставив в (7.1) вместо истинных параметров их оценки, получим уравнение регрессии:
    )
    (
    ˆ
    1 0
    x
    x
    b
    b
    y

    +
    =
    (7.2)
    Оценки b
    0
    и b
    1
    уравнения регрессии (7.2) будем находить из условия минимума квадратов отклонений средних значений переменной
    )
    (

    j
    y
    от вычисленных по уравнению регрессии
    )
    (
    ˆ
    j
    x
    y
    , т.е. по методу наименьших квадратов (МНК).
    МНК Лежандра состоит в минимизации величины
    [
    ]


    =
    =



    =

    =
    n
    j
    n
    j
    j
    j
    j
    j
    x
    x
    b
    b
    j
    y
    P
    x
    y
    j
    y
    P
    b
    b
    1 1
    2 1
    0
    ср
    2
    ср
    1 0
    )
    (
    )
    (
    ))
    (
    ˆ
    )
    (
    (
    )
    ,
    (
    Ф
    , где
    j
    P
    – число повторных измерений
    )
    (
    j
    y
    по переменным b
    0
    и b
    1
    . Ис- пользуя необходимые (и для данного случая достаточные) условия мини- мума функции
    )
    ,
    (
    Ф
    1 0
    b
    b
    , получим систему нормальных уравнений:
    [
    ]
    ,
    0
    )
    (
    )
    (
    2
    Ф
    1 1
    0
    ср
    0

    =
    =




    =


    n
    j
    j
    j
    x
    x
    b
    b
    j
    y
    P
    b
    [
    ]
    0
    )
    (
    )
    (
    )
    (
    2
    Ф
    1 1
    0
    ср
    1

    =
    =





    =


    n
    j
    j
    j
    j
    x
    x
    x
    x
    b
    b
    j
    y
    P
    b
    Приводя подобные члены, получим:
    ,
    )
    (
    )
    (
    1

    1 1
    1 0



    =
    =
    =
    =

    +
    n
    j
    j
    n
    j
    j
    j
    n
    j
    j
    j
    y
    P
    x
    x
    P
    b
    P
    b

    31
    ,
    )
    )(
    (
    )
    (
    )
    (
    1

    1 2
    1 1
    0



    =
    =
    =

    =

    +

    n
    j
    j
    j
    n
    j
    j
    j
    n
    j
    j
    j
    x
    x
    j
    y
    P
    x
    x
    P
    b
    x
    x
    P
    b
    откуда имеем:
    )
    (
    )
    )(
    (
    ,
    )
    (
    1 2
    1

    1 1
    1

    0




    =
    =
    =
    =


    =
    =
    =
    n
    j
    j
    j
    n
    j
    j
    j
    n
    j
    j
    n
    j
    j
    x
    x
    P
    x
    x
    j
    y
    P
    b
    Y
    P
    j
    y
    P
    b
    Оценки, полученные по методу наименьших квадратов, обладают минимальной дисперсией в классе линейных оценок, т.е. являются не- смещёнными – M{b
    0
    }
    =
    0
    β , M{b
    1
    }
    =
    1
    β . Их дисперсии рассчитываются следующим образом:
    )
    (
    }
    )
    {(
    ;
    }
    )
    {(
    1 2
    2
    )
    (
    2 2
    1 1
    1 2
    )
    (
    2 2
    0 0
    0 0


    =
    =

    σ
    =

    β

    σ
    =

    β

    n
    j
    j
    j
    j
    y
    b
    n
    j
    j
    j
    y
    b
    x
    x
    P
    S
    b
    M
    P
    S
    b
    M
    Найдём несмещённую оценку
    2
    )
    ( j
    y
    σ
    :
    ∑∑
    = =
    η

    n
    j
    P
    i
    j
    ji
    j
    y
    1 1
    2
    )
    (
    =
    ∑∑
    = =

    n
    j
    P
    i
    ji
    j
    j
    y
    y
    1 1
    2

    ))
    (
    (
    +
    2

    1
    ))
    (
    ˆ
    )
    (
    (
    j
    n
    j
    j
    x
    y
    j
    y
    P


    =
    +
    +

    =
    β

    n
    j
    j
    P
    b
    1 2
    0 0
    )
    (
    +
    )
    (
    )
    (
    1 2
    2 1
    1

    =

    β

    n
    j
    j
    j
    x
    x
    P
    b
    7.3)
    Первый член правой части есть мера экспериментальной ошибки, полученной в каждом отдельном опыте, выполненном при различных значениях х
    i
    , второй член служит мерой эффективности линейной модели для подгонки экспериментальных данных. Левая часть равенства является суммой квадратов с

    =
    n
    j
    j
    P
    1
    степенями свободы и распределённой как
    2 2
    )
    (
    χ

    σ
    j
    y
    . Можно показать, что каждый член правой части равенства рас- пределён по закону
    2 2
    )
    (
    χ

    σ
    j
    y
    с
    n
    P
    n
    j
    j


    =1
    , n – 2, 1 и 1 степенями свободы, соответственно.
    Если оценивать
    2
    )
    ( j
    y
    σ
    по второму члену правой части равенства (7.3), то получим несмещённую оценку
    2
    r
    S
    дисперсии адекватности

    32

    =


    =
    n
    j
    j
    j
    r
    x
    y
    j
    y
    P
    n
    S
    1 2
    ср
    2
    ))
    (
    ˆ
    )
    (
    (
    2 1
    Величина
    2
    r
    S
    характеризует влияние переменной х.
    Величина
    2
    l
    S
    характеризует влияние неучтённых факторов и служит мерой рассеяния, вызванного экспериментальной ошибкой:
    n
    P
    j
    y
    y
    S
    n
    j
    j
    n
    j
    P
    i
    ji
    l
    j


    =

    ∑∑
    =
    = =
    1 1
    1 2

    2
    ))
    (
    (
    Эта величина тоже является несмещённой оценкой. Очевидно, чем меньше влияние неучтённых факторов, тем лучше математическая модель соответствует экспериментальным данным, так как изменение у в основ- ном объясняется влиянием переменной х.
    Поэтому, прежде чем принять решение по поводу модели, необходи- мо проверить гипотезу о том, что линейная модель удовлетворительно описывает экспериментальные данные. Для проверки этой гипотезы вы- числим статистику
    2 2
    l
    r
    S
    S
    F
    =
    , которая имеет распределение Фишера с
    )
    2
    (
    1

    = n
    f
    и
    n
    P
    f
    n
    j
    j

    =

    =1 2
    степенями свободы. По доверительной веро- ятности
    }
    99
    ,
    0
    ;
    95
    ,
    0
    ;
    9
    ,
    0
    {
    1
    =
    α

    =
    ρ
    и числу степеней свободы
    2 1
    , f
    f
    нахо- дят по таблицам F-распределения критическое значение
    )
    ,
    ,
    (
    2 1
    f
    f
    F
    ρ
    . Да- лее проверяется выполнение условия:
    )
    ,
    ,
    (
    2 1
    2 2
    f
    f
    F
    S
    S
    F
    l
    r
    ρ
    <
    =
    Если это условие выполняется, т.е. вычисленные значения
    F
    мень- ше табличного значения
    )
    ,
    ,
    (
    2 1
    f
    f
    F
    ρ
    , то гипотеза о том, что линейная мо- дель адекватна, принимается. В противном случае гипотезу о линейности модели следует отвергнуть и для описания экспериментальных данных необходимо выбрать другую модель.
    В случае
    F
    <
    )
    ,
    ,
    (
    2 1
    f
    f
    F
    ρ
    оценки дисперсий
    2
    r
    S
    и
    2
    l
    S
    можно объеди- нить, чтобы получить лучшую оценку
    2
    )
    (
    j
    y
    σ
    с
    2 1


    =
    n
    j
    j
    P
    степенями свободы:

    33
    2
    ))
    (
    ˆ
    (
    )
    2
    (
    ))
    (
    ˆ
    )
    (
    (
    ))
    (
    (
    1 1
    1 2
    1 1
    1 2

    1 2

    2
    )
    (
    ∑∑





    = =
    =
    =
    =
    =
    =


    =
    =

    +










    +

    =
    n
    j
    P
    i
    n
    j
    j
    j
    ji
    n
    j
    j
    n
    j
    n
    j
    j
    j
    P
    i
    ji
    j
    y
    j
    j
    P
    x
    y
    y
    n
    n
    P
    x
    y
    j
    y
    P
    j
    y
    y
    S
    Конечно, если повторные измерения y
    ji
    при заданном
    j
    x
    не произво- дились, то оценку дисперсии
    2
    )
    (
    j
    y
    S
    можно получить лишь по
    2
    r
    S
    . Без по- вторных измерений F-критерий не может быть применён для проверки гипотезы линейности.
    Далее можно проверить гипотезу о том, что
    0 1
    =
    β
    , составляя отно- шение оценок дисперсий:
    2
    )
    (
    1 2
    2
    )
    (
    2 3
    )
    )
    (
    ˆ
    (
    j
    y
    n
    j
    j
    j
    j
    y
    S
    y
    x
    y
    P
    S
    S
    F

    =

    =
    =
    , где


    =
    =
    n
    j
    j
    i
    j
    ji
    P
    y
    y
    1
    ,
    Если это отношение больше табличного значения
    )
    ,
    ,
    (
    2 1
    f
    f
    F
    ρ
    , гипо- теза
    0
    :
    1 0
    =
    β
    H
    отвергается (рис. 11).
    0
    :
    1 0
    =
    β
    H
    0
    :
    1 0
    =
    β
    H
    y
    y
    x
    x
    )
    (
    ˆ x
    y
    )
    (
    ˆ x
    y
    а
    )
    б
    )
    Рис. 11. К проверке гипотезы H
    0
    :
    β
    1
    = 0:
    а
    – гипотеза отвергается; б – гипотеза принимается

    34
    Понятие доверительного интервала. Доверительная вероятность.
    Оценку неизвестного параметра генеральной совокупности одним числом называют точечной оценкой. Наряду с точечным статистическая теория оценивания параметров занимается вопросами интервального оце- нивания.
    Задачу интервального оценивания в самом общем виде можно сфор- мулировать так: по данным выборки построим числовой интервал, отно- сительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом числе наблюдений, когда точечная оценка мало надёжна.
    Доверительным интервалом
    [ ]
    b
    b
    ,
    для параметра b называют такой интервал, относительно которого можно с заранее выбранной вероятно- стью
    α

    =
    ρ
    1
    близкой к единице, утверждать, что он содержит значение параметра b, т.е.
    [
    ]
    α

    =
    <
    <
    1
    b
    b
    b
    P
    Чем меньше для выбранной вероятности
    b
    b,
    , тем точнее оценка неизвестного параметра b и, наоборот, если этот интервал велик, то оцен- ка, произведённая с его помощью, мало пригодна для практики. Вероят- ность
    α

    =
    ρ 1
    принято называть доверительной вероятностью, а число
    α – уровнем значимости. Выбор доверительной вероятности определяется конкретно решаемой задачей.
    Оценим значимость оценок коэффициентов регрессии и построим интервальные оценки этих коэффициентов. Для этого проверяют гипотезу о равенстве нулю коэффициента регрессии, соблюдая предпосылки нор- мального распределения b относительно
    β
    В этом случае вычисляемая для проверки нулевой гипотезы
    0
    :
    1 0
    =
    β
    H
    статистика
    b
    S
    b
    t
    β

    =
    имеет распределение Стьюдента. Тогда для коэффициента
    0
    β имеем:
    2
    ,
    1 2
    1 1
    )
    (
    0 0
    0 0
    0


    =
    =

    =








    β

    =
    β

    =
    n
    j
    j
    n
    j
    j
    j
    y
    b
    P
    f
    P
    S
    b
    S
    b
    t
    Величину
    )
    ( j
    y
    S
    называют оценкой стандартной ошибки.

    35
    По доверительной вероятности
    2 1 α

    и числу степеней свободы f находят по таблицам распределения Стьюдента критическое значение
    ,
    1 2
    f
    t
    α

    В этом случае доверительный интервал для
    0
    β имеет вид:
    0 0
    ,
    2 1
    0 0
    ,
    2 1
    0
    b
    f
    b
    f
    S
    t
    b
    S
    t
    b
    α

    α

    +
    <
    β


    Аналогично для
    1
    β
    имеем:
    2
    ,
    )
    )
    (
    (
    1 1
    2 1
    2
    )
    (
    1 1
    1 1
    1


    =
    =

    =

    β

    =
    β

    =
    n
    j
    j
    n
    j
    j
    j
    j
    y
    b
    P
    f
    x
    x
    P
    S
    b
    S
    b
    t
    1 1
    ,
    2 1
    1 1
    ,
    2 1
    1
    b
    f
    b
    f
    S
    t
    b
    S
    t
    b
    α

    α

    +
    <
    β


    Линия регрессии характеризует изменение условного математиче- ского ожидания выходной переменной
    y


    от вариации входной перемен- ной х. Точечной оценкой условного математического ожидания
    }
    |

    {
    x
    y
    M
    =
    η
    является
    )
    (
    ˆ x
    y
    . Построим доверительный интервал для
    }
    |

    {
    x
    y
    M
    =
    η
    в точках
    n
    j
    x
    j
    ,
    1
    ,
    =
    Известно что
    )
    (
    /
    })
    |
    {
    )
    (
    ˆ
    (
    j
    y
    X
    S
    y
    M
    x
    y

    имеет распределение Стьюден- та с

    =

    =
    n
    j
    j
    P
    f
    1 2
    степенями свободы:
    y
    S
    y
    t
    ˆ
    ˆ
    η

    =
    ,
    y
    f
    y
    f
    S
    t
    y
    S
    t
    y
    ˆ
    ,
    2 1
    ˆ
    ,
    2 1
    ˆ
    ˆ
    α

    α

    +
    <
    η


    , где
















    +
    =



    =
    =
    =
    n
    j
    j
    j
    n
    j
    j
    n
    j
    j
    j
    y
    j
    y
    x
    x
    P
    x
    x
    P
    S
    S
    1 2
    1 2
    1 2
    )
    (
    2
    )
    (
    ˆ
    )
    (
    )
    (
    1
    Доверительные границы интервала для
    }
    |

    {
    x
    y
    M
    =
    η
    в точках
    j
    x можно изобразить графически (рис. 12).
    В точке
    x
    x
    =
    границы интервала наиболее близки друг к другу. Рас- положение границ доверительного интервала показывает, что прогнозы по уравнению регрессии с заданной точностью (интервальные оценки для η )

    36
    Нижняя граница интервала
    $( )
    (
    )
    y x
    b
    b x x
    =
    +

    0 1
    y
    x
    x
    1
    x
    2
    x
    3
    x
    x
    j
    ... x
    n
    Доверительный интервал для
    η в точке х
    j
    Верхняя граница интервала
    Рис. 12. К понятию «точность» линейной регрессионной модели
    допустимы для значений
    x, не выходящих за пределы выборки. Иными словами, экстраполяция по уравнению регрессии может приводить к зна- чительным погрешностям.
    Нелинейная регрессия.
    Пусть уравнение регрессии задаётся поли- номом
    k-й степени:
    ,
    ˆ
    2 2
    1 0
    k
    k
    x
    b
    x
    b
    x
    b
    b
    y
    +
    +
    +
    +
    =
    коэффициенты которого будем определять методом наименьших квадра- тов по экспериментальным данным.
    Однако нам неизвестна степень полинома
    k. Для её определения ис- пользуем итерационный метод: вначале задаёмся степенью полинома, например
    k = 2, и определяем коэффициенты полинома методом наи- меньших квадратов. Затем вычисляем остаточную дисперсию по формуле
    )
    1
    (
    ))
    (
    ˆ
    (
    1 2
    ,
    ост
    2
    +


    =

    =
    k
    n
    x
    y
    y
    S
    n
    j
    j
    j
    k
    Далее увеличиваем заданную степень полинома
    k на 1 и повторяем вышеописанную процедуру при увеличенном значении степени полино- ма. Как только
    2 1
    ,
    ост
    +
    k
    S
    перестаёт быть значимо меньше
    2
    ,
    ост k
    S
    , увеличе- ние степени
    k нужно прекратить. Значимость различия между
    2 1
    ,
    ост
    +
    k
    S
    и
    2
    ,
    ост k
    S
    проверяется по критерию Фишера:
    ),
    ,
    ,
    (
    2 1
    2 1
    ,
    ост
    2
    ,
    ост
    f
    f
    F
    S
    S
    F
    k
    k
    ρ
    <
    =
    +
    где
    f
    1
    ,
    f
    2
    – число степеней свободы остаточной дисперсии в числителе и знаменателе соответственно.

    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта