МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ И АППАРАТОВ ХИМИЧЕСКИХ, ПИЩЕВЫХ И БИОТЕХНОЛОГИЧЕСКИХ ПРОИЗВОДСТВ. Д. С. Дворецкий, С. И. Дворецкий, Е. В. Пешкова, М. С. Темнов математическое моделирование
Скачать 0.96 Mb.
|
симая переменная примет вполне определённое значение. Однако, по- скольку понятие статистической зависимости относится к осреднённым условиям, прогнозы не могут быть безошибочными. Применяя вероят- ностные методы, как будет показано далее, можно вычислить вероят- ность того, что ошибка прогноза не выйдет за определённые границы. Уравнения регрессии классифицируют на линейные (корреляцион- ные) и нелинейные. Уравнение линейной регрессии (истинное) запишем в следующем виде ) ( } | { 1 0 x x Y M x X − β + β = η = = (7.1) Оценки истинных параметров модели 0 β и 1 β обозначим через b 0 и b 1 , а оценку η через yˆ . Подставив в (7.1) вместо истинных параметров их оценки, получим уравнение регрессии: ) ( ˆ 1 0 x x b b y − + = (7.2) Оценки b 0 и b 1 уравнения регрессии (7.2) будем находить из условия минимума квадратов отклонений средних значений переменной ) ( cр j y от вычисленных по уравнению регрессии ) ( ˆ j x y , т.е. по методу наименьших квадратов (МНК). МНК Лежандра состоит в минимизации величины [ ] ∑ ∑ = = − − − = − = n j n j j j j j x x b b j y P x y j y P b b 1 1 2 1 0 ср 2 ср 1 0 ) ( ) ( )) ( ˆ ) ( ( ) , ( Ф , где j P – число повторных измерений ) ( j y по переменным b 0 и b 1 . Ис- пользуя необходимые (и для данного случая достаточные) условия мини- мума функции ) , ( Ф 1 0 b b , получим систему нормальных уравнений: [ ] , 0 ) ( ) ( 2 Ф 1 1 0 ср 0 ∑ = = − − − − = ∂ ∂ n j j j x x b b j y P b [ ] 0 ) ( ) ( ) ( 2 Ф 1 1 0 ср 1 ∑ = = − − − − − = ∂ ∂ n j j j j x x x x b b j y P b Приводя подобные члены, получим: , ) ( ) ( 1 cр 1 1 1 0 ∑ ∑ ∑ = = = = − + n j j n j j j n j j j y P x x P b P b 31 , ) )( ( ) ( ) ( 1 cр 1 2 1 1 0 ∑ ∑ ∑ = = = − = − + − n j j j n j j j n j j j x x j y P x x P b x x P b откуда имеем: ) ( ) )( ( , ) ( 1 2 1 cр 1 1 1 cр 0 ∑ ∑ ∑ ∑ = = = = − − = = = n j j j n j j j n j j n j j x x P x x j y P b Y P j y P b Оценки, полученные по методу наименьших квадратов, обладают минимальной дисперсией в классе линейных оценок, т.е. являются не- смещёнными – M{b 0 } = 0 β , M{b 1 } = 1 β . Их дисперсии рассчитываются следующим образом: ) ( } ) {( ; } ) {( 1 2 2 ) ( 2 2 1 1 1 2 ) ( 2 2 0 0 0 0 ∑ ∑ = = − σ = ≈ β − σ = ≈ β − n j j j j y b n j j j y b x x P S b M P S b M Найдём несмещённую оценку 2 ) ( j y σ : ∑∑ = = η − n j P i j ji j y 1 1 2 ) ( = ∑∑ = = − n j P i ji j j y y 1 1 2 cр )) ( ( + 2 cр 1 )) ( ˆ ) ( ( j n j j x y j y P − ∑ = + + ∑ = β − n j j P b 1 2 0 0 ) ( + ) ( ) ( 1 2 2 1 1 ∑ = − β − n j j j x x P b 7.3) Первый член правой части есть мера экспериментальной ошибки, полученной в каждом отдельном опыте, выполненном при различных значениях х i , второй член служит мерой эффективности линейной модели для подгонки экспериментальных данных. Левая часть равенства является суммой квадратов с ∑ = n j j P 1 степенями свободы и распределённой как 2 2 ) ( χ ⋅ σ j y . Можно показать, что каждый член правой части равенства рас- пределён по закону 2 2 ) ( χ ⋅ σ j y с n P n j j − ∑ =1 , n – 2, 1 и 1 степенями свободы, соответственно. Если оценивать 2 ) ( j y σ по второму члену правой части равенства (7.3), то получим несмещённую оценку 2 r S дисперсии адекватности 32 ∑ = − − = n j j j r x y j y P n S 1 2 ср 2 )) ( ˆ ) ( ( 2 1 Величина 2 r S характеризует влияние переменной х. Величина 2 l S характеризует влияние неучтённых факторов и служит мерой рассеяния, вызванного экспериментальной ошибкой: n P j y y S n j j n j P i ji l j − − = ∑ ∑∑ = = = 1 1 1 2 cр 2 )) ( ( Эта величина тоже является несмещённой оценкой. Очевидно, чем меньше влияние неучтённых факторов, тем лучше математическая модель соответствует экспериментальным данным, так как изменение у в основ- ном объясняется влиянием переменной х. Поэтому, прежде чем принять решение по поводу модели, необходи- мо проверить гипотезу о том, что линейная модель удовлетворительно описывает экспериментальные данные. Для проверки этой гипотезы вы- числим статистику 2 2 l r S S F = , которая имеет распределение Фишера с ) 2 ( 1 − = n f и n P f n j j − = ∑ =1 2 степенями свободы. По доверительной веро- ятности } 99 , 0 ; 95 , 0 ; 9 , 0 { 1 = α − = ρ и числу степеней свободы 2 1 , f f нахо- дят по таблицам F-распределения критическое значение ) , , ( 2 1 f f F ρ . Да- лее проверяется выполнение условия: ) , , ( 2 1 2 2 f f F S S F l r ρ < = Если это условие выполняется, т.е. вычисленные значения F мень- ше табличного значения ) , , ( 2 1 f f F ρ , то гипотеза о том, что линейная мо- дель адекватна, принимается. В противном случае гипотезу о линейности модели следует отвергнуть и для описания экспериментальных данных необходимо выбрать другую модель. В случае F < ) , , ( 2 1 f f F ρ оценки дисперсий 2 r S и 2 l S можно объеди- нить, чтобы получить лучшую оценку 2 ) ( j y σ с 2 1 − ∑ = n j j P степенями свободы: 33 2 )) ( ˆ ( ) 2 ( )) ( ˆ ) ( ( )) ( ( 1 1 1 2 1 1 1 2 cр 1 2 cр 2 ) ( ∑∑ ∑ ∑ ∑ ∑ ∑ = = = = = = = − − = = − + ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − + − = n j P i n j j j ji n j j n j n j j j P i ji j y j j P x y y n n P x y j y P j y y S Конечно, если повторные измерения y ji при заданном j x не произво- дились, то оценку дисперсии 2 ) ( j y S можно получить лишь по 2 r S . Без по- вторных измерений F-критерий не может быть применён для проверки гипотезы линейности. Далее можно проверить гипотезу о том, что 0 1 = β , составляя отно- шение оценок дисперсий: 2 ) ( 1 2 2 ) ( 2 3 ) ) ( ˆ ( j y n j j j j y S y x y P S S F ∑ = − = = , где ∑ ∑ = = n j j i j ji P y y 1 , Если это отношение больше табличного значения ) , , ( 2 1 f f F ρ , гипо- теза 0 : 1 0 = β H отвергается (рис. 11). 0 : 1 0 = β H 0 : 1 0 = β H y y x x ) ( ˆ x y ) ( ˆ x y а ) б ) Рис. 11. К проверке гипотезы H 0 : β 1 = 0: а – гипотеза отвергается; б – гипотеза принимается 34 Понятие доверительного интервала. Доверительная вероятность. Оценку неизвестного параметра генеральной совокупности одним числом называют точечной оценкой. Наряду с точечным статистическая теория оценивания параметров занимается вопросами интервального оце- нивания. Задачу интервального оценивания в самом общем виде можно сфор- мулировать так: по данным выборки построим числовой интервал, отно- сительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом числе наблюдений, когда точечная оценка мало надёжна. Доверительным интервалом [ ] b b , для параметра b называют такой интервал, относительно которого можно с заранее выбранной вероятно- стью α − = ρ 1 близкой к единице, утверждать, что он содержит значение параметра b, т.е. [ ] α − = < < 1 b b b P Чем меньше для выбранной вероятности b b, , тем точнее оценка неизвестного параметра b и, наоборот, если этот интервал велик, то оцен- ка, произведённая с его помощью, мало пригодна для практики. Вероят- ность α − = ρ 1 принято называть доверительной вероятностью, а число α – уровнем значимости. Выбор доверительной вероятности определяется конкретно решаемой задачей. Оценим значимость оценок коэффициентов регрессии и построим интервальные оценки этих коэффициентов. Для этого проверяют гипотезу о равенстве нулю коэффициента регрессии, соблюдая предпосылки нор- мального распределения b относительно β В этом случае вычисляемая для проверки нулевой гипотезы 0 : 1 0 = β H статистика b S b t β − = имеет распределение Стьюдента. Тогда для коэффициента 0 β имеем: 2 , 1 2 1 1 ) ( 0 0 0 0 0 ∑ ∑ = = − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ β − = β − = n j j n j j j y b P f P S b S b t Величину ) ( j y S называют оценкой стандартной ошибки. 35 По доверительной вероятности 2 1 α − и числу степеней свободы f находят по таблицам распределения Стьюдента критическое значение , 1 2 f t α − В этом случае доверительный интервал для 0 β имеет вид: 0 0 , 2 1 0 0 , 2 1 0 b f b f S t b S t b α − α − + < β ≤ − Аналогично для 1 β имеем: 2 , ) ) ( ( 1 1 2 1 2 ) ( 1 1 1 1 1 ∑ ∑ = = − = − β − = β − = n j j n j j j j y b P f x x P S b S b t 1 1 , 2 1 1 1 , 2 1 1 b f b f S t b S t b α − α − + < β ≤ − Линия регрессии характеризует изменение условного математиче- ского ожидания выходной переменной y от вариации входной перемен- ной х. Точечной оценкой условного математического ожидания } | { x y M = η является ) ( ˆ x y . Построим доверительный интервал для } | { x y M = η в точках n j x j , 1 , = Известно что ) ( / }) | { ) ( ˆ ( j y X S y M x y − имеет распределение Стьюден- та с ∑ = − = n j j P f 1 2 степенями свободы: y S y t ˆ ˆ η − = , y f y f S t y S t y ˆ , 2 1 ˆ , 2 1 ˆ ˆ α − α − + < η ≤ − , где ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − + = ∑ ∑ ∑ = = = n j j j n j j n j j j y j y x x P x x P S S 1 2 1 2 1 2 ) ( 2 ) ( ˆ ) ( ) ( 1 Доверительные границы интервала для } | { x y M = η в точках j x можно изобразить графически (рис. 12). В точке x x = границы интервала наиболее близки друг к другу. Рас- положение границ доверительного интервала показывает, что прогнозы по уравнению регрессии с заданной точностью (интервальные оценки для η ) 36 Нижняя граница интервала $( ) ( ) y x b b x x = + − 0 1 y x x 1 x 2 x 3 x x j ... x n Доверительный интервал для η в точке х j Верхняя граница интервала Рис. 12. К понятию «точность» линейной регрессионной модели допустимы для значений x, не выходящих за пределы выборки. Иными словами, экстраполяция по уравнению регрессии может приводить к зна- чительным погрешностям. Нелинейная регрессия. Пусть уравнение регрессии задаётся поли- номом k-й степени: , ˆ 2 2 1 0 k k x b x b x b b y + + + + = коэффициенты которого будем определять методом наименьших квадра- тов по экспериментальным данным. Однако нам неизвестна степень полинома k. Для её определения ис- пользуем итерационный метод: вначале задаёмся степенью полинома, например k = 2, и определяем коэффициенты полинома методом наи- меньших квадратов. Затем вычисляем остаточную дисперсию по формуле ) 1 ( )) ( ˆ ( 1 2 , ост 2 + − − = ∑ = k n x y y S n j j j k Далее увеличиваем заданную степень полинома k на 1 и повторяем вышеописанную процедуру при увеличенном значении степени полино- ма. Как только 2 1 , ост + k S перестаёт быть значимо меньше 2 , ост k S , увеличе- ние степени k нужно прекратить. Значимость различия между 2 1 , ост + k S и 2 , ост k S проверяется по критерию Фишера: ), , , ( 2 1 2 1 , ост 2 , ост f f F S S F k k ρ < = + где f 1 , f 2 – число степеней свободы остаточной дисперсии в числителе и знаменателе соответственно. |