лекции. Поволжский государственный технологический университет волжский филиал
Скачать 1.61 Mb.
|
Метод наименьших квадратов (аналитический) Краткая теория метода наименьших квадратов. Допустим, что некоторая теоретическая модель предполагает линейную зависимость одной из характеристик системы от других: y = Σ i k i ·x i (i – число независимых переменных). Задача заключается в следующем: при фиксируемых параметрах x и измеренных значениях y рассчитать вектор параметров k, удовлетворяющий некоторому критерию оптимальности. В методе наименьших квадратов этим критерием является минимум суммы квадратов отклонений расчитанных значений y от наблюдаемых (экспериментальных): min Σ i (y s,i – y i )². Чтобы найти минимум функции, это выражение надо продифференцировать по параметрам и приравнять нулю (условие 44 минимума). В результате поиск минимума суммы квадратов сводится к простым операциям с матрицами (см. например МНК, регрессионный анализ). Если теоретическая модель представляет собой линейную зависимость от одного параметра (y = a + b·x), то решение выражается в виде простых формул, которые можно рассчитать даже на микрокалькуляторе: Z = nΣx i ² - (Σx i )²; a = (ΣyiΣx i ² – Σy i x i Σx i ) / Z; S a ² = S y ² Σx i ² / Z; b = (nΣy i x i – Σy i Σx i ) / Z; Sb² = S y ² n / Z; Sy² = Σ(y s,i – y i )² / (n – 2) (y s,i – рассчитанное значение, y i – экспериментально измеренное значение). При расчете погрешностей предполагается, что точность плана эксперимента (значений x) значительно превосходит точность измеряемых значений y, погрешность измерения которых подчиняется нормальному распределению. Использование пакета действующих программ Пакет программ расчета такой линейной модели приведен на сайте: http://www.sinisha.ru/math/mnk.html . Для расчета параметров линейной зависимости y = a + b·x по этим программам нужно ввести в соответствующие колонки приведенной таблицы наблюдаемые значения величин факторов. В результате расчета будет вычерчен график линейной зависимости y = a + b·x, приведены рассчитанные значения коэффициентов a и b,выборочная дисперсия и коэффициент корреляции. Лекция №10(4часа) Нахождение эмпирических уравнений (Линеаризация зависимостей) Представление зависимости в виде прямой оказывается удобным для обеспечения равной точности на всех участках графика (идеально, когда наклон прямой равен 45°). Кроме того, это удобно при экстраполяции, при применении метода наименьших квадратов, при нахождении эмпирического уравнения. Последнее получают на основе экспериментальных данных при изучении явлений или процессов, еще не имеющих прочной теоретической базы. Анализ полученных таким образом уравнений вскрывает некоторые закономерности и способствует углубленному пониманию явления, сами уравнения могут использоваться для расчетов и других практических целей. Методика заключается в нанесении данных на график в линейных координатах, затем через точки проводится плавная кривая. Плавность обеспечивается использованием лекал. Проверка состоит в наблюдении за ходом кривой при взгляде на нее в плоскости листа на уровне глаза (напоминает уходящие вдаль рельсы). Если плавность нарушена, мы обнаружим четкий излом. После этого выбирается наиболее подходящая функция и на кривой берут произвольные точки для проверки соответствия принятой функции. Проверку производят для «специфических» значений аргумента. Предположим, необходимо построить график функции , 1 1 2 x y причем х может принимать как 45 положительные, так и отрицательные значения. Выберем несколько значений аргумента, найдем соответствующие значения функции: х -2 -1 0 1 2 у 0,2 0,5 1 0,5 0,2. По полученным координатам построим точки и соединим их пунктирной линией (рис. 12). Проверим, правильно ли мы провели кривую линию между найденными точками графика. Возьмем х = 0,5. Тогда у = 0,8 и соответствующая точка ложится выше пунктирной кривой. Значит на участке 0<х<1 график идет не так, как мы думали. На «сомнительном» участке возьмем еще значения х = 0,25 и х = 0,75. Соединив полученные точки, получим правильную кривую без излома, что весьма существенно при обсуждении изучаемого явления. Начинающие исследователи выбор и преобразование системы координат производят методом проб и ошибок до тех пор, пока полный набор данных не даст в пределах разумного отклонения прямую линию. Распространено представление данных в логарифмических координатах (или наносят логарифмы значений х и у на линейную графическую бумагу). Тогда график простой и в виде функции a kx y (28). имеет вид прямой. Логарифмированием получим: log y=log k + a log x, (29). где k и а - согласующие постоянные. Используют также полулогарифмическую бумагу: одна шкала является логарифмической; другая - линейной. Прямая получается в том случае, если данные подчиняются закону ax k y 10 или ax ke y (30). После преобразования этой функции имеем: log y=log k+ax (31). 46 Чтобы получалась прямая, шкала по оси у должна быть логарифмической, а по оси х - линейной. Гиперболическую функцию bx a x y (32) можно представить в виде прямой, построив в линейных координатах зависимость х/у от х или 1/у от 1/х. Иногда в линейных координатах получают колоколообразную кривую. Это свидетельствует о том, что функция параболическая или более общая полиномная функция 2 cx bx a y (33). В этом случае строят в линейных координатах график зависимости 1 1 x - x y - y - - от х, где х 1 и y 1 - координаты произвольной точки на гладкой исходной кривой. Существуют и другие преобразования, приводящие к получению на графике прямой, а на этой основе - к получению ценной информации. Для неустановившихся тепловых процессов часто строят график зависимости температуры от логарифма времени. При расчете энергии активации химических реакций прямую получают, откладывая по оси абсцисс величину, обратную абсолютной температуре, а по оси ординат - логарифм константы скорости реакции. Кинетическая природа прочности материалов иллюстрируется на графиках зависимости .логарифма долговечности от напряжений при разных температурах. Представление процесса горения древесины в координатах логарифм изменения массы - продолжительность горения вскрыло существование стадии пламенного горения и стадии горения угольного остатка, что позволило разработать методы избирательного воздействия на механизм процесса с целью полного его исключения. Рассмотрим важнейшее свойство целлюлозных и древесных материалов - гигроскопичность. Кривые гигроскопичности устанавливают связь между давлением паров (относительной влажностью воздуха, выражающуюся в виде р/р 0 , где р - давление пара, находящегося в равновесии с материалом, р 0 - давление насыщенных паров воды) и количеством поглощенной воды (а). Они имеют s- образную форму и сложны для интерпретации. Была найдена такая зависимость, которая линеаризует связь между р/р 0 и а дли широкого участка изотермы (рис. 13). Это позволило выделить ту часть изотермы, которая при высоких давлениях паров отвечает капиллярной конденсации (а к ), оценить молекулярное поглощение воды при достижении области насыщения паров (а с ), а также установить значение коэффициента k, который оказался постоянным для различных видов целлюлозы, но зависим от степени делигнификации образца, содержания гемицеллюлоз, интенсивности тепловой обработки и др. Э.3. Файнберг, в работах которого обосновывается правомерность отнесения значений а c и а к к указанным явлениям, пишет: «Линеаризация зависимостей представляет собой один из важных приемов топологического анализа и необязательно требует непосредственного обоснования линейной зависимости между переменными в избранных координатах, хотя, в принципе, такая возможность не исключается». 47 Исследователи применяют графическое дифференцирование, кривой, получаемой по данным эксперимента. Например, растворимость целлюлозы зависит от длины ее макромолекул или степени полимеризации (СП). Тогда, приведя ступенчатое растворение; продифференцировав полученную кривую, мы получим представление о полидисперсности целлюлозы. Выпускаются приборы, которые позволяют получать данные в нормальном виде и в виде кривой, получаемой путем дифференцирования. В частности, такой принцип заложен в приборах для дифференциально-термического анализа (ДТА). В заключение следует отмстить, что результаты исследований, творчески и корректно обработанные и приведенные к линейному виду, содержат интересные и важные закономерности. Встречаются вместе с тем публикации и отчеты с необработанными данными, анализ которых показывает, какая ценная информация оказалась потерянной, а не владеющие методами обработки данных авторы подменяют доказательства умозрительными рассуждениями и декларациями. Планирование факторных экспериментов. Общие сведения Математический аппарат используется не только на стадии обработки результатов эксперимента; как это рассмотрено выше, но также и при подготовке и проведении опытов. С развитием формализованных методов стало возможным говорить о возникновении новой научной дисциплины - математической теории эксперимента. Если раньше выбор стратегии эксперимента определялся целиком интуицией исследователя, то теперь все чаще с целью повышения эффективности экспериментов, в которых изучается влияние нескольких факторов на функцию отклика, используют планирование эксперимента. Планирование эксперимента является одним из разделов математической теории эксперимента. Оно представляет собой оптимальное управление экспериментом при неполном знании механизма явлений. Планирование 48 эксперимента начало развиваться в 20—30-х годах прошлого века, его возникновение связано с именем английского ученого Ренальда Фишера. В нашей стране плодотворно развивают это направление В. В. Налимов, Ю. П. Адлер и др. Чем сложнее задача, тем эффективнее применение статистических методов планирования эксперимента. Считается, что новая стратегия исследования повышает эффективность эксперимента от двух до десяти раз. Выделим некоторые основные методы, использующиеся в исследованиях по химической переработке древесины. Дисперсионный анализ. Используют в задачах, когда нужно предложить такую схему расположения опытов, которая позволит разложить суммарную дисперсию на отдельные составляющие, отнеся их к конкретным изучаемым причинам. Этот метод используется наиболее широко. Факторные эксперименты. Используют в задачах, когда нужно оценить линейные эффекты и эффекты взаимодействия при большом числе независимых переменных (факторов). В отличие от классического эксперимента варьируют одновременно всеми факторами сразу обычно на двух уровнях. Исследование поверхности отклика. Это направление развивает методы факторного эксперимента. Варьируют многими независимыми переменными с целью найти оптимальный состав (рецептуру) материала или продукта, а также оптимальные условия проведения технологического процесса (например, варки целлюлозы, гидролиза растительного сырья и др.). При этом аналитическое выражение функции отклика до опытов неизвестно. Объект исследования в планировании эксперимента рассматривают как «черный ящик», то есть он представляет собой плохо организованную систему, а исследователь сознательно (по крайней мере, на этой стадии) отказывается от детального, традиционного изучения механизма всех явлений, протекающих в объекте (системе). Чтобы лучше представить концепцию «черного ящика», обратимся к рис. 1. Мы видим, что на объект исследования воздействуют входные параметры (факторы) посредством элементов испытательной аппаратуры, а также внешние переменные. Реакция объекта исследования проявляется в виде выходного параметра, или функции отклика, Задача формулируется так: необходимо установить связь между выходным параметром и факторами в условиях их одновременного действия, В простейшем случае результатом может быть одно уравнение. В общем случае математическое описание называют математической моделью. Модели, получаемые с помощью методов планирования эксперимента в виде уравнений регрессии, принято называть экспериментально-статистическими. Следует иметь в виду, что качество материала или качество технологического процесса чаше всего характеризуется несколькими функциями отклика. Например, стандарт на бумагу для бумажно-слоистого пластика регламентирует: массу 1 м 3 , прочность и сухом и во влажном состоянии, воздухопроницаемость, капиллярную впитываемость, белизну. Обычно невозможно найти такое сочетание значений факторов, при которых одновременно достигаются максимум прочности и минимум массы 1 м 2 материала. Максимальная производительность оборудования и минимальная себестоимость продукции также достигаются при различных 49 технологических режимах. Следовательно, выбор наилучших условии (оптимизация) осуществляется, как правило, при ограничениях на влияющие факторы и функции отклика. Величина, характеризующая уровень оптимизации процесса, называется критерием оптимальности. В частном случае критерием оптимальности может быть одна из функций отклика, характеризующих процесс. Оптимизация процесса (или состава) представляет собой целенаправленный поиск значений факторов, доставляющих экстремум критерия оптимальности с учетом ограничений, наложенных как на факторы, так и на функции отклика. В этом определении особо подчеркнем слово «целенаправленный». Алгоритмы поиска достаточно разнообразны: метод крутого восхождения, симплексный метод и др. Лекция № 11(2часа) Полный двухфакторный эксперимент. Поиск оптимальных условий ведения технологического процесса путем математического факторного планирования. Пусть нам при проведении исследований требуется определить оптимальные значения двух технологических факторов P и τ (P – давление прессования картона, τ – продолжительность его прессования или уплотнения в горячем прессе). Условием оптимизации факторов является обеспечение минимального значения показателя качества картона – его сжимаемости под давлением – С. Тогда С – параметр оптимизации. По традиционной методике необходимо исследовать всю область факторного пространства (в нашем случае плоскость P-0-τ). Результаты исследования дадут значения сжимаемости C как функции от P и τ, которую называют поверхностью отклика S (см. рис.14). Мы выбрали специально двухфакторную модель, чтобы ее наглядно показать на рисунке. В случае большего числа факторов (а их число не имеет ограничения) точного наглядного представления получить невозможно. Построив поверхность отклика (см. рис.14), на ней графическим методом можно найти минимальное значение сжимаемости (C мин ) и соответствующие ему оптимальные значения технологических Рис.14. К объяснению факторного планирования эксперимента 50 факторов P опт и τ опт . При такой традиционной методике исследований требуется проведение большого числа опытов, чтобы охватить всё факторное пространство, в особенности при большом числе факторов, учитывая необходимость их парного сочетания. При математическом факторном планировании используется небольшая область факторного пространства (на рис. 14 обозначена цифрами 1,2,3,4). Благодаря чему значительно сокращается количество опытов и время их проведения. По результатам опытов рассчитывают коэффициенты уравнения регрессии. Проверяют их значимость. Рассчитывают и проводят крутое восхождение (этот термин используется как к достижению максимума, так и минимума), по результатам которого находят оптимальные значения технологических параметров P опт и τ опт (см. рис. 14). Здесь может возникнуть вопрос: как же можно неплоскую поверхность отклика описывать линейным уравнением? Но надо помнить, что уравнение регрессии мы получаем для небольшой области факторного пространства, для которой с понятным допущением (с целью упрощения) этот участок поверхности отклика мы можем считать плоским. А, самое главное, - это уравнение дает направление движения к оптимуму. Поэтому используют термин «движение по градиенту». Теперь рассмотрим конкретный пример полного факторного планирования, при котором реализуют все возможные комбинации из k факторов на двух выбранных уровнях. Необходимое количество опытов при этом определяется по формуле N=2 k (34) . Для двухфакторного эксперимента N = 2 2 = 4 (см. табл. 1). В примере приведен поиск оптимальных условий уплотнения готового жёсткого картона . В качестве параметра оптимизации выбрали сжимаемость электрокартона. На основании априорной информации и предварительных опытов было установлено, что величина сжимаемости электрокартона (С) при проведении уплотнения зависит от давления уплотнения (Р), продолжительности уплотнения (τ) температуры плит пресса и влажности картона. Последние два фактора стабилизировали: температуру плит пресса - на уровне (150±3) °С, влажность образцов - на уровне 2-3% путём их сушки перед опытом в сушильном шкафу при температуре 105 °С в течении 10 часов. Температура (150±3)°С выбрана на основании того, что согласно литературным данным она соответствует температуре стеклования целлюлозы. На основании анализа предварительных опытов были выбраны интервалы варьирования, уровни факторов, составлена матрица планирования и проведены опыты по определению минимального значения сжимаемости при уплотнении картона в горячем прессе. Результаты опытов приведены в таблице 1. 51 Таблица 1. Матрица планирования и результаты опытов Количество параллельных опытов Кодированное значение фактора Натуральное значение фактора С i ,% S b , % P i τ i Р i , МПа τ i ,мин 4 + + 100 16 2,45 0,089 4 - + 20 16 3,10 4 + - 100 2 2,34 4 - - 20 2 3,88 По результатам опытов (таблица 1) были вычислены коэффициенты уравнения регрессии, дисперсия коэффициентов регрессии (S b 2 ) и значение доверительного интервала Δb = ± t c ·S b , где t c -критерий Стъюдента при 95% доверительной вероятности. С = 3,07 - 0,42·Р - 0,29·τ (35), Δb = ± 0,19 (36). Вспомогательные таблицы для расчета: P i x C i P i *C i +1 2,45 +2,45 -1 3,10 -3,10 +1 2,84 +2,84 -1 3,88 -3,88 4 p i=1 1 C = P C = - 0,42 4 i i (37), 4 i=1 1 C 0, 29 4 i i C (38), 4 0 i=1 1 C = C = 3,07 4 i (39), C = C 0 + C p P + C , или после учета (37), (38) и (39) получим уравнение регрессии (35) : C=3,07-0,42P-0,29 . i x C i i *C i +1 2,45 +2,45 +1 3,10 +3,10 -1 2,84 -2,84 -1 3,88 -3,88 |