53
11
,
,
,
,
2
,
1 1
D
D
R
xk
xj
x
yx
,
(3.32) где D – определитель матрицы (3.29).
Если число опытов n сравнимо с числом коэффициентов l=k+1, связи оказываются преувеличенными. Поэтому следует исключить систематическую погрешность, физический смысл которой состоит в следующем. Если разность n и l будет уменьшаться, то коэффициент множественной корреляции R будет возрастать и при n-l=0 окажется равным R=1, а уравнение регрессии превратится в функциональное уравнение гиперплоскости, которая пройдёт через все n эксперимен- тальных точек.
Значимость коэффициента множественной корреляции проверя- ется по критерию Стьюдента
f
d
R
t
S
R
t
,
;
1
k
n
f
d
,
(3.33) где
R
S
– СКО коэффициента множественной корреляции,
1 1
2
k
n
R
S
R
,
(3.34) или по критерию Фишера
2
,
1
,
2 2
1 1
f
d
f
d
F
k
R
k
n
R
F
;
1 1
k
n
f
d
,
k
f
d
2
(3.35)
Если коэффициент множественной корреляции оказался неожи- данно малым, хотя априорно известно, что между выходом у и входа- ми х
1
,…,х
к
должна существовать довольно тесная корреляционная связь, то возможными причинами такого явления могут быть сле- дующие:
1) ряд существенных факторов не учтён, и следует включить в рассмотрение дополнительно эти существенные входные параметры;
2) линейное уравнение плохо аппроксимирует в действительно- сти нелинейную зависимость
k
x
x
f
y
,....,
1
, и следует определить коэффициенты уже нелинейного уравнения регрессии методами рег- рессионного анализа;
3) рабочий диапазон рассматриваемых факторов находится в районе экстремума функции отклика – в этом случае следует расши- рить диапазон изменения входных переменных, а также перейти к не- линейной математической модели объекта.
Си бА
ДИ
54
Вопросы и задания для самоподготовки
1. Задачи, решаемые в дисперсионном анализе.
2. Дайте характеристику межгрупповой и внутригрупповой дисперсии.
3. Чем обусловлена вариация групповых средних вокруг обще- го среднего?
4. Какая параметрическая гипотеза принимается в качестве ну- левой при дисперсионном анализе? Порядок проверки этой гипотезы.
5. Что называют дисперсионным отношением?
6. Какое вероятностное распределение применяют для провер- ки гипотезы в дисперсионном анализе? Перечислите его числовые ха- рактеристики.
7. Дайте определение статистической и функциональной связи.
8. Что называют корреляционной связью?
9. Перечислите причины возникновения корреляционной связи между признаками.
10. Какие задачи решает корреляционно-регрессионный анализ?
11. В чем заключается суть метода наименьших квадратов?
12. Практическое значение парной линейной корреляции.
13. Что называют уравнением регрессии?
14. Дайте определение коэффициента корреляции.
15. Перечислите основные этапы изучения корреляционной за- висимости. Какие задачи решаются на каждом этапе?
16. Задача линейной множественной регрессии.
17. Определение коэффициентов множественной корреляции.
18. Подход к задаче регрессии с позиций матричной алгебры.
Матрицы планирования, наблюдений, коэффициентов.
19. Характеристики и область применения информационной матрицы.
4. МНОГОФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ
4.1. Общие сведения
В практике научных исследований параметр оптимизации обычно зависит от нескольких факторов. Многофакторные экспери- менты проводятся для построения линейных полиномиальных моде- лей. Вид полинома задается заранее, а его параметры определяются
Си бА
ДИ
55 по экспериментальным данным. Широкое распространение полино- миальных моделей объясняется тем, что исследуемую функцию мно- гих переменных
kxxxf,
,
,
2 1
в ограниченной области эксперимента обычно можно разложить в ряд Тейлора.
Для математического описания поверхности отклика исполь- зуют уравнение
kjukujkqjuqjuujqkjujuujkuuuxxxxxxxxxy
1 0
, (4.1) где
0
– свободный член;
ujquju
,
,
– коэффициенты,
учитывающие линейное влияние на отклик, взаимодействия факторов первого, вто- рого и т.д. порядков. Последнее слагаемое учитывает влияние на от- клик произведения всех факторов.
В практических задачах всегда можно ограничиться полинома- ми, включающими первые степени переменных
ux и их различные произведения или первые и вторые степени переменных и крайне редко – более высокие степени. Если переменная в модели имеет сте- пень
1
p, то в эксперименте она должна принимать не менее
p зна- чений или уровней.
По результатам эксперимента производится обработка данных по методу наименьших квадратов. Этот метод позволяет найти оцен- ку
b коэффициентов
, тогда математическая модель примет вид
kjukujkqjuqjuujqkjujuujkuuuxxxbxxxbxxbxbby
1 0
. (4.2)
Последовательность активного эксперимента:
1) разрабатывается схема проведения исследований, т.е. выпол- няется планирование эксперимента. При планировании эксперимен- тов обычно требуется с наименьшими затратами и с необходимой точностью либо построить регрессионную модель процесса, либо оп- ределить его оптимальные условия;
2) осуществляется реализация опытов по заранее составленно- му исследователем плану, т.е. осуществляется сам эксперимент;
3) выполняется обработка результатов измерений, их анализ и принятие решений.
Использование теории планирования эксперимента обеспечи- вает:
1) минимизацию, т.е.
предельное сокращение необходимого числа опытов;
2) одновременное варьирование всех факторов;
Си бА
ДИ
56
3) выбор чёткой стратегии, что позволяет принимать обосно- ванные решения после каждой серии опытов;
4) минимизацию ошибок эксперимента за счёт использования специальных проверок.
Рассмотрим пример планирования – хороший и плохой экспе- римент (В.В Налимов, Т.И. Голикова. Логические основы планирова- ния эксперимента.– М.: Металлургия, 1980.– 152 с.). Взвешивание трёх объектов А, В, С на аналитических весах.
Первый – традиционный – подход предусматривает последова- тельное взвешивание каждого из образцов. Исследователь вначале делает холостое взвешивание для определения нулевой точки весов, а затем по очереди взвешивает каждый из образцов. Это пример тради- ционного использования однофакторного эксперимента, т.е. здесь ис- следователь изучает реакцию на поведение каждого из факторов в от- дельности. Традиционная схема взвешивания трёх объектов пред- ставлена в табл. 4.1.
Таблица 4.1
Первая схема взвешивания
Номер опыта
A
B
C
Результат взвешивания
1
-1
-1
-1
y
0 2
+1
-1
-1
y
1 3
-1
+1
-1
y
2 4
-1
-1
+1
y
3
Масса каждого объекта оценивается только по результатам двух опытов: того опыта, в котором на весы был положен изучаемый объект, и холостого опыта. Например, масса объекта А:
0 1
y
y
m
A
.
Ошибка измерения предполагается независимой от измеряемой величины, аддитивной и имеющей одно и то же распределение. Тогда дисперсия измерения веса образца
2 2
2 2
2 0
1
y
y
A
, где
2
– дисперсия любого взвешивания. Такими же будут и диспер- сии весов образцов В и С.
Проведём теперь тот же эксперимент по несколько иной схеме: в первых трёх опытах последовательно взвешивают объекты А, В, С, в последнем опыте взвешивают все три объекта вместе, а «холостое» взвешивание не проводится (табл. 4.2).
Си бА
ДИ
57
Таблица 4.2
Вторая схема взвешивания
Номер опыта
A
B
C
Результат взвешивания
1
+1
-1
-1 y
1 2
-1
+1
-1 y
2 3
-1
-1
+1 y
3 4
+1
+1
+1 y
4
В этом случае масса каждого объекта будет задаваться форму- лами
4 3
2 1
2 1
y
y
y
y
m
A
;
4 3
1 2
2 1
y
y
y
y
m
B
;
4 2
1 3
2 1
y
y
y
y
m
C
Масса объекта А, вычисленная по приведённой выше формуле, оказывается не искажённой массами весов объектов В и С, так масса каждого из них входит в формулу для массы объекта А дважды с раз- ными знаками.
Дисперсия, связанная с ошибкой взвешивания по новой схеме,
2 2
2 2
2 2
4 3
2 1
4 1
y
y
y
y
A
Аналогичным образом находим:
2 2
B
,
2 2
C
Таким образом, по второй схеме взвешивания дисперсия полу- чается вдвое меньшей, чем при первой, традиционной, хотя в обоих случаях на взвешивание трёх объектов затрачивалось четыре опыта. В результате чего происходит увеличение точности эксперимента в два раза? В первом случае эксперимент поставлен так, что каждую массу получают в результате двух взвешиваний. При новой схеме каждая масса вычисляется по результатам всех четырёх взвешиваний. Вто- рую схему можно назвать многофакторной, поскольку здесь опери- руют всеми факторами так, что каждая масса вычисляется по резуль- татам сразу всех опытов, – вот главная причина уменьшения диспер- сии.
Си бА
ДИ
58
4.2. Полный факторный эксперимент
Полный факторный эксперимент (ПФЭ) – это эксперимент, в котором реализуются все возможные, неповторяющиеся комбинации уровней факторов.
Число опытов в ПФЭ определяется в соответствии с (1.3).
Обычно встречаются планы эксперимента типа
k
2
(два уровня варьи- рования факторов), реже
k
3 и очень редко при
3
p
в связи с резким ростом числа независимых опытов (табл. 4.3).
Таблица 4.3
Число опытов
k
p
N
p
k
2 3
4 2
4 8
16 3
9 27 81 4
16 64 256
Этапы планирования и реализации ПФЭ:
выбор параметров оптимизации и уровней их варьирования;
кодирование факторов;
составление матрицы планирования эксперимента;
рандомизация опытов;
реализация плана эксперимента;
проверка однородности дисперсий параллельных опытов, воспроизводимости результатов;
расчет коэффициентов уравнения регрессии, их ошибок и значимости;
проверка адекватности модели.
4.2.1. Кодирование факторов
Кодирование – это перевод натуральных значений уровней факторов в кодовые безразмерные величины с целью построения стандартной матрицы эксперимента.
Для факторов с непрерывной областью определения кодирова- ние осуществляют по формуле
u
u
u
u
x
x
x
X
0
,
(4.3)
Си бА
ДИ
59
где
u
X
– кодовое значение u-го фактора;
u
x
– натуральное текущее значение u-го фактора;
0
u
x
– начальный (нулевой) уровень фактора;
u
x
– интервал варьирования u-го фактора.
2
min max
u
u
u
x
x
x
(4.4)
После кодирования уровни факторов принимают значения: +1 – верхний уровень; –1 – нижний уровень; 0 – нулевой уровень. В каче- стве нулевого уровня принимают центр интервала, в котором предпо- лагается проводить эксперимент. Например, результат кодирования двух факторов
1
x
и
2
x
можно представить табл. 4.4.
Таблица 4.4
Кодирование факторов
Факторы
1
x
1
X
2
x
2
X
Интервал варьирования
0,75 1
1 1
Верхний уровень
2,5
+1 3
+1
Нижний уровень
1
–1 1
–1
Основной уровень
1,75 0
2 0
На рис. 4.1 представлено факторное пространство и уровни фак- торов до кодирования (а) и после кодирования (б).
4.2.2. Матрицы планирования эксперимента
Условия эксперимента обычно записывают в виде матриц пла- нирования эксперимента (табл. 4.5), где строки соответствуют раз- личным независимым опытам, а столбцы – значениям (уровням) фак- торов. На рис. 4.2 представлена геометрическая интерпретация ПФЭ.
(3; 2,5)
(3; 1)
(1; 2,5)
(1; 1)
1,75 2
1 2,5 3
1
x
2
x
1
x
2
0
(+1;+1)
(+1;-1)
(-1;+1)
(-1;-1)
1,75 2
1
2,5 3
1
x
1
а)
б)
Рис. 4.1. Кодирование факторов
Си бА
ДИ
60
Таблица 4.5
Матрица планирования эксперимента
2
2
Номер опыта
X
1
X
2
y
1
–1
–1
y
1 2
+1
–1
y
2 3
–1
+1
y
3 4
+1
+1
y
4
В общем случае планы типа
k
2
геометрически представляют со- бой совокупность точек, расположенных в вершинах гиперкуба, раз- мещенного в многомерном пространстве. Пространство, заключенное внутри гиперкуба, является областью планирования эксперимента.
Существует несколько способов построения матрицы планиро- вания большой размерности. Один из них основан на чередовании знаков: в первом столбце знаки меняются поочередно, во втором – через два, в третьем – через четыре и т.д.
В табл. 4.6 представлены матрицы ПФЭ (
4 3
2 2
;
2
;
2
), построенные по данному способу. Вместо единиц с соответствующими знаками указаны только знаки. Такое обозначение возможно для ПФЭ, по- строенного на двух уровнях факторов.
3 3
8 7
6 4
1
2
x
3
x
1
x
2
+1
+1
-1
-1
x
1
x
2
2 1
4 5
а)
б)
Рис. 4.2. Геометрическая интерпретация ПФЭ:
а – в двухмерном пространстве (N=2 2
); б – в трехмерном пространстве (N=2 3
)
Си бА
ДИ
61 Таблица 4.6
Матрица планирования ПФЭ Номер опыта
X1
X2
X3
X4 1
– – – – 2
+ – – – 3
– + – – 4
+ + – – 5
– – + – 6
+ – + – 7
– + + – 8
+ + + – 9
– – – + 10
+ – – + 11
– + – + 12
+ + – + 13
– – + + 14
+ – + + 15
– + + + 16
+ + + + ПФЭ относится к числу планов, которые являются наиболее эф- фективными при построении линейных моделей. Эффективность дос- тигается за счет следующих свойств:
симметричности относительно центра эксперимента. Алгеб- раическая сумма значений каждого из столбцов матрицы равна нулю:
0 1
NiuiX,
(4.5) где
u=1,2,3,
…,
k – номер фактора;
i – номер опыта;
N – число опытов;
условия нормировки. Сумма квадратов элементов каждого столбца матрицы равна числу опытов:
NXNiui
1 2
(4.6)
Это
является следствием того, что значения факторов в матри- це задаются равными +1 и –1;
ортогональности. Сумма почленных произведений двух столбцов матрицы равна нулю:
quXXNiqiui
,
0 1
;
(4.7)
ротатабельности. Экспериментальные точки в матрице пла- нирования располагаются так, что точность предсказания параметра
Си бА
ДИ