Российская академия наук институт проблем управления им. В. А. Трапезникова

Название	Российская академия наук институт проблем управления им. В. А. Трапезникова
Дата	24.04.2022
Размер	1.88 Mb.
Формат файла
Имя файла	casc2007.pdf
Тип	Документы #492705
страница	10 из 21

1 ... 6 7 8 9 10 11 12 13 ... 21

Выводы
1. Экспертные системы имеют широкое распространение во всех сферах промышленности.
Тренажерные технологии - сложные комплексы, системы моделирования и симуляции, компьютерные программы и физические модели, специальные
116
методики, создаваемые для того, чтобы подготовить личность к принятию качественных и быстрых решений.
2. Нами разрабатывается тренажёр мастера обжиговой печи по производству керамики и огнеупоров с применением “со- вмещённых” рулей и неполадок, а также технологической, фи- зико–химической моделей аналитического контроля. Особен- ность данной модели заключается в обработке логической информации, её воздействии на технологическую модель и по- лучение конечных результатов.
3. Разрабатываемая экспертная система (тренажёр) мастера обжиговой печи на базе нечёткой логики и искусственного ин- теллекта имеет большое значение для предотвращения аварий- ных ситуаций, повышения квалификации обслуживающего пер- сонала и обучения студентов старших курсов вузов технических специальностей.
Литература
1. СКРИБАНОВ Е.В., ТАРАТЫНОВ О.В., КОЛОТО А.В.,
ЧИСТЯКОВА А.С. Описание изобретения к патенту №
2280903 С1 / Универсальный обучающий комплекс.
2. ПЕРЕПЕЛИЦИН В.А., СИВАШ В.Г. Теоретические про-
гнозы
относительно
износоустойчивости
оксидо-
углеродистых огнеупоров // Новые огнеупоры № 5, 2003, с.
87 – 91 3. ПАДЕРИН С.Н., ФИЛИППОВ В.В. Теория и расчеты ме-
таллургических систем. М.: МИСИС, 2002. – 334 с.
4. КАРПОВ Ю.А., ГИММЕЛЬФАРБ Ф.А., САВОСТИН А.П.,
Сальников В.Д. Аналитический контроль металлургическо-
го производств. М.: Металлургия, 1995, 400 с.

117
СИСТЕМЫ ОЦЕНКИ ДЕЯТЕЛЬНОСТИ
В КОМПЕНСАТОРНЫХ И ЛИНЕЙНЫХ СИСТЕМАХ
МНОГОКРИТЕРИАЛЬНОГО СТИМУЛИРОВАНИЯ
Иващенко А.А. , Заложнев Д.А., Новиков Д.А., Щепкина М.А.
(Институт проблем управления РАН, Москва)
ai@chemdiv.com, dazal@rinform.ru, novikov@ipu.ru, masch@ipu.ru
Ключевые слова: система оценки деятельности, задача стимулирования, комплексное оценивание
Введение
Проведенный в [1] анализ многокритериальных систем сти- мулирования свидетельствует, что равновесие игры агентов, деятельность каждого из которых описывается вектором его действий, существенно зависит от оператора агрегирования, отображающего множество векторов индивидуальных действий агентов во множество результатов их совместной деятельности.
Другими словами, оператор агрегирования является компонентой системы оценки деятельности [13], которая ставит в соответствие
«детальным» действиям агентов менее подробные показатели, характеризующие эффективность их деятельности с точки зрения организации. Поэтому одной из задач управления, которая может и должна решаться совместно с синтезом оптимальных много- критериальных систем стимулирования, является выбор опти- мальной системы оценки деятельности. В настоящей работе приведены результаты решения этой задачи для компенсаторных и линейных систем многокритериального стимулирования.
Описание модели
Рассмотрим двухуровневую организационную систему (ОС), состоящую из одного центра на верхнем уровне иерархии и n агентов на нижнем.
118
Стратегией i-го агента является выбор действия y
i
∈ A
i
,
i
∈ N = {1, 2, ..., n} – множеству агентов; стратегией центра – выбор системы стимулирования {
σ
i
(z)}
i
∈N
, где z
i
= Q
i
(y)
∈ B
i
– наблюдаемый центром результат деятельности i-го агента,
y = (y
1
, y
2
, ..., y
n
)– вектор действий агентов, z = (z
1
, z
2
, ..., z
n
) – вектор результатов деятельности агентов, Q
i
: A
→
B
i
– оператор агрегирования,
σ
i
: B
→
ℜ
1
, i
∈ N, A =
∏
∈N
i
i
A
, B =
∏
∈N
i
i
B
Предпочтения центра отражены его целевой функцией
(1)
Φ
(z,
σ
(z)) = H(z) –
∑
∈N
i
i
z)
(
σ
, где H(
⋅
): B
→
ℜ
1
– функция дохода центра.
Предпочтения i-го агента отражены его целевой функцией:
(2) f
i
(y,
σ
i
(z))=
σ
i
(z) – c
i
(y), где c
i
(
⋅
): A
→
ℜ
1
– функция затрат i-го агента, i
∈ N.
Последовательность функционирования ОС такова: центр выбирает и сообщает агентам систему стимулирования (зависи- мость вознаграждения, выплачиваемого каждому из агентов, от вектора результатов их деятельности), затем агенты однократно, одновременно и независимо выбирают свои действия, которые приводят к соответствующим результатам деятельности. Целевые функции и допустимые множества, а также операторы агрегиро- вания, являются общим знанием среди всех участников ОС (цен- тра и агентов); агенты на момент принятия решений знают вы- бранную центром систему стимулирования; центр наблюдает результаты деятельности агентов, но может не знать их действий.
Обозначим:
P(
σ
(
⋅
))
⊆ A – множество действий, выбираемых агентами при системе стимулирования
σ
(
⋅
): обычно считается, что агенты выбирают действия, являющиеся равновесием их игры [1];
Q(P) =
∪
P
y
∈
{(Q
1
(y
1
), Q
2
(y
2
), ..., Q
n
(y
n
))}– множество резуль- татов деятельности агентов, которые могут реализоваться при выборе ими действий из множества P.
Эффективность стимулирования K(
σ
) определяется как га- рантированное значение целевой функции центра:

119
(3) K(
σ
) =
))
(
(
min
σ
P
Q
z
∈
[H(z) –
∑
∈N
i
i
z)
(
σ
].
В общем виде задача стимулирования формулируется сле- дующим образом – найти допустимую систему стимулирования, обладающую максимальной эффективностью:
(4) K(
σ
)
→
σ
max
Пусть действие каждого агента является вектором с действи- тельнозначными координатами: y
i
= (y
ij
)
j
∈ Ki
, где K
i
– множество компонентов, описывающих деятельность i-го агента (например, объем работ, их качество и т.д.).
Введем следующие предположения.
А.1. B
i
=
ℜ
1
, i
∈ N.
А.2. Функции затрат агентов аддитивны и сепарабельны:
(5) c
i
(y
i
) =
∑
∈
i
K
j
ij
ij
r
y
)
2
/(
)
(
2
, i
∈ N.
А.3. Результат деятельности i-го агента аддитивно зависит только от его собственных действий:
(6) z
i
= Q
i
(y
i
) =
∑
∈
i
K
j
ij
ij
y
β
, i
∈ N.
Содержательно совокупность «весов» {
β
ij
} в рассматриваемой модели представляет собой систему оценки деятельности аген- тов.
А.4. Функция дохода центра представляет собой взвешенную сумму компонентов векторов действий агентов:
(7) H(Q(y)) =
∑ ∑
∈
∈
Δ
N
i
K
j
ij
ij
i
y
, где веса
Δ
= {
Δ
ij
} отражают приоритеты центра.
Рассмотрим последовательно задачи выбора операторов аг- регирования для различных систем многокритериального стиму- лирования.
120
Компенсаторная система многокритериального сти-
мулирования в одноэлементной ОС
Фиксируем произвольный результат деятельности агента
z
∈
B и вычислим, во-первых, множество его действий, приводя- щих к данному результату:
(8) Y(z) = {y
∈
A | Q(y) = z}, и, во-вторых, минимальные затраты агента по достижению дан- ного результата:
(9) C(z) =
)
(
min
z
Y
y
∈
c(y).
Рассмотрим компенсаторную систему стимулирования
(10)
σ
K
(x, z) =
⎩
⎨
⎧
≠
=
x
z
x
z
x
C
,
0
,
)
(
, x, z
∈
B.
Видно, что система стимулирования (10) в рамках гипотезы благожелательности (при прочих равных агент выберет действия, наиболее благоприятные с точки зрения центра) побуждает агента выбрать действия, приводящие к «плановому результату» x
∈ B, причем затраты центра на стимулирование при этом минимальны.
Оптимальный реализуемый результат деятельности может быть найден из решения следующей стандартной оптимизацион- ной задачи
(11) z
*
= arg
B
x
∈
max
[H(x) – C(x)].
В [2] доказано, что в рамках гипотезы благожелательности система стимулирования (10)-(11) оптимальна.
Исследуем роль системы оценки деятельности. Из (9), опус- кая номер агента, получаем:
(12) C(z) =
∑
∈K
j
j
j
r
z
2 2
2
β
Обозначим
)
(
*
z
y
– вектор действий из множества Y(z), на котором достигается минимум затрат:

121
(13)
)
(
*
z
y
j
=
∑
∈K
j
j
r
r
z
ξ
ξ
ξ
β
β
2
, j
∈
K.
Вычислим оптимальное с точки зрения центра значение агре- гированного результата деятельности агента:
(14) z
*
(
β
) =
∑
∈
Δ
K
j
j
j
j
r
β
Действия, выбираемые агентом, и, следовательно, его ре- зультат деятельности, зависят от функции агрегирования (которая в рамках предположения А.3 задается набором «весов»
β
). Если выбор функции агрегирования (системы оценки деятельности) является прерогативой центра, то одним из «инструментов» управления является назначение таких весов, которые приводили бы к наиболее выгодному для центра (с точки зрения значения его целевой функции) поведению агента.
Поэтому рассмотрим задачу выбора системы оценки дея-
тельности (весов
β
= {
β
ij
}):
(15)
Φ
(y
*
(
β
),
σ
K
(z
*
(
β
)))
→
β
max
Для рассматриваемого случая получаем, что решение этой задачи дается следующим утверждением.
Утверждение 1. Если выполнены предположения А.1-А.4, то в одноэлементной ОС оптимальная система оценки деятельности должна удовлетворять следующему условию:
(16)
ξ
β
β
j
=
ξ
Δ
Δ
j
, j,
ξ
∈
K.
Содержательно условие (16) означает, что относительный приоритет компонентов вектора деятельности агента, устанавли- ваемый системой оценки его деятельности, должен определяться приоритетами центра. Такой вывод вполне соответствует здраво- му смыслу. Интересно отметить, что при этом параметры систе- мы оценки деятельности не зависят от индивидуальных характе- ристик агента, отражаемых в рассматриваемой модели вектором
r = (r
1
, r
2
, ..., r
k
), где k = |K|, «эффективностей» его деятельности по каждой из оцениваемых компонент вектора действий.
122
Линейная система многокритериального стимулиро-
вания в многоэлементной ОС
Пусть центр установил ставку оплаты
α
≥ 0, то есть предло- жил агентам систему стимулирования:
(17)
σ
Li
(z
i
) =
α
z
i
, i
∈ N.
Данная система стимулирования является унифицированной, так как ставка оплаты
α
одинакова для всех агентов. Однако, агенты могут быть различными, поэтому проанализируем, какие действия они будут выбирать при данной системе стимулирова- ния. Целевая функция i-го агента имеет вид:
(18) f
i
(y) =
α
Q
i
(y) – c
i
(y), i
∈ N.
Обозначим P(
α
) – множество равновесий Нэша игры агентов.
Тогда задача синтеза оптимальной линейной системы стимулиро- вания сводится к выбору оптимальной ставки оплаты:
(19)
α
*
= arg
0
max
≥
α
)
(
min
α
P
y
∈
[H(Q
1
(y), …, Q
n
(y)) –
α
∑
∈N
i
i
y
Q
)
(
].
Исследуем задачу (19).
Обозначим K
i
= {1, 2, …, k
i
} – множество показателей дея- тельности i-го агента (множество компонент вектора его дейст- вий).
Для того чтобы найти «равновесие Нэша» игры агентов, ре- шим следующую задачу:
(20)
⎩
⎨
⎧
=
→
≥
i
i
i
y
i
i
z
y
Q
y
c
i
)
(
min
)
(
0
В итоге получаем:
(21)
)
(
*
i
ij
z
y
=
∑
∈
−
−
−
i
i
i
i
i
K
i
i
ij
ij
i
r
r
z
ξ
γ
ξ
γ
γ
ξ
γ
β
β
1 1
1 1
1
)
(
)
(
)
(
, j
∈ K
i
, i
∈ N.
При этом минимальные затраты i-го агента на достижение результата деятельности z
i
≥ 0 равны
(22) С
i
(z
i
) =
i
i
z
γ
/ (
γ
i
b
i
), i
∈ N, где

123
(23) b
i
=
1 1
1 1
)
(
)
(
−
∈
−
−
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
∑
i
i
i
i
i
K
i
i
r
γ
ξ
γ
ξ
γ
γ
ξ
β
, i
∈ N.
Найдем для i-го агента результат деятельности
)
(
*
α
i
z
, дос- тавляющий максимум его целевой функции
α
z
i
– С
i
(z
i
):
(24)
)
(
*
α
i
z
=
(
)
1 1
−
i
i
b
γ
α
, i
∈
N.
В результате задача (19) превращается в стандартную опти- мизационную задачу:
(25)
α
*
= arg
0
max
≥
α
[h(z
*
(
α
)) –
α
∑
∈N
i
i
z
)
(
*
α
].
В [2] доказано, что если выполнены предположения А.1-А.4, то зависимость действий, выбираемых агентами, от ставки опла- ты описывается выражением (21), а оптимальной является ставка оплаты (25).
Вернемся к исследованию роли систем оценки деятельности.
Вычисляем:
(26)
)
(
*
α
ij
y
=
α
β
ij
r
ij
, j
∈ K
i
, i
∈ N.
(27)
Φ
(y
*
(
β
),
σ
L
(z
*
(
β
))) =
∑ ∑
∑ ∑
∈
∈
∈
∈
⎥
⎦
⎤
⎢
⎣
⎡
Δ
N
i
K
j
ij
ij
N
i
K
j
ij
ij
ij
i
i
r
r
2 2
)
(
2
β
β
Находя максимум (27) по параметрам системы оценки дея- тельности, получаем следующий аналог утверждения 1:
Утверждение 2. Если выполнены предположения А.1-А.4, то в многоэлементной ОС при использовании линейной системы многокритериального стимулирования оптимальная система оценки деятельности должна удовлетворять следующему усло- вию:
(28)
ξ
β
β
i
ij
=
ξ
Δ
Δ
i
ij
, j,
ξ
∈ K
i
, i
∈ N.
Содержательная интерпретация условия (28) такая же, что и у условия (16): относительный приоритет компонентов вектора
124
деятельности агента, устанавливаемый системой оценки его деятельности, должен определяться приоритетами центра
Литература
1
ГУБКО М.В., НОВИКОВ Д.А. Теория игр в управлении орга-
низационными системами. М.: Синтег, 2002. – 148 с.
2
ИВАЩЕНКО А.А., НОВИКОВ Д.А., ЩЕПКИНА М.А. Мо-
дели и механизмы многокритериального стимулирования в
организационных системах. М.: ИПУ РАН, 2006. – 60 с.
3
НОВИКОВ Д.А. Теория управления организационными сис-
темами. М.: МПСИ, 2005. – 584 с.

125

1 ... 6 7 8 9 10 11 12 13 ... 21