ВВедение в теорию управления организационными системами. В теорию управления организационными
Скачать 1.89 Mb.
|
в организационных системах В первой главе были выделены несколько видов управления – управление составом системы, ее структурой, институциональное, мотивационное и информационное управление. Наиболее подробно исследованным на сегодняшний день является мотивационное управление – управление интересами и предпочтениями участников ОС – поэтому начнем с рассмотрения моделей именно этого вида управления. 3.1. Постановка задачи стимулирования Содержательная интерпретация мотивационного управления – задача стимулирования. Несмотря на то, что под мотивацией в общем случае понимается и материальная, и моральная сторона: поощрения, побуждения и т.д., к сожалению, формальных моделей того, как человек реагирует на моральное вознаграждение, на сего- дняшний день почти нет. А математическая модель желательна для того, чтобы предсказывать поведение человека как реакцию на вознаграждение. Зато имеется модель материального воздействия. Можно строить аналогично и модели морального стимулирования. Но, если при построении модели материального стимулирования мы вводим вполне реальные предположения (например, предприятие стремится максимизировать прибыль), то при построении моделей морального стимулирования мы должны говорить, предположим, что на такие-то стимулы субъект будет реагировать так-то, а на такие-то – так-то. Это предположение обосновать уже сложно. Модели морального стимулирования более уязвимы для критики, а психология сегодня не дает нам должной основы. Поэтому будем описывать материальное стимулирование. Рассмотрим систему, состоящую из одного центра (руководите- ля, начальника, заказчика) и одного агента (подчиненного, исполни- теля), то есть приведенную на Рис. 1.11 (или Рис. 1.12в). Агент выбирает действие + = Î 1 R A y . Содержательная интер- претация действия: отрабатываемые часы, объем выпускаемой продукции. Начальник выбирает управление, то есть зависимость вознаграждения агента от выбираемого последним действия. Эта зависимость называется функцией стимулирования. Модель органи- зационной системы будем описывать по тем компонентам, которые 69 перечислены в первой главе (состав, структура, целевые функции, допустимые множества, информированность, порядок функциони- рования). Состав: центр, агент. Структура двухуровневая: начальник – подчиненный (центр – агент). Центр выбирает стимулирование, агент выбирает действие. Допустимые множества: множество до- пустимых действий – положительная полуось: часы, штуки, кило- граммы и т.п. Функцию стимулирования s(y) будем считать неотри- цательной и, когда это необходимо, дифференцируемой. Целевая функция центра представляет собой разность между функцией дохода H(y) (от деятельности подчиненного начальник получает доход (например, «продает на рынке» то, что произвел подчиненный)) и стимулированием s(y), которое выплачивается подчиненному: ) ( ) ( ) ), ( ( y y H y Ф s s - = × Целевая функция агента: то стимулирование, которое он полу- чает, минус его затраты: ) ( ) ( ) ), ( ( y c y y f - = × s s , где c(y) – функция затрат агента. Предположим, что функция дохода неотрицательна при любом действии y и принимает максимальное значение при 0 ¹ y : " y ³ 0 0 ) ( ³ y H , ) ( max Arg 0 0 y H y ³ Ï Относительно функции затрат предположим, что она неотрица- тельна, неубывающая и в нуле равна нулю: " y ³ 0 , 0 ) ( ³ y c 0 ) 0 ( = c . Последние два предположения не очень существенны с формальной точки зрения, но ноль – хорошая точка отсчета. Содер- жательная интерпретация: выбор агентом действия, равного нулю, то есть отказ от работы, соответствует нулевому объему работ. Логично взять и точку отсчета затрат, равной нулю. Проблемы идентификации задач стимулирования, например, в терминах пред- ложения труда, подробно описаны в [1]. Сформулируем задачу управления: агент будет выбирать дейст- вия из множества тех действий, которые обеспечивают максимум его целевой функции: )] ( ) ( [ max Arg )) ( ( 0 y c y P y - = × ³ s s . Это – игра 2 Г с побочными платежами (см. раздел 1.3). Реакция агента на управление – это множество тех действий, на котором достигается максимум целевой функции как разности между вознаграждением и затратами. Центр может предсказать поведение агента, следователь- 70 но, целевая функция центра зависит от действий и вознаграждения агента. Центр вычисляет минимум из всех действий агента по мно- жеству всех действий, на которых максимальна целевая функция агента (это соответствует принципу максимального гарантированно- го результата), и дальше центр хочет максимизировать эту величину выбором функции стимулирования, то есть выбором зависимости вознаграждения от действий агента: ) ( )) ( ( max ) ), ( ( min × × Î ® × s s s y Ф P y . С формальной точки зрения даже при конкретном виде целевой функ- ции задача получается сложная. Но можно сначала угадать решение, а потом доказать его оптимальность. Утверждение 3.1. Предположим, что использовалась некоторая система стимулирования s(×), такая, что при ее использовании цен- тром агент выбирал действие )) ( ( × Î s P x . Если взять другую систе- му стимулирования ) ( × s , которая равна нулю всюду, кроме точки x, и равна старой системе стимулирования в точке x, то и при новой системе стимулирования это же действие агента будет доставлять максимум его целевой функции. То есть, если центр использует некоторую систему стимулиро- вания, и агент выбирает действие x, то центр говорит: «я меняю систему стимулирования и буду платить по-другому: вознагражде- ния не будет нигде, кроме точки x, а за эту точку я буду платить по- старому» (см. Рис. 3.1), то агент по-прежнему будет выбирать старое действие: )) ( ( × Î s P x , где î í ì ¹ = = x y x y x y x , 0 ), ( ) , ( s s ) ( y s ) , ( y x s x y Рис. 3.1. Иллюстрация утверждения 3.1 Приведем формальное доказательство утверждения 3.1. Усло- вие того, что выбор действия x доставляет максимум целевой функ- 71 ции агента при использовании системы стимулирования s(×) можно записать в следующем виде: разность между стимулированием и затратами будет не меньше, чем при выборе любого другого дейст- вия: ) ( ) ( ) ( ) ( y c y x c x - ³ - s s A y Î " Теперь заменим систему стимулирования s(×) системой стиму- лирования ) ( × s , тогда получим следующее: в точке x система сти- мулирования ) ( × s по-прежнему равна системе стимулирования s(×). В правой части т записана система стимулирования ) ( × s , которая равна нулю при y ¹ x: ) ( 0 ) ( ) ( y c x c x - ³ - s x y ¹ " Если выполнялась первая система неравенств, то выполняется и новая система неравенств, так как в ней ослабили правую часть – если разность между доходом и затратами составляет положитель- ное число, то тем более она будет больше, чем ноль минус затраты. Следовательно, )) ( ( × Î s P x . Таким образом, утверждение 3.1 дока- зано. · С помощью утверждения 3.1 исследуем следующую ситуацию. Пусть центр использует некую систему стимулирования со сложной зависимостью вознаграждения агента от его действий. Утверждение 3.1 гласит, что центру достаточно воспользоваться классом систем стимулирования, в которых стимулирование отлично от нуля в одной точке. То есть центр может использовать систему стимулиро- вания, которая называется квазикомпенсаторной и имеет следую- щий вид: î í ì ¹ = l = s x y x y y x K , 0 , ) , ( Итак, для любой сложной системы стимулирования найдется компенсаторная система стимулирования, которая приведет к тому же выбору агента (то есть ничего не изменится ни для центра, ни для агента). Но ситуация существенно упростится с точки зрения слож- ности задачи стимулирования, и понимания агентом того, как и за что его стимулируют. Представьте, начальник говорит, что система стимулирования представляет собой «логарифм тангенса в квадра- те», ни один подчиненный этого не поймет. Гораздо проще будет, если му скажут: «Давай подпишем контракт: тебе нужно выбрать такое действие, за него ты получишь вот столько, если выберешь другое, то ничего не получишь». Просто и понятно с точки зрения 72 практики, а что это значит с точки зрения математики? Мы свели задачу поиска функции, принадлежащей множеству всех положи- тельнозначных дифференцируемых функций, к задаче поиска двух чисел: действия x и вознаграждения l, которое надо платить за выбор именно этого действия. Два числа найти проще, чем функ- цию! Гипотеза благожелательности. Рассмотрим целевую функцию центра. Стимулирование агента входит в нее со знаком «-», то есть вознаграждение агента центр старается минимизировать (желатель- но чтобы подчиненный работал за минимально возможную оплату). С точки зрения агента – наоборот. При фиксированных затратах он хотел бы получить побольше. Но, несмотря на желание агента, имеется иерархия – решения первым принимает центр. Поэтому центр должен рассуждать так: сколько как минимум надо заплатить агенту за некое действие, чтобы он согласился его выполнить. Понятно, что центр должен «работать» на кривой затрат агента, то есть должен сказать агенту: «Ты выбираешь такое-то действие, я тебе за него компенсирую затраты. А за любое другое действие я тебе ничего не заплачу». Компенсаторная система стимулирования принимает следую- щий вид: величина l должна быть равна затратам агента, быть может, плюс еще что-то ( d ³ 0). С точки зрения центра величину s(x) = c(x) + d надо сделать минимальной, то есть: î í ì ¹ = + = x y x y x c y x K , 0 , ) ( ) , ( d s Целевая функция агента изображена на Рис. 3.2. К затратам, изображенным со знаком минус, добавляется следующая система стимулирования: в точке x центр выплачивает вознаграждение d + ) (x c , а во всех остальных точках стимулирование равно нулю. Вычитая из положительного стимулирования затраты, получа- ем, что целевая функция агента имеет следующий вид – жирная линия на Рис. 3.2. Она всюду равна отрицательным затратам, кроме точки x. В точке x она равна величине d. Определим значение d ³ 0.Оно должно быть минимальным с точки зрения центра. А дальше – ее значение зависит от того, как формулируется задача. Если предполагается, что агент благожелательно относится к центру и готов среди двух точек, имеющих одинаковую для него 73 предпочтительность, выбрать точку, наилучшую для центра, то достаточно положить константу d равной нулю. Тогда, если d = 0, то точка максимума лежит на горизонтальной оси, максимум полезно- сти агента (разности между стимулированием и затратами), равный нулю, будет достигаться в двух точках: 0 (ничего не делать) и точно такую же нулевую полезность агент получит в точке x – действии, которого хочет от него добиться центр. Во всех остальных случаях его полезность отрицательная. Множество максимумов целевой функции агентов состоит из двух точек, и, если агент благожела- тельно настроен к центру, то он выберет x (гипотеза благожела- тельности). y -c(y) f(y) x 0 d Рис. 3.2. Целевая функция агента Если же центр не хочет рассчитывать на благожелательность агента, а хочет гарантировать, чтобы агент выбрал какое-то дейст- вие, отличное от нуля, ему достаточно положить d, равной любому сколь угодно малому строго положительному числу, чтобы значение целевой функции агента в точке x было строго больше нуля. Други- ми словами, d характеризует «различие» между принципами песси- мизма и оптимизма. Различие это невелико, так как константа d может быть выбрано сколь угодно малой. Таким образом, мы сначала перешли от системы стимулирова- ния общего вида к системе стимулирования, зависящей от двух скалярных параметров: точки плана – то, чего хочет центр добиться от агента, и вознаграждения агента l. Потом нашли значение l, равное затратам агента плюс d. В этот параметр d для любой задачи можно «зашить» любую «моральную» составляющую, то есть его можно интерпретировать, как мотивационную надбавку. С фор- мальной точки зрения агент выбирает точку максимума своей целе- вой функции, но если d = 0, его полезность равна нулю независимо 74 от того, не работает ли он вообще или выполняет план, то есть понятно, что в этом с точки зрения практики есть что-то подозри- тельное, так как, если не работает – получает ноль, и если работает – получает ноль. Тогда d (мотивационная надбавка) показывает, сколько обещают человеку за то, что он работает, и работает именно в данной организации. Таким образом, все внемодельные мотиваци- онные аспекты могут быть заложены в d. Какая она должна быть – эта величина d – это не математиков и экономистов, дело. Этими аспектами занимаются менеджмент и психология. Принцип компенсации затрат. Предположим, имеется функ- ция затрат агента c(y) (см. Рис. 3.3), эта функция неотрицательна, в нуле равна нулю и не убывает. Неубывание означает, что чем боль- ше агент работает, тем больше у него затраты. Предположим, что функция дохода центра H(y) достигает максимума при ненулевых действиях агента. Это – существенное условие, так как если макси- мум дохода центра достигается при нулевых действиях агента, то нет и задачи стимулирования (побуждения к совершению опреде- ленных действий): зачем стимулировать агента, если максимум выигрыша центра достигается, когда агент ничего не делает. A 0 c(y) H(y) y x * B S Рис. 3.3. Область компромисса в задаче стимулирования Теперь рассмотрим эту ситуацию (см. Рис. 3.3) с точки зрения центра и агента. Ноль характеризуется тем, что, если агент ничего не делает, то его затраты равны нулю, и, если центр ему за это ничего не платит, то агент получает нулевую полезность. Таким образом, оценка снизу выигрыша агента – 0: ничего не делает, ничего не 75 получает. Значит, агент согласится что-то делать, если вознагражде- ние, которое будет платить ему центр, будет не меньше, чем его затраты. Таким образом, имеется ограничение: вознаграждение должно быть не меньше затрат агента. Значит, агента устраивают все точки на Рис. 3.3, которые лежат выше функции затрат c(y). С точки зрения центра: центр может получить какую-то полез- ность в случае нулевого действия агента, то есть если он ничего ему не платит. И он точно не заплатит агенту больше, чем доход, кото- рый он получает от деятельности агента. То есть с точки зрения центра допустимыми являются комбинации действий и вознаграж- дений, расположенные ниже функции дохода центра H(y) (см. Рис. 3.3). Так как центр стремится минимизировать выплаты агенту при условии, что последний выбирает требуемое действие, оптимальная точка в рамках гипотезы благожелательности должна лежать на нижней границе области, заштрихованной на Рис. 3.3, то есть сти- мулирование в точности должно равняться затратам агента. Этот важный вывод получил название «принцип компенсации за- трат». В соответствии с этим принципом, для того чтобы побудить агента выбрать определенное действие, центру достаточно компен- сировать затраты агента. Пересечение этих двух областей (выплат, бóльших затрат агента и меньших дохода центра) дает нам некоторую область. Формально множество реализуемых действий )} ( ) ( | { y c y H A y S ³ Î = – множество таких действий агента, что доход от его деятельности не превосходит его затраты. Совокупность множества действий S и вознаграждений за эти действия, устраивающих одновременно и центра и агента (то есть размер вознаграждения должен быть не меньше затрат агента и не больше дохода центра) называется обла- стью компромисса. Она заштрихована на Рис. 3.3. Принцип декомпозиции и принцип агрегирования. Мы рас- смотрели простейшую систему, состоящую из одного центра, из одного агента. Теперь усложним задачу. Рассмотрим систему, со- стоящая из нескольких агентов, подчиненных одному центру. То есть, от структуры, приведенной на Рис. 1.12в, перейдем к простей- шей веерной структуре – см. Рис. 3.4 (и Рис. 1.12г). Предположим, что затраты каждого агента зависят не только от его собственных действий, но и от действий других агентов. Соот- ветственно вознаграждение будет зависеть от действий всех агентов. 76 А 1 А 2 А n Ц … Рис. 3.4. Веерная структура Есть параметр – план, и агенту платят в зависимости от вы- бранного им действия. Понятно, что не следует ничего платить, если агент выбирает действие, не равное соответствующей компоненте плана. Сколько ему нужно платить, если он выбирает действие, совпадающее с планом? Ему нужно платить что-то «около» его затрат, но затраты каждого агента зависят от действий всех агентов. Следует помнить, что следует платить так, чтобы агент выполнял план. Оказывается, нужно компенсировать агенту его затраты в случае, если он сделал то, что нужно, независимо от действий, вы- бранных другими агентами. В этом заключается принцип декомпози- ции (см. раздел 3.3). Рассмотрим ситуацию, когда центр не может наблюдать дейст- вие каждого агента в отдельности, а может наблюдать лишь некий агрегат – результат деятельности всего коллектива в целом. Какова должна быть система стимулирования в данном случае. Оказывает- ся, что если центр может определить минимальные затраты, которые должны понести все агенты для достижения какого-либо общего результата, то эффективная система стимулирования будет иметь следующий вид – каждому агенту компенсируются его минималь- ные затраты, при условии, что результат коллективной деятельности удовлетворяет требованиям центра. Более того, оказывается, что центр не несет никаких потерь, не наблюдая индивидуальные дейст- вия каждого агента. То есть, для построения эффективной системы стимулирования не обязательно наблюдать индивидуальные дейст- вия каждого из агентов, достаточно лишь знать результат их общей деятельности и уметь вычислять минимальные затраты агентов на его достижение. В этом заключается принцип агрегирования [4]. |