методы принятия управленческих решений. методы принятия УР. Содержание введение 5 1 Основы методологии теории принятия решений 7
Скачать 5.15 Mb.
|
5.3 Принятие решений в условиях неопределенности5.3.1 Принятие решений при линейной упорядоченности состояний внешней средыЛПР не знает закона распределения вероятностей состояний внешней среды, но располагает информацией, позволяющей упорядочить эти состояния по вероятности их появления. Последовательность принятия решения в рассматриваемой ситуации описывается следующим алгоритмом. Шаг 1. Установить отношение порядка на множестве Е состояний внешней среды. Шаг 2. Найти точечную оценку распределения вероятностей состояния внешней среды, т.е. некоторое конкретное распределение , удовлетворяющее введенному на первом шаге отношению порядка . Шаг 3. Для найденной точечной оценки найти оптимальную альтернативу по одному из критериев (или их группе), используемых для ПР в условиях риска. Шаг 4. Проверить, является ли найденное решение оптимальным для всех других распределений , но удовлетворяющих данной системе отношений порядка . Если «да», то решение принимается, иначе — перейти к следующему шагу. Шаг 5. Наложить на распределение дополнительные условия (их характер рассмотрен ниже) и проверить их выполнение. Если эти условия выполнены, то решение принимается, иначе — ввести дополнительные отношения порядка в и вернуться к шагу 2. Рассмотрим алгоритм более подробно. На шаге 1 ЛПР устанавливает отношение порядка на множестве Е. Простейший способ упорядочения — введение на множестве Е отношения предпочтения следующим образом: где — вектор распределения вероятностей внешней среды; — вероятность появления состояния . Если такое упорядочение выполнено для всех пар (, то получаем линейное отношение частичного порядка и будем считать, что состояния внешней среды перенумерованы таким образом, что . Шаг 2. Вычисление точечных оценок распределений вероятностей, удовлетворяющих введенным отношениям порядка, может быть выполнено различными способами. Один из них предложен П. Фишберном. Оценки Фишберна образуют убывающую арифметическую прогрессию вида Другие способы можно найти в работе [30]. Шаг 3. Находим оптимальную альтернативу, например, по критерию Байеса: . Пусть это критерий при альтернативе . Шаг 4. Необходимо проверить, будет ли оптимальным решением не только для найденного распределения , но и для любого другого распределения, удовлетворяющего введенному на шаге 1 отношению порядка . При использовании критерия Байеса можно гарантировать тогда и только тогда, когда или для всех i, (5.1) где Р — множество распределений, удовлетворяющих заданному отношению порядка . Очевидно, что для выполнения (5.1) необходимо и достаточно, чтобы . (5.2) Поскольку выражение представляет собой в рассматриваемом случае не что иное, как систему линейных ограничений, накладываемых на компоненты вектора Р, то выражение (5.2) определяет множество задач, состоящее из задач линейного программирования (при условие 5.2 выполняется). Шаг 5. Этот шаг и последующие удобнее рассмотреть на примере. Пример Пусть таблица значений оценочного функционала задана (табл. 5.2). Предположим, что на первом шаге алгоритма на множестве состояний среды введено отношение частичного порядка с помощью неравенств Таблица 5.2 — Исходные данные
Вычислим по формуле Фишберна точечные оценки: Для выбора оптимальной стратегии воспользуемся критерием Байеса. Математическое ожидание полезностей Наилучшей стратегией по Байесу является стратегия . Проверим, для любого ли распределения вероятностей, удовлетворяющего заданному отношению порядка, эта стратегия оптимальна. для всех альтернатив i,кроме второй, на любых допустимых распределениях вероятностей, если (5.3) Таким образом, мы имеем 3 задачи линейного программирования (табл.5.3). Таблица 5.3 — Задачи линейного программирования
Как видно из табл. 5.3, условие 5.3 выполняется только для стратегий и , но не для . Следовательно, решение , полученное на основе точечных оценок Фишберна, лучше, чем и , , но — это дополнительное ограничение. Оно не противоречит ранее введенной системе ограничений (есть общая область допустимых решений и при этом условии). Если ЛПР считает, что последнее ограничение выполняется (а это так), то оптимальна для любого распределения вероятностей, которое может иметь место. Если бы ограничение не выполнялось (т.е. не было общей области допустимых решений), то в рассмотрение вводится дополнительное отношение — (но не , а) и переходим на шаг 2. 5.3.2 Принятие решений при отсутствии информации о состоянии внешней средыЛПР не располагает никакой информацией о вероятностях появления различных состояний внешней среды , в том числе и об их соотношении. Простейший способ решения задачи состоит в использовании точечных оценок неизвестного априорного распределения, причем критерии выбора в таких условиях принимают известный «принцип недостаточного основания», предложенный Даниилом Бернулли, и означают, что если нет данных, позволяющих считать одно состояние среды более вероятным, чем любое другое, то априорные вероятности всех этих состояний следует считать равными Оптимальной по критерию Бернулли—Лапласса считается альтернатива, максимизирующая математическое ожидание полезности, т.е. . Способ, использующий понятие Байесова множества Рассмотрим множество всевозможных распределений вероятностей состояний внешней среды. Так как , то в каждом распределении достаточно задать лишь вероятность, например, Обозначим . Очевидно, что каждому конкретному распределению вероятностей соответствует точка -мерного пространства с координатами , лежащая в замкнутой области, определяемой соотношениями: . Область, определяемая таким образом, называется -мерным симплексом . Если n = 2, то одномерный симплекс — это отрезок [0,1], если m = 3, то двумерный симплекс — треугольник. Если в распоряжении ЛПР имеется m альтернатив, то этот симплекс можно разбить на m непересекающихся подмножеств, таких, что в любой точке этого подмножества оптимальной по критерию Байеса является одна и та же альтернатива. Такое подмножество (из ), соответствующее стратегии , называется байесовым множеством этой стратегии. Будем обозначать его или . Понятию байесова множества можно дать простую геометрическую интерпретацию. Если среда может находиться всего в двух состояниях n = 2 с вероятностями и , то симплекс — есть отрезок. Математическое ожидание полезности при использовании альтернативы . Таким образом, каждой альтернативе соответствует прямая на плоскости с системой координат . Приведем пример построения байесовых множеств в одномерном симплексе при наличии трех альтернатив (рис. 5.2). Множеству соответствует отрезок симплекса, на котором альтернатива обеспечивает максимум математического ожидания полезности. Можно доказать, что каждое байесово множество образует в -мерном пространстве замкнутый выпуклый многогранник (в нашем случае при n = 2 — отрезок, а при n = 3 — многогранник). Объем этого многогранника будем рассматривать как меру байесова множества и обозначим ее . Назовем интегральным потенциалом альтернативы величину где числитель характеризует интегральное (средневзвешенное по всем априорным распределениям) байесово значение оценочного функционала; — мера (объем) симплекса, и, следовательно, знаменатель определяет геометрическую вероятность непопадания вектора p в байесово множество альтернативы . Естественно предположить, что ЛПР стремится к увеличению числителя при возможно меньшем знаменателе. Отсюда получаем критерий наибольшего интегрального потенциала: . Пример Задана матрица значений оценочного функционала (табл. 5.4). Найдем зависимость математического ожидания полезности от вероятности появления состояния и изобразим ее на рис. 5.3. Таблица 5.4 — Исходные данные
Длины соответствующих отрезков: Мера симплекса: . Вычислим значения интегрального потенциала для всех стратегий: Оптимальной альтернативой следует считать . 5.3.3 Принятие решений в условиях противодействияИмеется активная внешняя среда, которая стремится принять такие состояния, сводящие к минимуму эффективность процесса управления. ПР в таких условиях рассматривается в теории игр. Основными критериями ПР в этой ситуации являются: 1) максиминный критерий Вальда, в соответствии с которым ЛПР выбирает такую стратегию, что при любом состоянии внешней среды обеспечивается доход не меньше некоторой гарантированной величины (принцип наибольшего гарантированного результата): ; 2) критерий минимаксный Сэвиджа, при использовании которого минимизируются максимальные значения риска или сожаления : , . Пример Дана матрица доходов (табл. 5.5). Найдем в каждом столбце матрицы максимальный элемент: , где — доход, получаемый ЛПР, при условии, что оно знает состояние внешней среды . Разность между максимально возможным и реальным доходом, соответствующим выбранной стратегии и состоянию внешней среды , называется риском (табл. 5.6): . Риск характеризует потери, которые несет ЛПР при выборе альтернативы, отличной от оптимальной. Таблица 5.5 — Д Альтернативы и дают наибольший гарантированный выигрыш. Перейдем к матрице риска . анные доходов
Таблица 5.6 — Данные потерь
В некоторых ЗПР оценка исходов производится не по доходу, а по потерям , которые несет ЛПР при альтернативе и состоянии среды . Найдем минимальный элемент в каждом столбце , где — минимальные потери ЛПР, при условии, что оно знает состояние . Сожаление — это разность: . Оно определяет дополнительные (относительно ) потери ЛПР в случае неудачного для данного состояния выбора альтернативы . 5.3.4 Принятие решений при наличии неопределенной информации о состоянии внешней средыЛПР может установить некоторый уровень пессимизма-оптимизма в отношениях наихудшего и наилучшего для него состояний среды. Критерий Гурвица учитывает в отличие от критерия Вальда и Сэвиджа лишь частичный антагонизм внешней среды , где — показатель Гурвица. При получаем критерий Вальда. Пример Дана матрица реализаций (табл. 5.7). При каких значениях альтернативы будут наилучшими? Таблица 5.7 — Исходные данные
при всех . , если или (рис. 5.4). 5.3.5 Принятие решений при нечетком описании множества состояний внешней средыЛПР знает полный перечень состояний внешней среды множество альтернатив матрицу исходов Но имеющаяся информация не позволяет четко определить состояние среды. Принятие решения в таком случае осуществляется с использованием теории нечетких множеств [18, 38]. Пусть порождает нечеткое множество где — состояние среды, носитель нечеткого множества — функция принадлежности состояния нечеткому множеству Полагаем, что функция принадлежности известна и множество ее значений для представлено вектором Для оценки альтернатив могут быть использованы критерии принятия решений в условиях вероятностной неопределенности (п. 5.2.2), если вместо вероятности использовать взвешенную оценку, равную Например, при использовании критерия Байеса оценка альтернативы будет иметь вид |