ТЕОРИЯ ПРИНЯТИЯ РЕШЕНИЙ. Lekcciya_11 В УСЛОВИЯХ НЕ ОПРЕДЕЛЕННОСТИ. Лекция 11 Принятие решений в условиях неопределенности. Оценка сложных системы в условиях
Скачать 0.57 Mb.
|
нестохастической неопределенности Особенностями оценки сложных систем в условиях неопределенностиявляются: 1. Наличие в управляющей системе в качестве элемента ЛПР, осуществляющему управление на основе субъективных моделей, которые приводят к большому разнообразию поведения системы. 2. Алгоритм управления строит сама система управления, преследуя помимо целей старшей системы свои целине всегда совпадающие с внешними. 3. На этом этапе оценки ситуации в ряде случаев исходят не из фактической ситуации, а из той модели, которую использует ЛПР. 4. В процессе принятия решений большую роль играют логические рассуждения ЛПР, неподдающиеся формализации классическими методами математики. 5. При выборе управляющего воздействия ЛПР может оперировать нечеткими понятиями, отношениями и высказываниями. 6. В большинстве классов задач управление АСУ отсутствуют объективные критерии оценивания достижения целевого и текущего состояния ОУ, а также статистических данных для определения вероятностных законов для конкретного принятого решения. Таким образом, методы принятия решений, используемые для детерминированных и вероятностных решений, для данного класса задач неприменимы Поэтому для оценки систем в условиях нестохастической неопределенности используются методы, в основе которых лежит матрица эффективности в виде где i a - вектор управляемых параметров, определяющих свойства системы ; j n - вектор неуправляемых параметров, определяющих состояния обстановки ; 11 k - значение эффективности системы i a для состояния обстановки j n ; ) ( i a K - эффективность системы. В зависимости от характера неопределенности операции делятся на | |. Предположим вначале, что априорная информация о вероятностях возникновения той или иной ситуации отсутствует. Теория статистических решений предлагает несколько критериев оптимальности выбора решений. Выбор того или иного критерия неформализуем, он осуществляется человеком, принимающим решения, субъективно, исходя из его опыта, интуиции и т. д. Рассмотрим эти критерии. Классические критерии принятия решений . Критерий среднего выигрыша Данный критерий предполагает задание вероятностей состояния обстановки i P . Эффективность системы оценивается как среднее ожидаемое значение (МОЖ) оценок эффективности по всем состояниям обстановки l j ij j i m i k P a K 1 , 1 ) ( l j ij j i опт m i k P K 1 , 1 , max Критерий минимакса ij j i k a K max ) ( ) max ( min ij j i опт k K Критерий максимакса. Этим критерием предписывается оценивать системы по максимальному значению эффективности и выбирать в качестве оптимального решения обследующую эффективность с наибольшим из максимумов l j m i k a K ij j i , 1 , , 1 , max ) ( l j m i k K ij j i опт , 1 , , 1 , max Это самое оптимистическое решение. При этом риск max. Критерий Лапласа Поскольку вероятности возникновения той или иной ситуации неизвестны, будем их все считать равновероятными. Тогда для каждой строки матрицы выигрышей подсчитывается среднее арифметическое значение оценок. Оптимальному решению будет соответствовать такое решение, которому соответствует максимальное значение этого среднего арифметического, те Критерий Вальда. В каждой строчке матрицы выбираем минимальную оценку. Оптимальному решению соответствует такое решение, которому соответствует максимум этого минимума, те) Этот критерий очень осторожен. Он ориентированна наихудшие условия, только среди которых и отыскивается наилучший и теперь уже гарантированный результат. Критерий Сэвиджа. В каждом столбце матрицы находится максимальная оценка и составляется новая матрица, элементы которой определяются соотношением Величину называют риском, под которым понимают разность между максимальным выигрышем, который имел бы место, если бы было достоверно известно, что наступит ситуация , и выигрышем при выборе решения в условиях . Эта новая матрица называется матрицей рисков. Далее из матрицы рисков выбирают такое решение, при котором величина риска принимает наименьшее значение в самой неблагоприятной ситуации, те Сущность этого критерия заключается в минимизации риска. Как и критерий Вальда, критерий Сэвиджа очень осторожен. Они различаются разным пониманием худшей ситуации в первом случае — это минимальный выигрыш, во втором — максимальная потеря выигрыша по сравнению стем, чего можно было бы достичь в данных условиях. Производные критерии. Критерий Гурвица. Вводится некоторый коэффициента, называемый коэффициентом оптимизма, . В каждой строке матрицы выигрышей находится самая большая оценка и самая маленькая. Они умножаются соответственно на и и затем вычисляется их сумма. Оптимальному решению будет соответствовать такое решение, которому соответствует максимум этой суммы, те) При = 0 критерий Гурвица трансформируется в критерий Вальда. Это случай крайнего пессимизма. При = 1 (случай крайнего оптимизма) человек, принимающий решение, рассчитывает на то, что ему будет сопутствовать самая благоприятная ситуация. Коэффициент оптимизма а назначается субъективно, исходя из опыта, интуиции и т. д. Чем более опасна ситуация, тем более осторожным должен быть подход к выбору решения и тем меньшее значение присваивается коэффициенту Примером принятия решений в условиях неопределенности может служить рассмотренная выше задача выбора метода кодирования картографической информации, когда вероятности появления того или иного вида этой информации неизвестны. Критерий Ходжа-Лемана. Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае - ММ-критерий, темы ищем max i e ir = max i e ij i j n q 1 + (1- ) min j e ir , 0 1. Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом матрица решений e ij дополняется столбцом, составленным из средних взвешенных (с весом const) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца. При = 1 критерий Ходжа-Лемана переходит в критерий Байеса- Лапласа, а при = 0 становится минимаксным. Выбор субъективен т. к. Степень достоверности какой-либо функции распределения - дело тѐмное. Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам i j ij 0 0 max и наименьшим значением соответствующей строки. В третьем столбце помещаются разности между наибольшим значением каждой строки и наибольшим значением maxe i j 0 той строки, в которой находится значение e i j 0 0 . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение e e i j j ij 0 из второго столбца должно быть или равно некоторому заранее заданному уровню риска доп. Значение же из третьего столбца должно быть больше значения из второго столбца. Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение 1) вероятности появления состояний F j неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения 2) необходимо считаться с появлением различных состояний как по отдельности, таки в комплексе) допускается ограниченный риск) принятое решение реализуется один разили многократно. BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска доп и, соответственно, оценок риска i не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, ноне исключено полностью. Условие j ij j i j i e e max существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом неизвестно, однако, четких количественных указаний, в каких случаях это условие следовало бы опускать. Критерий произведений. e ir : = max П Правило выбора в этом случае формулируется так : Матрица решений e ij дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца. Применение этого критерия обусловлено следующими обстоятельствами : 1) вероятности появления состояния F j неизвестны 2) с появлением каждого из состояний по отдельности необходимо считаться 3) критерий применим и при малом числе реализаций решения 4) некоторый риск допускается. Критерий произведений приспособлен в первую очередь для случаев, когда все e ij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвига с некоторой константой а ij e ij . Результат при этом будет, естественно зависеть от а На практике чаще всего а := min ij e ij +1. Если же никакая константане может быть признана имеющей смысл, то критерий произведений неприменим. Пример. Рассмотрим пример ММ-критерий критерий B-L F 1 F 2 F 3 e ir = min j e ij max i e ir e ir = e ij j max i e ir E 1 -20.0 -22.0 -25.0 -25.0 -25.0 -22.33 E 2 -14.0 -23.0 -31.0 -31.0 -22.67 E 3 0 -24.0 -40.0 -40.0 -21.33 -21.33 Построение оптимального решения для матрицы решений о проверках по критерию Гурвица имеет вид (при Св С СВ данном примере у решения имеется поворотная точка относительно весового множителя С : до Св качестве оптимального выбирается Е, а при больших значениях Е 1 Применение критерия Ходжа-Лемана (q = 0.33, = 0.5, в 10 3 ) : e q ij j j min j e ij e ij j q j (1- ) min j e ij e ir max i e ir -22.33 -25.0 -11.17 -12.5 -23.67 -23.67 a или c Q n j j j 1 . Получается, что мы будем проводить эксперимент, если n j ij j i n j j j a Q c Q 1 1 max B преобразовав это неравенство, получим i i r c min 2) Неидеальный эксперимент. В результате проведения эксперимента мы не находим однозначно j P , а лишь изменяем вероятность j Q . Пусть проводится неидеальный эксперимент. В результате появляются некоторые несовместные события k , , , 2 1 . Вероятности этих событий зависят от условий, в которых они проводятся. Пусть известны j l P B P . Эти вероятности называются прямыми. После эксперимента, давшего исход необходимо пересмотреть вероятности j Q , те. вместо вероятности j Q мы перейдѐм к вероятности jl Q . Это так называемые апостериорные вероятности формула Байеса. Но результаты эксперимента могут быть и 1 B и 2 B и k B , поэтому мы можем только ожидать всякие исходы l B , которые получатся в результате эксперимента. Причѐм, каждый исход l B привѐл бык некоторым оптимальным стратегиям * l A . А величина выигрыша, которая бы при этом получилась Эти выигрыши l a , могут произойти с вероятностью события l B , те. это вероятность l B P . У нас их нет, но их можно получить по формуле полной вероятности Тогда ожидаемый выигрыш будет Можно рассмотреть случай, когда проводят , 4 , 3 , 2 эксперимента. Их при этом считают независимыми. Многоэтапное принятие решений. Мы рассмотрели различные критерии принятия решений в условиях неопределѐнности. На практике, в таких задачах как, проектирование изделий, программ, мы можем столкнуться с Сознательное принятие решения Случайная вершина 1) Сознательный выбор между двумя и более альтернативами 2) Случайный переход из одной ветви в другую под воздействием внешних факторов Рассмотрим пример оптимизации многоэтапных решений на примере экономической задачи. Пример фирма может принять решение о строительстве крупного или мелкого предприятия. Строительство крупного предприятия относительно дешевле, в случае если будет высокий спрос на производимые товары, мелкое предприятие можно расширить. Деятельность фирмы рассматривается в течение десяти лет, причѐм в случае строительства мелкого предприятия, вопрос о расширении будет рассматриваться через два года. Спрос заранее неизвестен. Введѐм градацию спроса высокий 75 0 p и низкий 25 Затраты и доходы строительство крупного предприятия – 5 млн. $; строительство мелкого – 1 млн. $; затраты на расширение – 4,2 млн. $; крупное предприятие при высоком спросе даѐт доход – 1 млн. $ ежегодно, а при низком – 300 тыс. $; мелкое предприятие при высоком спросе – 250 тыс. $ ежегодно, при низком – 200 тыс. $; расширенное предприятие в случае высокого спроса приносит доход – 900 тыс. $ в год, и при низком спросе – 200 тыс. $; мелкое предприятие без расширения при высоком спросе на производимый продукт приносит в течение двух лет по 250 тыс. $ ежегодно, а в течение следующих восьми по 200 тыс. $. Нарисуем наше дерево. Применим для решения этой задачи метод динамического программирования. В качестве критерия применим средний выигрыш, те МО выигрыша. Сама величина критерия равна доходу без затратна строительство. Начнѐм с последнего четвѐртого шага подсчитаем средний выигрыш 5 6 4 3 2 1 крупное мелкое p=0,75 p=0,25 p=0,25 p=0,75 p=0,75 p=0,25 p=0,75 p=0,25 расш без расш. 1,0 0,3 0,9 0,2 0,25 0,2 0,2 2 года 8 лет |