Материал по ТПР. Наличие хорошего по в соответствующей организации или фирме и хороших аппаратных средств это лишь необходимое, но не достаточное условие
Скачать 0.64 Mb.
|
Максиминный критерий Вальда используется в случаях, когда требуется гарантия, чтобы выигрыш в любых условиях оказывался не менее чем наибольший из возможных в худших условиях. Наилучшим решением будет то, для которого выигрыш окажется максимальным из всех минимальных при различных вариантах условий. Критерий, используемый при таком подходе, получил название максимина. Его формализованное выражение Как видим, в качестве исходных данных при выборе вариантов решений по критерию Вальда являются выигрыши аij , соответствующие каждой паре сочетаний решений Р и обстановки О. Воспользуемся приведенным ранее примером (в частности, матрицей эффективности решений, представленной в табл. 2) для иллюстрации выбора оптимального варианта по критерию Вальда. Минимальная отдача по вариантам выделена жирным цветом в табл. 4. Таблица 4. Эффективность выпуска новых видов продукции
Из табл. 4 следует, что максимальный из минимальных результатов равен 0,25 и, следовательно, предпочтение необходимо отдать варианту Р1 обеспечивающему этот результат. Это максимальный гарантированный результат (выигрыш), который может быть получен в условиях имеющихся исходных данных. Выбрав решение Р1, мы независимо от вариантов обстановки получим выигрыш не менее 0,25. При любом другом решении, в случае неблагоприятной обстановки, может быть получен результат (выигрыш) меньше 0,25. Так, при выборе решения Р2 полученный выигрыш в зависимости от наступившего варианта обстановки будет колебаться от 0,2 до 0,75. Для решений Р3 и Р4 границы, в которых будет колебаться выигрыш, составят соответственно 0,10÷0,82 и 0,20÷0,80. Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения. Так, этот критерий никак не учитывает, что в случае принятия решения Р1 (т.е. при ориентации на выигрыш 0,25) максимальный выигрыш не превышает 0,4. Однако, выбирая, например, решение Р4, при гарантированном выигрыше 0,20 в случае благоприятной обстановки можно получить выигрыш, равный 0,80. Поэтому критерием Вальда, главным образом, пользуются в случаях, когда необходимо обеспечить успех при любых возможных условиях. Рассмотрим минимаксный критерий Сэвиджа, который используется в тех случаях, когда требуется в любых условиях избежать большого риска. Этот критерий также относится к разряду осторожных. Однако, в отличие от критерия Вальда, который направлен на получение гарантированного выигрыша, критерий Сэвиджа минимизирует возможные потери. Критерий минимального сожаления, предложенный Сэвиджем, состоит в применении минимаксного критерия (независимо от того, какой характер имели элементы aij– «доходы» или «потери») к матрице сожалений: . Здесь в качестве исходных данных при выборе решений выступают потери (Hij), соответствующие каждой паре сочетаний решений Р и обстановки О. Для иллюстрации выбора по критерию Сэвиджа воспользуемся приведенным выше примером (в частности, матрицей потерь, представленной в табл. 3). Максимальные потери по вариантам выделены в табл. 5 жирным шрифтом. Таблица 5. Величина потерь при выпуске новых видов продукции
Из табл. 5 следует, что минимальные из максимальных потерь составляют 0,45 и, следовательно, предпочтение необходимо отдать варианту Р3обеспечивающему эти потери. Выбор варианта решения Р3 гарантирует, что в случае неблагоприятной обстановки потери не превысят 0,45. В то время как для решений Р1 Р2 и Р4в случае неблагоприятной обстановки потери составят соответственно: 0,55; 0,62 и 0,72. Основным исходным допущением этого критерия является предположение о том, что на наступление вариантов обстановки оказывают влияние действия разумных противников (конкурентов), интересы которых прямо противоположны интересам лица, принимающего решение. Поэтому, если у противников (конкурентов) имеется возможность получить какие-либо преимущества, то они ее обязательно используют. Это обстоятельство заставляет лицо, принимающее решение, обеспечить минимизацию потерь от этих действий. Критерий обобщенного максимина (пессимизма—оптимизма) Гурвица используется, если требуется остановиться между линией поведения в расчете на худшее и линией поведения в расчете на лучшее. В этом случае предпочтение отдается варианту решений, для которого окажется максимальным показатель О, определяемый из выражения: где k — коэффициент, рассматриваемый как показатель оптимизма , при k = 0 - линия поведения в расчете на лучшее, при k= 1 - в расчете на худшее; аij— выигрыш, соответствующий i- му решению при j-м варианте обстановки. Нетрудно убедиться, что при k = 1 критерий Гурвица совпадает с критерием Вальда, т.е. ориентацией на осторожное поведение. При k = 0 - ориентация на предельный риск, так как большой выигрыш, как правило, сопряжен с большим риском. Значения k между 0 и 1 являются промежуточными между риском и осторожностью и выбираются в зависимости от конкретной обстановки и склонности к риску лица, принимающего решение. В табл. 6 приведены значения показателя G для различных вариантов решений в зависимости от величины коэффициента k. Таблица 6. Значение показателя G для различных k
Как видим, с изменением коэффициента kизменяется вариант решения, которому следует отдать предпочтение. Нами рассмотрены наиболее общие (классические) методы, которые позволяют обосновывать и принимать решение при неопределенности экономических данных и ситуаций, недостатке фактической информации об окружающей среде и перспективных ее изменениях. Следует отметить, что разработанные экономической теорией и практикой способы и приемы решения задач в условиях риска и неопределенности не ограничиваются перечисленными методами. В зависимости от конкретной ситуации в процессе анализа используются и другие методы, способствующие решению задач, связанных с минимизацией риска. Некоторые из них, в частности, основаны на использование среднеквадратического отклонения (σ) и коэффициента вариации (V) как меры риска. Критерий, основанный на байесовском подходе. В рамках нашего курса рассмотрим весьма простой формализованный метод решения задач на принятие решений в условиях неопределенности, который основан на так называемом «байесовском подходе». Прежде всего, рассмотрим типовой пример задачи на принятие решений, которая может быть решена этим методом. Перед группой бурильщиков, осуществляющей разведку нефтяных месторождений, периодически встает вопрос, бурить ли ей скважину в определенном месте или нет. При этом заранее неизвестны некоторые обстоятельства: стоимость бурения, запасы нефти на которые можно рассчитывать (в частности, результат может быть нулевым), стоимость эксплуатации скважины и т.д. Для принятия решения можно заказать различную информацию, позволяющую принять решение более обоснованно: результат сейсмической разведки (это стоит достаточно дорого), заказать карту данной местности из космоса (это стоит еще дороже) и т.д. В простейшем случае можно принять решение без использования дополнительной информации. В зависимости от результатов бурения можно рассчитывать на получение определенной прибыли, которая является случайной величиной, и задается соответствующим законом распределения. Если рассмотреть несколько подобных разных задач, можно, не вникая в содержательные особенности, выделить несколько общих этапов их решения: • определение в рамках содержательной постановки задачи перечня (группы) событий, которые могут произойти • составление списка доступных возможностей сбора информации, постановки эксперимента • определение упорядоченной во времени последовательности событий, в исходах которых можно получить определенную информацию, и последовательности действий, которые мы можем предпринять • оценка полезности доступных действий • определение вероятности каждого неопределенного (имеющего вероятностную природу) события В качестве основного формального математического инструмента рассматриваемого метода используется так называемое «дерево решений» (диаграмма решений). «Дерево решений» - это граф, содержащий вершины двух типов. К первому типу относятся вершины, которые соответствуют моментам принятия некоторых частных решений человеком (эти вершины будем обозначать квадратиками), к другому типу - вершины, соответствующие проявлению случайной природы некоторых событий (эти вершины будем обозначать кружочками). Можно использовать другое определение, дополняющее первое. «Дерево целей» - это структура задачи в виде хронологически увязанных выборов (моментов принятия решений), которые должен делать человек, решающий задачу на принятие решений, и выборов, определяемых случаем (случайным механизмом). Продемонстрировать использование рассматриваемого метода и его основного рабочего инструмента - «дерево целей» можно на примере типовой задачи, сформулированной в терминологии урн (терминология, привычная в теории вероятностей). Имеется Nурн, каждая из которых может быть одного из двух типов - Q1 или Q2. Известно, что 80% урн принадлежат к типу Q1, и 20% урн - к типу Q2. В каждой урне находятся 10 шаров (красные и черные). Распределение красных и черных шаров различно в зависимости от типа урны - в урнах типа Q1 4 красных и 6 черных шаров, в урнах типа Q2 9 красных и 1 черный шар. Человеку предлагается сыграть в игру. Он случайным образом выбирает одну из N урн, и должен решить, к какому типу принадлежит выбранная им урна. Если человек угадывает тип урны, то он выигрывает некоторую сумму денег, если не угадывает - проигрывает. У участника игры имеются варианты получить некоторую информацию перед тем, как определить тип урны. За дополнительную плату (8 единиц) можно случайным образом вынуть 1 шар из выбранной урны. За дополнительную плату в 12 единиц можно вынуть 2 шара из выбранной урны. За дополнительную плату в 9 единиц можно вынуть 1 шар и решить вынуть ли ещё один шар за 4.5 единиц. При этом шар, вынутый первым, может быть возвращен в урну или нет (возможны варианты) и т.д. В результате человек может принимать решение, выбирая из следующих вариантов: • отказаться от игры • без дополнительной информации определить тип урны (решение ЕО) • вынуть один шар из выбранной урны и после этого определить тип урны (решение Е1) • вынуть два шара из выбранной урны и после этого определить тип урны (решение Е2) • вынуть один шар из выбранной урны и решить, выбирать ли ещё один шар. После получения необходимой информации определить тип урны (решение ЕЗ). Если участник игры определяет тип урны Q1, то он выигрывает 40 единиц в случае «истинности», и проигрывает 20 единиц в случае «ложности» утверждения. Если участник игры определяет тип урны Q2, то он выигрывает 100 единиц в случае истинности, и проигрывает 5 единиц в случае «ложности» утверждения. Для использования дерева в решении, необходимо определить распределение вероятностей для возможных вариантов развития событий. Некоторые распределения вероятностей задаются в условиях задачи. Например, в нашей задаче задаются: P(Q1) - вероятность выбора урны типа Q1, (P(Q1) = 0.8) P(Q2) - вероятность выбора урны типа Q2, (P(Q2) = 0.2) P(R/Q1) - вероятность выбрать красный шар при условии выбора урны типа Q1 (P(R/Q1) = 0.4) P(B/Q1) - вероятность выбрать черный шар при условии выбора урны типа Q1 (P(B/Q1) = 0/6) P(R/Q2) - вероятность выбрать красный шар при условии выбора урны типа Q2 (P(R/Q2) = 0.9) P(B/Q2) - вероятность выбрать черный шар при условии выбора урны типа Q2 (P(B/Q2) = 0.1) Нам необходимо определить ещё четыре величины: P(Q1/R), P(Q1/B), P(Q2/R), P(Q2/B), соответственно вероятности выбора урны типа Ql (Q2) при условии, что был вынут красный (черный) шар. Эти вероятности не заданы, их можно найти с помощью известной формулы Байеса. P(Q1/R) = P(Q1)*P(R/Q1) / (P(Q1)*P(R/Q1)+P(Q2)*P(R/Q2)) = = 0.8*0.4 / (0.8*0.4 + 0.2*0.9) = 0.64 P(Q1/B) = P(Q1)*P(B/Q1) / (P(Q1)*P(B/Q1)+P(Q2)*P(B/Q2) = = 0.8*0.6 / (0.8*0.6 + 0.2*0.1) = 0.96 P(Q2/R) = P(Q2)*P(R/Q2) / (P(Q1)*P(R/Q1)+P(Q2)*P(R/Q2)) = = 0.2*0.9 / 0.5 = 0.36 P(Q2/B) = P(Q2)*P(B/Q2) / (P(Q1)*P(B/Q1)+P(Q2)*P(B/Q2)) = = 0.2*0.1 / 0.5 = 0.04 По известной формуле полной вероятности определим значение безусловной вероятности достать красный (черный) шар: P(R ) = P(Q1)*P(R/Q1) + P(Q2)*P(R/Q2) = = 0.8*0.4 + 0.2*0.9 = 0.5 P(B) = 0.5. Следует иметь в виду, что равенство вероятностей P(R ) и Р(В) определяется нашими исходными данными (при других исходных данных равенства, естественно, не будет). 3. Игровые методы обоснования решений Особый, очень большой и разнообразный класс составляют задачи на принятие решений в условиях неопределенности, когда имеется сознательное противодействие «противника». Эти задачи характеризуются тем, что в них участвуют две или более конкурирующих стороны, преследующие противоположные цели (конфликтные ситуации). Методы решения таких задач достаточно сложны и рассматриваются в специальном разделе математики - Теория игр. Введем некоторые понятия и определения: Игра - упрощенная схематизированная модель конфликтной ситуации, где конкурирующие стороны соблюдают некоторые правила игры. Правила игры регламентируют: • возможные варианты действия игроков • объем информации каждой стороны о поведении другой стороны • результат игры, к которому приводит любая совокупность ходов (чаще всего результат игры характеризуется числовой величиной) Игра развивается во времени, т.е. имеется последовательность действий игроков (игроки делают свои ходы). Ход - выбор одного из предусмотренных правилами игры действий и его осуществление. Различают личные и случайные ходы. Личный ход - сознательный выбор одного из возможных действий и его осуществление. Случайный ход - выбор из числа возможностей, осуществляемый с помощью механизма случайного выбора (бросание монеты, выбор карты и т.д.) в соответствии с законом распределения. Стратегия игрока - совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от ситуации, сложившейся в процессе игры. Если число стратегий конечное, то считается, что игра - конечная. Оптимальная стратегия - стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш). 2.1. Платежная матрица Для проведения простейшего анализа игровых задач на принятие решения используется так называемая платежная матрица. Рассмотрим конечную игру, в которой участвуют два игрока А и В. Игрок А имеет m стратегий (Al, A2, ..., Am), а игрок В - n стратегий (Bl, B2, ..., Вn). Предположим, что при выборе игроком А стратегии Ai и игроком В стратегии Bj игрок А получает выигрыш aij. Тогда можно составить платежную матрицу, в которой строки соответствуют стратегиям игрока А, столбцы - стратегиям игрока В, а элементы матрицы - соответствующим выигрышам игрока А.
Рассмотрим простой пример (Игра «поиск»). Игрок А - прячется, игрок В - ищет игрока А. В распоряжении игрока А есть два убежища. Если игрок В «находит» игрока А (с одной попытки), то игрок А платит ему 1 руб. Если Игрок В не «находит» игрока А, то он платит игроку А 1руб. Платежная матрица для такой игры будет иметь вид:
Анализ этой простой игры показывает, что, используя платежную матрицу, можно получить далеко нетривиальные выводы: • если играть только один раз, то вообще нельзя говорить об оптимальной стратегии • если играть многократно, то игроку А нельзя придерживаться какой-либо одной стратегии или чередовать их в каком-либо определенном порядке. В этом случае игрок В со временем поймет закономерность использования стратегий и начнет постоянно выигрывать. • игроку А необходимо использовать случайный механизм выбора стратегий (стратегии A1 и A2 должны быть равновероятны). В нашем примере игрок А должен использовать «смешанную стратегию», когда отдельные чистые стратегии (Al, A2) чередуются случайным образом. Пример 2. (Игра «Пальцы»). Игроки А и В «выбрасывают» одновременно до 3-х (1, 2 или 3) пальцев. Игрок А выигрывает (величина выигрыша равна сумме «выброшенных» пальцев), если сумма четная и соответственно проигрывает, если сумма - нечетная. Для данной игры платежная матрица имеет вид:
Анализ этой платежной матрицы позволяет заключить: • для каждой стратегии игрока А у игрока В есть лучшая стратегия (для A1 - В2, для A2 - ВЗ, для A3 - В2) • аналогично у игрока А есть лучшая стратегия игры против игрока В • игрокам А и В необходимо пользоваться «смешанными стратегиями» 2.2. Нижняя и верхняя цена игры. Принцип минимакса Рассмотрим некоторую игру, определяемую нижеприведенной платежной матрицей, и рассмотрим случай использования в этой игре «чистых» стратегий.
Дополним платежную матрицу столбцом с элементами 1, 2, …, m, где i = minij (минимизация по j) и строкой с элементами 1, 2, …, n, где j = maxij.минимизация по i). = maxi или = maxminij- нижняя цена игры - так называемый максимин. Оказывается, что при любом поведении игрока В игрок А имеет выигрыш не меньший, чем . Таким образом это оценка снизу для результата игры игрока А, если в игре используются «чистые» стратегии. Аналогичные рассуждения можно провести для игрока В и ввести = minj или = minmaxij- называют минимакс или верхняя цена игры. Придерживаясь «чистой» стратегии, соответствующей минимаксу, игрок В может быть уверен, что проиграет не больше. Принцип, определяющий игрокам выбор максиминной и минимаксной стратегий, называется принципом минимакса. Рассмотрим игру, характеризующуюся «платежной матрицей»:
Для этой игры = -3, = 4. Максиминная стратегия игрока А гарантирует, что игрок А проиграет не более 3 руб., минимаксная стратегия игрока В гарантирует, что он проиграет не больше 4 руб. Для рассматриваемой игры минимаксные стратегии неустойчивы. Действительно, пусть Игрок В выбрал стратегию В1, тогда, поняв это, игрок А выберет A3 и будет выигрывать 4 руб. На это игрок В может ответить стратегией В2 и будет выигрывать 5 руб. На это игрок А ответит стратегией А2 и будет выигрывать 4 руб. и т.д. В нашем случае соответствующие минимаксные стратегии игроков неустойчивы, и могут быть изменены после поступления информации о поведении противника. Однако, существуют игры, для которых значения максимина и минимакса совпадают. При этом минимаксные стратегии игроков А и В («чистые стратегии») являются устойчивыми стратегиями. В платежной матрице такой игры имеется элемент, который является одновременно минимальным в своей строке и максимальным в соответствующем столбце. Такой элемент называют «седловой точкой», а соответствующую игру - игрой с «седловой точкой». Для игры с «седловой точкой» минимаксные стратегии игроков А и В являются оптимальными стратегиями, т.е. если один игрок придерживается своей минимаксной стратегии, то для другого игрока не может быть выгодным отклоняться от своей минимаксной стратегии. Для игры с «седловой точкой» минимаксные стратегии обладают устойчивостью. Одним из фундаментальных результатов «Теории игр» является доказательство факта, что «игры с полной информацией» являются играми с «седловой точкой» (к таким играм относятся, например, шашки, шахматы, крестики-нолики и т.д.). «Игры с полной информацией» - это игры, в которых каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов - как личных, так и случайных. Таким образом, доказано, что любая «игра с полной информацией» имеет «седловую точку» и, следовательно, оптимальное решение в «чистых стратегиях». Это сильный результат, если учитывать, что класс игр с полной информацией достаточно велик. Другим интересным фундаментальным результатом «Теории игр» является утверждение, что для каждой «конечной игры» можно в классе «смешанных стратегий» найти пару устойчивых оптимальных стратегий для игроков А и В, обладающих свойством -если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей (здесь оптимальные стратегии смешанные). Рассмотренный материал из «Теории игр» является очень кратким введением, позволяющим почувствовать специфику задач этого раздела математики, получить представление об используемом аппарате и сложности задач данной области. 4. Методы коллективной экспертной оценки. Коллективная генерация идей. Дельфийский метод. Если ранее рассмотренные модели и методы решения претендовали на вполне определенные классы задач на принятие решений, то методы коллективной экспертной оценки могут быть использованы для решения любых задач на принятие решений. Такая целевая универсальность методов коллективной экспертной оценки, естественно, должна сочетаться со значительной неконкретностью используемых алгоритмов решения задач. Так оно и есть на самом деле. Сущность методов коллективной экспертной оценки состоит в определении согласованности мнений экспертов по вопросам, требующим принятия решений. В данном разделе под термином эксперт будем понимать специалиста в определенной области очень высокой квалификации, так что он имеет право делать свои заключения, не всегда обосновывать их. Методы коллективной экспертной оценки, как правило, включают следующие этапы: • создание рабочих групп, в функции которых входит проведение опроса, обработка материалов и анализ результатов коллективной экспертной оценки. Рабочая группа назначает экспертов (количество экспертов - 10-150), которые дают ответы на поставленные вопросы • разработка вопросов (необходимо обеспечить однозначность понимания вопросов), которые будут представлены экспертам • обработка материалов коллективной экспертной оценки, которые характеризуют обобщенное мнение и степень согласованности индивидуальных оценок экспертов. Окончательная оценка определяется как среднее в определенном смысле суждение экспертов. Метод «мозгового штурма» Основное назначение метода «мозгового штурма» - поиск новых идей на основе интуититвного мышления. В основе метода лежит тезис - «большое число идей включает по крайней мере несколько хороших идей». Основные условия для реализации метода: • сформулировать проблему в основных терминах • не объявлять ни одну идею ошибочной • поддерживать каждую идею, даже если её осуществление предполагается в далеком будущем • постоянно поддерживать и подбадривать участников для создания свободных взаимоотношений » стремиться к тому, чтобы высказывания участников были четкими и сжатыми • критика предыдущих выступлений не допускается • каждый участник может выступать несколько раз, но не подряд Важный этап метода - систематизация идей, который включает: • составление перечня всех высказанных идей, определение дублирующих и дополняющих идей, формирование комплексных идей • объединение идей в группы, согласно выделенным признакам • упорядочение идей в группах от более общих к более частным. Часто используется этап деструкции, который включает оценку идей на основе критерия практической реализуемости. Каждая идея подвергается всесторонней критике со стороны участников «мозговой атаки». При этом могут появляться новые идеи. На этом этапе в группу участников «мозговой атаки» привлекаются высококвалифицированные специалисты. Далее идет оценка критических замечаний и составление списка практически применимых идей. В результате составляется список идей, которые не опровергнуты критикой. Метод Дельфи. Этот метод был в свое время разработан известной Rand Corporation для решения задач долгосрочного прогнозирования. Сущность метода заключается в следующем: • разрабатываются подробные вопросники для ведущих специалистов и экспертов • вопросы в анкетах составляются так, чтобы ответы на них имели какую-либо количественную характеристику • опросы экспертов проводятся в несколько туров, в ходе которых вопросы и ответы все более уточняются • предусматривается ознакомление с результатами опроса всех участников опроса после каждого тура • использование методов математической статистики для обработки результатов опросов и получения обобщающих характеристик. С помощью «метода Дельфи» успешно выявляются преобладающие суждения авторитетных специалистов по анализируемому вопросу. |