Неопределенность на входе. Принятие решений при неопределённости и риске введение

Название	Принятие решений при неопределённости и риске введение
Дата	01.03.2023
Размер	165.09 Kb.
Формат файла
Имя файла	Неопределенность на входе.docx
Тип	Документы #963541
страница	4 из 5

1 2 3 4 5

1.4. Теорема о минимаксе и седловые точки

В этом разделе мы вернёмся к исходной постановке задачи оптимизации в условиях неопределённости, выраженной формулой (В2)

f(u,) →

(1.6)

Для удобства чтения эта формула повторена здесь. В ней  заранее неизвестное воздейс-твие, принадлежащее некоторому множеству G, которое во многих случаях можно считать известным (в отличие от его конкретного элемента ). Именно такая постановка была рассмотрена выше в разделах 1.1 – 1.4. Для продавца прохладительных напитков в качестве множества G выступает множество возможных состояний погоды в августе {холодно, прохладно, тепло, жарко}.

Рассмотрим общий случай. Выбирая произвольно uQ, получаем выигрыш x = f(u,), где  может быть любым значением неконтролируемой переменной. Самое меньшее, что мы можем при этом получить – это зависящий только от u выигрыш

x(u) =

. (1.7)

Обозначим через u* то значение контролируемой переменной u, при котором левая часть (1.7) x(u) достигает максимума, а само это значение xобозначим через x*:

x* = x(u*) =

. (1.8)

Вход u* в пункте 1.2 назван гарантирующей стратегией*, а соответствующее максимальное значение x* = x(u*)  гарантированным результатом. Смысл этих названий состоит в следующем: выбор u = u* при любом значении неконтролируемого входа гарантирует значение целевой функции f(u,), не меньшее, чем x*.

Для получения гарантирующей стратегии и гарантированного результата надо сделать следующее.

1. Вычислить x(u) =

(см. (1.7)) для любого uQ.

2. Вычислить x* =

(cм. (1.8)).

Так, x* является гарантированным результатом, а то значение контролируемой переменной u, на котором достигается максимум в (1.8), является гарантирующей стратегией u*. Как видим, необходимо решить не одну оптимизационную задачу, а целое семейство таких задач. Это  естественная расплата за неопределённость и, к сожалению, далеко не единственная. Главный же недостаток гарантированного результата  это его неоптимальность. Грубо говоря, при получении оценки x* (см. формулы (1.7) и (1.8)) мы «закладывались» на самый худший случай (брали в (1.7) минимум функции по ). Житейский опыт подсказывает, что такое поведение, как правило, далеко не оптимально. А что же будет, если рискнуть и выбрать u≠ u*? Может ведь случиться и так, что неконтролируемое значение окажется как раз таким, которое минимизирует f(u,), и при этом мы получим результат x(u), ещё худший, чем x*. Все эти рассуждения можно подытожить пессимистической пословицей: кто не рискует, тот не ужинает с коньячком, а кто рискует, тот совсем не ужинает.

То, что мы перешли от формальной постановки к содержательным рассуждениям, т.е. то, что в условиях неопределённости задача оптимизации (1.6) по существу перестает быть формальной, связано с более глубокими причинами, о которых будет сказано в части 4.

Слегка видоизменим постановку. Пусть (как это действительно иногда бывает) мы можем принять решение, предварительно выяснив ситуацию. Формально это означает, что мы выбираем u, уже зная . Естественно, u выбирается из условия

x() =

. (1.9)

То значение u, на котором достигается максимум в правой части (1.9), обозначим через u(); соответствующее значение x обозначено в (1.9) через x(). Можно считать, что x()  это наилучший результат, которого мы можем достичь, если неконтролируемый фактор принимает некоторое значение G. При этом в худшем случае мы получим

x⁰ =

. (1.10)

В этой ситуации гарантирующей является уже не одна стратегия u, а вся функция u(), поскольку управление u() обеспечивает наилучший результат при каждом значении .

Оказывается, что в рассматриваемой ситуации, когда  известно заранее, выигрыш всегда не меньше, чем тогда, когда  заранее неизвестно. Формально это означает, что

x⁰ =

≥

= x*. (1.11)

Имеет место

Утверждение 1. (Теорема о минимаксе). Пусть A и B два множества, F(x,y) – любая функция от двух переменных, определённая при всех xA и yB. Тогда

≥

. (1.12)

Доказательство. Пусть (x, y)  произвольная пара переменных. Ясно, что

≥ F(x, y). (1.13)

Левая и правая части (1.13) при фиксированном xявляются функциями от y. Обозначим их через φ₁(y) и φ₂(y). Ясно, что из φ₁(y) ≥ φ₂(y) следует, что

≥

откуда с учётом определения φ₁(y) и φ₂(y) получаем

≥

. (1.14)

Неравенство (1.14) верно при любых x, причем его левая часть от x не зависит. Поэтому оно остаётся верным, если в правую часть подставить то значение x, которое её максимизирует, т.е.

≥

, что совпадает с (1.12).

В доказательстве предполагалось, что все максимумы и минимумы достигаются. Это не очень существенное ограничение, учитывая, что на компактном (замкнутом и ограниченном) множестве любая непрерывная функция достигает максимального и минимального значений. Однако оно останется верным для произвольных функций, если минимум заменить на инфинум, а максимум – на супремум.

Неравенство (1.12) очевидно, эквивалентно (1.11) при F(x,y) = f(u,), x = u, y = , A = Q и B = G.

Разница x⁰  x*  это и есть наша плата за незнание ситуации. Именно ради этой разницы и работают все разведки мира. Подчеркнём ещё раз  выгоду (и иногда ог-ромную)  приносит только знание о неконтролируемых факторах, даже без малейшей возможности влиять на них. «Знал бы прикуп, жил бы в Сочи».

Пример 1.2. Пусть f(u, α) = –(u – α)², множества возможных значений Q и G – множества всех действительных чисел от –∞ до ∞. Найдём для этой функции

.

1. При любом α выражение –(u – α)² достигает максимума, равного 0, при u = α. Поэтому

= min_α 0 = 0.

2. При любом uвыражение –(u – α)² может быть сколь угодно большим по модулю отрицательным числом. Можно считать, что при любом u = –∞, откуда

= –∞.

Пример 1.3. Пусть теперь f(u, α) = (u – α)² при Q = [0, 100], G = [0, 100]. Найдём для этой функции

.

1. Определим максимум выражения (u – α)² в зависимости от α. Легко видеть, что

u(α) =

, откуда

.

Поэтому

достигается при α = 50, т.е.

= 50² = 2500.

2. Определим минимум выражения (u – α)² в зависимости от u. При любом uминимум (u – α)² достигается при α= u; он равен 0. Ясно, что

= 0, т.е.

= 0.

Пример 1.4. Попытаемся найти гарантирующую стратегию и гарантированный ре-зультат для функции f(u, α) из примера 1.2. В данном случае f(u, α) = –(u – α)², множества возможных значений Q и G – множества всех действительных чисел от –∞ до ∞. В соот-ветствии с описанным выше методом находим

x(u) =

–(u – α)² = –∞.

Поэтому в данном случае гарантирующая стратегия и гарантированный результат не опре-делены.

Пример 1.5. Найдём гарантирующую стратегию и гарантированный результат для функции f(u, α) из примера 1.3. В соответствии с описанным выше методом находим

x(u) =

(u – α)² = 0 (при α= u).

Ясно, что гарантирующей является любая стратегия u, поскольку гарантированный результат 0 обеспечивается при любом u.

1.4.1. Седловые точки. Пусть для некоторой функции f(x, y) от двух переменных в формуле (1.12) имеет место равенство:

f(x, y) =

f(x, y). (1.15)

Это значит, что в некоторой точке (x*, y*), где x*A, y*B

f(x, y) = f(x*, y*) =

f(x, y). (1.16)

Точки (x*, y*), удовлетворяющие условию (1.16), называются седловыми точками. Это название связано с их геометрической интерпретацией: поверхность функции z= y² – x², для которой точка (0, 0) удовлетворяет условиям (1.16), напоминает седло (см. рис. 1).

Рис. 1. Седловая точка

Имеют место следующие утверждения.

Утверждение 2а. Пусть для некоторых множеств X и Y и некоторой функции f(x, y), определённой при всех xX и yY, точки (x¹, y¹) и (x², y²) являются седловыми, т.е. удовлетворяют условиям (1.16). Тогда

f (x¹, y¹) =f(x², y²), (1.17)

т.е. значения функции во всех седловых точках (если их больше одной) совпадают.

Утверждение 2б. Пусть (x¹, y¹) и (x², y²) – две седловые точки. Тогда (x¹, y²) и (x², y¹) также являются седловыми точками.

Утверждение 2в. Для любой седловой точки (x*, y*), любого xX и любого yY имеют место неравенства

f(x, y*) ≤ f(x*, y*) ≤ f(x*, y). (1.18)

Утверждение 2г. Пусть для некоторых множеств Xи Yи некоторой функции f(x, y), определённой при всех xX и yY, существует точка (x*,y*), для которой при любом xX и любом yY выполнено (1.18). Тогда для этой функции f(x, y) и точки (x*,y*) выполнено равенство (1.16), т.е. точка (x*, y*) является седловой точкой.

Пример 1.6. Нахождение минимакса и максимина. Продемонстрируем вычисление

f(x,y) и

f(x,y). Сначала введём некоторые необходимые понятия и обозначения. Будем рассматривать функции f(x, y), такие, что f(x,y) = φ(z), где z = |x–y|, φ(z) – непрерывная монотонно возрастающая функция, определённая при всех z ≥ 0, и φ(0) = 0, Например, к таким функциям относятся f(x,y) = (x– y)², f(x, y) =

, f(x, y) = arctg(|x–y|), и пр.

Далее, будем предполагать, что оба множества Xи Y являются отрезками на числовой оси: X = [a, b], Y = [c, d]. Величины

f(x, y) и

f(x, y) существенно зависят от взаимного расположения этих отрезков. Далее рассматриваются два случая с номерами 2 и 3. Нумерация охватывает все случаи взаимного расположения двух отрезков. Она начинается со случая a<b≤ c<d(отрезок Y = [c, d] расположен справа от отрезка X = [a, b]). Заканчивается нумерация случаем c<d≤ a<b, когда отрезок Y = [c, d] расположен слева от отрезка X = [a, b].

Случай 2: a<

≤ c< b< d; отрезки [a, b] и [c, d] пересекаются и общими точками являются все точки отрезка [c,

], но при этом середина

отрезка [a, b] не является внутренней точкой отрезка [с, b], т.е. не принадлежит ему или совпадает с концом с.

1) g(x) =

f(x,y) =

.

Далее,

f(x,y) =

g(x) = φ(c–a). Гарантирующей стратегией является a, гаранти-рованным результатом φ(c– a).

2) h(y) =

f(x,y) = φ(y–a) (a– самая далёкая от любой точки y[c, d] точка на [a, b]).

Далее,

f(x,y) =

h(y) =

φ(y– a) = φ(c– a).

Сравнение. В данном случае

f(x,y) = φ(c–a) = φ(a–c) =

f(x,y). Поэтому седловой точкой будет точка (a, c).

Случай 3: a< c<

< b< d; отрезки [a, b] и [c, d] пересекаются и общими точками являются все точки отрезка [c, b], но при этом середина

отрезка [a, b] принадлежит пересечению [c, b] и является его внутренней точкой (в отличие от случая 2).

1) g(x) =

f(x, y) =

Далее,

f(x, y) =

g(x) = φ(с–a). Гарантирующей стратегией является a, гаранти-рованным результатом φ(c– a).

2) h(y) =

f(x, y) =

.

Далее,

f(x, y) =

h(y) = φ(

– a) = φ(

).

Сравнение. В данном случае

f(x,y) = φ(c–a),

f(x,y) = φ(

) = φ(b –

). Так как в данном случае

> c, то b–c < b –

, откуда φ(b–c) < φ(b –

) и

f(x, y)< f(x, y). Таким образом, седловой точки в данном случае нет.

1 2 3 4 5