Главная страница
Навигация по странице:

  • Смешивание стратегий на футбольном поле

  • Теория игр. Искусство стратегического мышления в бизнесе и жизни. Барри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство


    Скачать 3.58 Mb.
    НазваниеБарри Дж. НейлбаффАвинаш ДикситТеория игр. Искусство
    Дата15.04.2022
    Размер3.58 Mb.
    Формат файлаpdf
    Имя файлаТеория игр. Искусство стратегического мышления в бизнесе и жизни.pdf
    ТипРеферат
    #476504
    страница12 из 38
    1   ...   8   9   10   11   12   13   14   15   ...   38
    Глава 5. Выбор и случай
    Конец остряка
    The Princess Bride
    138
    («Принцесса-невеста») – блестящая комедия, в которой много запоминающихся сцен. Самая ин- тересная из них – сражение на смекалку между героем (Уэст- ли) и злодеем (сицилийцем Виццини). Уэстли предлагает
    Виццини сыграть в игру: Уэстли отравит вино в одном из бокалов так, чтобы Виццини не видел, в каком именно. За- тем Виццини должен выбрать один из бокалов и выпить вино из него, а Уэстли выпьет из другого бокала. Виццини заяв- ляет, что он гораздо умнее Уэстли: «Ты слышал что-нибудь о Сократе, Платоне, Аристотеле? ‹…› Дуралей». Он убежден в том, что может выиграть, воспользовавшись логическими рассуждениями:
    Все, что мне нужно сделать, – это угадать, опираясь
    138
    «Принцесса-невеста» – фильм режиссера Роба Райнера (1987 год) по мо- тивам одноименного романа американского писателя Уильяма Голдмана. Прим.
    ред.
    на то, что я знаю о тебе: ты человек, который положит яд в свой бокал или в бокал своего врага? Умный человек положит яд в свой бокал, потому что он знает,
    что только полный дурак выберет тот бокал, который предназначен для него. А я не полный дурак и не могу выбрать бокал, стоящий перед тобой. Но ты, наверное,
    знал, что я не полный дурак, и рассчитывал на это,
    поэтому я не могу выбрать вино, стоящее передо мной.
    Виццини рассуждает дальше, придерживаясь той же ло- гики. В конце концов он отвлекает внимание Уэстли, меня- ет кубки местами и смеется, уверенный в своей победе, ко- гда они оба пьют вино из своих кубков. Виццини говорит
    Уэстли: «Ты пал жертвой грубой ошибки. Всем известно, что нельзя ввязываться в земельный спор в Азии; точно так же нельзя спорить с сицилийцем, когда на кону стоит смерть».
    Виццини все еще смеется, радуясь своей победе, когда вне- запно падает замертво.
    Почему логические рассуждения Виццини не принесли ему успеха? Каждый из его аргументов содержал внутреннее противоречие. Если Виццини считает, что Уэстли отравит вино в кубке А, он приходит к выводу, что ему следует вы- брать кубок Б. Но Уэстли тоже может сделать такой же логи- ческий вывод, и в этом случае он подсыплет яд в кубок Б.
    Но Виццини должен предвидеть это, а значит, ему следует выбрать кубок А. Но… этому циклу логических рассужде-
    ний нет конца
    139
    Дилемма, с которой столкнулся Виццини, возникает во многих играх. Представьте себе, что вам предстоит сделать штрафной удар во время футбольного матча. Вы направите удар по левую или по правую сторону от вратаря? Предпо- ложим, руководствуясь определенными соображениями (что вы делаете удар с левой, а не с правой ноги; что вратарь лев- ша, а не правша или что вы выбрали ту или иную сторону,
    когда в прошлый раз били пенальти), вы приходите к выво- ду, что следует направить удар по левую сторону от вратаря.
    Если вратарь способен выстроить такую же цепочку рассуж- дений, он мысленно и даже физически подготовится к тому,
    чтобы прикрыть именно эту сторону, так что вам лучше на- править удар по правую сторону. Но что если вратарь пойдет в своих рассуждениях дальше? Тогда вам лучше придержи- ваться первоначального плана и быть по левую сторону от
    139
    Те из вас, кто смотрел этот фильм или читал книгу, знают, что в рассужде- ниях Виццини был более серьезный изъян. Уэстли много лет вырабатывал имму- нитет к этому яду и подсыпал его в оба кубка. Таким образом, что бы ни выбрал
    Виццини, он был обречен, а Уэстли ничего не грозило. Виццини не знал об этом и вел игру в условиях, когда у его противника было большое информационное преимущество. В более общем смысле, если кто-то предлагает вам какую-либо игру или сделку, вы обязательно должны задать себе вопрос: «Знает ли этот че- ловек то, чего не знаю я?» Вспомните совет отца Ская Мастерсона: никогда не соглашайтесь на пари с человеком, который говорит, что вытянет из колоды пи- кового валета и если выиграет, то пустит вам струю сидра в ухо (это девятая ис- тория из главы 1
    ). Мы вернемся к теме асимметричности информации позже в данной главе. Здесь же остановимся на круговой логике, поскольку она сама по себе представляет большой интерес и имеет много областей применения.
    него. И так далее. Где заканчивается этот круг рассуждений?
    В подобных ситуациях единственный логически обосно- ванный вывод состоит в том, что, если вы будете выбирать свои ходы, придерживаясь той или иной системы или зако- номерности, другой игрок непременно воспользуется этим на пользу себе и в ущерб вам. Следовательно, вы не должны придерживаться никакой системы или закономерности. Ес- ли всем известно, что вы бьете по мячу левой ногой, вратари будут более тщательно прикрывать эту сторону и чаще от- ражать ваши удары. Вы должны заставить их строить догад- ки, совершая бессистемные или случайные действия в каж- дом отдельном случае. Осознанный выбор случайных дей- ствий может показаться иррациональным решением в ситу- ации, которая подразумевает необходимость рационального стратегического мышления, однако в этой кажущейся непо- следовательности есть своя логика. Ценность рандомизации можно не только осознавать в абстрактном, общем смысле,
    но и выразить в количественной форме. Мы подробно объ- ясним этот метод в данной главе.
    Смешивание стратегий на футбольном поле
    Штрафной удар в футболе – самый простой и самый известный пример ситуации, требующей случайных ходов,
    или, если говорить в терминах теории игр, смешанных стра- тегий. Этот удар был тщательно изучен в ходе теоретических
    и эмпирических исследований игр и широко обсуждался в средствах массовой информации
    140
    Пенальти назначается, если игроки защиты совершают любое запрещенное действие или нарушение в штрафной площадке своих ворот. Кроме того, серия штрафных ударов выполняется после окончания футбольного матча для опре- деления победителя в случае ничьей. Ширина футбольных ворот 7,32 метра, высота – 2,44 метра. Мяч устанавливает- ся на линии, расположенной в 11 метрах от линии ворот, на- против центра ворот. Игрок, выполняющий удар, должен по- слать мяч в ворота непосредственно с этого места. Вратарь должен стоять на линии ворот до момента нанесения удара по мячу.
    Мяч, по которому сделан сильный удар, долетает с 11-мет- ровой отметки до ворот за две десятые секунды. У вратаря,
    который ждет момента удара, чтобы увидеть, куда направля- ется мяч, нет никаких шансов остановить его, если только мяч не был нацелен на самого вратаря. Футбольные ворота достаточно широкие; следовательно, вратарь должен заранее решить, следует ли ему делать прыжок, чтобы прикрыть одну
    140
    Результаты исследований изложены в следующих работах: Pierre-Andre
    Chiappori, Steven Levitt, Timothy Groseclose, “Testing Mixed-Strategy Equilibria
    When Players Are Heterogeneous: The Case of Penalty Kicks in Soccer,” American
    Economic Review 92, no. 4 (September 2002): 1138–1151; Ignacio Palacios-Huerta,
    “Professionals Play Minimax,” Review of Economic Studies 70, no. 2 (April 2003):
    395–415. К числу материалов, опубликованных в популярных СМИ, относится и статья Daniel Altman, “On the Spot from Soccer’s Penalty Area,” New York Times,
    June 18, 2006.
    из сторон, и если да, то в какую сторону необходимо двигать- ся – налево или направо. Игрок, выполняющий пенальти, то- же должен выбрать направление удара еще до того, как уви- дит, куда наклоняется вратарь. Разумеется, каждый из них сделает все возможное, чтобы скрыть свой выбор от другого.
    Следовательно, эту ситуацию лучше всего рассматривать как игру с параллельными ходами. В действительности крайне редко бывает так, что вратарь стоит в центре ворот, не пры- гая налево или направо; игроки, выполняющие пенальти, то- же сравнительно редко бьют в центр ворот, и такое поведе- ние можно объяснить теоретически. Поэтому мы упростим свои выкладки, ограничив выбор каждого игрока двумя ва- риантами. Поскольку игроки, выполняющие пенальти, бьют по мячу внутренней стороной ступни, естественное направ- ление удара для игрока, бьющего правой ногой, – в правую сторону от вратаря, а для игрока, бьющего левой, – в левую сторону. Для простоты будем называть естественную сторо- ну «справа». Следовательно, у каждого игрока есть два ва- рианта выбора: «справа» и «слева». Когда вратарь выбира- ет вариант «справа», это означает естественную сторону вы- полнения удара игроком, бьющим пенальти.
    Учитывая, что у каждого игрока есть два варианта вы- бора и что оба делают свои ходы одновременно, мы можем отобразить результаты в обычной таблице выигрышей 2 × 2.
    В каждом сочетании вариантов выбора «слева» и «справа»,
    сделанного каждым из игроков, есть элемент случайности.

    Например, мяч может пролететь над перекладиной ворот или вратарь может направить мяч в сетку ворот, слегка кос- нувшись его. В представленной таблице выигрыш игрока,
    выполняющего пенальти, – это выраженное в процентах чис- ло раз, когда мяч забит, а выигрыш вратаря – выраженное в процентах число раз, когда мяч не забит.
    Разумеется, все эти показатели относятся к конкретному игроку, выполняющему штрафной удар, и конкретному вра- тарю. Подробную информацию о показателях игроков мож- но получить в профессиональных футбольных лигах разных стран. Для общего сведения ознакомьтесь со средними по- казателями ряда разных вратарей и игроков, выполнявших штрафной удар, которые рассчитал Игнасио Паласиос Уэр- та на основании данных футбольных лиг Италии, Испании и Англии за период с 1995-го по 2000 год. Не забывайте,
    что в левом нижнем углу каждой ячейки показан выигрыш бьющего игрока, которому соответствуют строки, а в пра- вом верхнем углу – выигрыш вратаря, которому соответству- ют столбцы таблицы. Выигрыш бьющего игрока выше, если оба выбирают противоположные стороны; процент забитых мячей у такого игрока почти одинаковый независимо от то- го, выбирает он естественную сторону или нет: единствен- ная причина неудачи – когда удар направлен выше ворот или мимо ворот. В случае, если оба выбирают одну и ту же сто- рону, выигрыш бьющего игрока выше, когда он предпочита- ет свою естественную сторону. Все эти действия носят в ка-
    кой-то мере интуитивный характер.
    Попробуем найти равновесие Нэша для этой игры. Если оба игрока выбирают позицию «слева», это не будет равно- весием, поскольку, когда вратарь выбирает левую сторону,
    бьющий игрок может повысить свой выигрыш с 58 до 93,
    переключившись на позицию «справа». Это тоже не может быть равновесием, поскольку в таком случае вратарь может повысить свой выигрыш с 7 до 30, тоже переключившись на позицию «справа». Однако в таком случае игрок, выполня- ющий пенальти, получит более высокий выигрыш, переклю- чившись на позицию «слева»; тогда и вратарю будет лучше переключиться на позицию «слева». Иными словами, в этой игре в таком виде, в каком она отображена на таблице, рав- новесия Нэша не существует.
    Циклы переключения с одной позиции на другую пол-
    ностью соответствуют круговой логике рассуждений Вицци- ни о том, в каком кубке находится яд. Тот факт, что в дан- ной игре с указанными парами стратегий нет равновесия Нэ- ша, подтверждает правильность одного из постулатов тео- рии игр, касающегося важности смешивания ходов. В дан- ном примере необходимо ввести смешивание ходов как еще одну, принципиально новую, стратегию и попытаться найти равновесие Нэша в расширенном множестве стратегий. Ис- ходные стратегии каждого игрока («слева» и «справа») бу- дем называть чистыми стратегиями.
    Прежде чем продолжить анализ, упростим таблицу игры.
    У этой игры есть одна особенность: интересы двух игроков полностью противоположны. В каждой ячейке выигрыш вра- таря равен 100 минус выигрыш бьющего игрока. Следова- тельно, если сравнить данные в ячейках, становится очевид- ным, что, когда выигрыш больше у бьющего игрока, он мень- ше у вратаря, и наоборот.
    Многие люди, опираясь на свой опыт игр подобного рода,
    интуитивно считают, что в любой игре должен быть победи- тель и проигравший. Однако в огромном мире стратегиче- ских игр сравнительно редко встречаются игры, в которых наблюдается чистый конфликт. В мире экономики, где иг- роки сознательно идут на компромисс ради взаимной выго- ды, возможен такой исход игры, когда выигрывают все. При- мер ситуации, в которой все могут проиграть, – дилемма за- ключенных. А в игре с торгом и игре в труса возможен од-
    носторонний исход, когда одна сторона выигрывает за счет другой. Таким образом, большинству игр свойственно со- четание конфликта и общих интересов. Тем не менее дан- ный пример игры с абсолютным конфликтом первым был изучен теоретически, поэтому представляет особый интерес.
    Как мы уже говорили, такие игры называются играми с ну- левой суммой (выигрыш одного игрока означает проигрыш другого) или, в более общем случае, играми с постоянной суммой, как в нашем текущем примере, где сумма выигры- шей двух игроков всегда равна 100.
    Таблицы выигрышей для таких игр можно упростить, ука- зывая в них выигрыш одного игрока, поскольку выигрыш другого можно рассматривать как величину, равную разнице между постоянной суммой (в нашем примере 100) и выигры- шем первого игрока. Как правило, в явной форме указыва- ется выигрыш игрока, которому соответствуют строки таб- лицы. В данном примере для такого игрока предпочтителен результат с более высокими показателями, а для игрока, ко- торому соответствуют столбцы таблицы, оптимален резуль- тат с более низкими показателями. С учетом этих правил таблица выигрышей для штрафного броска выглядит так:

    Если вы игрок, выполняющий штрафной удар, какой из двух стратегий отдали бы предпочтение? Если вы выберете стратегию «слева», вратарь может удержать ваш процент за- битых мячей на уровне не выше 58, выбрав стратегию «сле- ва»; если же вы выберете стратегию «справа», вратарь может удержать ваш процент забитых мячей на уровне не выше 70,
    тоже выбрав стратегию «справа»
    141
    . Из этих двух вариантов вам лучше выбрать сочетание «справа», «справа».
    Можете ли вы получить лучшие результаты? Предполо- жим, вы выбираете стратегию «слева» или «справа» случай- ным образом в пропорции 50:50. Например, когда вы уже го- товы подбежать к мячу и нанести по нему удар, подбросьте
    141
    Это может произойти в случае, если вы заработали себе репутацию игрока,
    всегда выбирающего удар слева или удар справа. Разумеется, вам не нужна ни такая схема, ни такая репутация; именно здесь вам и понадобится метод рандо- мизации, который мы и пытаемся сейчас объяснить.
    монетку, которую держите в руке так, чтобы этого не видел вратарь, и выберите «слева», если выпадет решка, и «спра- ва», если выпадет орел. Если вратарь выберет стратегию
    «слева», ваша смешанная стратегия обеспечит вам попада- ние в
    1
    /
    2
    × 58 +
    1
    /
    2
    × 93 = 75,5 процентах случаев; если вра- тарь выберет стратегию «справа», ваша стратегия обеспечит вам успех в
    1
    /
    2
    × 95 +
    1
    /
    2
    × 70 = 82,5 процентах случаев. Если вратарь знает, что вы делаете свой выбор по такому принци- пу, он выберет стратегию «слева», чтобы удержать процент успешных ударов на уровне 75,5 процента. Но это все же больше, чем 70 процентов забитых мячей, которые вы полу- чили бы в случае применения двух чистых стратегий.
    Легкий способ проверить, нужна ли такая случайность при выборе стратегий, – попытаться понять, причинит ли вам вред, если вы позволите другому игроку узнать о вашем фактическом выборе до того, как он сделает ответный ход.
    Если вам это невыгодно, значит случайный выбор, который заставит другого игрока строить догадки, принесет вам поль- зу.
    Можно ли назвать смешивание стратегий по принципу
    50:50 лучшим для вас? Нет. Попробуйте другой вариант –
    когда вы будете выбирать стратегию «слева» в 40 процентах случаев, а стратегию «справа» – в 60 процентах случаев. По- ложите в карман маленькую книжку, а когда будете готовы подбежать к мячу и сделать удар, достаньте ее и откройте на
    любой странице (снова так, чтобы не видел вратарь). Если последняя цифра номера страницы попадает в диапазон от 1
    до 4, выберите стратегию «слева», а если от 5 до 10 – стра- тегию «справа». Теперь процент успешных ударов в случае,
    если вратарь выберет стратегию «слева», составит 0,4 × 58 +
    0,6 × 93 = 79, а если стратегию «справа» – 0,4 × 95 + 0,6 ×
    70 = 80. Вратарь может держать вас на уровне 79 процентов,
    выбрав стратегию «слева», но это лучше, чем 75,5 процен- та успешных ударов, которые вы могли бы сделать в случае смешивания стратегий по принципу 50:50.
    Обратите внимание на следующий факт: чем лучше пропорции смешивания стратегий игрока, выполняющего штрафной удар, тем меньше разница между показателями успешных ударов в случаях, когда вратарь выбирает страте- гию «слева» и стратегию «справа». При выборе чистых стра- тегий эти показатели составляют 93 и 70 процентов; в случае смешивания стратегий по принципу 50:50–82,5 и 75,5 про- цента, а при смешивании стратегий в пропорции 40:60–80
    и 79 процентов. Очевидно, что смешивание стратегий в оп- тимальной пропорции обеспечивает один и тот же процент успешных ударов независимо от того, какую стратегию вы- берет вратарь. Кроме того, это согласуется и с интуитивным предположением, что смешивание ходов – правильный под- ход, поскольку он не позволяет другому игроку извлекать для себя выгоду из любой системы или закономерности вы- бора.

    Расчеты, о которых пойдет речь в одном из следующих разделов данной главы, свидетельствуют, что для игрока, вы- полняющего пенальти, лучше всего смешивать стратегии по такому принципу: выбирать стратегию «слева» в 38,3 про- центах случаев и стратегию «справа» – в 61,7 процентах. Это обеспечит 0,383 × 58 + 0,617 × 93 = 79,6 процентах забитых мячей, если вратарь выберет стратегию «слева», и 0,383 ×
    95 + 0,617 × 70 = 79,6 процента забитых мячей, если вратарь выберет стратегию «справа».
    А что насчет стратегии вратаря? Если он выберет чистую стратегию «слева», бьющий игрок может получить 93 про- цента забитых мячей, выбрав стратегию «справа»; если вра- тарь выберет чистую стратегию «справа», у бьющего игрока есть шансы получить 95 процентов забитых мячей при усло- вии выбора стратегии «слева». Смешав свои стратегии, вра- тарь может удержать число успешных ударов игрока, выпол- няющего пенальти, на гораздо более низком уровне. Для вра- таря оптимальна та пропорция смешивания стратегий, при которой у бьющего игрока сохранится процент успешных ударов независимо от того, какую стратегию он выберет –
    «слева» или «справа». С учетом этого условия вратарь дол- жен выбрать смешивание стратегий «слева» и справа» в про- порции 41,7 процента и 58,3 процента соответственно; бью- щему игроку это обеспечивает 79,6 процента успешных уда- ров.
    Обратите внимание на следующий факт – на пер-
    вый взгляд он кажется совпадением: процент положитель- ных исходов, который может обеспечить себе бьющий иг- рок, выбрав оптимальное смешивание стратегий (а именно
    79,6 процента), совпадает с процентом положительных ис- ходов, которым вратарь может ограничить бьющего игрока,
    выбрав свое оптимальное смешивание стратегий. На самом деле это не совпадение, а важное общее свойство равновесия в смешанных стратегиях в играх с чистым конфликтом (иг- рах с нулевой суммой).
    Этот результат, который получил название «теорема о ми- нимаксе», впервые сформулировал математик Принстонско- го университета, человек энциклопедических знаний Джон фон Нейман. Впоследствии в соавторстве с экономистом
    Принстонского университета он развил эту идею в классиче- ской книге Theory of Games and Economic Behavior
    142
    , кото- рая и положила начало теории игр.
    Теорема о минимаксе гласит, что в играх с нулевой сум- мой, в которых интересы игроков прямо противоположны
    (выигрыш одного означает проигрыш другого), один игрок должен стремиться к тому, чтобы минимизировать макси- мальный выигрыш соперника, тогда как его соперник стре- мится максимизировать свой минимальный выигрыш. Та- кой подход к ведению игры приводит к поразительному вы-
    142
    Нейман фон Дж., Моргенштерн О. Теория игр и экономическое поведение.
    М.: Наука, 1970. (Впервые книга была опубликована издательством Princeton
    University Press в 1944 году.)
    воду: минимальный из максимальных выигрышей (мини- макс) эквивалентен максимальному из минимальных выиг- рышей (максимин). Общее доказательство теоремы доста- точно сложное, но результат полезен и его стоит запомнить.
    Если все, что вам нужно знать, – это выигрыш одного игро- ка или проигрыш другого в случае, когда оба применяют во время игры оптимальное смешивание стратегий, необходи- мо только рассчитать оптимальную пропорцию смешивания стратегий для одного из них и определить результат такого смешивания.
    1   ...   8   9   10   11   12   13   14   15   ...   38


    написать администратору сайта