Главная страница
Навигация по странице:

  • Дилемма заключенных. Равновесие в доминирующих стратегиях.

  • Равновесие по Нэшу.

  • Метод обратной индукции и common knowledge.

  • Простейшая модель торга (дележка доллара). Факторы, обусловливающие пропорции раздела.

  • Усечение игры. Повторяемые игры.

  • Инстэк_коллоквиум_шпора. Функциональный спрос. Характеристики товаров и выбор потребителя (подход Ланкастера)


    Скачать 1.18 Mb.
    НазваниеФункциональный спрос. Характеристики товаров и выбор потребителя (подход Ланкастера)
    АнкорИнстэк_коллоквиум_шпора.doc
    Дата01.02.2017
    Размер1.18 Mb.
    Формат файлаdoc
    Имя файлаИнстэк_коллоквиум_шпора.doc
    ТипДокументы
    #1560
    страница3 из 4
    1   2   3   4

    Теория игр. Дилемма заключенных. Равновесие в доминирующих стратегиях. Равновесие по Нэшу. Последовательные игры с совершенной информацией. Метод обратной индукции и common knowledge. Соображения, связанные с правомерностью применения метода обратной индукции. Простейшая модель торга (дележка доллара). Информационное множество. Усечение игры. Совершенное равновесие по Нэшу. Повторяемые игры. Сигнализирующие игры.


    Дилемма заключенных. Равновесие в доминирующих стратегиях.

    Примеры взаимодействий, описываемых этой игрой.

    В первоначальной версии игры рассматривалась ситуация, в которой двоих заключенных — соучастников преступления — допрашивают в отдельных комнатах. У каждого из заключенных имеется выбор: либо признаться в преступлении и тем самым впутать другого, либо отрицать свое

    участие в преступлении. Если признается лишь один из заключенных, его освободят, и обвинение падет на другого заключенного, которого приговорят к 6 месяцам тюремного заключения. Если оба заключенных будут отрицать свою причастность к преступлению, обоих продержат в тюрьме

    по 1 месяцу в связи с соблюдением формальностей, а если оба игрока признаются, обоих приговорят к 3 месяцам тюремного заключения.

    Платежная матрица для этой игры приведена в таблице. Записи в каждой клетке матрицы представляют полезность, приписываемую каждым

    из игроков различным срокам пребывания в тюрьме, которую мы для простоты будем считать продолжительностью их тюремного заключения, взятой со знаком "минус".



    Поставьте себя на место игрока A. Если игрок B решит отрицать, что совершил преступление, то, конечно, вам лучше признаться, так как тогда вас освободят. Подобным же образом если игрок B признается, то вам лучше признаться, так как в этом случае вас приговорят не к 6 месяцам тюремного заключения, а только к 3. Следовательно, что бы ни делал игрок B, игроку A выгоднее признаться.
    То же самое можно сказать и об игроке B — ему тоже выгоднее признаться. Следовательно, единственное равновесие по Нэшу в этой игре — исход, при котором оба игрока признаются. В действительности исход, при котором оба игрока признаются, — это не только равновесие по Нэшу, но и равновесие при доминирующих стратегиях, поскольку у каждого игрока имеется один и

    тот же оптимальный выбор, независимый от выбора другого игрока.
    Но если бы они оба держали язык за зубами, им обоим это было бы выгоднее! Если бы они оба могли быть уверены в том, что другой промолчит, и договорились бы между собой не признаваться, то выигрыш каждого составил бы —1, что было бы выгодно обоим. Стратегия ("отрицать", "отрицать") эффективна по Парето, другой стратегии, которая была бы выгодна сразу обоим, нет, в то время, как стратегия ("признаться", "признаться") неэффективна по Парето.
    Проблема состоит в том, что заключенные лишены возможности координировать свои действия.
    Если бы каждый из них мог доверять другому, благосостояние обоих повысилось бы.
    Дилемма заключенного применима к широкому кругу экономических и политических явлений.
    Рассмотрим, например, проблему контроля над вооружением. Можно интерпретировать стратегию "признаться" как "развертывать новые ракеты", а стратегию "отрицать" — как "не развертывать новые ракеты". Обратите внимание на то, что выигрыши вполне подходят для такой игры. Если мой противник развертывает свои ракеты, я, конечно, захочу развертывать

    свои несмотря на то, что наилучшей стратегией для нас обоих было бы придти к соглашению о неразвертывании ракет. Однако если не существует способа заключить соглашение, реально обязывающее его участников к выполнению, мы в итоге оба развернем ракеты и благосостояние

    обоих понизится.
    Другой хороший пример применения дилеммы заключенного — проблема мошенничества в картеле. Теперь можно интерпретировать "признаться" как "превысить квоту выпуска", а "отрицать" — как "придерживаться первоначальной квоты". Если вы думаете, что другая фирма

    собирается придерживаться своей квоты, вам выгоднее превысить свою квоту. А если вы думаете, что другая фирма превысит свою квоту выпуска, то и вы тоже можете это сделать!
    Дилемма заключенного вызвала большие споры в отношении того, как же "правильно", или, точнее, как разумнее играть в эту игру. Ответ, похоже, зависит от того, разыгрывается ли игра в течение одного периода или повторяется бесконечное число раз.
    Если в игру играют только один раз, то разумной представляется стратегия нарушения условий соглашения — в рассматриваемом примере это стратегия "признаться". В конце концов, что бы ни делал другой, вам выгоднее следовать данной стратегии, и у вас нет способа повлиять на поведение другого игрока.
    Равновесие по Нэшу.

    Пара стратегий приводит к равновесию по Нэшу, если выбор, сделанный A, оптимален при данном выборе B, а выбор, сделанный B, оптимален при данном выборе A.
    Помните, что ни один из игроков не знает, что будет делать другой, когда ему самому придется выбирать стратегию. Однако у каждого игрока могут иметься какие-то ожидания в отношении возможного выбора другого игрока. Равновесие по Нэшу можно истолковывать как пару таких ожиданий в отношении выбора каждого игрока, что когда выбор каждого становится известным, ни один из игроков не хочет изменить свое поведение.



    В случае, представленном в таблице, стратегия ("верх", "слева") приводит к равновесию по Нэшу.

    Чтобы это доказать, обратите внимание на то, что если A выбирает "верх", то в лучше всего выбрать "слева", таккак выигрыш от выбора "слева" составляет для B 1, а от выбора "справа" — 0. Если же B выбирает "слева", то для A лучше всего выбрать "верх", поскольку тогда A получит выигрыш 2, а не 0.
    Таким образом, если A выбирает "верх", то оптимальным для B будет выбор "слева"; а если B выбирает "слева", то оптимальным для A будет выбор "верх". В итоге мы имеем равновесие по Нэшу: выбор каждого игрока оптимален при данном выборе другого игрока.
    Понятию равновесия по Нэшу нельзя отказать в определенной логике. К сожалению, с ним связаны и некоторые проблемы. Во-первых, игра может иметь больше одного равновесия по Нэшу. В самом деле, в таблице выбор ("низ", "справа") также есть равновесие по Нэшу. Вы можете либо проверить это с помощью аргументации, использованной выше, либо просто обратить внимание на то, что структура игры симметрична: B имеет при одном исходе те же выигрыши, что A при другом, так что, доказав, что ("верх", "слева") есть равновесие, мы тем самым доказали и что ("низ", "справа") тоже равновесие.
    Вторая проблема, связанная с понятием равновесия по Нэшу, состоит в том, что существуют игры, вообще не имеющие равновесия по Нэшу в том смысле, о котором шла речь. Рассмотрим, например, случай, описанный в таблице. Здесь равновесия Нэша в том виде, в каком оно изучалось нами, не существует. Если игрок A следует стратегии "верх", то игрок B захочет

    выбрать стратегию "слева". Но если игрок B следует стратегии "слева", то игрок A хочет следовать стратегии "низ". Аналогично если игрок A следует стратегии "низ", то игрок B будет следовать стратегии "слева". Если игрок В выбирает стратегию "справа", то А выбирает стратегию "верх".



    Равновесия с доминирующими стратегиями хороши, но встречаются не так уж часто. Например, в игре, описанной в таблице, нет равновесия с доминирующими стратегиями. В ней при выборе игроком B стратегии "слева" выигрыш для A составляет 2 или 0. Если В выбирает "справа", то

    выигрыш А — от 0 до 1. Это означает, что когда B выбирает стратегию "слева", A захочет выбрать стратегию "верх"; а когда B выбирает стратегию "справа", A захочет выбрать стратегию "низ".
    Следовательно, оптимальный выбор A зависит от того, каких действий он ожидает от B.



    Однако, возможно, равновесие с доминирующими стратегиями связано с чересчур большими требованиями. Вместо требования, чтобы выбор, сделанный игроком A, был оптимальным для всех выборов игрока B, можно просто потребовать, чтобы он был оптимальным для всех оптимальных выборов, сделанных B. Ведь если B — хорошо информированный умный игрок, он захочет выбирать только оптимальные стратегии. (Хотя то, что оптимально для B, будет зависеть также от выбора, сделанного A!).
    Метод обратной индукции и common knowledge.

    Мы считаем, что информация о полезности игроков есть у всех и она одинакова. Это позволяет нам построить дерево, и мы можем допустить, что игроки поступают рационально.
    Метод обратной индукции:

    Идём с конца в начало. Смотрим, какие варианты выберет игрок, ходящий последним. Потом то же для предыдущего хода. И, в результате, получаем ход игры.
    Простейшая модель торга (дележка доллара). Факторы, обусловливающие пропорции раздела.

    Есть два игрока, есть доллар, есть ставки процентов для каждого из игроков и количество дней, через которое этот наш доллар достанется кому-то одному из игроков. В каждый из периодов происходит торг и какой-то из игроков делает предложение второму, с заранее заданной очередностью.

    Суть этого торга – максимизировать собственную прибыль, путем предложения другому игроку такой суммы, которая с учетом ставки процентов будет не хуже, чем то, что он может получить в последующем периоде.

    Факторов не много, это ставки процентов, количество дней (шагов) торга и, что самое главное, то, как именно этот доллар «разделится» в последний день, ведь от этой суммы игра и отталкивается.

    Усечение игры. Повторяемые игры.

    Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик.
    Стратегия проста:

    сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.
    Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:
    Добрая

    Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
    Мстительная

    Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
    Прощающая

    Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
    Не завистливая

    Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.
    Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми, прощающими и не завистливыми.
    Стратегия наказания в теории игр, смысл которой состоит в том, что игрок, обиженный действиями другого игрока, предпринимает ответные действия, которые наказывают нанесшего обиду.
    Наказание может быть временным или постоянным; его цель заключается в применении таких мер строгости, которые могут уберечь от ответной реакции наказанного. Игроки должны учитывать свои издержки от применения стратегии наказания. Может быть необходимо наказать другую

    сторону, но для создания репутации, даже если достигнут эффект устрашения, нет необходимости применять наказание.
    Сигнализирующие игры.



    1. Основополагающие принципы анализа контрактных обязательств. Асимметрия информации как причина оппортунистического поведения агентов. Асимметричная информация и неблагоприятный отбор на рынке потребительских товаров и услуг. Рынок «лимонов»: модель Акерлофа.


    Неблагоприятный отбор - одна из моделей оппортунистического поведения, предшествующего заключению контракта.

    Возможность неблагоприятного отбора обусловлена асимметрией информации:
    ● покупатели в момент покупки (а иногда и позже) не в состоянии оценить качество приобретаемых им товаров или услуг;

    ● страховые компании не в состоянии оценить вероятность наступления страхового случая у лица (или фирмы), обратившегося за страховкой;

    ● банки не в состоянии оценить вероятность невозврата кредитов заемщиками;

    ● наймодатель не может оценить "качество" нанимаемых работников;

    ● регулирующий орган не обладает достаточной информацией о уровне издержек регулируемых фирм;

    ● владелец патента не в полной мере может оценить выигрыш возможных покупателей патента от его использования.
    Впервые внимание на трудности, возникающие на рынке в связи с асимметрией информации на стадии до заключения сделки, обратил внимание Акерлоф в 1970 году. Он рассмотрел механизм неблагоприятного отбора на примере рынка подержанных автомобилей.
    На этом рынке продаются хорошие автомобили, которые на жаргоне называются «сливы», и плохие автомобили (на жаргоне — «лимоны»).
    Продавцы располагают большей информацией о качестве автомобилей, которые они продают, чем покупатели. Но поскольку покупатели не могут

    провести различие между сливами и лимонами, то и хорошие, и плохие автомобили продаются по одной цене. Акерлоф утверждает, что в этой ситуации на рынке останутся в основном лимоны, и, возможно, хорошие автомобили вообще не будут предлагаться к продаже.
    Проиллюстрировать проблему неблагоприятного отбора можно с помощью простого числового примера. Пусть 100 человек, желают продать свои подержанные автомобили, а 100 человек, желают купить подержанные автомобили. Всем известно, что 50 автомобилей — это автомобили

    хорошего качества (на жаргоне — «слива»), а 50 автомобилей — это автомобили плохого качества (на жаргоне — «лимоны»). Владелец «лимона» готов продать свой автомобиль за 2000 долл., а владелец «сливы» готов продать автомобиль за 4000 долл. Покупатели готовы платить 2400 долл. за «лимон» и 4800 долл. за «сливу». Проблем не возникало бы, если бы

    проверить качество «лимонов» было легко. «Лимоны» продавались бы по цене от 2000 до 2400 долл., а «сливы» — по цене от 4000 до 4800 долл. Однако, покупатели не располагают информацией о качестве отдельных автомобилей. Автомобиль с равной вероятностью может оказаться и «сливой», и «лимоном». Типичный покупатель готов оплатить ожидаемую стоимость автомобиля:

    1/2 · 2400+ 1/2 · 4800 = 3600 долл.
    Кто захочет продать свой автомобиль по этой цене? Владельцы «лимонов» готовы это сделать, но владельцы «слив» хотят продать свой автомобиль по цене не меньше 4000 долл. Цена, которую должны заплатить за «средний» автомобиль покупатели, меньше той цены, по которой готовы продать свой автомобиль продавцы «слив». По цене 3600 долл. к продаже будут предложены только лимоны. Но если бы покупатель был уверен, что ему достанется «лимон», он не захотел бы заплатить за нее 3600 долл. На самом деле равновесная цена установилась бы где-то между 2000 и 2400 долл. По этой цене предлагались бы к продаже только «лимоны», и поэтому покупатели справедливо ожидали бы, что им достанется «лимон». Сливы на этом рынке вообще не предлагаются к продаже. Итак, несмотря на то, что цена, по которой покупатели готовы купить «сливы», превышает цену, по которой продавцы готовы их продать, ни одна из этих сделок не состоится.
    Методы противодействия неблагоприятному отбору на рынке потребительских товаров
    ● Фирмы: предоставление гарантии на продаваемый товар или предоставляемую услугу, репутация, стандарты и сертификаты качества.

    ● Государство: защита потребителей и защита от недобросовестной конкуренции (высокие трансакц. издержки). Методы противодействия неблагоприятному отбору на рынке страховых услуг

    ● Перечень нестраховых случаев. Например оговаривается, что выплата страховки на случай самоубийства осуществляется страховой компанией только в том случае, если оно произошло не ранее, чем через 1- 2 года после заключения договора. Тем не менее, статистика свидетельствует, что эта мера не слишком эффективна: пик самоубийств приходится на 13 и 25 месяцы с момента заключения страхового договора.

    ● Страхование по месту работы (что усредняет вероятность наступления некоторых страховых случаев, или позволяет оценить риск более точно ввиду однородности страхуемой группы). Государственное страхование простейшая версия: государство преодолевает "провалы рынка".
    Методы противодействия неблагоприятному отбору на рынке банковских кредитов: рационирование кредитов.
    Способ борьбы - не увеличивать процентную ставку , если существует избыточный спрос, а рационировать кредиты( нормировать их).
    В принципе выделяют два типа противодействия неблагоприятному отбору, различающихся в зависимости от того, какая из сторон (информированная или неинформированная) его осуществляет: сканирование и сигналы.


    1. Методы противодействия неблагоприятному отбору: сканирующие контракты. Информационная рента. Контракты первого и второго наилучшего. Игровое представление сканирующих взаимодействий. Дискриминация по количеству (дискриминация второго рода). Дискриминация по качеству. Сканирование на рынке страхования.


    1   2   3   4


    написать администратору сайта