Текст книги "Стратегические игры. Доступный учебник по теории игр"
Автор книги: Авинаш Диксит
Жанр: Зарубежная образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 9 (всего у книги 72 страниц) [доступный отрывок для чтения: 23 страниц]
Участникам игр с последовательными ходами необходимо проанализировать последствия своих текущих ходов, прежде чем выбирать действия. Как правило, анализ чистых игр с последовательными ходами требует построения дерева игры. Такое дерево состоит из узлов и ветвей, отображающих все вероятные действия каждого игрока при каждой возможности сделать ход, а также выигрыши для всех предполагаемых исходов игры. Стратегия каждого игрока представляет собой исчерпывающий план, описывающий его действия в каждом узле принятия решений в зависимости от всех возможных комбинаций действий, предпринятых другими игроками в предыдущих узлах. В играх с последовательными ходами используется концепция равновесия обратных рассуждений, в соответствии с которой игроки определяют свои равновесные стратегии посредством прогнозного анализа последующих узлов и выполненных в них возможных действий, а также путем применения этих прогнозов для вычисления лучшего текущего действия. Этот процесс известен как «обратные рассуждения» или «обратная индукция».
Ряд типов игр предоставляет игрокам различные преимущества, такие, например, как преимущество первого хода. Наличие в игре большого количества участников или ходов приводит к росту дерева игры с последовательными ходами, но не меняет процесса ее решения. Иногда построение полного дерева игры может потребовать больше места или времени, чем это возможно на практике. Во многих случаях такие игры решаются путем простых логических размышлений или посредством определения стратегических сходных элементов различных действий, что позволяет уменьшить размер дерева игры.
При решении более крупных игр вербальные размышления могут привести к равновесию обратных рассуждений, если игра достаточно простая или ее полное дерево поддается построению и анализу. Если игра сложная, вербальные размышления слишком трудны, а полное дерево игры огромно, можно прибегнуть к помощи компьютерной программы. Игру в шашки удалось решить посредством такой программы, хотя полное решение игры в шахматы еще предположительно долго будет оставаться за пределами возможностей компьютеров. В реальных шахматных баталиях в определении ходов игроков присутствуют как элементы искусства (выявление закономерностей и возможностей в зависимости от рисков), так и науки (упреждающее вычисление вероятных исходов игры, вытекающее из результатов определенных ходов).
Проверка теории игр с последовательными ходами на первый взгляд подтверждает тот факт, что реальные игры демонстрируют иррациональность игроков или неспособность теории адекватно предсказывать их поведение. Встречный аргумент подчеркивает сложность фактических предпочтений в отношении различных возможных исходов игры, а также пользу стратегической теории для определения оптимальных действий в случаях, когда фактические предпочтения известны.
Ключевые терминыВетвь
Дерево игры
Дерево решений
Концевой узел
Корень (дерева)
Метод обратных рассуждений
Начальный узел
Обратная индукция
Отсечение (ветвей)
Преимущество второго хода
Преимущество первого хода
Путь игры
Равновесие обратных рассуждений
Равновесный путь игры
Узел
Узел действия
Узел принятия решений
Функция промежуточной оценки
Ход
Экстенсивная форма
Упражнения с решениямиS1. Предположим, два игрока, Гензель и Гретель, участвуют в игре с последовательными ходами. Гензель ходит первым, Гретель – второй, причем каждый ходит только раз.
a) Нарисуйте дерево игры, в которой у Гензеля есть два возможных действия («вверх» или «вниз») в каждом узле, а у Гретель – три («вверх», «посредине» или «вниз»). Сколько узлов каждого типа (узлов принятия решений и концевых узлов) присутствует в дереве этой игры?
b) Нарисуйте дерево для игры, в которой у Гензеля и Гретель по три возможных действия («сидеть», стоять» и «прыгать») в каждом узле. Сколько узлов двух типов присутствует в дереве такой игры?
c) Нарисуйте дерево для игры, в которой у Гензеля четыре возможных действия («север», «юг», «восток», «запад») в каждом узле, а у Гретель – два («стоять» или «идти»). Сколько узлов двух типов присутствует в дереве такой игры?
S2. Определите, сколько чистых стратегий (исчерпывающих планов действий) находится в распоряжении каждого игрока в следующих играх. Перечислите все чистые стратегии каждого игрока.
S3. Для каждой из игр, представленных в упражнении S2, вычислите исход, полученный посредством равновесия обратных рассуждений, а также полную равновесную стратегию каждого игрока.
S4. Рассмотрим соперничество между Airbus и Boeing в сфере разработки нового коммерческого реактивного самолета. Предположим, что Boeing лидирует в этом процессе, а в Airbus размышляют, стоит ли вступать в конкурентную борьбу. В случае отказа Airbus получит нулевую прибыль, тогда как Boeing станет монополистом и заработает 1 миллиард долларов. Если Airbus решит вступить в борьбу и создать конкурентоспособный самолет, то Boeing придется решать, уладить ли разногласия с Airbus мирным путем или развязать ценовую войну. Мирная конкуренция обеспечит каждой компании прибыль в 300 миллионов долларов, а ценовая война приведет к потере каждой из них 100 миллионов долларов, поскольку цены на самолеты настолько сильно упадут, что ни одна из них не сможет возместить затрат на разработку самолета.
Нарисуйте дерево этой игры. Найдите равновесия обратных рассуждений и опишите равновесные стратегии компаний.
S5. Рассмотрим игру, в которой два игрока, Фред и Барни, по очереди извлекают спички из кучки. Изначально там находится 21 спичка, и Фред ходит первым. На каждом ходе каждый игрок может убрать одну, две, три или четыре спички. Побеждает тот, кто забрал последнюю спичку.
a) Предположим, осталось шесть спичек и пришла очередь Барни ходить. Какой ход он должен сделать, чтобы обеспечить себе победу? Объясните логику своих рассуждений.
b) Допустим, осталось 12 спичек и настала очередь Барни ходить. Какой ход он должен сделать, чтобы обеспечить себе победу? (Совет: используйте свой ответ в пункте a и примените метод обратных рассуждений.)
c) Теперь начните с исходной точки игры. Если оба игрока выберут оптимальный способ ее ведения, то кто из них победит?
d) Какие оптимальные стратегии (исчерпывающие планы действий) есть в распоряжении каждого игрока?
S6. Проанализируем игру из предыдущего упражнения. Предположим, игроки достигли того момента, когда следующим ходить должен Фред, а спичек осталось всего пять.
a) Нарисуйте дерево этой игры, начиная с пяти спичек.
b) Найдите для нее равновесие обратных рассуждений, начиная с пяти спичек.
c) Можно ли сказать, что в этой игре с пятью спичками существует преимущество первого или второго хода?
d) Объясните, почему вы нашли более одного равновесия обратных рассуждений. Как ваш ответ связан с оптимальными стратегиями, которые вы определили в пункте с предыдущего упражнения?
S7. Элрой и Джуди играют в игру, которую Элрой называет «гонка до 100». Элрой ходит первым, и игроки по очереди выбирают числа от одного до девяти, на каждом ходе прибавляя новое число к промежуточной сумме. Победителем становится тот, кто увеличит промежуточную сумму ровно до 100.
a) Если оба игрока ведут игру оптимальным способом, то кто из них выиграет? Есть ли преимущество первого хода в этой игре? Объясните логику своих рассуждений.
b) Каковы оптимальные стратегии (исчерпывающие планы действий) для каждого игрока?
S8. В римском Колизее только что бросили раба на съедение львам. Три льва посажены на цепь в ряд, причем льву 1 до раба ближе всего. Длина цепи каждого льва такова, что он может дотянуться лишь до двух находящихся рядом с ним игроков.
Игра проходит следующим образом. Сначала лев 1 решает, съесть ли ему раба. Если он съедает, тогда лев 2 решает, съесть ли ему льва 1 (который стал слишком тяжелым, чтобы защищаться). Если лев 1 не съедает раба, тогда у льва 2 не остается выбора: бесполезно пытаться съесть льва 1, поскольку в драке погибнут они оба. Точно так же, если лев 2 съедает льва 1, то лев 3 решает, съесть ли ему льва 2.
Предпочтения каждого льва вполне естественны: лучший исход игры (4) – кого-то съесть и остаться в живых; следующий приемлемый исход (3) – выжить, но остаться голодным; следующий исход (2) – съесть кого-то и быть съеденным; худший исход (1) – остаться голодным и быть съеденным.
a) Нарисуйте дерево этой игры с выигрышами для трех участников.
b) Какое равновесие обратных рассуждений имеет место в этой игре? Обязательно опишите стратегии, а не только выигрыши.
c) Есть ли в этой игре преимущество первого хода? Объясните, почему есть или почему нет.
d) Сколько полных стратегий у каждого льва? Перечислите их.
S9. Три крупных универмага (Big Giant, Titan и Frieda’s) планируют открыть филиал в одном из двух новых торговых центров в районе Бостона. Торговый центр Urban Mall не очень большой и может вместить максимум два универмага в качестве «якорей», но зато он расположен рядом с крупным богатым населенным пунктом. Торговый центр Rural Mall находится дальше, в сельской сравнительно бедной местности и может вместить три якорных магазина. Ни один из трех универмагов не хочет открывать филиалы в обоих торговых центрах, потому что их сегменты покупателей частично пересекаются, а значит, размещение филиалов в обоих торговых центрах будет означать конкуренцию с самим собой. Каждый универмаг склонен работать в торговом центре вместе с одним или несколькими универмагами, а не в одиночку, поскольку такой торговый центр привлекает намного больше покупателей, что увеличивает прибыль каждого магазина. Кроме того, каждый универмаг предпочитает Urban Mall из-за более богатого контингента покупателей. Каждый универмаг должен выбрать между попыткой получить торговую площадь в Urban Mall (зная, что в случае неудачи можно попробовать побороться за место в Rural Mall) и ее получением в Rural Mall сразу же (даже не пробуя попасть в Urban Mall).
В данном случае универмаги так ранжируют пять возможных исходов этой игры: 5 (лучший исход) – в торговом центре Urban Mall вместе с другим универмагом; 4 – в торговом центре Rural Mall вместе с еще одним или двумя универмагами; 3 – один в Urban Mall; 2 – один в Rural Mall; 1 (худший исход) – один в Rural Mall после неудачной борьбы за место в Urban Mall, тогда как другие магазины уже получили лучшие якорные места в Urban Mall.
Поскольку в этих трех магазинах различные системы управления, они с разной скоростью готовят необходимые документы для получения торговой площади в новом торговом центре. В Frieda’s с этим справляются быстрее всех, затем следует Big Giant и наконец Titan, в котором процесс подготовки плана размещения филиала наименее эффективен. После подачи ими заявок на предоставление торговой площади торговый центр решает, какие универмаги выбрать. Учитывая узнаваемость названий Big Giant и Titan среди потенциальных покупателей, торговый центр выберет либо одного из них, либо обоих, прежде чем рассматривать запрос Frieda’s. Следовательно, Frieda’s не получит одну из торговых площадей в Urban Mall, если все три универмага подадут на них заявки; так будет даже в случае, если Frieda’s первым сделает свой ход.
a) Нарисуйте дерево этой игры с размещением универмагов в торговом центре.
b) Проиллюстрируйте процесс отсечения ветвей на дереве в ходе обратных рассуждений и используйте усеченное дерево для поиска равновесия обратных рассуждений. Опишите это равновесие с помощью (полных) стратегий, применяемых всеми универмагами. Какими окажутся выигрыши каждого универмага в случае исхода, полученного в результате равновесия обратных рассуждений?
S10 (дополнительное упражнение). Рассмотрим следующую ультимативную игру с переговорами, которая изучалась в ходе лабораторных экспериментов. Игрок, делающий предложение, ходит первым и предлагает разделить сумму в 10 долларов между собой и вторым игроком. Принцип дележа может быть любым. Например, игрок может оставить себе все 10 долларов, или взять себе 9 долларов и отдать 1 доллар оппоненту, или 8 долларов себе и 2 доллара другому игроку и т. д. (Обратите внимание, что в этом случае у предлагающего игрока одиннадцать возможных вариантов выбора.) Второй игрок, получив предложение о разделении общей суммы, может либо принять, либо отвергнуть его. Если он его примет, оба игрока получат предложенную сумму. Если отвергнет, оба не получат ничего.
a) Постройте дерево этой игры.
b) Сколько полных стратегий находится в распоряжении каждого игрока?
c) В чем состоит равновесие обратных рассуждений в этой игре при условии, что игроков интересует исключительно денежный выигрыш?
d) Предположим, второй игрок, Рейчел, примет любое предложение в 3 (или больше) доллара и отклонит любое предложение в 2 (или меньше) доллара. Допустим, предлагающий игрок, Пит, знает о стратегии Рейчел и хочет получить максимальный денежный выигрыш. Какую стратегию он применит?
e) Истинный выигрыш Рейчел (ее «полезность») может не совпадать с денежным выигрышем. Какие еще аспекты игры могут представлять для нее интерес? С учетом вашего ответа составьте набор выигрышей Рейчел, который бы сделал ее стратегию оптимальной.
f) В ходе лабораторных экспериментов игроки, как правило, не придерживаются равновесия обратных рассуждений. Игроки, делающие предложение, обычно предлагают соперникам сумму от 2 до 5 долларов. А те часто отклоняют предложения 3, 2 и особенно 1 доллар. Объясните, почему, по вашему мнению, происходит именно так.
Упражнения без решенийU1. «В игре с последовательными ходами игрок, делающий ход первым, непременно выиграет». Это утверждение истинно или ложно? Обоснуйте свой ответ посредством нескольких кратких предложений и приведите пример, иллюстрирующий его.
U2. Сколько стратегий (исчерпывающих планов действий) в каждой из представленных ниже игр имеется в распоряжении каждого игрока? Перечислите все чистые стратегии каждого игрока.
U3. Определите для каждой из игр, представленных в упражнении U2, исход, полученный посредством равновесия обратных рассуждений, и полную равновесную стратегию каждого игрока.
U4. В Вашингтоне проходят дебаты по предложениям А и Б. Конгресс предпочитает предложение А, тогда как президент – предложение Б. Эти предложения не взаимоисключающие: оба могут стать законами или быть отклонены. Таким образом, существует четыре возможных исхода, имеющих следующий рейтинг (более высокий показатель означает более предпочтительный исход).
a) Ходы в этой игре выполняются по следующей схеме. Сначала Конгресс решает, принимать ли законопроект и должен ли он включать в себя предложение А, или Б, или оба. Затем президент решает, подписать ли законопроект или наложить на него вето. У Конгресса нет достаточного количества голосов для преодоления вето. Нарисуйте дерево этой игры и найдите равновесие обратных рассуждений.
b) Предположим, правила игры изменились: президент получает право постатейного вето. Таким образом, если Конгресс примет законопроект, содержащий оба предложения, президент может не только выбирать, подписать его или наложить вето, но и накладывать вето лишь на одно из предложений. Постройте новое дерево игры и найдите равновесие обратных рассуждений.
c) Объясните на интуитивном уровне, в чем разница между этими двумя равновесиями.
U5. Два игрока, Эми и Бет, играют в игру, в которой разыгрывается банка с сотней монет номиналом 1 цент. Игроки делают ходы по очереди; Эми ходит первой. Каждый раз, когда наступает очередь одной из участниц ходить, она берет из банки от 1 до 10 центов. Побеждает тот, после чьего хода банка опустеет.
a) Если игроки ведут игру оптимальным способом, то кто из них выиграет? Есть ли в этой игре преимущество первого хода? Объясните логику своих рассуждений.
b) Какие оптимальные стратегии (исчерпывающие планы действий) имеются в распоряжении каждого игрока?
U6. Рассмотрим несколько измененный вариант игры, представленной в упражнении U5. Теперь игрок, опустошивший банку, проигрывает.
a) Присутствует ли преимущество первого хода в этой игре?
b) Какие оптимальные стратегии есть в распоряжении каждого игрока?
U7. Кермит и Фоззи играют в игру с двумя банками, в каждой из которых находится по 100 одноцентовых монет. Игроки делают ходы по очереди; Кермит ходит первым. Всякий раз, когда наступает очередь игрока ходить, он берет из одной из банок от 1 до 10 центов. Побеждает тот, после чьего хода обе банки опустеют. (Обратите внимание, что, когда игрок достает оставшиеся монеты из второй банки, первая банка уже должна быть пустой в результате предыдущего хода кого-то из игроков.)
a) В этой игре имеет место преимущество первого или второго хода? Объясните, кто из игроков может обеспечить себе победу и каким образом. (Совет: упростите игру, начав с меньшего количества монет в каждой банке, и попытайтесь понять, применимы ли сделанные выводы в реальной игре.)
b) Какие оптимальные стратегии есть в распоряжении каждого игрока? (Совет: сначала проанализируйте исходную ситуацию, в которой в обеих банках одинаковое количество монет, затем когда их количество от 1 до 10 центов и наконец когда число монет свыше 10 центов.)
U8. Измените упражнение S8 таким образом, чтобы в нем было четыре льва.
a) Постройте дерево игры с выигрышами для этих четырех участников.
b) Какое равновесие обратных рассуждений имеет в ней место? Обязательно опишите стратегии, а не только выигрыши.
c) Дополнительный лев – это хорошо или плохо для раба? Обоснуйте свой ответ.
U9. Для того чтобы предоставить маме один день отдыха, отец планирует устроить своим детям, Барту и Кэсси, воскресную экскурсию. Барт предпочитает поход в парк развлечений (Р), а Кэсси – в музей науки (Н). Каждый ребенок получит 3 единицы полезности за более предпочтительное занятие и только 2 единицы – за менее предпочтительное. Отец – 2 единицы полезности за любое из занятий.
Чтобы определиться с планами на воскресенье, отец намерен сначала спросить Барта о его предпочтениях, а затем Кэсси, после того как она узнает, что выбрал Барт. Каждый ребенок может выбрать либо парк развлечений (Р), либо музей науки (Н). Если оба остановятся на одном и том же, то именно туда все и пойдут. Если возникнут разногласия, тогда отец примет окончательное решение. У него как у отца есть дополнительный вариант действий: он может предложить парк развлечений, музей науки или поход в горы, причем за поход получит 3 единицы полезности, а Барт и Кэсси по 1.
Поскольку отец хочет, чтобы его дети не конфликтовали, он получит 2 дополнительные единицы полезности, если дети выберут одно и то же занятие (не имеет значения, какое именно).
a) Постройте дерево с выигрышами для этой игры с тремя участниками.
b) Какое равновесие обратных рассуждений имеет в ней место? Обязательно опишите стратегии, а не только выигрыши.
c) Сколько разных полных стратегий находится в распоряжении Барта? Обоснуйте свой ответ.
d) Сколько разных полных стратегий у Кэсси? Обоснуйте ответ.
U10 (дополнительное, более трудное упражнение). Рассмотрим дерево игры Survivor, представленное на рис. 3.11. Мы могли не угадать точные значения, которые Рик присвоил вероятностям различных исходов, поэтому давайте обобщим это дерево, проанализировав другие возможные значения. В частности, предположим, что вероятность победы в испытании на получение иммунитета в случае, если Рик выберет вариант «продолжить», составляет x для Рика, y для Келли и 1 – x – y для Руди; точно так же вероятность победы в случае отказа Рика от дальнейшей борьбы равна z для Келли и 1 – z для Руди. Далее допустим, что шанс Рика на то, что его выберет жюри, составляет p, если он выиграет испытание на получение иммунитета и проголосует за изгнание Руди с острова, и q, если Келли выиграет испытание и проголосует за изгнание Руди с острова. Предположим также, что, если Руди выиграет испытание на получение иммунитета, он поддержит Рика с вероятностью 1 и станет победителем в игре с вероятностью 1, если войдет в число двух финалистов. Обратите внимание, что в примере, отображенном на рис. 3.11, были такие значения: x = 0,45, y = 0,5, z = 0,9, р = 0,4 и q = 0,6. (В общем случае переменные p и q необязательно должны в сумме составлять 1, хотя именно так получилось на рис. 3.11.)
a) Найдите алгебраическую формулу, выраженную через x, y, z, p, q, для определения вероятности того, что Рик выиграет миллион долларов, если выберет вариант «продолжить». (Обратите внимание: формула может включать в себя не все переменные.)
b) Найдите аналогичную алгебраическую формулу для определения вероятности того, что Рик выиграет миллион долларов, если выберет вариант «прекратить». (Опять же, формула может не включать в себя все переменные.)
c) Используйте эти результаты для поиска алгебраического неравенства, указывающего, при каких обстоятельствах Рику следует выбрать вариант «прекратить».
d) Предположим, значения всех переменных те же, что и на рис. 3.11, кроме z. Насколько высоким или низким может быть значение z, чтобы Рик по-прежнему предпочел вариант «прекратить»? Объясните на интуитивном уровне, почему при некоторых значениях z Рику лучше выбрать вариант «продолжить».
e) Допустим, значения всех переменных те же, что и на рис. 3.11, за исключением p и q. Предположим также, что, поскольку жюри с большей вероятностью выберет того, кто не станет голосовать против Руди, значения p и q должны удовлетворять условию p > 0,5 > q. При каких значениях коэффициента p/q Рику следует выбрать вариант «прекратить»? Объясните на интуитивном уровне, почему при некоторых значениях p и q для Рика предпочтительнее вариант «продолжить».
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?