Текст книги "Стратегические игры. Доступный учебник по теории игр"
Автор книги: Авинаш Диксит
Жанр: Зарубежная образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 23 (всего у книги 72 страниц) [доступный отрывок для чтения: 23 страниц]
Наше обсуждение игр со смешанными стратегиями до сих пор ограничивалось только играми, в которых у каждого участника было по две чистые стратегии, а также их комбинации. Однако во многих стратегических ситуациях каждый игрок располагает большим количеством чистых стратегий, поэтому мы должны подготовиться к вычислению равновесных смешанных стратегий и в подобных случаях. Но уровень сложности таких расчетов стремительно повышается. В поистине сложных играх для поиска равновесия в смешанных стратегиях нам пришлось бы прибегнуть к помощи компьютера. Тем не менее в некоторых небольших играх найти такое равновесие вручную не составит труда. И этот процесс вычислений позволит лучше понять, как работает равновесие, чем при анализе решения, сгенерированного компьютером. По этой причине в данном и следующем разделах мы поищем решение более крупных игр.
В этом разделе мы остановимся на играх с нулевой суммой, в которых у одного из игроков всего две чистые стратегии, тогда как у другого – больше. Как мы заметили, в таких играх игрок, имеющий три (или более) чистые стратегии, как правило, использует в равновесии только две. Остальные просто не входят в эту комбинацию стратегий, то есть вероятность их применения равна нулю. Мы должны лишь определить, какие стратегии используются в равновесии, а какие нет[99]99
Даже если игрок располагает только двумя чистыми стратегиями, он может не применять одну из них в равновесии. В таком случае другой игрок обычно обнаруживает, что одна из его стратегий более эффективна в игре против той стратегии, которую первый игрок все же использует. Иными словами, такая равновесная «комбинация» стратегий сводится к частному случаю чистых стратегий. Однако если в распоряжении одного или обоих игроков есть три или более стратегии, мы можем получить настоящее равновесие в смешанных стратегиях, где некоторые из чистых стратегий остаются неиспользованными.
[Закрыть].
В качестве примера рассмотрим игру в розыгрыш очка в теннисе, включив в число стратегий Эверт третий тип возврата подачи. Помимо удара по линии и удара по диагонали теперь она может использовать свечу (более медленный, но и более высокий и длинный удар). Равновесие зависит от выигрышей в случае применения свечи против каждой из двух оборонительных стратегий Навратиловой. Начнем с самого вероятного случая, а затем перейдем к анализу особого случая.
А. Общий случай
Теперь в распоряжении Эверт три чистые стратегии: ПЛ (по линии), ПД (по диагонали) и СВ (свеча), а у Навратиловой только две: прикрывать удар ПЛ или прикрывать удар ПД. Таблица выигрышей этой новой игры представлена на рис. 7.8. Мы исходили из предположения, что выигрыши Эверт от стратегии СВ находятся в диапазоне между максимальным и минимальным выигрышами, которые она может получить от стратегий ПЛ и ПД, а также что они не слишком отличаются в случаях, когда Навратилова прикрывает ПЛ или ПД. В таблице отображены выигрыши не только от чистых стратегий, но и от трех чистых стратегий Эверт против q-комбинации Навратиловой. (Мы не показываем строку для p-комбинации Эверт, поскольку в этом нет необходимости. Для этого понадобились бы две вероятности, скажем, p1 в случае стратегии ПЛ и p2 в случае стратегии ПД; тогда вероятность стратегии СВ составила бы (1 – p1 – p2). В следующем разделе мы расскажем, как найти равновесные комбинации стратегий такого типа.)
.
Рис. 7.8. Таблица выигрышей в игре с розыгрышем очка с использованием стратегии «свеча»
Строго говоря, прежде чем приступать к поиску равновесия в смешанных стратегиях, мы должны убедиться в том, что в игре отсутствует равновесие в чистых стратегиях. Однако сделать это достаточно легко, поэтому оставляем эту задачу вам и переходим к смешанным стратегиям.
Мы проанализируем оптимальный выбор q Навратиловой с помощью логики наилучших ответов. На рис. 7.9 показаны ожидаемые выигрыши Эверт (проценты успеха) в случае выбора каждой из чистых стратегий – ПЛ, ПД и СВ, тогда как значение q в q-комбинации Навратиловой меняется в интервале от 0 до 1. На данном рисунке изображены графики формул расчета выигрышей, представленных в правом столбце таблицы на рис. 7.8. По каждому значению q при выборе Навратиловой данной q-комбинации в равновесии наилучшим ответом Эверт был бы выбор стратегии, обеспечивающей ей (Эверт) самый высокий выигрыш. На рис. 7.9 совокупность наилучших исходов для Эверт выделена более жирной линией, называемой на языке математики верхней огибающей трех линий выигрышей. Навратилова стремится выбрать свое наилучшее значение q, которое бы позволило ей получить как можно более высокий выигрыш (тем самым понизив выигрыш Эверт, насколько возможно) из этой совокупности наилучших ответов Эверт.
.
Рис. 7.9. Поиск q-комбинации Навратиловой графическим способом
Для более точного определения оптимального выбора q Навратиловой мы должны вычислить координаты точек излома линии, соответствующей ее наихудшему исходу (и наилучшему исходу для Эверт). Значение q в крайней левой точке излома линии означает безразличие Эверт в отношении выбора между ПЛ и СВ. Это значение q должно равняться двум выигрышам от использования стратегий ПЛ и СВ против данной q-комбинации. Приравняв эти два выражения, получим 50q + 80(1 – q) = 70q + 60(1 – q), или q = 20/40 = 1/2 = 50 %. Ожидаемый выигрыш Эверт в этой точке составит 50 × 0,5 + 80 × 0,5 = 70 × 0,5 + 60 × 0,5 = 65. Во второй (крайней правой) точке излома Эверт безразлично, какую стратегию выбрать, ПД или СВ. Таким образом, значение q в этой точке приравнивает выражения для вычисления выигрышей от стратегий ПД и СВ. Установив равенство 90q + 20(1 – q) = 70q + 60(1 – q), находим значение q = 40/60 = 2/3 = 66,7 %. В этом случае ожидаемый выигрыш Эверт составляет 90 × 0,667 + 20 × 0,333 = 70 × 0,667 + 60 × 0,333 = 66,67. Следовательно, наилучший (или наименее неблагоприятный) выбор q Навратиловой находится в крайней левой точке излома, то есть q = 0,5. При этом ожидаемый выигрыш Эверт равен 65, а Навратиловой, соответственно, 35.
Когда Навратилова выбирает q = 0,5, Эверт безразлично, какую стратегию применить, ПЛ или СВ, а значит, выбор любой из них обеспечивает ей более высокий выигрыш, чем стратегия ПД. Поэтому Эверт не станет включать стратегию ПД в равновесие, и она станет неиспользуемой в равновесной комбинации стратегий Эверт.
Теперь продолжим анализ равновесия так, как если бы это была игра с двумя чистыми стратегиями у каждой из ее участницы: ПЛ и ПД у Навратиловой и ПЛ и СВ у Эверт. Итак, мы вернулись на знакомую почву, поэтому предоставляем вам возможность выполнить необходимые расчеты самостоятельно и приводим здесь только результат. Оптимальная комбинация стратегий Эверт в данной игре подразумевает выбор стратегии ПЛ с вероятностью 0,25 и стратегии СВ с вероятностью 0,75. Ожидаемый выигрыш Эверт от этой комбинации стратегий, использованных в игре против ПЛ и ПД Навратиловой соответственно, составляет 50 × 0,25 + 70 × 0,75 = 80 × 0,25 + 60 × 0,75 = 65, как, разумеется, и должно быть.
Мы не могли начать этот анализ с игры два на два, поскольку не знали заранее, какую из трех стратегий Эверт не будет использовать. Однако мы не сомневаемся, что в общем случае обязательно будет одна такая стратегия. Когда три линии ожидаемых выигрышей занимают самые общие положения, они пересекаются попарно, а не все в одной точке. При этом верхняя огибающая имеет форму как на рис. 7.9. Самая нижняя точка огибающей задается пересечением линий выигрышей, соответствующих двум из трех стратегий. Выигрыш от третьей стратегии находится ниже пересечения в этой точке, а значит, игрок, выбирающий между тремя стратегиями, не будет использовать именно третью стратегию.
Б. Особые случаи
Положения и пересечения трех линий на рис. 7.9 зависят от выигрышей, указанных для чистых стратегий. Для данной игры мы выбирали выигрыши, позволяющие проиллюстрировать общую конфигурацию линий. Однако, если выигрыши находятся в весьма своеобразной зависимости друг от друга, мы можем получить особые конфигурации с различными результатами. Мы проанализируем здесь такие варианты, а возможность построить новые графики для этих случаев предоставляем вам.
Во-первых, если выигрыши от стратегии СВ, применяемой Эверт против стратегий ПЛ и ПД Навратиловой, равны, прямая СВ будет горизонтальной; при этом весь диапазон значений q делает комбинацию стратегий Навратиловой защищенной от использования. Например, если каждый из двух выигрышей в строке СВ таблицы на рис. 7.8 равен 70, то нетрудно определить, что левая точка излома на обновленном рис. 7.9 находилась бы в точке, соответствующей значению q = 1/3, а правая точка излома – в точке q = 5/7. При любом значении q в диапазоне от 1/3 до 5/7 наилучший ответ Эверт – СВ, а значит, мы получаем необычное равновесие, в котором Эверт выбирает чистую стратегию, а Навратилова чистые стратегии смешивает. Более того, вероятности чистых стратегий в равновесной смешанной стратегии Навратиловой имеют неопределенное значение в диапазоне от q = 1/3 до q = 5/7.
Во-вторых, если выигрыши Эверт при использовании стратегии СВ против стратегий ПЛ и ПД Навратиловой на определенную величину ниже выигрышей, представленных в таблице на рис. 7.8 (или если выигрыши от оставшихся двух стратегий на определенную величину выше указанных в таблице), все три прямые могут пересекаться в одной точке. Например, если выигрыши Эверт от стратегии СВ против стратегий ПЛ и ПД Навратиловой составляют не 70 и 60, а 66 и 56 соответственно, то при q = 0,6 ожидаемый выигрыш Эверт от стратегии СВ равен 66 × 0,6 + 56 × 0,4 = 39,6 + 22,6 = 62, то есть такой же, как и выигрыш от стратегий ПЛ и ПД при q = 0,6. В таком случае Эверт безразлично, какую из трех имеющихся стратегий выбрать при q = 0,6, и она готова смешивать все три.
В этом особом случае вероятности чистых стратегий в равновесной комбинации стратегий Эверт не могут быть полностью определенными. Напротив, целый диапазон комбинаций (в том числе и использующих все три стратегии) может выполнять задачу по поддержанию безразличия Навратиловой в отношении выбора между стратегиями ПЛ и ПД, а значит, и готовности их смешивать. Тем не менее Навратилова должна применить комбинацию со значением q = 0,6. Если она этого не сделает, наилучшим ответом Эверт будет переход к одной из чистых стратегий в ущерб Навратиловой. Мы не станем подробно останавливаться на определении точного диапазона, в котором могут меняться равновесные смешанные стратегии Эверт, поскольку такая ситуация может сложиться лишь при особых комбинациях выигрышей и, стало быть, это не столь важно.
Обратите внимание, что выигрыши Эверт от использования стратегии СВ против стратегий ПЛ и ПД Навратиловой могут быть даже ниже значения, при котором все три прямые пересекаются в одной точке (например, если бы выигрыши от СВ равнялись 75 и 30 вместо 70 и 60, как на рис. 7.8). Тогда стратегия СВ не может быть наилучшим ответом Эверт, хотя она не является ни доминируемой стратегией ПЛ, ни доминируемой стратегией ПД. Случай, когда стратегия СВ доминируема по отношению к комбинации стратегий ПЛ и ПД, рассматривается в онлайн-приложении в данной главе.
7. Смешивание стратегий при наличии трех стратегий у обоих игроковПри рассмотрении игр, в которых у обоих игроков есть по три чистые стратегии с возможностью смешивания всех трех, необходимы две переменные, чтобы задать каждую комбинацию стратегий[100]100
В общем случае, если у игрока N чистых стратегий, то его комбинация содержит (N − 1) независимых переменных, или степеней свободы выбора.
[Закрыть]. В комбинации игрока, данные которого отображаются в строках, его первой чистой стратегии соответствует вероятность p1, а второй – вероятность p2. Тогда вероятность использования третьей чистой стратегии должна составлять 1 минус сумма вероятностей остальных двух стратегий. То же самое касается комбинации игрока, которому соответствуют столбцы. Таким образом, когда каждый игрок имеет по три чистые стратегии, найти равновесие в смешанных стратегиях без выполнения алгебраических операций с двумя переменными нельзя. Тем не менее зачастую такие алгебраические расчеты вполне выполнимы.
А. Полная комбинация всех стратегий
Рассмотрим упрощенное представление пенальти в футболе. Предположим, выполняющий его игрок, бьющий правой ногой, имеет три чистые стратегии: удар влево, вправо или в центр (налево или направо по отношению к вратарю; для игрока-правши было бы логично отправить мяч направо от вратаря), и может смешивать их с вероятностями, обозначенными как pл, pп, pц соответственно. Любые две из этих вероятностей можно принять как независимые переменные, а третью выразить через них. Если pл и pп – независимые переменные, то pц = 1 – pл – pп. Вратарь также располагает тремя чистыми стратегиями, а именно двигаться налево от бьющего игрока (направо от самого вратаря), направо от бьющего игрока (налево от вратаря) или оставаться в центре. Кроме того, вратарь может их смешивать с вероятностями qл, qп, qц, две из которых могут быть выбраны в качестве независимых переменных.
Как и в разделе 6.А, график наилучших ответов для этой игры потребовал бы более двух размерностей. (Точнее говоря, четыре. Вратарь выбрал бы свои две независимые переменные, скажем (qл, qп), как свой наилучший ответ на две независимые переменные игрока, выполняющего пенальти (pл, pп), и наоборот.) Вместо этого мы снова воспользуемся свойством безразличия соперника, чтобы сфокусироваться на вероятностях чистых стратегий в смешанной стратегии по одному игроку за один раз. В случае каждого игрока вероятности должны быть такими, чтобы другому игроку было безразлично, какую стратегию из имеющихся в его комбинации стратегий выбрать. Это дает нам систему уравнений, которая позволит найти вероятности применения чистых стратегий в смешанной стратегии. В примере с футболом переменные (pл, pп) удовлетворяли бы двум уравнениям, выражающим требование о том, что ожидаемый выигрыш вратаря от использования стратегии «налево» должен быть равен ожидаемому выигрышу от применения стратегии «направо», а также что ожидаемый выигрыш вратаря от выбора стратегии «направо» должен равняться ожидаемому выигрышу от выбора стратегии «в центре». (В таком случае равенство ожидаемых выигрышей от применения стратегий «налево» и «в центре» определяется автоматически и не требует отдельного уравнения.) При большем количестве стратегий число вероятностей, подлежащих вычислению, и уравнений, которым они должны удовлетворять, тоже увеличивается.
На рис. 7.10 показана таблица взаимодействия между игроком, выполняющим пенальти, и вратарем, где в качестве выигрышей каждого игрока указаны проценты успешных действий. (В этой таблице для упрощения расчетов приведены не фактические данные европейского футбола, представленные чуть ниже, а аналогичные округленные числа.) Поскольку игрок, бьющий пенальти, хочет максимально увеличить выраженную в процентах вероятность того, что он забьет гол, а вратарь стремится минимизировать вероятность того, что он его пропустит, мы имеем дело с игрой с нулевой суммой. Например, в ситуации, когда бьющий игрок отправит мяч налево от себя, а вратарь сделает движение налево от бьющего игрока (ячейка в верхнем левом углу), мы исходим из предположения, что бьющему игроку все равно удастся забить гол в 45 % случаев, стало быть, вратарь сможет отразить удар в 55 % случаев. Однако если бьющий игрок отправит мяч направо от себя, а вратарь сделает движение налево от него, то у бьющего есть возможность забить гол с вероятностью 90 %; мы исходим из того, что он с вероятностью 10 % может ударить мимо или выше ворот, а значит, вратарь может добиться успеха в 10 % случаев. Вы можете поэкспериментировать с другими, более приемлемыми, на ваш взгляд, значениями выигрышей.
.
Рис. 7.10. Игра в пенальти в футболе
Легко убедиться, что в этой игре нет равновесия в чистых стратегиях. Поэтому допустимя, что игрок, выполняющий пенальти, смешивает стратегии с вероятностями pл, pп и pц = 1 – pл – pп. По каждой чистой стратегии вратаря эта комбинация обеспечивает ему следующие выигрыши:
«Налево»: 55pл + 15pц + 5pп = 55pл + 15(1 – pл – pп) + 5pп.
«В центр»: 10pл + 100pц + 5pп = 10pл + 100(1 – pл – pп) + 5pп.
«Направо»: 10pл + 15pц + 40pп = 10pл + 15(1 – pл – pп) + 40pп.
Правило безразличия соперника гласит, что бьющий игрок должен выбрать pл и pп, с тем чтобы в равновесии все три выражения были эквивалентны.
Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 45pл = 35pп, или pп = (9/7)pл. Далее приравниваем выражения, соответствующие стратегиям «в центре» и «направо», и упрощаем полученное равенство с помощью только что выведенного соотношения между pп. Это дает 10pл + 100[1 – pл – (9pл / 7)] + 5(9pл / 7) = 10pл + 15[1 – pл – (9pл / 7)] + 40 (9pл / 7), или [85 + 120(9/7)] pл = 85, что дает pл = 0,355. Далее получаем pп = 0,355(9/7) = 0,457 и, наконец, pц = 1–0,355 – 0,457 = 0,188. Затем вычисляем с помощью представленных выше трех строк выигрышей выигрыш вратаря от любой из его трех стратегий против этой комбинации стратегий; результат – 24,6.
Вероятности чистых стратегий в смешанной стратегии вратаря можно определить, записав и решив уравнения безразличия бьющего игрока в отношении его выбора из трех чистых стратегий в игре против комбинации стратегий вратаря. Мы будем это делать в ходе анализа несколько измененного варианта этой игры в разделе 7.Б, поэтому здесь опускаем детали и просто приводим полученный результат: qл = 0,325, qп = 0,561 и qц = 0,113. Выигрыш бьющего игрока от любой из его чистых стратегий в игре против равновесной комбинации стратегий вратаря составляет 75,4. Разумеется, он согласуется с выигрышем вратаря 24,6, который мы вычислили выше.
Теперь можем разъяснить эти выводы. Игрок, выполняющий пенальти, получит более высокий выигрыш от своей чистой стратегии «направо», чем от чистой стратегии «налево», как в случае, если вратарь правильно угадает его ход (60 > 45), так и если он ошибется (95 > 90). (Предположительно игрок будет бить левой, а значит, может сделать более сильный удар направо.) Таким образом, бьющий игрок выберет с самой высокой вероятностью стратегию «направо», и чтобы противостоять этому, вратарь также с высокой вероятностью выберет стратегию «направо»; однако при таком раскладе выигрыш бьющего в итоге составит всего 60, то есть меньше выигрыша 75,4, который он получит при равновесии в смешанных стратегиях.
Б. Равновесные комбинации, в которых используются не все стратегии
В равновесии из предыдущего примера вероятность применения стратегии «в центре» в смешанной стратегии достаточно низкая для каждого игрока. Комбинация «в центр» / «в центре» привела бы к гарантированному отражению пенальти, и бьющий игрок получил бы поистине низкий выигрыш, то есть ноль. В связи с чем данный игрок присваивает этому выбору низкую вероятность. Но тогда вратарь также должен присвоить выбору этой стратегии низкую вероятность, сосредоточившись на противодействии более вероятным стратегиям бьющего игрока. Но если последний получит достаточно высокий выигрыш от выбора стратегии «в центр», когда вратарь применит «налево» или «направо», то он будет выбирать «в центр» с определенной положительной вероятностью. Если бы выигрыши бьющего игрока в строке, соответствующей стратегии «в центр», были ниже, то он мог бы использовать стратегию «в центр» с нулевой вероятностью; тогда вратарь также присвоил бы нулевую вероятность стратегии «в центре». При таком развитии событий данная игра превратилась бы в игру с двумя базовыми чистыми стратегиями, «налево» и «направо», находящимися в распоряжении каждого игрока.
Этот вариант игры в футбол показан на рис. 7.11. Единственное различие между выигрышами в данной и первоначальной версии игры (рис. 7.10) состоит в том, что выигрыши бьющего игрока от комбинации стратегий «в центр» / «слева» и «в центр» / «справа» сократились еще больше, с 85 до 70. Это могло произойти потому, что бьющему игроку свойственно посылать мяч слишком высоко, а значит, он часто промахивается, целясь в центр. Попробуем вычислить равновесие в этой игре, воспользовавшись тем же методом, что и в разделе 7.А. На этот раз сделаем это с позиции вратаря, попытавшись найти вероятности применения чистых стратегий qл, qп и qц в смешанной стратегии с помощью условия безразличия бьющего игрока в отношении выбора между тремя чистыми стратегиями в игре против данной комбинации стратегий.
.
Рис. 7.11. Вариант игры в пенальти в футболе
Выигрыши бьющего игрока от его чистых стратегий составляют:
«Налево»: 45qл + 90qц + 90qп = 45qл + 90(1 – qл – qп) + 90qп = 45qл + 90(1 – qл).
«В центре»: 70qл + 0qц + 70qп = 70qл + 70qп.
«Направо»: 95qл + 95qц + 60qп = 95qл + 95(1 – qл – qп) + 60qп = 95(1 – qл) + 60qп.
Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 90–45qл = 95–35qп, или 35qп = 5 + 45qл. Далее приравниваем выражения, соответствующие стратегиям «налево» и «в центр», и упрощаем их, что дает 90–45qл = 70qл + 70qп, или 115qл + 70qп = 90. Подставив qп из первого уравнения (сначала умножив все члены уравнения на 2, чтобы вышло 70qп = 10 + 90qл) во второе, получаем 205qл = 80, или qл = 0,390. Затем, подставив это значение qл в любое из уравнений, получим qп = 0,644. И наконец, используем эти оба значения, чтобы получить qц = 1–0,390 – 0,644 = –0,034. Поскольку значение вероятности не может быть отрицательным, что-то явно пошло не так.
Чтобы понять, что происходит в данном примере, для начала обратите внимание на то, что теперь для бьющего пенальти игрока стратегия «в центр» хуже этой же стратегии в первоначальной версии игры, где вероятность ее выбора уже была достаточно низкой. Однако логика безразличия соперника, выраженная в виде уравнений, приведших к данному решению, означает, что бьющий игрок должен быть готов использовать эту плохую стратегию. Это может произойти только тогда, когда вратарь достаточно редко применяет свою наилучшую стратегию противодействия стратегии бьющего игрока «в центр», а именно стратегию «в центре». В данном примере такую логику рассуждений необходимо продолжать до тех пор, пока вероятность применения вратарем стратегии «в центре» не станет отрицательной.
С сугубо алгебраической точки зрения полученное решение вполне приемлемо, однако оно нарушает требование теории вероятностей и свойственной реальной жизни рандомизации в отношении того, что значение вероятности не может быть отрицательным. Лучшее, что здесь можно сделать, – снизить вероятность выбора вратарем стратегии «в центре» до минимального значения, то есть до нуля. Но в этом случае бьющий игрок не склонен к выбору стратегии «в центр». Иными словами, мы получаем ситуацию, в которой каждый игрок не использует одну из своих чистых стратегий в смешанной стратегии или использует ее с нулевой вероятностью.
Но тогда может ли существовать равновесие, в котором каждый игрок смешивает две оставшиеся стратегии – «налево» и «направо»? Если рассматривать эту сокращенную игру два на два саму по себе, можно без труда найти ее равновесие в смешанных стратегиях. Учитывая, что к настоящему моменту вы уже накопили достаточно большой опыт, мы оставляем детали поиска равновесия вам и приводим только полученный результат.
Вероятности применения чистых стратегий в смешанной стратегии бьющего игрока: pл = 0,4375, pл = 0,5625.
Вероятности применения чистых стратегий в смешанной стратегии вратаря: qл = 0,3750, qп = 0,6250.
Ожидаемый выигрыш бьющего игрока (процент успеха): 73,13.
Ожидаемый выигрыш вратаря (процент успеха): 26,87.
Мы получили этот результат, просто исключив стратегии двух игроков «в центр» и «в центре», руководствуясь интуицией. Но мы должны проверить, действительно ли это равновесие будет таковым в полной игре три на три, то есть должны убедиться, что ни один игрок не сочтет нужным применить третью стратегию в случае комбинации двух стратегий, выбранных другим игроком.
При выборе вратарем той или иной комбинации стратегий выигрыш бьющего игрока от применения чистой стратегии «в центр» составляет 0,375 × 70 + 0,625 × 70 = 70, что меньше выигрыша 73,13, который он получит от любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации, а значит, бьющему игроку нет необходимости применять стратегию «в центр». Когда бьющий игрок выбирает комбинацию из двух стратегий с указанными выше вероятностями, выигрыш вратаря от использования чистой стратегии «в центре» составляет 0,4375 × 10 + 0,5625 × 50 = 7,2. И он существенно ниже выигрыша 26,87, который вратарь получил бы в случае применения любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации. Таким образом, вратарю также не имеет смысла применять стратегию «в центре». Следовательно, равновесие, которое мы нашли для игры два на два, актуально и для игры три на три.
Чтобы предусмотреть вероятность того, что некоторые стратегии могут остаться незадействованными в равновесной комбинации стратегий, следует уточнить или расширить принцип безразличия соперника. Равновесная комбинация каждого игрока должна быть такой, чтобы другому игроку было безразлично, какую именно стратегию выбрать из тех, которые действительно используются в его равновесной комбинации, то есть другому игроку не безразличен выбор между ними и неиспользованными стратегиями и он отдает предпочтение выбранным стратегиям перед невыбранными. Иными словами, в игре против равновесной комбинации соперника все стратегии, вошедшие в состав вашей равновесной комбинации, должны обеспечивать вам один и тот же ожидаемый выигрыш, а он, в свою очередь, должен превышать выигрыш, который бы вы получили от любой из неиспользованных стратегий.
Какие именно стратегии останутся неиспользованными в равновесии? Ответ на этот вопрос требует применения метода проб и ошибок, как в приведенных выше вычислениях, либо выполнения соответствующих расчетов с помощью компьютерной программы. Как только вы поймете саму концепцию, можете приступать ко второму. Описание общей теории равновесий в смешанных стратегиях в случаях, когда в распоряжении игроков есть любое количество возможных стратегий, ищите в онлайн-приложении к данной главе.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?