Автор книги: Авинаш Диксит
Жанр: Личностный рост, Книги по психологии
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 12 (всего у книги 35 страниц) [доступный отрывок для чтения: 12 страниц]
Можно ли назвать смешивание стратегий по принципу 50:50 лучшим для вас? Нет. Попробуйте другой вариант – когда вы будете выбирать стратегию «слева» в 40 процентах случаев, а стратегию «справа» – в 60 процентах случаев. Положите в карман маленькую книжку, а когда будете готовы подбежать к мячу и сделать удар, достаньте ее и откройте на любой странице (снова так, чтобы не видел вратарь). Если последняя цифра номера страницы попадает в диапазон от 1 до 4, выберите стратегию «слева», а если от 5 до 10 – стратегию «справа». Теперь процент успешных ударов в случае, если вратарь выберет стратегию «слева», составит 0,4 × 58 + 0,6 × 93 = 79, а если стратегию «справа» – 0,4 × 95 + 0,6 × 70 = 80. Вратарь может держать вас на уровне 79 процентов, выбрав стратегию «слева», но это лучше, чем 75,5 процента успешных ударов, которые вы могли бы сделать в случае смешивания стратегий по принципу 50:50.
Обратите внимание на следующий факт: чем лучше пропорции смешивания стратегий игрока, выполняющего штрафной удар, тем меньше разница между показателями успешных ударов в случаях, когда вратарь выбирает стратегию «слева» и стратегию «справа». При выборе чистых стратегий эти показатели составляют 93 и 70 процентов; в случае смешивания стратегий по принципу 50:50–82,5 и 75,5 процента, а при смешивании стратегий в пропорции 40:60–80 и 79 процентов. Очевидно, что смешивание стратегий в оптимальной пропорции обеспечивает один и тот же процент успешных ударов независимо от того, какую стратегию выберет вратарь. Кроме того, это согласуется и с интуитивным предположением, что смешивание ходов – правильный подход, поскольку он не позволяет другому игроку извлекать для себя выгоду из любой системы или закономерности выбора.
Расчеты, о которых пойдет речь в одном из следующих разделов данной главы, свидетельствуют, что для игрока, выполняющего пенальти, лучше всего смешивать стратегии по такому принципу: выбирать стратегию «слева» в 38,3 процентах случаев и стратегию «справа» – в 61,7 процентах. Это обеспечит 0,383 × 58 + 0,617 × 93 = 79,6 процентах забитых мячей, если вратарь выберет стратегию «слева», и 0,383 × 95 + 0,617 × 70 = 79,6 процента забитых мячей, если вратарь выберет стратегию «справа».
А что насчет стратегии вратаря? Если он выберет чистую стратегию «слева», бьющий игрок может получить 93 процента забитых мячей, выбрав стратегию «справа»; если вратарь выберет чистую стратегию «справа», у бьющего игрока есть шансы получить 95 процентов забитых мячей при условии выбора стратегии «слева». Смешав свои стратегии, вратарь может удержать число успешных ударов игрока, выполняющего пенальти, на гораздо более низком уровне. Для вратаря оптимальна та пропорция смешивания стратегий, при которой у бьющего игрока сохранится процент успешных ударов независимо от того, какую стратегию он выберет – «слева» или «справа». С учетом этого условия вратарь должен выбрать смешивание стратегий «слева» и справа» в пропорции 41,7 процента и 58,3 процента соответственно; бьющему игроку это обеспечивает 79,6 процента успешных ударов.
Обратите внимание на следующий факт – на первый взгляд он кажется совпадением: процент положительных исходов, который может обеспечить себе бьющий игрок, выбрав оптимальное смешивание стратегий (а именно 79,6 процента), совпадает с процентом положительных исходов, которым вратарь может ограничить бьющего игрока, выбрав свое оптимальное смешивание стратегий. На самом деле это не совпадение, а важное общее свойство равновесия в смешанных стратегиях в играх с чистым конфликтом (играх с нулевой суммой).
Этот результат, который получил название «теорема о минимаксе», впервые сформулировал математик Принстонского университета, человек энциклопедических знаний Джон фон Нейман. Впоследствии в соавторстве с экономистом Принстонского университета он развил эту идею в классической книге Theory of Games and Economic Behavior[142]142
Нейман фон Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. (Впервые книга была опубликована издательством Princeton University Press в 1944 году.)
[Закрыть], которая и положила начало теории игр.
Теорема о минимаксе гласит, что в играх с нулевой суммой, в которых интересы игроков прямо противоположны (выигрыш одного означает проигрыш другого), один игрок должен стремиться к тому, чтобы минимизировать максимальный выигрыш соперника, тогда как его соперник стремится максимизировать свой минимальный выигрыш. Такой подход к ведению игры приводит к поразительному выводу: минимальный из максимальных выигрышей (минимакс) эквивалентен максимальному из минимальных выигрышей (максимин). Общее доказательство теоремы достаточно сложное, но результат полезен и его стоит запомнить. Если все, что вам нужно знать, – это выигрыш одного игрока или проигрыш другого в случае, когда оба применяют во время игры оптимальное смешивание стратегий, необходимо только рассчитать оптимальную пропорцию смешивания стратегий для одного из них и определить результат такого смешивания.
Теория и реальность
Насколько близки показатели реальных игроков, выполняющих штрафной удар, и вратарей нашим теоретическим расчетам соответствующих оптимальных смешанных стратегий? Обратите внимание на таблицу, составленную по данным, которые получил Игнасио Паласиос Уэрта, а также по данным наших расчетов[143]143
Некоторые числа немного отличаются от чисел Игнасио Паласиоса Уэрты, поскольку он использует данные с точностью до двух десятичных знаков, а мы решили округлить их для большей наглядности.
[Закрыть].
Неплохо, не правда ли? Во всех случаях фактический процент стратегии «слева» в смешанной стратегии достаточно близок к оптимальному. Фактические смешанные стратегии обеспечивают почти одинаковый процент положительных результатов при любом выборе другого игрока, а значит, делают первого игрока неуязвимым к попыткам эксплуатации, предпринимаемым другим игроком.
Аналогичные доказательства совпадения фактических результатов игры и теоретических прогнозов были получены в процессе анализа профессиональных теннисных матчей высшего уровня[144]144
Mark Walker and John Wooders, “Minimax Play at Wimbledon,” American Economic Review 91, no. 5 (December 2001): 1521–1538.
[Закрыть]. В этом нет ничего удивительного. Одни и те же люди регулярно играют друг против друга и изучают методы соперника, поэтому любая более или менее очевидная схема будет замечена и использована противником с выгодой для себя. Ставки же в таких матчах очень высоки в плане денег, достижений и славы; следовательно, игроки весьма заинтересованы в том, чтобы не совершать ошибок.
Тем не менее теория игр не всегда обеспечивает благоприятный исход. Далее в этой главе мы проанализируем, насколько эффективен или неэффективен метод смешивания стратегий в других играх и почему. Но сначала давайте кратко сформулируем то, о чем шла речь, в виде очередного правила:
ПРАВИЛО № 5: в игре с чистым конфликтом (игре с нулевой суммой), если вам невыгодно заранее раскрывать сопернику свой фактический выбор, следует случайным образом выбрать одну из имеющихся у вас чистых стратегий. Смешивать стратегии нужно в такой пропорции, чтобы соперник не смог извлечь для себя выгоду из вашего выбора, придерживаясь любой из имеющихся в его распоряжении чистых стратегий. Иными словами, вы получаете один и тот же средний выигрыш, если ваша смешанная стратегия противопоставлена каждой из чистых стратегий соперника[145]145
Одно предостережение: другой игрок может использовать в своей смешанной стратегии только часть имеющихся у него стратегий, поскольку другие стратегии обеспечат ему относительно низкий выигрыш (или дадут вам возможность получить особенно большой выигрыш). Равновесное решение покажет вам, какие стратегии задействованы в смешанной стратегии соперника. См.: Avinash Dixit and Susan Skeath. Games of Strategy. P. 210–212.
[Закрыть].
Если один игрок придерживается этого правила, другой не сможет добиться большего выигрыша, применив одну из своих чистых стратегий. Следовательно, для него не имеет большого значения, какую именно стратегию выбрать, и единственное, что ему остается сделать, – это использовать смешанную стратегию, предписанную ему тем же правилом. Когда этого правила придерживаются оба игрока, ни один из них не сможет добиться большего выигрыша, отклонившись от данной линии поведения. Это полностью соответствует определению равновесия Нэша, представленному в главе 4. Иными словами, в ситуации, когда оба игрока следуют этому правилу, мы имеем равновесие Нэша в смешанных стратегиях. Следовательно, теорему о минимаксе Неймана – Моргенштерна можно рассматривать как частный случай более общей теории Нэша. Теорема о минимаксе применима только к играм с нулевой суммой, рассчитанным на двух игроков, тогда как концепцию равновесия Нэша допускается использовать в играх с любым числом игроков и любым сочетанием конфликта и общности интересов.
В играх с нулевой суммой равновесие возможно и при отсутствии смешанных стратегий. Вот простой пример: предположим, у игрока, выполняющего пенальти, очень низкий процент успешных ударов слева от вратаря (это не его естественная сторона), даже когда вратарь неправильно угадывает его действия. Это может быть связано с высокой вероятностью того, что бьющий игрок в любом случае промахнется, если будет бить внешней стороной ступни. Предположим, таблица выигрышей в этом случае выглядит так:
В данном случае стратегия «справа» доминирующая для бьющего игрока и у него нет причин смешивать стратегии. В более общем случае равновесие возможно даже при наличии чистых стратегий, среди которых нет доминирующих. Но и здесь нет причин для беспокойства: методы поиска равновесия в смешанной стратегии также позволяют обнаружить равновесие в случае чистой стратегии как частный случай смешивания стратегий, в котором доля одной из них составляет 100 процентов.
Детская забава
23 октября 2005 года Эндрю Бергель из Торонто получил титул чемпиона мира в игре «камень, ножницы, бумага» (КНБ), а также золотую медаль Всемирной ассоциации игроков в КНБ. Стэн Лонг из Ньюарка выиграл серебряную медаль, а Стюарт Уолдман из Нью-Йорка – бронзовую.
Всемирная ассоциация игроков в КНБ поддерживает сайт www.worldrps.com, на котором публикуются правила игры и различные рекомендации по поводу стратегии. Кроме того, ассоциация проводит ежегодный чемпионат мира по игре КНБ. Знали ли вы о том, что игра, в которую вы играли в детстве, вышла на такой серьезный уровень?
Правила игры в КНБ сейчас те же, что были в вашем детстве; они описаны в главе 1. Два игрока одновременно выбирают (на жаргоне этой игры «выбрасывают») один из знаков рукой: кулак символизирует камень, расположенная горизонтально ладонь – бумагу, а указательный и средний пальцы, расставленные под углом и указывающие на соперника, – ножницы. Если оба игрока показали один знак, засчитывается ничья. Если игроки выбирают разные знаки, камень побеждает (ломает) ножницы, ножницы побеждают (режут) бумагу, а бумага побеждает (обертывает) камень. Каждая пара игроков проводит несколько раундов игры подряд, а участник соревнований, победивший в максимальном числе раундов, становится победителем матча.
Тщательно продуманные правила, опубликованные на сайте Всемирной ассоциации игроков в КНБ, регламентируют два важных момента соревнований по этой игре. Во-первых, точно описаны жесты, которые символизируют камень, ножницы и бумагу в момент выброса. Это предотвращает любые попытки мошенничества, когда один игрок делает жест, допускающий двоякое толкование, а затем заявляет, что его знак побеждает знак соперника. Во-вторых, в этих правилах описана последовательность действий, которые обозначаются как «исходная позиция, готовность, выброс», для того чтобы обеспечить одновременность ходов двух игроков. При таком подходе один игрок не может заранее увидеть, что сделал другой, и выбрать в ответ тот знак, который обеспечил бы ему победу.
Таким образом, мы имеем игру с параллельными ходами с участием двух игроков, у каждого из которых есть три чистые стратегии. Предположим, за победу засчитывается 1 очко, за поражение – 1, за ничью – 0; игроков назовем Эндрю и Стэн в честь победителей на чемпионате мира в 2005 году. Таблица этой игры выглядит так:
Что порекомендовала бы в этом случае теория игр? Это игра с нулевой суммой, поэтому раскрывать свой ход заранее невыгодно. Если Эндрю делает только один чистый ход, Стэн сможет ответить выигрышным ходом и сократить выигрыш Эндрю до –1. Если Эндрю смешает три хода в равных пропорциях, по 1/3 на каждый ход, это обеспечит ему средний выигрыш 1/3 × 1 + 1/3 × 0 + 1/3 × (–1) = 0 против любой из чистых стратегий Стэна. Поскольку игра имеет симметричную структуру, очевидно, что это лучшее, на что может рассчитывать Эндрю, и расчеты подтверждают эту интуитивную оценку. Та же аргументация верна и для Стэна. Следовательно, смешивание всех трех стратегий в равной пропорции – оптимальное решение для обоих игроков, которое и представляет собой равновесие Нэша в смешанных стратегиях.
Однако далеко не все участники чемпионата мира по игре «камень, ножницы, бумага» придерживаются такого подхода. На сайте ассоциации этот подход называют хаотичной игрой и не рекомендуют применять. «Критики этой стратегии настаивают на том, что случайного выброса просто не существует. Люди неизменно подчиняются какому-либо импульсу или склонности при выборе знака, а значит, придерживаются подсознательной, хотя и предсказуемой схемы игры. “Школа хаоса” теряет свое влияние в последнее время, поскольку статистика проведения турниров свидетельствует о более высокой эффективности таких стратегий».
Формирование «подсознательной, хотя и предсказуемой схемы игры» – это действительно серьезная, заслуживающая дальнейшего обсуждения проблема, и мы вернемся к ней немного позже. Но сначала посмотрим, каким стратегиям отдают предпочтение участники чемпионата мира по игре «камень, ножницы, бумага».
На сайте перечислен ряд «гамбитов», в частности стратегия с весьма удачным названием «бюрократ», которая сводится к трем последовательным выбросам знака «бумага», или стратегия «сэндвич с ножницами», которая состоит из ходов «бумага», «ножницы», «бумага». Достаточно часто используется стратегия исключения, когда игрок пропускает один из знаков. Идея таких стратегий заключается в том, что соперники сфокусируют все свое внимание на изменении схемы или на появлении пропущенного знака, а вы постараетесь воспользоваться этим слабым местом в их рассуждениях.
Кроме того, у игроков могут быть хорошо развиты навыки обмана и обнаружения обмана со стороны соперника. Такие игроки наблюдают за движениями тела и рук друг друга в поисках признаков того, какой именно знак те выбросят. С другой стороны, они пытаются ввести соперника в заблуждение, делая движения, которые предполагают один знак, а вместо этого выбирают совсем другой. Вратари и футболисты, выполняющие штрафной удар, тоже наблюдают за движениями ног и тела друг друга, чтобы догадаться, в какую сторону будет двигаться соперник. Такие навыки имеют очень большое значение. Например, во время серии послематчевых пенальти, которая решила исход матча в четвертьфинале чемпионата мира по футболу 2006 года между сборными Англии и Португалии, вратарь португальской команды каждый раз правильно угадывал направление удара и отбил три мяча, что обеспечило его команде победу.
Смешивание стратегий в лаборатории
В отличие от поразительной согласованности теоретических прогнозов и реальных результатов смешанных стратегий на футбольном поле или на теннисном корте во время лабораторных экспериментов были получены разнородные или отрицательные выводы. В одной из первых книг, посвященных экспериментальной экономике, в достаточно категоричной форме сказано: «Участники экспериментов редко (почти никогда) не используют подбрасывание монеты»[146]146
Douglas D. Davis and Charles A. Holt, Experimental Economics (Princeton, NJ: Princeton University Press, 1993): 99.
[Закрыть]. Каковы причины этого различия?
Некоторые из этих причин совпадают с теми, о которых шла речь в главе 4, когда мы сравнивали два типа эмпирических данных. В лабораторных условиях игры искусственно структурированы, а играют в них новички ради сравнительно небольшого выигрыша. С другой стороны, в реальных условиях опытные игроки ведут знакомые им игры ради огромного выигрыша – славы, престижа, а во многих случаях и денег.
На результатах экспериментов сказывается еще один ограничивающий фактор. Эксперименты всегда начинаются с объяснения правил игры; экспериментаторы делают все возможное, чтобы участники игры действительно их поняли. Однако в этих правилах в явной форме не упоминается о возможности рандомизации; не говорится что-либо в таком роде: «При желании вы можете подбросить монету или бросить кости для того, чтобы решить, что вы будете делать». В таком случае вряд ли стоит удивляться тому, что участники эксперимента, которым было указано строго придерживаться правил игры, не бросают монету. Еще со времени проведения знаменитого эксперимента Стэнли Милгрэма известно, что испытуемые воспринимают экспериментаторов как авторитетных лиц, которым необходимо подчиняться[147]147
Речь идет об известном эксперименте в социальной психологии, впервые описанном в 1963 году С. Милгрэмом, в ходе которого была показана неспособность испытуемых открыто противостоять «начальнику» (в данном случае исследователю, одетому в лабораторный халат). Прим. ред.
[Закрыть][148]148
Stanley Milgram, Obedience to Authority: An Experimental View (New York: Harper and Row, 1974).
[Закрыть]. Поэтому нет ничего удивительного в том, что они строго придерживаются правил игры и даже не думают о случайном выборе стратегий.
Однако факт остается фактом: даже в тех случаях, когда структура лабораторных игр была аналогична структуре футбольных пенальти, где ценность смешивания стратегий не вызывала сомнений, участники этих игр даже с течением времени не применяли рандомизацию надлежащим образом[149]149
Информацию об этих экспериментах можно найти в статьях в следующих работах: Pierre-Andre Chiappori, Steven Levitt, Timothy Groseclose, “Testing Mixed-Strategy Equilibria When Players Are Heterogeneous: The Case of Penalty Kicks in Soccer,” American Economic Review 92, no. 4 (September 2002): 1138–1151; Ignacio Palacios-Huerta, “Professionals Play Minimax,” Review of Economic Studies 70, no. 2 (April 2003): 395–415. К числу материалов, опубликованных в популярных СМИ, относится и статья Daniel Altman, “On the Spot from Soccer’s Penalty Area,” New York Times, June 18, 2006.
[Закрыть].
Таким образом, у нас есть противоречивые выводы относительно успеха и провала теории смешанных стратегий. Проанализируем некоторые из этих выводов глубже, для того чтобы понять, что нам следует ожидать от тех игр, которые мы наблюдаем, а также чтобы научиться играть более эффективно.
Внесение элемента случайности
Рандомизация – не простое чередование чистых стратегий. Если питчеру говорят, чтобы он смешивал фастболы и форкболы в равных пропорциях, это не означает, что ему следует бросать фастбол, затем форкбол, затем снова фастбол и так далее по очереди[150]150
Фастболл (англ. fastball) – прямая подача, при которой упор делается на скорость полета мяча; самый распространенный тип подачи. Форкбол (англ. forkball) – подача, при которой мяч удерживается между пальцами руки так, будто он зажат между зубьями вилки; в момент броска мяча ему можно придать дополнительное вращение. Прим. пер.
[Закрыть]. Бэттеры сразу же заметят эту схему и используют ее в своих интересах. Точно так же, если соотношение фастболов и форкболов должно составлять 60:40, это не значит, что нужно бросать сначала шесть фастболов, а затем четыре форкбола.
Что же должен делать питчер, для того чтобы случайным образом смешивать фастболы и форкболы в равных пропорциях? Один из способов – выбрать число от 1 до 10; если выбранное число меньше 5, бросать фастбол, а если больше 6 – форкбол. Безусловно, это снимает только часть проблемы. Как обеспечить случайный выбор чисел от 1 до 10?
Начнем с более простой задачи – попытки записать случайную последовательность выпавших сторон монеты. Если это действительно случайная последовательность, тогда любой, кто попытается догадаться, что именно вы записываете, будет прав в среднем не более чем на 50 процентов. Однако записать такую «случайную» последовательность труднее, чем можно себе представить.
Психологи обнаружили интересный факт: люди склонны забывать о том, что, если выпадает орел, в следующий раз с равной вероятностью могут выпасть и орел, и решка. В итоге они слишком часто выбирают противоположный вариант, а в их догадках слишком мало последовательностей, состоящих из одних только орлов. Если при подбрасывании монеты тридцать раз подряд выпадает орел, в следующий раз с одинаковой вероятностью могут выпасть и орел, и решка. Понятия «теперь должна выпасть решка» просто не существует. То же самое касается и лотереи: число, которое выпало на прошлой неделе, может выпасть снова с той же вероятностью, что и все остальные числа.
Тот факт, что многие люди допускают ошибку, слишком часто чередуя возможные варианты, объясняет использование такого множества стратагем и гамбитов участниками чемпионатов мира по КНБ. Игроки предпринимают попытки извлечь для себя выгоду из этой слабости соперников, а на более высоком уровне пытаются использовать, в свою очередь, и сами попытки такого рода. Игрок, который три раза подряд выбрасывает знак «бумага», рассчитывает на то, что его соперник подумает: маловероятно, чтобы и в четвертый раз была «бумага». Игрок, который пропускает один из знаков и смешивает очередность выбрасывания оставшихся двух на протяжении ряда следующих друг за другом раундов игры, пытается воспользоваться тем, что соперник думает, будто недостающий знак вот-вот «должен быть» выброшен.
Для того чтобы предотвратить такое «упорядочение хаоса», необходимы более объективные или независимые способы. Один из них сводится к тому, чтобы придерживаться определенного твердого правила, но это правило необходимо держать в тайне и оно должно быть достаточно сложным, чтобы его трудно было обнаружить. Возьмем в качестве примера длину предложений в нашей книге. Если в предложении нечетное число слов, присвоим ему имя «орел», а если четное – «решка». Это и есть достаточно эффективный генератор случайных чисел. Если рядом с вами нет нашей книги, не беспокойтесь: мы можем предложить вам и другие способы формирования последовательности случайных чисел. Возьмите несколько дат рождения ваших друзей и родственников и загадывайте «орел» на четные даты, а «решку» – на нечетные. Или посмотрите на секундную стрелку своих часов. Если ваши часы не выставлены с точностью до секунды, никто, кроме вас, не узнает, на какой отметке находится секундная стрелка. Мы рекомендуем питчеру, который должен смешивать броски в пропорции 50:50, или кэтчеру, готовящемуся принять подачу, перед каждым броском смотреть на часы. Если секундная стрелка указывает на четное число, необходимо бросить фастбол, если на нечетное – форкбол. С помощью секундной стрелки обеспечивается случайный выбор бросков в любой пропорции. Для того чтобы бросать фастболы в 40 процентах случаев, а форкболы – в 60 процентах, необходимо выбирать фастбол, когда секундная стрелка попадает в диапазон от 1 до 24, и форкбол – от 25 до 60.
Насколько успешно применяли метод рандомизации лучшие профессиональные теннисисты и футболисты? Анализ данных о финальных матчах турниров «Большого шлема» позволил обнаружить интересную закономерность: теннисисты переключались с подачи справа на подачу слева чаще, чем это могло происходить случайно (если говорить на языке статистики, наблюдалась отрицательная сериальная корреляция). Однако эта закономерность была, по всей видимости, слишком слабой, чтобы соперники заметили и использовали ее в своих интересах, что подтверждает статистически несущественная разница между показателями эффективности разных подач. Что касается штрафных ударов в футболе, рандомизация была почти безупречной, а смена стратегий (отрицательная сериальная корреляция) – статистически несущественной. Это вполне закономерно: между штрафными ударами, которые выполняет один и тот же игрок, проходит несколько недель, поэтому тенденция к смене стратегий менее заметна.
Судя по всему, участники чемпионатов по игре «камень, ножницы, бумага» придают слишком большое значение стратегиям, подразумевающим сознательный отказ от рандомизации, и пытаются использовать с выгодой для себя попытки соперников распознавать закономерности в игре. Насколько успешны эти попытки? Судить об этом можно, в частности, по стабильности успеха. Если некоторые игроки добиваются более весомых результатов, когда применяют нерандомизированные стратегии, они должны выигрывать одно соревнование за другим, из года в год. Но у Всемирной ассоциации игроков в КНБ «нет персонала, который фиксировал бы результаты всех участников чемпионатов, а этот вид спорта еще не получил достаточно широкого распространения, чтобы эту информацию отслеживал кто-то еще. В целом среди участников чемпионатов не так уж много игроков, которые добиваются статистически устойчивых результатов, хотя серебряный медалист чемпионата 2003 года снова вошел в финальную восьмерку в следующем году»[151]151
Электронное письмо Грэма Уокера из Всемирной ассоциации игроков в КНБ за 1 июля 2006 года.
[Закрыть]. Все это говорит о том, что тщательно продуманные стратегии не обеспечивают игрокам устойчивого преимущества.
Почему бы не положиться на то, что другой игрок использует метод рандомизации стратегий? Если один участник игры применяет оптимальное смешивание стратегий, то его показатель эффективности останется неизменным, что бы ни сделал соперник. Предположим, в примере с пенальти вы футболист, выполняющий штрафной удар, а вратарь использует оптимальное смешивание стратегий: «слева» – 41,7 процента, «справа» – 58,3 процента. В данной ситуации вы забьете гол в 79,6 случаев, какую бы стратегию ни выбрали: слева, справа или любое их сочетание. Когда вы поймете это, может появиться соблазн обойтись без расчета своего оптимального варианта смешивания стратегий, а вместо этого просто придерживаться какой-то одной линии поведения и рассчитывать на то, что другой игрок использует свой оптимальный вариант. Проблема в том, что, если вы не применяете свою оптимальную смешанную стратегию, у вашего соперника нет стимула продолжать использовать свой вариант смешивания стратегий. Например, если вы будете неизменно выбирать стратегию «слева», вратарь тоже начнет прикрывать только свою левую сторону. В этом и состоит причина: вы должны применить свою оптимальную смешанную стратегию, для того чтобы заставить соперника и дальше использовать свой оптимальный вариант смешивания стратегий.
Уникальные ситуации
Эта логика имеет смысл в таких играх, как футбол, бейсбол или теннис, в которых одна и та же ситуация складывается много раз в течение одного матча, а в борьбу во многих матчах вступают одни и те же игроки. Кроме того, в этих играх есть время и возможность обнаружить любые системные действия соперников и отреагировать на них. С другой стороны, важно избегать в игре таких схем, которые соперники могут использовать с выгодой для себя, и придерживаться оптимальной смешанной стратегии. Но как быть с играми, которые происходят только один раз?
Рассмотрим в качестве примера выбор позиций для наступления и обороны во время сражения. Эта ситуация поистине уникальна: противник не может вывести какую бы то ни было закономерность на основании ваших прошлых действий. Однако необходимость в случайном выборе возникает в связи с возможностью шпионажа. Если вы выберете определенный курс действий, а противник узнает, что вы собираетесь делать, он изменит свой план так, чтобы поставить вас в самое невыгодное положение. Вам необходимо застать противника врасплох, а самый верный способ сделать это сводится к тому, чтобы действовать неожиданно даже для самих себя. Вы должны как можно дольше воздерживаться от выбора и сделать его в самый последний момент, применив для этого непредсказуемый, а значит, защищенный от шпионажа, способ. При этом соотношение разных вариантов выбора в вашей стратегии должно быть таким, чтобы противник, узнав об этом, не смог воспользоваться данной информацией в своих целях. Это и есть оптимальное смешивание стратегий, о котором шла речь.
И наконец, хотелось бы сделать одно предостережение. Даже если вы используете оптимальный вариант смешивания стратегий, все равно в некоторых случаях вы будете получать плохой результат. Даже если игрок, выполняющий пенальти, действует непредсказуемо, вратарь может угадать направление удара и отразить его. В американском футболе, когда после третьей попытки осталось пройти один ярд, разумно прорываться с мячом посередине, но важно также время от времени делать длинный пас, чтобы не дать защищающейся команде разгадать схему нападения. Если такой пас оказывается успешным, болельщики и спортивные комментаторы восхищаются столь изобретательным выбором схемы игры и называют тренера гением. В случае неудачного паса тренера подвергают жесткой критике: как он мог делать ставку на длинный пас, вместо того чтобы выбрать более безопасную схему игры?
Разъяснять стратегию тренера необходимо еще до ее применения в том или ином матче. Тренер должен донести до всеобщего сведения тот факт, что прорыв с мячом посередине поля остается элементом осторожной и методичной схемы игры именно благодаря отвлечению части игроков защищающейся команды на оборону от случайного длинного паса, который может обойтись команде слишком дорого. Однако мы допускаем, что даже если накануне игры тренер во всеуслышание заявит об этом во всех газетах и на всех телеканалах, а затем использует длинный пас, который окажется неудачным, на него все равно обрушится лавина критики, как если бы он и не пытался объяснить широкой публике элементы теории игр.
Смешивание стратегий в неантагонистических играх
До сих пор мы рассматривали в этой главе только антагонистические игры, в которых интересы игроков полностью противоположны: игры с нулевой суммой или игры с постоянной суммой. Однако мы неизменно подчеркиваем, что в реальной жизни интересы людей могут совпадать, а могут и противоречить друг другу. Играет ли смешивание стратегий значимую роль в играх с ненулевой суммой? Да, но с некоторыми условиями.
В качестве иллюстрации еще раз рассмотрим охотничью версию игры «семейный спор», о которой шла речь в главе 4. Вспомните наших отважных охотников Фреда и Барни, которые решают (каждый в своей пещере), на какого зверя им охотиться – на оленя или на бизона. Удачная охота требует совместных усилий обоих охотников, поэтому, если они выберут противоположные варианты, никто из них не добудет мяса. И Фред, и Барни заинтересованы в том, чтобы предотвратить такой итог. Однако помимо двух вариантов благополучного исхода (при условии, что они охотятся на одном участке) нужно учесть, что Фред отдает предпочтение мясу оленя и оценивает результат совместной охоты на этого зверя как четыре вместо трех единиц мяса, тогда как у Барни противоположные предпочтения. Следовательно, таблица их выигрышей выглядит так:
Как мы уже убедились, в этой игре есть два равновесия Нэша; в таблице они выделены серым цветом. Теперь мы назвали бы их равновесиями в чистых стратегиях. Но возможно ли такое равновесие в игре со смешанной стратегией?
По каким причинам Фред выбрал бы смешанную стратегию? Возможно, он не уверен в том, что именно выберет Барни. Если под влиянием этих субъективных сомнений Фред оценивает число случаев, когда Барни выберет охоту на оленя и на бизона, как y и (1 – у) соответственно, тогда он рассчитывает на выигрыш в размере 4y + 0(1 – y) = 4y, если он сам выберет охоту на оленя, и 0y + 3(1 – y), если он сам выберет охоту на бизона. Если y имеет значение, при котором 4y = 3(1 – y), или 3 = 7y, или y = 3/7, тогда Фред получит один и тот же выигрыш, выбрав стратегию охоты на оленя или на бизона, а также если он решит использовать обе стратегии в любой пропорции. Предположим, что Фред смешивает стратегию охоты на оленя и на бизона в таких пропорциях, что для Барни не имеет значения, какую из чистых стратегий выбрать. (Эта игра симметрична, поэтому вы можете предположить – и подтвердить это предположение расчетами, – что Фред должен смешивать свои стратегии, выбирая охоту на оленя в x = 4/7 случая.) При этом Барни тоже мог бы смешивать свои стратегии по такому принципу, чтобы Фреду было все равно, какую стратегию выбрать, а значит, Барни сам мог бы выбрать оптимальную стратегию. Эти два варианта смешивания стратегий – x = 4/7 и y = 3/7 – образуют равновесие Нэша в смешанных стратегиях.
Всегда ли такое равновесие обеспечивает удовлетворительный результат? Нет. Проблема в том, что два охотника делают свой выбор независимо друг от друга. Следовательно, Фред выберет охоту на оленя, тогда как Барни выберет охоту на бизона, в 4/7 × 4/7 = 16/49 случаях, и наоборот – в 3/7 × 3/7 = 9/49 случаях. Таким образом, в 25/49 или немногим более половины случаев два охотника окажутся на разных участках и получат нулевой выигрыш. Воспользовавшись приведенными формулами, мы увидим, что каждый из них получит выигрыш в размере 4 × 3/7 + 0 × 4/7 = 12/7 ≈ 1,71, что меньше выигрыша 3 в случае неблагоприятного равновесия в чистых стратегиях.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?