Текст книги "Стратегические игры. Доступный учебник по теории игр"
Автор книги: Авинаш Диксит
Жанр: Зарубежная образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 22 (всего у книги 72 страниц) [доступный отрывок для чтения: 23 страниц]
Методы поиска равновесий в смешанных стратегиях в играх с нулевой суммой (такие как защищенность от использования соперником или свойство безразличия соперника) применимы и к играм с ненулевой суммой, причем в некоторых из них действительно позволяют найти равновесия в смешанных стратегиях. Однако в таких играх интересы игроков могут в определенной степени совпадать. Следовательно, тот факт, что другой игрок использует ваш системный выбор стратегий с выгодой для себя, необязательно означает, что это нанесет ущерб вам, как в случае игр с нулевой суммой. Например, в координационной игре, которую мы анализировали в главе 4, игроки способны лучше координировать свои действия, если каждый из них может полагаться на системные действия другого, поскольку случайный выбор действий только повышает риск неудачи с их координацией. Именно поэтому в играх с ненулевой суммой равновесия в смешанных стратегиях имеют слабое логическое обоснование или не имеют его вообще. Ниже мы проанализируем равновесия в смешанных стратегиях в контексте некоторых известных игр с ненулевой суммой, а также обсудим их значимость или отсутствие таковой.
А. Встретятся ли Гарри и Салли? Доверие, чистая координация и битва полов
Проиллюстрируем смешивание стратегий в играх с ненулевой суммой на примере игры «встреча», основанной на игре в доверие. Для вашего удобства мы воспроизводим таблицу этой игры (см. рис. 4.11) на рис. 7.3. Сначала проанализируем игру с точки зрения Салли. Если она уверена в том, что Гарри отправится в Starbucks, ей тоже следует туда пойти. Если она уверена, что Гарри выберет Local Latte, то же самое нужно сделать и ей. Но если Салли сомневается в выборе Гарри, то каким должен быть ее наилучший выбор?
.
Рис. 7.3. Игра в доверие
Чтобы ответить на этот вопрос, мы должны дать более четкую трактовку неопределенности в понимании Салли. (В теории вероятностей и статистике есть специальный термин для обозначения такой неопределенности – субъективная неопределенность. В контексте неопределенности относительно действий другого игрока это стратегическая неопределенность; вспомните о различиях, которые мы анализировали в разделе 2.Г главы 2). Для большей точности укажем, с какой вероятностью Гарри выберет то или иное кафе, по мнению Салли. Вероятность того, что это будет Local Latte, может быть выражена любым вещественным числом от 0 до 1 (то есть от 0 % до 100 %). Мы охватим все возможные варианты с помощью алгебраических формул, обозначив символом p вероятность того, что Гарри (по мнению Салли) выберет Starbucks; переменная p может иметь любое вещественное значение в диапазоне от 0 до 1. Тогда (1 – p) – это вероятность (снова по мнению Салли) того, что Гарри предпочтет Local Latte. Иными словами, мы описываем стратегическую неопределенность Салли следующим образом: она считает, что Гарри использует смешанную стратегию, применив совокупность двух чистых стратегий (Starbucks и Local Latte) в пропорциях или с вероятностью p и (1 – p) соответственно. Назовем эту смешанную стратегию p-комбинацией Гарри, хотя на данный момент это всего лишь идея, существующая в сознании Салли.
С учетом этой неопределенности Салли может вычислить ожидаемые выигрыши от своих действий, предпринятых на основании убежденности в отношении р-комбинации Гарри. Если Салли выберет Starbucks, это даст ей 1 × p + 0 × (1 – p) = p, если Local Latte, это даст 0 × p + 2 × (1 – p) = 2 × (1 – p). Когда p имеет высокое значение, p > 2(1 – p), то есть Салли достаточно уверена в том, что Гарри отправится в Starbucks, ей лучше пойти туда же. Точно так же, когда p имеет низкое значение, p < 2(1 – p), а значит, Салли достаточно уверена в том, что Гарри отправится в Local Latte, ей тоже нужно пойти в это кафе. При p = 2(1 – p), или 3p = 2, или p = 2/3 эти два варианта выбора обеспечивают Салли один и тот же выигрыш. Следовательно, если она убеждена в том, что p = 2/3, она может быть не уверена в собственном выборе и колебаться между этими двумя вариантами.
Понимание этого факта может вызвать у Гарри неуверенность в выборе Салли. Следовательно, Гарри также испытывает субъективную стратегическую неопределенность. Предположим, он считает, что Салли выберет Starbucks с вероятностью q, а Local Latte с вероятностью (1 – q). Аналогичные рассуждения показывают, что Гарри следует выбрать Starbucks, если q > 2/3, и Local Latte, если q < 2/3. В случае если q = 2/3, ему будет безразлично, какое из этих двух действий предпринять, и у него возникнет неуверенность в собственном выборе.
Теперь у нас есть основа для равновесия в смешанных стратегиях с p = 2/3 и q = 2/3. При таком равновесии данные значения p и q одновременно являются и фактическими вероятностями чистых стратегий, входящих в соответствующую смешанную стратегию, и субъективными убеждениями каждого игрока относительно вероятностей чистых стратегий в смешанной стратегии другого игрока. Правильность этих убеждений поддерживает собственное безразличие каждого игрока в отношении выбора между двумя чистыми стратегиями, а значит, и готовность каждого смешать их. Это полностью соответствует концепции равновесия Нэша как системы самоисполняющихся убеждений и ответных действий, описанной в разделе 3.
Ключ к поиску равновесия в смешанных стратегиях состоит в том, что Салли готова смешать две чистые стратегии только тогда, когда ее субъективная неопределенность в отношении выбора Гарри правильна, то есть если правильно значение р в р-комбинации Гарри. Алгебраически это утверждение можно обосновать посредством вычисления равновесного значения р с помощью уравнения р = 2(1 – р), которое гарантирует, что Салли получит такой же ожидаемый выигрыш от двух своих чистых стратегий при сопоставлении каждой из них с р-комбинацией Гарри. Если данное равенство справедливо в случае равновесия, вероятности чистых стратегий в смешанной стратегии Гарри как будто поддерживают безразличие Салли. Мы особо подчеркиваем сочетание «как будто», поскольку в этой игре у Гарри нет причин поддерживать безразличие Салли, поэтому полученный результат – просто свойство данного равновесия. Тем не менее общая идея такова: в равновесии Нэша в смешанных стратегиях вероятности чистых стратегий, входящих в смешанную стратегию каждого игрока, поддерживают безразличие другого игрока в отношении выбора между его чистыми стратегиями. Мы вывели свойство безразличия соперника выше в ходе обсуждения игр с нулевой суммой, а теперь видим, что оно актуально и для игр с ненулевой суммой.
Однако в игре в доверие равновесие в смешанных стратегиях имеет ряд весьма нежелательных свойств. Во-первых, оно обеспечивает обоим игрокам достаточно низкие ожидаемые выигрыши. Формулы расчета ожидаемых выигрышей Салли от двух ее действий, р и 2 (1 – р), в обоих случаях равны 2/3 при р = 2/3. Точно так же ожидаемые выигрыши Гарри в случае равновесной q-комбинации Салли при q = 2/3 также одинаковы и составляют 2/3. Следовательно, при равновесии в смешанных стратегиях каждый игрок получает выигрыш 2/3. В главе 4 мы нашли в этой игре два равновесия в чистых стратегиях, причем даже худшее из них (оба выбирают Starbucks) обеспечивает каждому игроку выигрыш 1, а лучшее (оба выбирают Local Latte) – выигрыш 2.
Причина, по которой в случае равновесия в смешанных стратегиях два игрока получают такие плохие результаты, состоит в следующем: при выборе игроками своих действий независимо и бессистемно достаточно высока вероятность того, что они отправятся в разные места и в результате не встретятся и оба получат выигрыш 0. Гарри и Салли не увидятся, если один из них пойдет в Starbucks, а другой в Local Latte или наоборот. Вероятность такого развития событий при использовании обоими равновесных комбинаций составляет 2 × (2/3) × (1/3) = 4/9[93]93
Вероятность того, что каждый игрок выберет Starbucks в случае равновесия, равна 2/3. Вероятность того, что каждый из них выберет Local Latte, составляет 1/3. Вероятность того, что один игрок выберет Starbucks, тогда как другой – Local Latte, равна (2/3) × (1/3). Однако это может произойти двумя разными способами (один из них, когда Гарри выберет Starbucks, а Салли Local – Latte, а второй, когда оба игрока сделают противоположный выбор). Следовательно, общая вероятность того, что Гарри и Салли не встретятся, составляет 2 × (2/3) × (1/3). Более подробная информация об алгебре вероятностей представлена в приложении к данной главе.
[Закрыть]. Аналогичная проблема наблюдается в равновесиях в смешанных стратегиях в большинстве игр с ненулевой суммой.
Второе нежелательное свойство равновесия в смешанных стратегиях – его неустойчивость. Если любой из игроков хотя бы немного отклонится от точных значений р = 2/3 или q = 2/3, наилучшим выбором другого игрока станет одна из чистых стратегий. И как только он ее применит, другой игрок получит более высокий выигрыш при выборе той же чистой стратегии, а значит, в игре наступит одно из двух равновесий в чистых стратегиях. Такая неустойчивость равновесий в смешанных стратегиях присуща многим играм с ненулевой суммой. Тем не менее в некоторых играх с ненулевой суммой все же есть более устойчивые равновесия в смешанных стратегиях. Один из примеров, описанный ниже в данной главе и в главе 12, – это равновесие в смешанных стратегиях в игре в труса, в отношении которой существует интересная эволюционная интерпретация.
С учетом результатов анализа равновесия в смешанных стратегиях в версии игры во встречу, основанной на игре в доверие, вы, по всей вероятности, теперь можете оценить равновесия в смешанных стратегиях в других вариантах игры во встречу с ненулевой суммой. В ее версии, построенной на чистой координации (см. рис. 4.10), выигрыш от встречи в двух кафе один и тот же, а значит, в равновесии в смешанных стратегиях значения p и q будут такими: p = 1/2 и q = 1/2. В варианте этой игры, представляющем собой битву полов (см. рис. 4.12), Салли предпочитает встретиться с Гарри в Local Latte, поскольку так она получит выигрыш 2 вместо 1 в случае встречи в Starbucks. Решение Салли зависит от того, больше или меньше 2/3 ее субъективная вероятность, что Гарри отправится в Starbucks. (В этом случае выигрыши Салли аналогичны выигрышам в версии игры в доверие, поэтому критическое значение p не меняется.) Гарри предпочитает встретиться в Starbucks, поэтому его решение зависит от того, больше или меньше 1/3 его субъективная вероятность, что Салли пойдет в Starbucks. Таким образом, при равновесии Нэша в смешанных стратегиях p = 2/3, а q = 1/3.
Б. Встретит ли Джеймс Дина? Игра в труса
В игре в труса с ненулевой суммой также существует равновесие в смешанных стратегиях, которое можно найти с помощью описанных выше методов, хотя у этой игры несколько иная интерпретация. Если вы помните, ее участники – Джеймс и Дин, пытающиеся избежать встречи. Таблица игры, первоначально представленная на рис. 4.13, воспроизведена здесь на рис. 7.4.
.
Рис. 7.4. Игра в труса
Если применить в этой игре смешанные стратегии, то в p-комбинации Джеймса вероятность того, что он свернет в сторону, будет равна p, а вероятность того, что он поедет прямо, составит 1 – p. При такой p-комбинации Дин получит выигрыш 0 × p – 1 × (1 – p) = p – 1, выбрав вариант «свернуть», и 1 × p – 2 × (1 – p) = 3p – 2, предпочтя вариант «ехать прямо». При сравнении этих уравнений видно, что Дин получит более высокий выигрыш при выборе «свернуть», когда p – 1 > 3p – 2, или когда 2p < 1, или когда p < 1/2 – иными словами, когда p имеет малое значение и Джеймс с большей вероятностью выберет «ехать прямо». Напротив, когда у p высокое значение и Джеймс с большей вероятностью выберет «свернуть», Дину лучше «ехать прямо». Если в p-комбинации Джеймса значение p в точности равно 1/2, то Дину безразлично, какую из двух чистых стратегий применить; следовательно, он в равной мере готов их смешивать. Аналогичный анализ игры с точки зрения Джеймса в плане оценки его вариантов в игре против q-комбинации Дина дает те же результаты. Таким образом, p = 1/2 и q = 1/2 и есть равновесие в смешанных стратегиях в этой игре.
В свойствах этого равновесия присутствуют общие черты и различия с равновесиями в смешанных стратегиях в игре «встреча». Здесь ожидаемый выигрыш каждого игрока достаточно низкий: (−1/2). Это плохо, как и в случае игры во встречу, но в отличие от нее выигрыш при равновесии в смешанных стратегиях не хуже для обоих игроков, чем выигрыш при двух равновесиях в чистых стратегиях. В действительности, поскольку в данной игре интересы игроков в какой-то степени противоположны, каждый непременно получит более высокий выигрыш от равновесия в смешанных стратегиях, чем от равновесия в чистых стратегиях, подразумевающего выбор варианта «свернуть».
Однако такое равновесие в смешанных стратегиях тоже неустойчиво. Если Джеймс повысит вероятность применения варианта «ехать прямо» до значения чуть больше 1/2, это приведет к выбору Дином чистой стратегии «свернуть». В результате сочетание стратегий «ехать прямо» / «свернуть» становится равновесием в чистых стратегиях. Если Джеймс, наоборот, снизит вероятность выбора варианта «ехать прямо» до значения чуть меньше 1/2, Дин выберет вариант «ехать прямо» и игра снова перейдет к другому равновесию в чистых стратегиях[94]94
В главе 12 мы рассмотрим другой тип устойчивости, а именно эволюционную устойчивость. В эволюционном контексте вопрос состоит в том, может ли среди участников игры в труса сформироваться и сохраниться устойчивая совокупность игроков, выбирающих варианты «ехать прямо» и «свернуть».
[Закрыть].
В данном разделе мы нашли равновесия в смешанных стратегиях в нескольких играх с ненулевой суммой путем решения уравнений, вытекающих из свойства безразличия соперника. Из главы 4 мы уже знаем, что в таких играх есть и равновесия в чистых стратегиях. Кривые наилучших ответов позволяют составить исчерпывающую картину, отобразив все равновесия Нэша одновременно. Поскольку вы уже ознакомились с ними в двух отдельных фрагментах книги, мы не будем тратить время и место на построение графиков, а просто подчеркнем, что при наличии двух равновесий в чистых стратегиях и одного в смешанных стратегиях (как в приведенных выше примерах) кривые наилучших ответов пересекаются в трех разных местах, по одному на каждое равновесие Нэша. В конце этой главы мы предложим вам самостоятельно построить графики наилучших ответов для аналогичных игр.
5. Общий анализ равновесий в смешанных стратегияхТеперь, узнав, как найти равновесия в смешанных стратегиях в играх с нулевой и ненулевой суммой, целесообразно проанализировать дополнительные свойства этих равновесий. В частности, в данном разделе мы отметим ряд общих свойств равновесий в смешанных стратегиях, а также ознакомим вас с некоторыми результатами, которые поначалу покажутся вам парадоксальными, но лишь до тех пор, пока вы полностью не проанализируете рассматриваемую игру.
А. Равновесие в слабом смысле
Свойство безразличия соперника, о котором шла речь в разделе 2, подразумевает, что в случае равновесия в смешанных стратегиях каждый игрок получает один и тот же ожидаемый выигрыш от каждой из двух своих чистых стратегий, а значит, получит один и тот же ожидаемый выигрыш и от любой их комбинации. Следовательно, равновесия в смешанных стратегиях – это равновесия Нэша только в слабом смысле. Когда один игрок выбирает свою равновесную комбинацию стратегий, у другого нет явных оснований отступать от своей равновесной комбинации. С другой стороны, этот игрок ничего бы не потерял, выбрав другую смешанную стратегию или даже одну из своих чистых стратегий. Каждому игроку безразлично, какую из чистых стратегий или их комбинацию выбрать, до тех пор, пока другой игрок разыгрывает свою правильную (равновесную) комбинацию.
На первый взгляд это сводит на нет принцип использования равновесия Нэша в смешанных стратегиях в качестве концепции решения игр. Зачем игроку выбирать соответствующую комбинацию стратегий, когда другой игрок применяет свою комбинацию? Почему бы не поступить проще, выбрав одну из чистых стратегий? Ведь ожидаемый выигрыш в обоих случаях тот же. Ответ состоит в том, что это не будет равновесием Нэша; такой исход игры не будет устойчивым, поскольку тогда другой игрок отклонится от своей комбинации стратегий. Предположим, Эверт говорит себе: «Когда Навратилова применит свою наилучшую комбинацию (q = 0,6), я получу один и тот же выигрыш от ПЛ, ПД или их любого сочетания. Так зачем же их смешивать? Почему бы просто не использовать ПЛ?» В таком случае Навратиловой выгоднее перейти к чистой стратегии прикрытия удара ПЛ. Аналогичным образом, если Гарри выберет чистую стратегию Starbucks в игре во встречу, основанной на доверии, то Салли может получить более высокий выигрыш в равновесии 1 вместо 2/3 благодаря переходу с комбинации 50 на 50 на чистую стратегию Starbucks.
Б. Парадоксальное изменение вероятностей чистых стратегий в смешанной стратегии в играх с нулевой суммой
Игры с равновесиями в смешанных стратегиях порой демонстрируют свойства, которые на первый взгляд могут казаться противоречащими здравому смыслу. Самое интересное из них – это изменение вероятностей чистых стратегий в равновесной смешанной стратегии, приводящее к изменению структуры выигрышей в соответствующей игре. Чтобы проиллюстрировать это, вернемся к Эверт и Навратиловой и их игре с розыгрышем очка в теннисе.
Предположим, Навратилова усовершенствует навыки прикрытия удара по линии до уровня, при котором результативность Эверт в использовании стратегии ПЛ против стратегии Навратиловой по прикрытию ПЛ сокращается с 50 до 30 %. Такое улучшение мастерства Навратиловой обусловливает изменение таблицы выигрышей, в том числе смешанных стратегий каждой участницы игры, представленной на рис. 7.1. Новая таблица игры отображена на рис. 7.5.
.
Рис. 7.5. Измененные выигрыши в игре в теннис
Единственное отличие от таблицы на рис. 7.1 наблюдается в верхней левой ячейке, где выигрыш Эверт 50 теперь составляет 30, а выигрыш Навратиловой 50 равен 70. Это изменение не приводит к игре с равновесием в чистых стратегиях, поскольку у ее участниц по-прежнему противоположные интересы: Навратилова все так же хочет, чтобы их выбор совпадал, а Эверт все так же необходимо, чтобы их выбор отличался. Так что мы все еще имеем игру, подразумевающую смешивание стратегий.
Но чем эти равновесные комбинации стратегий отличаются от рассчитанных в разделе 2? Многие могли бы заявить, что теперь, научившись очень хорошо прикрывать ПЛ, Навратилова должна делать это чаще. В основе таких рассуждений лежит предположение о том, что равновесная q-комбинация Навратиловой должна быть в большей степени смещена в сторону ПЛ, а ее равновесное значение q должно превышать рассчитанное значение 0,6.
Но при вычислении q-комбинации Навратиловой на основании условия о безразличии Эверт в отношении выбора между двумя чистыми стратегиями мы получим 30q + 80(1 – q) = 90q + 20(1 – q), или q = 0,5. Фактическое равновесное значение q (50 %) связано с исходным значением q (60 %) в прямо противоположном смысле по сравнению с интуитивными прогнозами многих людей.
Хотя на первый взгляд подобные интуитивные выводы кажутся вполне обоснованными, в них упущен один важный аспект теории стратегий: взаимодействие между двумя игроками. После изменения выигрышей Эверт также будет пересматривать свою равновесную комбинацию, а Навратилова должна учитывать как новую структуру выигрышей, так и поведение Эверт при определении своей новой комбинации стратегий. В частности, поскольку теперь Навратилова гораздо лучше прикрывает ПЛ, Эверт в своей смешанной стратегии чаще использует ПД. И чтобы противодействовать этому, Навратилова тоже чаще прикрывает ПД.
Это станет более очевидным после того, как мы вычислим новую комбинацию Эверт. Ее равновесное значение p должно обеспечивать равенство между ожидаемым выигрышем Навратиловой от прикрытия ПЛ, 30p + 90(1 – p), и ее ожидаемым выигрышем от прикрытия ПД, 80р + 20(1 – p). Таким образом, мы имеем уравнение 30p + 90(1 – p) = 80p + 20(1 – p), или 90–60p = 20 + 60p, или 120p = 70. Следовательно, значение p Эверт должно составлять 7/12, или 0,583 (58,3 %). Сравнение этого нового равновесного значения p с рассчитанным в разделе 2 первоначальным значением 70 % показывает, что Эверт существенно сократила количество использования ПЛ в ответ на повышение мастерства Навратиловой. С учетом такого поведения Эверт Навратиловой также лучше сократить частоту применения стратегии ПЛ. Теперь Эверт будет использовать с выгодой для себя любой другой выбор комбинации стратегий Навратиловой, особенно той, в которой предпочтительна стратегия ПЛ.
Означает ли это, что Навратилова совершенствовала навыки зря? Нет, но мы должны судить об этом не по частоте применения той или иной стратегии, а по итоговым выигрышам. Когда Навратилова использует свою новую равновесную комбинацию с q = 0,5, процент успеха Эверт при выборе любой из ее чистых стратегий составляет (30 × 0,5) + (80 × 0,5) = (90 × 0,5) + (20 × 0,5) = 55. Это меньше, чем процент успеха Эверт 62 в исходном примере. Следовательно, средний выигрыш Навратиловой также возрастает с 38 до 45, а значит, улучшение навыков прикрытия удара ПЛ действительно принесло ей пользу.
В отличие от парадоксального результата, который мы наблюдали при анализе стратегического ответа Навратиловой на изменение в структуре выигрышей, здесь мы видим, что этот ответ полностью соответствует интуитивным представлениям, если рассматривать его в свете ожидаемого выигрыша Навратиловой. На самом деле с точки зрения ожидаемых выигрышей ответы игроков на изменение структуры выигрышей просто не могут противоречить здравому смыслу, хотя стратегические ответы, как мы уже убедились, могут[95]95
Описание общей теории воздействия изменения выигрыша в определенной ячейке на равновесную комбинацию и ожидаемые выигрыши в равновесии можно найти здесь: Vincent Crawford and Dennis Smallwood, Comparative Statics of Mixed-Strategy Equilibria in Noncooperative Games, Theory and Decision, vol. 16 (May 1984), pp. 225–32.
[Закрыть]. Самый интересный аспект такого парадоксального результата стратегических ответов игроков – это сигнал, который он подает теннисистам и, в более общем плане, участникам стратегических игр. Этот результат эквивалентен утверждению, что Навратилова должна усовершенствовать навыки прикрытия удара по линии с тем, чтобы ей не пришлось использовать такое прикрытие слишком часто.
Далее мы представим еще более общий и неожиданный результат, обусловленный изменениями вероятностей применения чистых стратегий в смешанной стратегии. Условие безразличия соперника означает, что равновесные вероятности чистых стратегий в смешанной стратегии каждого игрока зависят исключительно от выигрышей другого игрока, а не от его собственных. Рассмотрим игру в доверие на рис. 7.3. Предположим, выигрыш Салли от встречи в Local Latte увеличивается с 2 до 3, тогда как все остальные выигрыши не меняются. Теперь в случае p-комбинации Гарри Салли получит выигрыш 1 × p + 0 × (1 – p) = p, если выберет Starbucks, и 0 × p + 3 × (1 – p) = 3–3p, если Local Latte. Условие безразличия Салли выглядит так: p = 3–3p, или 4p = 3, или p = 3/4 по сравнению со значением 2/3, вычисленным нами выше для p-комбинации Гарри в исходной игре. Расчет условия безразличия Гарри остается прежним и дает результат q = 2/3 в случае равновесной стратегии Салли. Изменение выигрышей Салли меняет вероятности применения чистых стратегий в смешанной стратегии Гарри, а не Салли! В упражнении S13 у вас будет возможность доказать истинность этого вывода в общей формулировке: доли чистых стратегий в равновесной смешанной стратегии игрока меняются не вследствие изменения его выигрышей, а только в случае изменения выигрышей его соперника.
В. Рискованный и безопасный выбор в играх с нулевой суммой
В спорте некоторые стратегии сравнительно безопасны; они не приводят к полной катастрофе, даже если соперник предвидит такой выбор, но и не позволяют добиться сверхрезультатов, если оказываются неожиданными для соперника. Другие стратегии достаточно рискованны; они обеспечивают блестящие результаты, если другая сторона к ним не готова, но терпят полное поражение, когда другая сторона готова. В американском футболе на третьем дауне, когда остается пройти один ярд, пробежка на середину поля – это безопасная стратегия, а длинный пас – рискованная. Здесь возникает интересный вопрос, поскольку порой в ситуациях «третий даун, один ярд» на кону стоит больше, чем в других подобных ситуациях. Например, начало игры с 10-ярдовой линии соперника гораздо сильнее влияет на возможное количество заработанных очков, чем ее старт с вашей собственной 20-ярдовой линии. Вопрос в том, следует ли вам чаще или реже прибегать к рискованным стратегиям в случае более высоких ставок, чем низких.
Для того чтобы представить это в более конкретном виде, проанализируйте вероятности успеха, представленные на рис. 7.6. (Обратите внимание, что тогда как в теннисе мы использовали проценты от 0 до 100, здесь мы используем вероятности от 0 до 1.) Безопасная игра команды нападения – пробежка; вероятность успешного первого дауна составляет 60 %, если команда защиты ожидает пробежки, и 70 %, если защита полагает, что будет пас. Рискованная игра команды нападения – пас, поскольку вероятность успеха в куда большей степени зависит от действий команды защиты; вероятность успеха равна 80 %, если защита ожидает пробежки, и всего 30 %, если защита рассчитывает на пас.
.
Рис. 7.6. Вероятность успеха команды нападения в игре «третий даун, один ярд»
Допустим, в случае успешной игры команда защиты получает выигрыш, равный V, а неудачной – выигрыш 0. Выигрыш V может представлять собой то или иное количество очков, скажем, три очка за гол в ворота или семь очков за тачдаун. Кроме того, выигрыш V может отображать определенный уровень статуса или количество денег, заработанных командой; например, V = 100 за успешную игру в обычном матче или V = 1 000 000 за победу в Суперкубке по американскому футболу[96]96
Обратите внимание, что значение V – не обязательно денежная сумма; это может быть величина полезности с учетом нерасположенности к риску. Мы рассмотрим вопросы, связанные с риском, более подробно в главе 8, а об отношении к риску и ожидаемой полезности рассказывается в приложении к этой главе.
[Закрыть].
В фактической таблице игры между командами нападения и защиты, представленной на рис. 7.7, отображены ожидаемые выигрыши каждой команды. Они представляют собой среднее между выигрышем V при успешной игре и 0 при неудачной. Например, ожидаемый выигрыш команды нападения, использующей стратегию «пробежка» в случае, если команда защиты ожидает стратегии «пробежка», составляет 0,6 × V + 0,4 × 0 = 0,6V. Поскольку данная игра относится к категории игр с нулевой суммой, выигрыш команды защиты в этой ячейке равен –0,6V. Аналогичным образом вы можете рассчитать выигрыши во всех остальных ячейках таблицы, чтобы убедиться, что значения, приведенные ниже, правильные.
.
Рис. 7.7. Игра «третий даун, один ярд»
При равновесии в смешанных стратегиях вероятность p того, что команда нападения выберет стратегию «пробежка», определяется свойством безразличия соперника. Стало быть, правильное значение p удовлетворяет следующему условию:
p[–0,6V] + (1 – p)[–0,8V] = p[–0,7V] + (1 – p)[–0,3V].
Обратите внимание, что мы можем разделить обе стороны этого равенства на V, чтобы полностью исключить V из процесса вычисления p[97]97
Этот результат получен с учетом того, что мы можем полностью исключить V из уравнения безразличия соперника, а значит, он не зависит от конкретных значений вероятности успеха, указанных на рис. 7.6. Следовательно, такой результат типичен для игр со смешанными стратегиями, в которых каждый выигрыш равен произведению вероятности успеха и значения выигрыша в случае успеха.
[Закрыть]. Тогда упрощенное уравнение будет выглядеть так: –0,6p – 0,8(1 – p) = –0,7p – 0,3(1 – p), или 0,1p = 0,5(1 – p). Решив его, получим p = 5/6; следовательно, команда нападения с высокой вероятностью применит стратегию «пробежка» в своей комбинации стратегий. Такую безопасную игру часто называют «процентной игрой», потому что это нормальный ход игры в подобных ситуациях. Рискованная игра (стратегия «пас») разыгрывается лишь изредка, чтобы держать соперника в неведении или, говоря на языке футбольных комментаторов, «не давать защите расслабиться».
Интересный аспект этого результата состоит в том, что выражение для вычисления p совершенно не зависит от V. То есть, согласно теории, процентную и рискованную игру следует смешивать в равных пропорциях как в очень важных, так и во второстепенных ситуациях. Но этот результат противоречит интуитивным выводам многих людей, которые считают, что в более важных ситуациях рисковать следует реже. Длинный пас на третьем дауне с одним оставшимся ярдом приемлем в обычный октябрьский воскресный день, но делать такой пас во время Суперкубка слишком рискованно.
Так кто же прав: теория или интуиция? По всей вероятности, мнения читателей по этому вопросу разделятся. Некоторые будут утверждать, что спортивные комментаторы ошибаются, и с радостью обнаружат, что теоретические аргументы опровергают их заявления. Другие примут сторону комментаторов и будут доказывать, что важные матчи требуют более безопасной игры. Есть и те, кто считает, что ради более крупных призов следует больше рисковать, однако даже они не находят поддержки данной идеи в теории, а это говорит о том, что размер приза или ущерба вряд ли оказывает какое-либо влияние на вероятности чистых стратегий в смешанной стратегии.
Во многих предыдущих случаях возникновения расхождений между теорией и интуицией мы утверждали, что они кажущиеся и являются результатом неспособности сделать теорию настолько общей или глубокой, чтобы она охватывала все аспекты ситуации, в отношении которой делаются интуитивные выводы, и что улучшение теории позволяет устранить такие расхождения. В данном случае ситуация иная: проблема имеет фундаментальное значение для вычисления выигрышей от смешанных стратегий как взвешенных по вероятности средних значений, или ожидаемых выигрышей. И это отправная точка почти всех научных работ в современной теории игр[98]98
К числу немногочисленных научных работ, предлагающих альтернативные основы теории игр, можно отнести следующие: Vincent P. Crawford, Equilibrium Without Independence, Journal of Economic Theory, vol. 50, no. 1 (February 1990), pp. 127–54; and James Dow and Sergio Werlang, Nash Equilibrium Under Knightian Uncertainty, Journal of Economic Theory, vol. 64, no. 2 (December 1994), pp. 305–24. А наше описание данной проблемы в первом издании книги вдохновило некоторых ученых на написание статьи, посвященной новым методам ее решения: Simon Grant, Atsushi Kaji, and Ben Polak, Third Down and a Yard to Go: Recursive Expected Utility and the Dixit-Skeath Conundrum, Economic Letters, vol. 73, no. 3 (December 2001), pp. 275–86. К сожалению, в этой статье используются более сложные концепции, чем концепции начального уровня, которые рассматриваются в данной книге.
[Закрыть].
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?