Электронная библиотека » Айван Пастин » » онлайн чтение - страница 1


  • Текст добавлен: 2 ноября 2018, 16:00


Автор книги: Айван Пастин


Жанр: Самосовершенствование, Дом и Семья


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 1 (всего у книги 6 страниц) [доступный отрывок для чтения: 2 страниц]

Шрифт:
- 100% +

Айван Пастин, Тувана Пастин
Теория игр в комиксах

Introducing Game Theory: A Graphic Guide (Introducing…)

by Ivan Pastine, Tuvana Pastine, illustrations by Tom Humberstone

Text and illustrations copyright © 2017 Icon Books Ltd


© Скворцова И., перевод на русский, 2017

© Леонтьев В., дизайн обложки, 2017

© Оформление. ООО «Издательство «Э», 2017

* * *

Что такое теория игр?

Теория игр представляет собой набор инструментов, применяемых для анализа ситуаций, в которых лучшая стратегия одного человека зависит от действий, в том числе ожидаемых, других людей. Благодаря теории игр мы можем понять, как люди действуют в ситуациях взаимной зависимости.

Такая взаимозависимость, или взаимосвязь, может сформироваться в самых разных ситуациях. Иногда кооперация помогает группе достичь большего, чем получилось бы у каждого человека в отдельности. С другой стороны, если человек добивается успеха за счет других, может произойти конфликт. Так, во многих ситуациях имеются и плюсы кооперации, и элементы конфликта.



Теория игр помогает проанализировать любую ситуацию, в которой успех одного человека зависит от поведения других. Именно поэтому она эффективно применяется во многих отраслях науки.

Экономика: на решения, принимаемые фирмами, влияют их ожидания относительно продукта, цены и рекламной политики, которые выберет фирма-конкурент.

Политология: на политическую платформу одного из кандидатов влияют политические заявления его соперника.

Биология: животным приходится бороться за скудные ресурсы, и в случае нападения на опасного противника они могут пострадать.

Информатика: подключенные к одной сети компьютеры «конкурируют» за канал передачи данных.

Социология: публичное выражение нетрадиционной точки зрения поддается влиянию других членов общества, чье поведение отвечает нормам социальной культуры.



Теория игр применяется при стратегическом взаимодействии в ситуациях, когда ваш успех зависит от действий других людей, а не только от ваших решений. В таких случаях на действия людей оказывают влияние те ожидания, которые они возлагают на действия других.


Почему она называется «теория игр»?

Теория игр изучает стратегическое взаимодействие, которое является основным элементом большинства настольных игр, – отсюда и название. От вашего решения зависят последующие действия вашего соперника, и наоборот. Большая часть жаргона теории игр заимствована напрямую из игр. Те, кто принимает решение, зовутся игроками. Игрок делает ход, когда принимает решение.


Работа с моделями

Вне игр стратегическое взаимодействие может быть устроено очень сложно. Взаимодействие между людьми включает, к примеру, не только наши решения, но и выражение лица, тон голоса, язык тела – все это оказывает влияние на других. То, как складываются отношения между людьми, во многом зависит от их личного опыта и точек зрения. Подобное разнообразие способно создавать сложные ситуации, которые с трудом поддаются анализу.

Эту сложность можно обойти, создавая упрощенные структуры, называемые моделями. Модели не так сложно анализировать, при этом они отражают важные элементы реальной задачи. Упрощенная модель, выбранная с умом, поможет узнать много полезной информации о сложной реальной задаче.



Шахматы – прекрасный пример того, как множество вариантов усложняет игру, предсказывание последующих шагов и исхода. В шахматах есть определенные правила. Существует ограниченное количество вариантов ходов в каждой позиции. Тем не менее сложность этой игры поражает, хоть она и намного проще любого акта человеческого взаимодействия.


Ничья

У сложных настольных игр вроде шахмат есть отличительная черта: чем опытнее игроки, тем чаще партия заканчивается ничьей. Как можно объяснить такую закономерность?

Шахматы – это игра, не поддающаяся доскональному анализу. Поэтому давайте используем упрощенную модель, которая отражала бы некоторые важные детали шахмат: крестики-нолики. Обе эти игры имеют игровые поля и правила. Игроки принимают решения по очереди, выбирая из ограниченного количества возможных ходов.

Конечно, крестики-нолики не отражают всего, что происходит в шахматах. Но благодаря тому, что эти две игры имеют некоторые одинаковые свойства, играя в крестики-нолики можно понять, почему опытные шахматисты часто заканчивают партию ничьей.



Крестики-нолики – любимая детская игра. Как правило, если играют двое неопытных игроков, то партия, скорее всего, окончится победой одного из них. Однако достаточно попрактиковавшись, вы быстро поймете как полезна может быть обратная индукция: вы можете предугадать реакцию вашего противника на ваши возможные действия и учитываете ее при принятии решения.

После того как игроки научатся использовать обратную индукцию, крестики-нолики, вероятнее всего, будут всегда заканчиваться ничьей. Если смотреть на игру с такой точки зрения, крестики-нолики играют роль упрощенной модели шахмат. Так, в шахматах, может, и существует намного больше возможных ходов, но когда играют искусные игроки – ничьей избежать трудно.


Рассмотрим сложность поближе: искусство и наука

Для теории игр наибольший интерес представляют все же не настольные игры вроде шахмат. Скорее, она направлена на улучшение нашего понимания того, как взаимодействуют люди, компании, страны, животные и так далее, когда сами проблемы слишком сложны для полного осмысления.

Чтобы достичь такого результата, мы создаем упрощенные модели, именуемые играми. Создание подобной полезной модели сочетает в себе науку и искусство. Правильная модель достаточно проста, чтобы обеспечивать понимание тех мотивов, что движут игроками. С другой стороны, она отражает важные элементы реальности, которые включают творческий подход и суждение, нацеленные на оценку значимости элементов.


Рациональность

Как правило, теория игр включает такие понятия, как рациональность и общеизвестность рациональности игроков. Рациональность – это качество игроков, которые хорошо понимают игровую ситуацию и рассуждают логически.

Общеизвестность рациональности игроков – это менее определенный критерий, значение которого в следующем: «Не только мы оба должны быть рациональны, но и я должен знать, что ты рационален. Мне нужен и второй уровень знания: я должен знать, что ты знаешь, что я рационален. Так же необходимый мне третий уровень знания гласит: я должен знать, что ты знаешь, что я знаю, что ты знаешь, что я рационален». И так далее к более глубоким уровням знания. Общеизвестность рациональности требует от игроков способности бесконечно продолжать эту цепь знаний.


«Кейнсианский конкурс красоты»

Эти требования общеизвестности рациональности легко могут запутать, но, что еще хуже, они могут просто-напросто не сработать, особенно в играх с большим количеством участников. Классический пример – так называемый «Кейнсианский конкурс красоты», в котором английский экономист Джон Мейнард Кейнс (1883–1946) сравнивает инвестиции в финансовые рынки с конкурсом, проводимым одной газетой в США, суть которого состояла в том, что читатели должны были выбрать «самую красивую девушку», то есть побеждали те читатели, что голосовали за наиболее часто выбираемую девушку.



На первый взгляд может показаться, что «Кейнсианский конкурс красоты» едва ли можно сравнивать с финансовыми рынками: тут нет никаких цен, покупателей и продавцов. Но у них есть один важный общий элемент. Добиться успеха на финансовом рынке можно лишь будучи на шаг впереди остальных. Если вы способны предсказать поведение среднестатистического инвестора, вы сорвете куш. Так же и в «Кейнсианском конкурсе красоты»: если вы можете предсказать среднестатистический выбор читателей газеты, вы можете победить.


Ричард Талер и «Игра на угадывание»

В 1997 году американский поведенческий экономист Ричард Талер (род. в 1945 г.) провел эксперимент в газете Financial Times под названием «Игра на угадывание» – его версия «Кейнсианского конкурса красоты».



Какое число выбрали бы вы?



Газета Financial Times получила более тысячи заявок в ходе эксперимента Ричарда Талера. Заявки с числом 33 были самыми частыми, на втором месте было число 22. Из этого можно сделать вывод, что многие продумали один шаг и выбрали 33. Но многие подумали, что другие на этом и остановятся, и попытались быть на шаг впереди них, выбрав число 22 (⅔ от 33).



Тем не менее если имеет место общеизвестность рациональности игроков, если вы знаете, что остальные не остановятся на первом шаге, то можете бесконечно продолжать такое итеративное рассуждение – процесс логического размышления, который включает повторение одного и того же действия, при котором результат одного этапа берется за отправную точку следующего.

Ученые, занимающиеся теорией игр, похожим образом играют в «Игру на угадывание» – они применяют итеративное исключение доминируемых стратегий.

Держим в уме, что нам необходимо найти число, равное ⅔ от среднего арифметического всех чисел, участвующих в конкурсе. Если бы все участники выбрали наибольшее из разрешенных чисел, то есть 100, то среднее арифметическое было бы равно 100. Соответственно, несмотря на то, каковы ожидания людей относительно среднего арифметического, нет никакого смысла в том, чтобы выбирать число, большее, чем ⅔ от 100, то есть 67.

Другими словами, любая стратегия с числом, большим, чем 67, доминируема числом 67. Говорят, что стратегия доминируема, если она (в данном случае выбор числа, большего, чем 67) дает игроку меньшие выигрыши, чем другая (выбор числа 67), при любых действиях оппонентов. Соответственно, даже если остальные игроки не рациональны, все стратегии, при которых названы числа больше 67, могут быть исключены.



Если остальные игроки рациональны, то каждый игрок может предполагать, что никто не назовет число больше 67. Таким образом, все догадки от 45 (ближайшее целое число к ⅔ от 67) также исключаются. А оттого, что каждый участник знает, что другие знают, что каждый рационален, все могут быть уверены, что никто не выберет число, большее, чем 45, и никто не выберет число большее, чем 30, которое равно ⅔ от 45.


Трудности, связанные с рациональностью и общеизвестностью рациональности

Тем не менее ноль не оказался выигрышным числом в этом эксперименте в Financial Times. Средним арифметическим было число 19, поэтому победило число 13.



В этом случае принципы рациональности и общеизвестности рациональности не были соблюдены. К примеру, многие участники нерационально выбрали число 100. Даже если бы кто-то ошибочно полагал, что все выберут 100, то оптимальным ответом было бы 67. Такие участники либо не совсем поняли правила игры, либо не смогли посчитать, сколько будет ⅔ от 100.

Концепция рациональности требует от игрока неограниченных когнитивных возможностей. Полностью рациональный человек знает, как решить любую математическую задачу, и может немедленно провести все вычисления, вне зависимости от уровня их сложности. Человеческое поведение можно было бы лучше соотнести с «ограниченной» рациональностью. Это значит, что человеческая рациональность ограничена разрешимостью задачи (то, насколько легко ее можно решить), нашими умственными возможностями, количеством отведенного времени и тем, насколько для нас важно решение этой задачи.



В дополнение к концепции «ограниченной» рациональности, которая имеет большое количество участников, как, например, было в «Игре на угадывание», трудно представить ситуацию, в которой сработал бы принцип общеизвестности рациональности. Даже если все игроки рациональны, вы не выберете 0, если думаете, что остальные игроки не знают, что вы рациональны. Вы бы выбрали число большее, чем 0.


Подъем и крах: применение рациональности на финансовых рынках

«Игра на угадывание» и «Кейнсианский конкурс красоты» объясняют тот интересный факт, что на финансовых рынках даже при условии рациональности всех участников наблюдаются так называемые экономические пузыри – чрезмерно «раздутые» цены. Это связывают с недостатком общеизвестной рациональности.


Игры с одновременными ходами

Часто так случается, что в момент принятия собственного решения игрок не знает, какое действие предпримет соперник. Подобные игры называются играми с одновременными ходами. Иногда игроки принимают решения буквально синхронно, а бывает, проходит какое-то время, но покуда соперники в момент принятия их собственного решения не знают, какой ход выбран другим игроком, мы можем называть их одновременными.

Рассмотрим пример. Кинокомпания Rabbit films сняла захватывающий рождественский фильм о супергероях. Эта лента может быть выпущена в прокат либо в октябре, либо в декабре.

Один из крупнейших конкурентов Rabbit films, кинокомпания Weasel studios, сняла ужасный фильм с огромным бюджетом. По сюжету главные герои этого фильма влюблены друг в друга, но плохая игра актеров не скрывает их взаимной неприязни. Weasel studios также может выпустить фильм в прокат в октябре или в декабре.



Люди чаще ходят в кино в декабре, чем в октябре, поэтому для обеих студий желателен выпуск фильма в декабре. Но оба фильма нацелены на одну аудиторию. Если они появятся в прокате в одно и то же время, то компаниям всеми правдами и неправдами придется бороться за зрителей.

Доход каждой студии зависит не только от даты выхода своего фильма в прокат, но и от даты выхода фильма студии-конкурента. Соответственно, между компаниями наблюдается стратегическое взаимодействие. Выигрыш, который одна студия получит благодаря выбору даты релиза, будет зависеть от выбора соперника.


Стратегическая форма игры

Мы можем проанализировать эту игру, записав возможные действия игроков (релиз фильма в октябре или декабре) и выигрыши (доходы) в таблицу под названием стратегическая (нормальная) форма игры. Стратегическая форма игры – это таблица, известная также как платежная матрица.



В каждом из двух рядов записан один возможный выбор Rabbit films (октябрь или декабрь), а в каждой колонке записаны возможные выборы Weasel studios. На пересечении каждого ряда и колонки указаны выигрыши каждого игрока: в этом примере под выигрышами понимаются доходы студии.

Эта матрица представляет все возможные исходы игры и указывает, что каждый участник получил бы в качестве выигрыша в каждой конкретной ситуации. Обе киностудии понимают, как работает платежная матрица, и знают, что имеют дело с одной и той же матрицей.

Выигрыши

В каждой конкретной ситуации под выигрышем будет пониматься что-то свое в зависимости от исследуемой проблемы. В примере с релизами фильмов выигрышем являются те многомиллионные доходы, которые с помощью этих фильмов заработали бы студии при любом из возможных исходов.

В иных случаях выигрыши будут иметь другие значения. В биологии выигрышами часто называют приспособленность животного. В экономике, социологии и других науках выигрыш понимается как относительное «благосостояние» или «полезность» участников.



Может показаться странным, что мы связываем с числовыми показателями понятия благосостояния и приспособленности животного. Однако на решения игроков влияют не столько сами числа, сколько то, как эти числа соотносятся.

Для стратегического взаимодействия двух студий важны лишь их предпочтения относительно исхода. Нам важно знать лишь то, какие результаты лучше, а какие хуже для каждого из участников. Числа – это просто удобный способ представления этих предпочтений.



Конечно, существует множество значимых ситуаций, в которых людям важны не только свои собственные выигрыши, но и чужие. Друзья и члены семьи, как правило, стараются радовать друг друга, а пары в состоянии развода и деловые конкуренты могут быть не против причинить друг другу неприятности.

Подобные ситуации легко поддаются анализу с помощью теории игр: записывая потенциальные выигрыши, мы учитываем все желания участников, включая и желания, связанные с личной выгодой, и желание помочь или навредить другим. Значащиеся в таблице числа – это итоговый выигрыш, который каждый из игроков получит при любом из исходов: так, выгода, которую участник способен извлечь, может быть прямой или непрямой (например, если он причинит вред или поможет кому-либо). Таким образом, выигрыш учитывает все, что для человека важно.

Соответственно, в игре стратегической формы каждый игрок заинтересован лишь в увеличении своих выигрышей.


Равновесие Нэша

Теперь, когда мы уточнили условия игры, записав ее в стратегической форме, можем перейти к возможным последующим событиям.

Равновесие Нэша – это фундаментальная концепция в теории игр, названная в честь американского математика Джона Нэша (1928–2015). Само понятие математического равновесия было придумано задолго до Нэша, но он был первым, кто приложил его к математическому анализу игр в общем, а не только к отдельным примерам, как делали раньше.



Идея равновесия Нэша и достаточно проста, и эффективна одновременно: в ситуации равновесия каждый рациональный игрок выбирает свою оптимальную стратегию, учитывая, что другой игрок также придерживается определенной стратегии. То есть участник выбирает стратегию в зависимости от действий оппонента.

Оптимальная стратегия Rabbit films

• Если Rabbit films ожидает, что Weasel Studios выпустит фильм в октябре, то их оптимальной стратегией будет выпуск фильма в декабре, так как R:120 > R:50. Подчеркиваем R:120.

• Если Rabbit films ожидает, что Weasel Studios выпустит фильм в декабре, то их оптимальной стратегией будет выпуск фильма в декабре, так как R:90 > R:70. Подчеркиваем R:90.

Оптимальная стратегия Weasel studios

• Если Weasel Studios ожидает, что Rabbit films выпустит фильм в октябре, то их оптимальной стратегией будет выпуск фильма в декабре, так как W:10 > W:5. Подчеркиваем W:10.

• Если Weasel Studios ожидает, что Rabbit films выпустит фильм в декабре, то их оптимальной стратегией будет выпуск фильма в декабре, так как W:8 > W:7. Подчеркиваем W:8.

В ситуации равновесия обе студии выпустили бы фильмы в декабре. Это единственный исход, при котором оптимальные стратегии обеих студий позволяют достичь наилучших результатов.



Одной из характеристик равновесия Нэша является отсутствие сожаления у каждого из игроков. Отказ от стратегии равновесия, подразумевающей выпуск фильмов в декабре, не принес бы ни одной из студий никакой выгоды. Равновесие Нэша также является и равновесием рациональных ожиданий. В такой ситуации Rabbit films выпускает фильм в прокат в декабре, ожидая, что Weasel Studios собирается выпускать фильм в прокат в декабре. И действительно, Weasel Studios назначает релиз на декабрь. Соответственно, ожидания правильны.


«Дилемма заключенных»

«Дилемма заключенных» – это самый известный парадокс во всей теории игр. Такое название этой дилемме дал канадский математик Альберт Такер (1905–1995). Эта игра профессора Такера очень похожа на голливудскую криминальную драму, в которой каждому из двух заключенных предлагают сделку о сотрудничестве с правосудием в обмен на донос о другом заключенном. Эта дилемма наглядно показывает, как трудно может быть действовать сообща для общего блага, если люди преследуют свои личные интересы.

Стимулы, которые мы наблюдаем в «Дилемме заключенных», достаточно часто встречаются и используются учеными при анализе задач в самых разнообразных областях науки, например конкуренция компаний в экономике, общественные нормы в социологии, механизмы принятия решения в психологии, борьба животных за скудные ресурсы в биологии или борьба компьютеров за канал передачи данных.



Алан и Бен угнали машину, но их вскоре поймали. Полицейские подозревают, что до того, как их арестовали, они сбили человека и скрылись с места преступления, но у следствия нет улик, прямо указывающих на их вину. Допрос преступников ведется в разных комнатах.

И у Алана, и у Бена есть два варианта действий: они могут сохранять молчание, а могут признаться. Соответственно, существует четыре возможных исхода этой игры:

Алан сохраняет молчание, и Бен сохраняет молчание;

Алан признается, и Бен сохраняет молчание;

Алан сохраняет молчание, и Бен признается;

Алан признается, и Бен признается.



«Дилемма заключенных» может быть представлена в стратегической форме, при которой каждый ряд матрицы представлял бы возможный выбор Алана, а каждая колонка – возможный выбор Бена. На пересечениях каждого ряда и колонки мы обозначим выигрыши каждого игрока: в данном случае это будет срок заключения.



Если Алан и Бен сохранят молчание, то оба получат срок в один год за угон автомобиля. Это отрицательный расклад, поэтому их выигрыши также в минусе (Алан: –1, Бен: –1). Если оба преступника сознаются, каждый сядет в тюрьму на 10 лет (А – 10, Б – 10).



Заключенные понимают, как работает эта матрица, и знают, что имеют дело с одной и той же матрицей.

Это пример игры с одновременными ходами. Даже если заключенные не принимают решения синхронно, мы все равно можем назвать их одновременными, потому что игроки находятся в разных комнатах и ни один из них в момент принятия своего решения не знает, как будет действовать другой.

Однако заметьте, что, воспринимая эту дилемму как игру в стратегической форме, мы не говорим о возможном исходе. Мы просто обозначаем все потенциально возможные итоги, будь они разумны или нет, и записываем выигрыши, которые игроки получили бы, если бы место имел именно такой исход.

Теперь, когда мы записали нашу задачу в стратегической форме, мы можем приступить к анализу возможного результата.



Очевидно, если бы Алан и Бен вместе придумали бы свою версию произошедшего, они смогли бы сохранить молчание и попали бы в тюрьму всего на один год.

Но этот вариант не входит в систему равновесия. Для Алана стратегия «сознаться» строго доминирует над стратегией «молчать»: всегда лучше сознаться, несмотря на его ожидания относительно действий Бена.



Точно так же и для Бена оптимальной стратегией было бы признание, вне зависимости от его ожиданий относительно действий Алана.

В ситуации равновесия Нэша в данной дилемме оба заключенных признаются. Стандартный способ записи этого исхода таков:

{признание, признание}

Это значит, что игрок, чьи выигрыши записаны в матрице в строку (Алан), сделал выбор в пользу признания, как и игрок, чьи выигрыши записаны в колонку (Бен). В равновесии оба заключенных получают по 10 лет тюремного срока.



Страницы книги >> 1 2 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации