Текст книги "Модельное мышление. Как анализировать сложные явления с помощью математических моделей"
Автор книги: Скотт Пейдж
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 40 страниц) [доступный отрывок для чтения: 13 страниц]
Проблемы моделирования поведения людей
Моделирование поведения людей – сложная задача, поскольку модели требуют низкоразмерного представления, а люди не поддаются простому описанию. Все мы разные, подвержены социальному влиянию, склонны к ошибкам, целеустремленны и обучаемы. Кроме того, мы обладаем агентивностью – способностью действовать.
Напротив, физические объекты, такие как атомы углерода или бильярдные шары, не демонстрируют ни одного из этих свойств. Атомам углерода не присуще многообразие (хотя они могут занимать различные позиции в соединениях, например в пропане). Они никогда не нарушают законов физики и не живут целеустремленной жизнью. Они не меняют свое поведение с учетом прошлого опыта и лишены агентивности; они не решают возглавить восстание или сменить сферу деятельности. Отсюда и проистекает часто повторяемый шуточный комментарий социологов: насколько сложной была бы физика, если бы электроны могли думать. Физика была бы еще сложнее, если бы электроны могли описывать модели.
Мы можем начать с проблем, обусловленных многообразием. Люди отличаются по предпочтениям, способности действовать, сети социальных связей, уровню альтруизма и уровню когнитивного внимания, которое они уделяют действиям. Моделирование было бы проще, если бы все мы были одинаковыми. Иногда мы прибегаем к статистической логике и предположению, что поведенческое многообразие уравновешивается. Например, мы могли бы построить модель, которая прогнозирует благотворительные пожертвования как функцию дохода. При определенном уровне дохода и налоговой ставки некоторые люди могут быть более, а другие менее альтруистичными, чем мы предполагаем. Если отклонения от модели исключаются путем усреднения (в главе 5 мы поговорим о моделях распределений, объясняющих, почему это происходит), то наша модель может быть точной. Такое уравновешивание многообразия возможно только в случае независимых действий. Когда поведение формируется под влиянием социальных факторов, экстремальные действия могут привести к побочным эффектам. Так происходит, когда политические активисты побуждают избирателей к действиям. Мы столкнемся с этим при моделировании массовых волнений.
Произойдет ли взаимоисключение ошибок в их общей совокупности, зависит от контекста. Ошибки, возникающие из-за отсутствия когнитивной привязанности, могут быть случайными и независимыми. Ошибки, обусловленные когнитивными искажениями, могут быть систематическими и коррелированными. Например, люди могут придавать чрезмерное значение недавним событиям и вспоминать описательную информацию лучше, чем статистические данные. Общее смещение такого рода не уравновешивается.
Следующая проблема связана с желаниями людей. Самая большая трудность в описании моделей людей – дать точную оценку их целей и задач. Одни люди жаждут богатства и славы. Другие хотят внести вклад в улучшение жизни своих общин и мира в целом. В модели рационального агента мы представляем выигрыш человека непосредственно в виде функции. В моделях, основанных на правилах, цели носят более имплицитный характер. Правило поведения, согласно которому люди стремятся жить в интегрированных районах, но покидают район, если доля людей их расы падает ниже 10 процентов, отражает определенные убеждения в отношении стремлений людей.
И наконец, последняя проблема моделирования людей связана с их агентивностью – способностью действовать, менять то, что они делают, и учиться. Вместе с тем в некоторых контекстах людей лучше охарактеризовать как рабов привычек. Действия могут быть нам неподвластны. Мало кто стремится к зависимости от опиоидов или к бедности. Тем не менее люди совершают действия, приводящие к таким результатам.
Когда действия человека влекут за собой негативные последствия, он во многих случаях адаптирует свое поведение. Мы можем учесть это, включив в свои модели обучение. То, как люди учатся, зависит от контекста. Сколько часов нужно готовиться к экзамену, чтобы получить хорошую оценку, или сколько раз в неделю тренироваться – этому люди учатся на основе личного опыта и самоанализа. В каких продуктовых магазинах делать покупки и жертвовать ли на благотворительность – об этом люди узнают, наблюдая за другими. В главе 26 мы покажем, как обычно работает обучение в нестратегических контекстах. Люди осваивают наиболее подходящие действия. Кроме того, мы продемонстрируем, что в стратегических контекстах, которые мы моделируем как игры, все ставки аннулируются. Однако индивидуальное и социальное обучение не обязательно обеспечивает хорошие результаты.
Каждая из шести характеристик является потенциальным свойством модели. Включая то или иное свойство в модель, мы должны решить, в каком объеме это делать. Насколько разноплановыми должны быть наши агенты? Какое социальное влияние мы учитываем? Учатся ли люди у других? Как мы определяем задачи? В какой степени людям свойственна активность? Мы можем обладать меньшей свободой действий, чем думаем. Джонатан Хайдт описывает отсутствие способности действовать с помощью метафоры о наезднике и слоне. «Образ, который я придумал для себя, когда поражался своей слабости, – что я наездник, сидящий на спине слона. Я держу в руках поводья и, потянув их в ту или иную сторону, могу велеть слону повернуть, остановиться или двигаться дальше. Я могу управлять происходящим, но только если у слона нет собственных желаний. Если же слон действительно захочет что-то сделать, мне его не одолеть»[63]63
См. Haidt, 2006.
[Закрыть]. Иногда нам удается прокатиться верхом на слоне, а иногда нет. Ни один подход к моделированию людей не может быть применим при любых обстоятельствах, поэтому мы моделируем их разными способами.
Модель рационального агента
Модель рационального агента предполагает, что люди делают оптимальный выбор с учетом функции выигрыша или полезности. Действиями могут выступать решения – тогда выигрыш зависит только от действий человека, или осуществляться в рамках игры – тогда выигрыш зависит от действий других игроков. В игре с одновременным выбором или неполной информацией модель также определяет убеждения в отношении действий других агентов.
Модель рационального агента
Предпочтения индивида представлены математической функцией полезности или выигрыша, определенной на множестве возможных действий. Человек выбирает действие, максимизирующее значение функции. В игре такой выбор может потребовать убеждений в отношении действий других игроков.
Давайте построим в качестве примера простую модель рационального агента, отражающую индивидуальное решение о том, какую часть дохода выделять на жилье. Модель отражает полезность как функцию от затрат на жилье и все остальные виды потребления, в том числе продукты питания, одежду и развлечения (см. врезку). В данной модели делается предположение в отношении цены на жилье и цены всех остальных товаров. Модель далека от реалистичности: она одинаково подходит ко всем вариантам жилья, объединяет все остальные товары в одну категорию «потребление» и устанавливает на них одну и ту же цену. Мы можем игнорировать какое-то время все эти неточности, поскольку задача модели – объяснить долю дохода, выделенную на жилье.
Модель рационального агента в контексте потребления
Исходное предположение: польза, получаемая человеком от общего потребления C и расходов на жилье H, можно описать как:
Результат: человек, максимизирующий полезность (рациональный агент), тратит на жилье ровно треть доходов[64]64
Предположим, человек располагает бюджетом M, цена одной единицы потребительского товара составляет 1 доллар, а цена единицы жилья равна PH. Бюджетное ограничение можно записать как M = C + PH · H. Это подразумевает, что C = M − PH − H; в таком случае мы можем описать полезность как функцию H:
Чтобы найти значение H, максимизирующее полезность, возьмем производную по H и приравняем ее к нулю. Это требует применения правила дифференцирования сложных функций:
Перемещение первого члена на другую сторону уравнения и приведение к общему знаменателю дает следующее:
2PH · H = (M − PH · H).
Подстановка 2PH · H вместо (M − PH · H) в уравнении бюджетного ограничения дает M = 2PH · H + PH · H, или M = 3PH · H. Отсюда следует, что человек тратит на жилье третью часть дохода.
[Закрыть][65]65
Можно показать (хотя бы численно), что данная функция имеет единственный максимум при Н равной трети суммарного дохода, равного С + Н. Прим. ред.
[Закрыть].
В этой модели доля дохода, выделяемая человеком на жилье, не зависит от цены жилья или дохода. Оба результата представляют собой достаточно точное приближение данных[66]66
В США это достаточно хорошее приближение. Источник: Бюро трудовой статистики США (US Bureau of Labor Statistics), 2013.
[Закрыть]. За исключением тех, кто находится на концах шкалы распределения доходов, большинство людей тратят на жилье около трети дохода. Этот вывод имеет политические последствия: если цены на жилье упадут на 10 процентов, люди будут покупать его на 10 процентов больше. Кроме того, он также обосновывает предположение об идентичности агентов. Если люди тратят на жилье фиксированный процент дохода, то общий объем расходов на жилье зависит только от среднего дохода.
Использование функции полезности делает модели разрешимыми, поддающимися анализу и проверке. Мы можем оценить такие функции с помощью данных, вывести оптимальные действия, а также задать вопросы типа «что, если», изменив значения параметров. Делая предположение относительно функции полезности, мы подразумеваем согласованность предпочтений, которой может не существовать. Для того чтобы предпочтения были представимы посредством функции полезности, они должны удовлетворять определенным аксиомам. Теоремы, доказывающие существование функций полезности, предполагают наличие совокупности альтернатив в сочетании с упорядочением предпочтений. Представьте, что мы можем перечислить все возможные группы товаров, которые может купить человек. Упорядочение предпочтений ранжирует эти группы от наиболее до наименее предпочтительных. Человек может предпочесть кофе с молоком чаю с лимоном и тогда разместит группу {кофе, молоко} выше группы {чай, лимон}.
Функция полезности отражает предпочтения, если она присваивает группе A более высокое значение, чем группе B, тогда и только тогда, когда порядок предпочтений ставит группу A выше группы B. Для того чтобы предпочтения можно было представить в виде функции полезности, они должны удовлетворять таким условиям, как полнота, транзитивность, независимость и непрерывность. Полнота требует, чтобы порядок предпочтений был определен на всех парах альтернатив. Транзитивность исключает циклы предпочтений. Если человек предпочитает группу A группе B, а группу B группе C, то он должен также отдавать предпочтение группе A перед группой C. Иначе говоря, если человек предпочитает яблоки бананам, а бананы сыру, то он должен также отдавать предпочтение яблокам перед сыром. Это условие исключает противоречивые предпочтения.
Независимость требует, чтобы люди оценивали результаты лотереи по отдельности. Лотерея – это распределение вероятностей по совокупности альтернатив, например, вероятность результата A составляет 60 процентов, а результата B – 40 процентов. Предпочтения удовлетворяют условию независимости, если, когда A находится в порядке предпочтений выше B, в любой лотерее, включающей в себя B в качестве результата, человек отдает предпочтение альтернативной лотерее, где место B занимает A[67]67
Формально – если лотерея L1 предпочтительнее лотереи L2, то для любого 0 < p < 1 лотерея pL1 + (1 − p)L3 предпочтительнее лотереи pL2 + (1 − p)L3 для всех лотерей L3. Прим. ред.
[Закрыть]. Условие независимости исключает сильное неприятие риска. Человек, не склонный рисковать, может ставить поездку в Новый Орлеан выше поездки в Disney World, но предпочитает точно знать, что поедет в Disney World, чем участвовать в лотерее, которая отправит его в Новый Орлеан с вероятностью ½ и в Disney World в остальных случаях. Последнее условие, непрерывность, гласит, что если человек ставит A выше B, а B выше C, то существует лотерея, в которой он получит A с вероятностью p и C с вероятностью (1 − p), которая нравится ему точно так же, как и лотерея B[68]68
Формально – если последовательность вероятностей {pn} сходится к p, и лотерея pnL1 + (1 − pn)L2 предпочтительнее лотереи L3 для всех n, то лотерея pL1 + (1 − p)L2 предпочтительнее лотереи L3. Прим. ред.
[Закрыть]. Это предположение исключает сильные предпочтения в отношении определенных результатов[69]69
Формально теорема записывается следующим образом: пусть X = {A, B, C, …, N} обозначает конечное множество результатов, и пусть лотерея представляет собой распределение вероятностей по результатам: L = (pA, pB, …, pN). Если предпочтения (n) по лотереям удовлетворяют условию полноты (любые две лотереи L и M можно сопоставить), транзитивности (если LnM, а MnN, тогда LnM), независимости (если LnM, то для произвольной лотереи N и любой вероятности p > 0, лотерея (pL + (1 − p)NnpM + (1 − p)N) и непрерывности (если LnM и MnN), тогда существует вероятность p такая, что pL + (1 − p)NnM, а значит, предпочтения можно представить в виде непрерывной функции полезности, которая присваивает каждой лотерее действительное значение, то есть полезность. Схема доказательства выглядит так. Предположим, существует лучший результат B и худший результат W. Примем полезность результата B равной 1, а полезность результата W равной нулю. Согласно аксиоме непрерывности, при наличии любого другого результата A существует вероятность p, которая делает человека безразличным к выбору между получением результата B с вероятностью p и получением результата W с вероятностью (1 − p). Запишем это как AnpB + (1 − p)W. Затем присвоим полезности результата A значение, равное p. Небольшой самоанализ (и немного математики) показывает, что чем больше человеку нравится результат (или лотерея), тем больше будет значение p. Почти как по волшебству мы превратили упорядоченные списки в числа. Полное доказательство ищите здесь: Von Neumann and Morgenstern, 1953.
[Закрыть].
Условия независимости и транзитивности, которые люди нарушают, в дополнение к спорным утверждениям, что люди склонны к оптимизации, побуждают многих ставить под сомнение модель рационального агента, особенно популярную среди экономистов. Тем не менее существуют веские основания исходить из рациональности. Во-первых, люди могут действовать, «как будто» они склонны к оптимизации, и могут применять правила, обеспечивающие почти оптимальное поведение. Когда люди играют в бильярд, ловят летающий диск фрисби или водят автомобиль, они не составляют математических уравнений. Математические расчеты времени прыжка, необходимого, чтобы поймать фрисби, озадачат практически любого. Тем не менее люди ловят фрисби. Кстати, собаки тоже это умеют. Таким образом, люди и собаки действуют так, будто решают сложную задачу оптимизации.
Эта же логика распространяется и на задачи высокой размерности. Анализ действий Гарольда Зерчера, директора отдела технического обслуживания муниципальной автобусной компании в Мэдисоне, показал, что он принял почти оптимальное решение относительно замены двигателей автобусов[70]70
См. Rust, 1987.
[Закрыть]. Зерчер не делал никаких математических расчетов, а полагался на эвристику, основанную на опыте, а это означало, что он действовал (почти) как рациональный агент.
Во-вторых, даже если люди действительно совершают ошибки, при повторении подобной ситуации способность учиться должна подталкивать нас к оптимальным действиям. В-третьих, в тех случаях, когда ставки высоки, люди должны вкладывать время и силы в принятие почти оптимальных решений. Люди могут переплачивать 30 процентов за кофе или батарейки, но они не переплачивают 30 процентов за автомобили или дома. Утверждение, что обучение и высокие ставки повышают уровень рациональности, подкреплено большим объемом эмпирических и экспериментальных данных[71]71
См. Camerer, 2003.
[Закрыть].
Как ни парадоксально, четвертое основание для принятия модели рационального агента состоит в том, что она упрощает анализ. В случае большинства функций полезности есть единственное оптимальное действие. Человек может вести себя неоптимально тысячами способов. Утверждение, что люди не склонны к оптимизации, открывает огромное окно возможностей. Исходя из предположения, что люди делают выбор в пользу сохранения своей идентичности или соблюдения культурных норм, мы можем не получить одного четкого ответа. Рациональный выбор не реалистичен, но реализм имеет свою цену – он порождает путаницу. Ответ, пусть и заведомо неправильный, может быть полезнее, чем отсутствие ответа вообще, поскольку это позволяет применить модель к данным и проанализировать последствия изменения переменных[72]72
См. Harstad and Selten, 2013.
[Закрыть].
Аргументы в пользу рационального выбора
«Как будто»: разумное поведение, основанное на правилах, может быть неотличимо от оптимального или почти оптимального поведения.
Обучение: в повторяющихся ситуациях люди должны приближаться к оптимальному поведению.
Большие ставки: в случае важных решений люди собирают информацию и думают медленно.
Уникальность: оптимальное поведение часто носит уникальный характер, что делает модель поддающейся проверке.
Непротиворечивость: оптимальное поведение создает непротиворечивую модель. Освоив ее, люди не будут менять свое поведение.
Эталон: оптимальное поведение выступает в качестве эталона, позволяющего определить верхнюю границу когнитивных способностей людей.
В-пятых, предположение о рациональном агенте обеспечивает внутреннюю непротиворечивость. Если модель предполагает субоптимальное поведение и находится в открытом доступе, ее можно изучить. Люди могут менять поведение. Они могут не быть оптимальны, однако любое предположение, отличное от предположения об оптимальности, подвергается критике за отсутствие непротиворечивости. Мы вернемся к этому вопросу в конце главы.
И последнее, по мнению некоторых, самое важное: рациональность может выступать в качестве эталона[73]73
См. Myerson, l999, где идет речь об использовании рационального выбора в качестве эталона.
[Закрыть]. При разработке политики, составлении прогноза или выборе действия мы должны анализировать, что бы произошло, если бы у людей были рациональные предпочтения и склонность к оптимизации. Это указало бы на изъяны в наших рассуждениях. Кроме того, мы должны быть готовы к тому, что это действие приведет нас к выводу, что модель рационального агента неприменима и нам следует использовать другие модели. К этому списку можно добавить и седьмую причину: многомодельное мышление. Когда люди применяют множество моделей, вероятность ошибок снижается.
ПСИХОЛОГИЧЕСКИЕ СМЕЩЕНИЯ
Модель рационального агента ставят под сомнение психологи, экономисты и нейроученые, заявляя, что она не соответствует поведению людей. Эмпирические результаты лабораторных и естественных экспериментов указывают на то, что люди подвержены различным искажениям и смещениям, в том числе и смещению в отношении статус-кво. При вычислении вероятностей мы игнорируем базовые ставки, придаем слишком большое значение беспроигрышным вариантам и стараемся избегать потерь.
По мере того как исследователи начинают связывать поведение и убеждения с процессами, протекающими в головном мозге, доказательства предрасположенности людей к психологическим смещениям становятся все более убедительными. Например, нейроэкономика использует исследования мозга для изучения экономически значимых аспектов поведения, таких как отношение к риску, уровень доверия и реакция на информацию[74]74
Результаты первых исследований можно найти здесь: Camerer, Loewenstein, and Prelec, 2005.
[Закрыть]. По утверждению Канемана, то, что нам известно на данный момент, позволяет провести различие между двумя типами мышления: быстрые, интуитивные правила (быстрое мышление) и неторопливые размышления (медленное мышление). Быстрое мышление более подвержено такого рода смещениям[75]75
См. Kahneman, 2011, где дается краткий обзор этого исследования.
[Закрыть]. В долгосрочной перспективе мы можем определить некоторые поведенческие шаблоны на основе структур головного мозга, но следует помнить, что мозг обладает огромной пластичностью – и способен преодолеть смещения посредством медленного мышления.
Кроме того, мы должны проявлять осмотрительность и не считать универсальным любой вывод, задокументированный всего в нескольких исследованиях. Результаты многих психологических исследований не подтвердились. В ходе одного из последних исследований не удалось воспроизвести и половины из сотни результатов, опубликованных в ведущих психологических журналах[76]76
Первая работа Open Science Collaboration, опубликованная в 2015 году, повлекла за собой другие попытки проверки воспроизводимости, показавшие аналогичные результаты.
[Закрыть]. Кроме того, воспроизводимость не всегда подразумевает универсальность. Во многих исследованиях совокупность объектов исследования лишена экономического и культурного многообразия[77]77
О необходимости более широкого многообразия в совокупности субъектов исследований идет речь в статье: Medin, Bennis, and Chandler, 2010.
[Закрыть]. Можно предположить, что в более разнообразной выборке поведенческих закономерностей будет еще меньше, что дает еще больше оснований избегать обобщений в отношении поведения.
Наконец, при создании более реалистичных моделей мы должны помнить о разрешимости. К тому же они могут потребовать более сложной математики[78]78
См. Berg and Gigerenzer, 2010. Авторы статьи полностью поддерживают эту линию критики, утверждая, что это подрывает психологические модели, основанные на математике.
[Закрыть]. Однако ни одна из этих причин не убедительна настолько, чтобы отказаться от моделей с психологически реалистичным поведением, но в совокупности они указывают на то, что мы должны действовать осмотрительно и уделять особое внимание документально подтвержденным поведенческим закономерностям.
Два неоднократно воспроизведенных отклонения – это неприятие потерь и гиперболическое дисконтирование. Неприятие потерь означает, что люди не склонны рисковать в случае потенциальной выгоды и готовы рискнуть в случае возможных потерь. Канеман и Тверски обозначают эту общую теорию как «теорию перспектив»[79]79
См. Kahneman and Tversky, 1979.
[Закрыть]. Неприятие потерь поначалу не кажется иррациональным, но говорит о том, что люди выбирают разные действия, если один и тот же сценарий представлен как потенциальная потеря или потенциальный выигрыш.
Например, люди предпочитают выиграть 400 долларов наверняка, чем участвовать в лотерее с равными шансами выиграть 1000 долларов. Тем не менее они примут участие в лотерее с равными шансами проиграть 1000 долларов, чем наверняка потерять 600 долларов. Такая непоследовательность распространяется и на неденежные сферы. Врачи, которым дают варианты выбора, представленные в виде выгоды, избегают риска. Когда эти варианты представлены в виде потерь, врачи в основном идут на риск[80]80
Представление альтернатив в виде выгоды: курс лечения A точно спасет 40 процентов пациентов. Курс лечения B с 50-процентной вероятностью спасет всех. Представление альтернатив в виде потери: курс лечения A’ однозначно приведет к смерти 60 процентов пациентов. При проведении курса лечения B’ с вероятностью 50 процентов не умрет никто и с вероятностью 50 процентов умрут все. Согласно теории перспектив, большинство врачей выбирают курс лечения A при представлении альтернатив в виде выгоды и курс лечения B’ – в виде потери.
[Закрыть].
Теория перспектив: пример
Представление альтернатив в виде выгоды
У вас есть два варианта выбора:
Вариант A: однозначно получить 400 долларов.
Вариант B: получить 1000 долларов, если при подбрасывании симметричной монеты выпадет орел, и 0 долларов, если выпадет решка.
Представление альтернатив в виде потери
Вам дают 1000 долларов и два варианта выбора:
Вариант Â: однозначно потерять 600 долларов.
Вариант : потерять 0 долларов, если при подбрасывании симметричной монеты выпадет орел, и 1000 долларов, если выпадет решка.
Варианты A и Â эквивалентны вариантам B и . Согласно теории перспектив, большинство людей выбирают варианты A и .
Гиперболическое дисконтирование подразумевает более высокий коэффициент дисконтирования для ближайшего будущего. Стандартные экономические модели опираются на экспоненциальное дисконтирование, при котором ценность будущих благ убывает по экспоненте. Человек с годовой ставкой дисконтирования 10 процентов оценивает сумму в 1000 долларов в следующем году как эквивалентную 900 долларам сегодня. Этот человек дисконтировал бы деньги следующего года на 10 процентов каждый очередной год. Однако опыт показывает, что большинство людей не дисконтируют будущие доходы по фиксированной ставке дисконтирования. Напротив, они подвержены смещению в сторону безотлагательности, то есть дисконтируют ближайшее будущее в гораздо большей степени, чем более отдаленное[81]81
Первые работы, в которых идет речь о последствиях гиперболического дисконтирования: Thaler, 1981 и Laibson, 1997.
[Закрыть]. Например, если вы спросите людей, что они предпочли бы – 9500 долларов через двадцать лет или 10 000 долларов через двадцать лет и один день, практически каждый подождал бы еще один день ради дополнительных 500 долларов. Но если вы спросите этих же людей, что они предпочли бы – 9500 долларов сегодня или 10 000 долларов завтра, многие бы взяли 9500 долларов сейчас. Это и есть пример смещения в сторону безотлагательности[82]82
Формулу гиперболического дисконтирования можно записать в более обобщенной форме:
[Закрыть].
Такое смещение порождает поведение, рассогласованное во времени. Через год большинство людей предпочтут подождать еще один день и получить 10 000 долларов. Такие предпочтения не являются логически противоречивыми. Гиперболическим дисконтированием объясняют, почему люди накапливают задолженность по кредитным картам, едят нездоровую пищу, вступают в незащищенные половые связи и не откладывают на пенсию.
Таким образом, в зависимости от того, как мы будем использовать модель, мы можем предпочесть неприятие потерь и гиперболическое дисконтирование, учитывая, что эти допущения лучше соответствуют поведению большинства людей. Основная причина этого не делать – если они усложняют модель без качественного изменения того, что мы находим, или если при допущении гиперболического дисконтирования наша модель приводит к нереалистичному поведению.
МОДЕЛИ, ОСНОВАННЫЕ НА ПРАВИЛАХ
Теперь рассмотрим модели, основанные на правилах[83]83
См. Gigerenzer and Selten, 2002.
[Закрыть]. Тогда как модели на основе оптимизации опираются на базовую функцию полезности или выигрыша, который люди стремятся максимизировать, модели, основанные на правилах, предполагают определенное поведение. Они могут исходить из того, что во время аукциона человек предложит за тот или иной лот на 10 процентов меньше его истинной стоимости или скопирует действия друга, если этот друг неизменно получает более высокие выигрыши. Многие приравнивают модели на основе оптимизации к математике, а основанные на правилах – к вычислениям. Хотя различие между ними не столь однозначное, как может показаться на первый взгляд. Вспомните нашу модель затрат на жилье. Оптимальное поведение приняло форму простого правила: выделять на жилье треть дохода. Ключевое различие между двумя подходами заключается в их базовых предположениях. В моделях на основе оптимизации главную роль играют предпочтения или выигрыш, а в модели, основанной на правилах, – поведение.
Правила поведения могут быть фиксированными или адаптивными. Фиксированное правило подразумевает применение одного и того же алгоритма во всех случаях. Модели рационального выбора обеспечивают верхний предел когнитивных способностей людей, а модели с фиксированными правилами – нижний предел. Распространенное на рынках фиксированное правило, правило нулевого интеллекта, подразумевает принятие любого предложения, обеспечивающего более высокий выигрыш. Это правило не допускает глупых действий (например, снижающих полезность). Предположим, мы хотим оценить эффективность одностороннего рынка, на котором продавцы размещают предложения о продаже товара без возможности торга. Продавец, придерживающийся правила нулевого интеллекта, случайным образом выберет цену, превышающую ценность этого товара для него. Покупатель купит любой товар по цене ниже ценности, которую представляет для него этот товар. Проанализировав эти варианты поведения с помощью компьютерной модели, мы обнаружим, что на рынках трейдеры с нулевым интеллектом обеспечивают почти оптимальные результаты. Следовательно, эффективное функционирование фондовых рынков не зависит от наличия рациональных покупателей и продавцов[84]84
См. Gode and Sunder, 1993.
[Закрыть].
Адаптивное правило подразумевает переключение между вариантами наборов поведения, развитие новых типов поведения или копирование поведения других. Эти действия предпринимаются ради повышения выигрыша. Следовательно, в отличие от фиксированных правил адаптивные правила требуют функции полезности или выигрыша. Сторонники этого подхода утверждают, что в любой ситуации люди склоняются к простым и эффективным правилам, а раз люди ведут себя именно так, мы должны моделировать их поведение аналогичным образом[85]85
См. Gigerenzer and Selten, 2002.
[Закрыть]. Хотя модели, основанные на правилах, не содержат явно выраженных предположений в отношении рациональности, модели на основе адаптивных правил демонстрируют экологическую рациональность – более эффективные правила начинают доминировать[86]86
В своей лекции по случаю вручения Нобелевской премии Вернон Смит отметил следующее: «Экологическая рациональность использует умозаключения (рациональную реконструкцию) для анализа поведения людей на основе их опыта и знаний, проистекающих из народной мудрости. Люди придерживаются правил, не будучи способными их сформулировать, но эти правила можно открыть». См. Smith, 2002.
[Закрыть].
Для того чтобы объяснить, как работают модели на основе адаптивных правил, опишем модель самоорганизованной координации под названием Эль Фароль[87]87
См. Arthur, 1994.
[Закрыть]. «Эль Фароль» – ночной клуб в Санта-Фе, в котором каждый вторник проводится вечер танцев. Каждую неделю 100 потенциальных танцоров решают, пойти в «Эль Фароль» на танцы или остаться дома. Все 100 человек любят танцевать, но не хотят идти в клуб, когда он переполнен. Модель основана на строгой системе предпочтений. Человек получит нулевой выигрыш, оставшись дома, выигрыш 1 – при посещении клуба при условии, что там будет 60 или менее посетителей, и выигрыш −1 – при посещении клуба, если там будет более 60 посетителей.
Если мы построим модель, основанную на фиксированных правилах, это может привести к чему угодно. Например, если бы мы предписали каждому человеку придерживаться правила «ходить каждую неделю; если в клубе будет более 60 посетителей, не идти на следующей неделе; а затем отправиться туда через неделю», то в клубе «Эль Фароль» было бы 100 посетителей в первую неделю, ноль посетителей во вторую и 100 посетителей в третью. Модель «Эль Фароль» создает адаптивные правила, позволяя каждому человеку использовать совокупность правил. Каждое правило говорит человеку о том, идти в клуб или не идти. Эти правила принимают несколько форм. Одни носят фиксированный характер: ходить в клуб каждую неделю. Другие основаны на закономерностях в количестве людей, посетивших клуб на протяжении последних недель. Третьи могут предсказывать, что количество посетителей заведения на этой неделе будет таким же, как и на прошлой. Если на прошлой неделе в клубе было меньше 60 посетителей, правило посоветует человеку посетить его на этой неделе.
Модель адаптивных правил поведения может присваивать каждому правилу оценку, эквивалентную проценту недель, на которые оно предоставило правильный совет. Тогда каждый человек мог бы использовать данную модель в своей совокупности правил с самой высокой оценкой. Лучшее правило будет меняться на протяжении нескольких недель. Моделирование такого типа показывает, что при наличии большой совокупности правил клуб каждую неделю посещают около 60 человек: координация происходит без централизованного планирования. Иначе говоря, система адаптивных правил путем самоорганизации обеспечивает почти оптимальные результаты.
Модель «Эль Фароль»: адаптивные правила
Еженедельно в течение года каждый из 100 человек независимо друг от друга решают, идти в клуб «Эль Фароль» или нет. Человек, посетивший клуб, получает выигрыш 1, если в нем будет 60 или менее посетителей, и выигрыш –1 в противном случае. Тот, кто не идет в клуб, получает нулевой выигрыш.
У каждого человека есть совокупность правил, на основании которых он решает, идти ли в ему клуб. Эти правила могут быть фиксированными или зависеть от посещаемости клуба в последнее время. Каждый человек еженедельно придерживается того правила из своей совокупности, выполнение которого обеспечивало максимальный выигрыш в прошлом.
Мы можем интерпретировать поведение в рамках моделей, основанных на адаптивных правилах, с помощью микро-макро цикла (см. рис. 4.1). На микроуровне группа индивидов совершают действия (обозначенные как ai) в соответствии с правилами. Эти правила порождают явления макроуровня (обозначенные как макро1 и макро2), на которые указывают стрелки, направленные вверх. В задаче клуб «Эль Фароль» в качестве явлений макроуровня выступают последовательности посещений за прошедший период. Стрелки, направленные вниз, указывают на то, как эти явления макроуровня отражаются на поведении людей. В модели «Эль Фароль» каждый индивид может применять разные правила. Если в результате примененных людьми правил клуб «Эль Фароль» переполнен четыре недели подряд, тогда правила, которые советуют реже посещать клуб, обеспечат более высокие выигрыши. Когда люди переключатся на эти правила, количество посетителей клуба уменьшится. Правила микроуровня порождают явление макроуровня (слишком высокая посещаемость), которое учитывается в правилах микроуровня.
Рис. 4.1. Микро-макро цикл
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?