Электронная библиотека » Скотт Пейдж » » онлайн чтение - страница 7


  • Текст добавлен: 23 июля 2020, 10:42


Автор книги: Скотт Пейдж


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 7 (всего у книги 40 страниц) [доступный отрывок для чтения: 13 страниц]

Шрифт:
- 100% +
Когнитивная завершенность, большой вопрос и множество моделей

Микро-макро цикл позволяет преодолеть основные разногласия относительно того, насколько умными следует делать агентов. Должны ли люди определять все последствия своих действий? Кроме того, цикл подразумевает более крупный вопрос (с которым мы будем постоянно сталкиваться в книге) о том, какую категорию результатов обеспечивает та или иная модель: переходит ли она к равновесию, порождает последовательность случайных событий, создает цикл или сложную серию результатов?

Начнем с вопроса о том, насколько умными должны быть агенты. Предположим, мы считаем, что люди обладают весьма скромными когнитивными способностями, поэтому разрабатываем модель с агентами с нулевым интеллектом[88]88
  Это агенты, которые пользуются фиксированным набором простых правил. Прим. ред.


[Закрыть]
. Совокупность их действий образует агрегированные явления макроуровня. Если макроуровень обеспечивает оптимальные или почти оптимальные результаты (как в случае одностороннего рынка покупателей и продавцов), то наше предположение может быть обоснованным. Легковыполнимое фиксированное правило дает хорошие результаты. У людей будет мало стимулов прилагать усилия к разработке более сложных правил.

Противоречие возникает, когда наша модель обеспечивает неоптимальные или даже очень плохие результаты. Так было в случае модели «Эль Фароль», когда общее фиксированное правило могло привести к циклу, в ходе которого клуб «Эль Фароль» был бы переполнен на протяжении одной недели и пуст на следующей. Столкнувшись с неоптимальным результатом, мы можем предположить, что люди будут адаптировать свое поведение. Они могут экспериментировать, могут анализировать логику ситуации, чтобы выработать новый план действий. Если мы последуем этой логике вплоть до ее экстремального значения и будем исходить из низких затрат на мышление, то может получиться так, что мы поддержим модель рационального агента. Любой неоптимально действующий человек мог бы добиться большего. И хотя это так, люди также должны уметь определять более эффективные действия.

Это поднимает большой вопрос: какую категорию результатов обеспечивает данная модель? У нас есть четыре варианта: равновесие[89]89
  В теории игр точка равновесия показывает путь к оптимальному (не обязательно максимальному) решению для всех игроков. Прим. ред.


[Закрыть]
, цикличность, хаотичность или сложность. Категория результатов будет иметь значение при принятии решения о том, насколько серьезно мы принимаем аргумент, что люди должны изучать свой путь к равновесию. Во-первых, если модель создает последовательность случайных событий на макроуровне, скорее всего, люди не смогут ничему научиться. С нашей моделью все в порядке. Аналогичная логика применима к моделям, порождающим сложные структуры. В таких случаях мы предположили бы, что люди продолжат адаптировать новые правила, но необязательно исходили бы из того, что они могут сделать оптимальный выбор. Напротив, сложность явлений макроуровня делает оптимальную реакцию неправдоподобной. По всей вероятности, люди противопоставили бы сложности совокупность простых правил, как в модели «Эль Фароль».

Модели, порождающие циклы или равновесия, создают стационарную среду, в связи с чем можно ожидать, что люди способны учиться, что никто не стал бы постоянно совершать неоптимальные действия. В качестве примера предположим, что у нас есть модель движения транспорта, в которой каждый выбирает маршрут поездки на работу с помощью фиксированного правила. В ней система движения транспорта приходит в равновесие. В его рамках участница дорожного движения по имени Лейн каждое утро тратит 75 минут на поездку из Калабасаса в деловой район Лос-Анджелеса. При наличии равновесия, если бы Лейн поехала по боковым улицам через каньон Топанга, дорога заняла бы всего 45 минут. С учетом ценности дополнительных 30 минут в день и частоты, с которой жители Лос-Анджелеса говорят о пробках, скорее всего, Лейн нашла бы более короткий маршрут. У нее нет недостатка в методах его поиска: можно воспользоваться системой автомобильной навигации, поговорить с соседями или поэкспериментировать.

Таким образом, если наша модель обеспечивает равновесие (или простой цикл), и оно не согласуется с оптимизацией поведения, то в нее закралась логическая ошибка. Если людям доступно более эффективное действие, они должны определить его. Они должны учиться. Обратите внимание, что нам нет надобности исходить из оптимальности поведения, чтобы достичь равновесия. Люди могут следовать простым правилам и обеспечивать равновесие, в котором никто не может извлечь выгоду посредством изменения своих действий. При таком равновесии ситуация выглядела бы так, «как будто» люди делают оптимальный выбор, поскольку на самом деле так и есть. Опять же, эту логику не нужно применять по отношению к сложным или случайным результатам. Если схема движения транспорта в Лос-Анджелесе порождает сложную последовательность транспортных тянучек и заторов, у нас мало оснований полагать, что Лейн сможет каждый день выбирать оптимальный маршрут. У нее почти наверняка не получится.

Если адаптивные правила, которые могут одобрить любые действия, порождают равновесие, то оно должно быть совместимо с поведением оптимизирующих агентов. Если те же правила создают сложность, поведение агентов не обязательно должно быть оптимальным. Мы можем сформулировать эту идею так: оптимальное поведение может быть нереалистичным предположением, особенно в сложных ситуациях. С другой стороны, если система обеспечивает устойчивый результат, при котором у человека есть более эффективные действия, скорее всего, он сможет определить, какое из них ему следует предпринять.

Расширенный вариант этой логики применим и к политике вмешательства. Предположим, мы используем данные для оценки правила поведения людей – например, вероятности того, что человек придет в отделение скорой помощи больницы в свой обеденный перерыв, чтобы решить мелкие проблемы со здоровьем. Прибегнув к фиксированному правилу, мы могли бы увеличить размер отделения, чтобы людям не приходилось ждать. Если люди продолжат придерживаться этого фиксированного правила, мы получим новое равновесие с коротким периодом ожидания в полдень. Однако при новом, более коротком периоде ожидания люди, которые не обращались в отделение скорой помощи с вывихнутыми лодыжками и простудой, теперь могут начать это делать. Данное равновесие опирается на то, что люди выбирают неоптимальные действия, такие как отказ от посещения отделения скорой помощи, даже тогда, когда им не пришлось бы долго ждать. Если люди учатся, мы не можем полагаться на данные за прошедший период для прогнозирования результатов в случае изменения политики. Эта идея, известная как критика Лукаса, представляет собой вариант закона Кэмбелла, который гласит, что люди реагируют на любой показатель или стандарт таким образом, что это делает его менее эффективным[90]90
  См. Lucas, 1976 и Campbell, 1976.


[Закрыть]
.

Критика Лукаса

Изменения в политике или среде обитания с большой вероятностью повлекут за собой поведенческую реакцию тех, кого это затрагивает. Следовательно, модели, которые оценены на основе данных о прошлом поведении людей, будут неточными. Модели должны учитывать тот факт, что люди реагируют на политические и экологические изменения.

Как должно быть ясно на данный момент, наилучшего решения о том, как моделировать поведение людей, нет. Насколько рациональными делать их, или адаптивными – их правила, зависит от обстоятельств. Мы должны проявлять максимальную проницательность в каждой ситуации. С учетом факторов неопределенности нам нужно отдавать предпочтение большему числу моделей, а не меньшему.

Даже если мы склонны отбрасывать модели рационального выбора как нереалистичные, нам следует признать их разрешимость, способность выявлять направляющую силу стимулов, а также их ценность как эталона. Простые модели поведения, основанного на правилах (такие как нулевой интеллект), также далеки от реальности. Однако даже будучи неправильными, они могут быть полезны. Их легко анализировать и они позволяют определить, какой уровень интеллекта важен в определенной среде.

Человеческое поведение попадает в диапазон между двумя крайними вариантами – нулевым интеллектом и полной рациональностью, поэтому имеет смысл строить модели, в которых люди адаптируются с помощью правил. Эти правила должны учитывать тот факт, что люди отличаются когнитивной привязанностью и способностями в пределах одной области. В связи с этим нам следует ожидать поведенческого многообразия. Кроме того, мы можем рассчитывать на определенную непротиворечивость в пределах группы. Это также можно включить в модели[91]91
  См. de Marchi, 2005, где идет речь о том, как модели позволяют определить, что может произойти. Информацию о моделях, основанных на уравнениях, и моделях, основанных на правилах, в которых акторы задействуют различные варианты поведения в аналогичных играх, можно найти здесь: Gilboa and Schmiedler, 1995 и Bednar and Page, 2007, 2018.


[Закрыть]
.

В общем, с учетом сложностей, связанных с моделированием людей, у нас есть все основания для применения множества разноплановых моделей. Возможно, нам не удастся точно прогнозировать действия человека, но мы сможем определить набор возможных вариантов. Это позволит извлечь пользу из создания моделей, поскольку мы будем знать, что может произойти.

В заключение мы призываем к смирению и состраданию. При построении моделей людей специалист по моделированию должен быть скромным. Учитывая такие сложные аспекты моделирования, как многообразие, социальное влияние, когнитивные ошибки, целеустремленность и адаптация, наши модели неизбежно будут в чем-то неправильными – именно поэтому мы используем многомодельный подход. Упрощенные модели поведения вполне соответствуют некоторым ситуациям и позволяют сфокусироваться на других аспектах окружающей среды. Более содержательные модели поведения уместны при наличии более качественных данных. У нас должны быть скромные ожидания. Все мы разные: нам свойственна целеустремленность, адаптивность и предвзятость, мы подвержены социальному влиянию и обладаем определенной степенью агентивности. Как мы можем не ожидать, что какая-то отдельная модель человеческого поведения будет неправильной? Так и должно быть. Наша задача – построить множество моделей, ансамбль которых будет полезен.

Глава 5
Нормальное распределение: Колоколообразная кривая

Я не считал себя умнее шестидесяти пяти человек, но умнее среднего из шестидесяти пяти человек – безусловно.

Ричард Фейнман

Распределения – один из элементов базовых знаний для любого разработчика моделей. В дальнейшем мы используем распределения для построения и анализа таких моделей, как зависимость от первоначально выбранного пути, случайные блуждания, процессы Маркова, поиск и обучение. Кроме того, навыки работы с распределениями нужны для оценки неравенства в распределении власти, доходов и богатства, а также для выполнения статистических тестов. Наш подход к использованию распределений представлен в двух небольших главах – одна посвящена нормальному распределению, а другая – распределению по степенному закону (распределению с длинным хвостом), – где мы будем рассуждать скорее как специалисты по моделированию, чем как статистики. Нас как разработчиков моделей интересуют два серьезных вопроса: почему распределения имеют именно такой вид и почему они так важны?

Для того чтобы ответить на первый вопрос, прежде всего нужно вспомнить, что такое распределение. Распределение математически описывает вариацию (различия в пределах одного типа) и многообразие (различия между типами) путем представления их в виде распределения вероятностей, заданного на числовых значениях или классах. Нормальное распределение принимает знакомую форму колоколообразной кривой. Рост и вес представителей большинства видов удовлетворяют нормальному распределению. Такое распределение симметрично относительно среднего значения и не включает особо крупные или мелкие события. Вряд ли мы встретим двухметрового муравья или двухкилограммового лося. Мы можем использовать центральную предельную теорему, чтобы объяснить широкую распространенность нормального распределения. Эта теорема говорит, что, выполняя сложение или усреднение случайных величин, мы можем ожидать получения нормального распределения. Многие эмпирические явления, в частности любой совокупный показатель (такой как данные о продажах или итоги голосования), можно записать в виде суммы случайных событий.

Однако не все события распределены по нормальному закону. Землетрясения, количество погибших во время военных действий и данные о продажах книг демонстрируют распределение с длинным хвостом, которое в основном состоит из крохотных событий, но иногда включает единичные масштабные события. Ежегодно калифорнийцы переживают более 10 000 землетрясений. Если не смотреть на трепещущие лепестки жасмина, вы их даже не заметите. Однако время от времени разверзается земля, рушатся автомагистрали и содрогаются города.

Знать, порождает ли система нормальное распределение или распределение с длинным хвостом, важно по ряду причин. Нам необходимо знать, будет ли энергосистема подвержена массовым отключениям и приведет ли рыночная система к появлению горстки миллиардеров и миллиардов бедняков (что гарантирует распределение с длинным хвостом). Знание распределений позволит нам прогнозировать вероятность наводнений, в результате которых вода перельется через дамбу, вероятность того, что рейс 238 авиакомпании Delta прибудет в Солт-Лейк-Сити вовремя, а также вероятность того, что транспортный хаб обойдется вдвое дороже заложенной в бюджете суммы. Знание распределений также понадобится при проектировании. Нормальное распределение не подразумевает значительных отклонений, поэтому авиаконструкторам не нужно выделять в самолете место для ног пятиметрового человека. Кроме того, знание распределений также может служить руководством к действию. Как мы узнаем чуть ниже, предотвращение массовых беспорядков зависит не столько от снижения среднего уровня недовольства, сколько от умиротворения людей, занимающих крайние позиции.

Эта глава организована по принципу «структура – логика – функция». Мы дадим определение нормальному распределению, опишем, как оно возникает, а затем спросим, почему оно имеет такое большое значение. Опираясь на знание распределений, мы объясним метод управления процессами «шесть сигм», а также почему хорошее происходит в малых количествах и как проверить значимость эффекта. Затем мы вернемся к вопросу логики и зададимся вопросом, что произойдет, если умножить, а не суммировать случайные величины. И узнаем, что при этом будет получено логарифмически нормальное распределение, которое включает более крупные события и не симметрично относительно среднего значения. Отсюда следует, что умножение эффектов приводит к усилению неравенства – вывод, указывающий на то, как политика повышения заработной платы сказывается на распределении доходов.

Нормальное распределение: Структура

Распределение присваивает вероятности событиям или величинам. Распределение суточного количества осадков, результатов тестов или роста людей присваивает вероятность каждому возможному значению этих результатов. Статистические показатели представляют информацию, содержащуюся в распределении, в виде отдельных чисел, таких как математическое ожидание (среднее значение) распределения. Средняя высота деревьев в горном массиве Шварцвальд в Германии может быть более 24 метров, а средний период пребывания в больнице после операции на открытом сердце может составлять пять дней. Социологи используют среднее значение распределения для сравнения социально-экономических условий в разных странах. В 2017 году ВВП США на душу населения в размере 57 000 долларов превысил ВВП Франции на душу населения, который составил 42 000 долларов, тогда как средняя продолжительность жизни во Франции превышает этот показатель в США на три года.

Второй статистический показатель, дисперсия, измеряет разброс распределения – среднее значение квадрата отклонения данных от их математического ожидания[92]92
  При наличии множества данных {xi, …, xN} дисперсия равна среднему квадрату отклонения от математического ожидания μ, что можно записать так:
  Стандартное отклонение равно квадратному корню из среднего квадрата отклонения от математического ожидания μ:


[Закрыть]
. Если все точки распределения имеют одно и то же значение, дисперсия равна нулю. Если одна половина данных имеет значение 4, а другая – значение 10, то в среднем каждая точка отстоит от среднего значения на 3, а дисперсия равна 9. Стандартное отклонение распределения (еще один распространенный статистический показатель) равно квадратному корню из дисперсии.

Совокупность возможных вероятностных распределений безгранична. Мы можем нарисовать любую линию на листе координатной бумаги и интерпретировать ее как распределение вероятностей. К счастью, распределения, с которыми мы сталкиваемся, как правило, относятся к нескольким классам. На рис. 5.1 показано самое распространенное распределение – нормальное распределение, или колоколообразная кривая.


Рис. 5.1. Нормальное распределение со стандартными отклонениями


Нормальное распределение симметрично относительно среднего значения. Если среднее значение равно нулю, вероятность значений больше 3 равна вероятности значений меньше −3. Нормальное распределение характеризуется математическим ожиданием и стандартным отклонением (или, что то же самое, дисперсией). Другими словами, графики нормального распределения всегда выглядят одинаково: примерно 68 процентов результатов в пределах одного стандартного отклонения от среднего значения, 95 процентов результатов в двух стандартных отклонениях и более 99 процентов результатов в трех стандартных отклонениях от среднего значения. Нормальное распределение допускает результат или событие любого масштаба, хотя крупные события происходят редко. Событие, лежащее в пяти стандартных отклонениях от среднего, происходит примерно один раз на каждые два миллиона случаев.

Мы можем использовать регулярность нормальных распределений для присвоения вероятностей диапазонам результатов. Если средняя площадь домов в Милуоки равна 2000 квадратных футов со стандартным отклонением в 500 квадратных футов, то площадь 68 процентов домов составляет от 1500 до 2500 квадратных футов, а площадь 95 процентов домов – от 1000 до 3000 квадратных футов. Если автомобили Ford Focus 2019 года способны проехать в среднем 40 миль на галлон со стандартным отклонением в 1 милю на галлон, то более 99 процентов этих авто будут проходить от 37 до 43 миль на галлон. Как бы ни хотел потребитель, его новый Focus не проедет 80 миль на одном галлоне бензина.

Центральная предельная теорема: Логика

Множество явлений демонстрируют нормальное распределение: физические размеры представителей флоры и фауны, экзаменационные оценки учащихся, дневной оборот мини-маркетов и продолжительность жизни морских ежей. Центральная предельная теорема, которая гласит, что сумма или усреднение случайных величин дает нормальное распределение, объясняет, почему так происходит (см. врезку).

Центральная предельная теорема

Сумма N ≥ 20 случайных величин будет иметь распределение, близкое к нормальному, при условии, что случайные величины независимы, что каждая из них имеет конечную дисперсию и что ни одно малое подмножество случайных величин не вносит определяющего вклада в вариацию[93]93
  Существует ряд достаточных условий. Наиболее общее условие, условие Линдеберга, требует, чтобы доля полной вариации любой случайной величины стремилась к нулю по мере увеличения количества случайных величин.


[Закрыть]
.

Один примечательный аспект этой теоремы состоит в том, что сами по себе случайные величины не нуждаются в нормальном распределении. У них может быть любое распределение при условии, что каждая из них имеет конечную дисперсию и ни одно малое подмножество случайных величин не вносит определяющего вклада в вариацию. Предположим, данные о покупательском поведении жителей небольшого поселка с населением 500 человек говорят о том, что каждый из них тратит на покупки в среднем 100 долларов в неделю. Некоторые жители тратят 50 долларов за одну неделю и 150 долларов – за вторую. Другие могут тратить по 300 долларов каждую третью неделю, а кто-то может еженедельно выделять на покупки произвольную сумму в диапазоне от 20 долларов до 180 долларов. При условии, что расходы каждого человека имеют конечную дисперсию и ни одно малое подмножество людей не вносит определяющего вклада в вариацию, сумма распределений будет распределена по нормальному закону с математическим ожиданием 50 000 долларов. Совокупный недельный объем расходов также будет симметричным: он может с одинаковой вероятностью оказаться выше 55 000 долларов и ниже 45 000 долларов. Согласно той же логике, количество бананов, литров молока или коробок корзиночек тако, которые покупают люди, тоже будет подлежать нормальному распределению.

Мы можем использовать центральную предельную теорему, например, для объяснения распределения роста людей. Рост человека определяется совокупностью генетики, среды обитания и взаимодействия между этими двумя факторами. Вклад генетики может достигать 80 процентов, поэтому будем считать, что рост зависит только от генов. На него влияют как минимум 180 генов[94]94
  См. Lango et al., 2010.


[Закрыть]
. Один ген может внести вклад в длину шеи или размер головы, а другой – в длину большой берцовой кости. Хотя гены взаимодействуют друг с другом, в первом приближении можно исходить из того, что каждый ген вносит свой вклад независимо от других генов. Если рост человека равен сумме вкладов 180 генов, то он будет иметь нормальное распределение. Согласно этой же логике, так же будет распределен вес волков и длина больших пальцев панд.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 13 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации