Автор книги: Дэвид Самптер
Жанр: Математика, Наука и Образование
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 5 (всего у книги 17 страниц) [доступный отрывок для чтения: 6 страниц]
В общем случае функция
с параметрами μ и σ2 называется плотностью нормального (гауссовского) распределения, и это одна из самых важных функций в математике. Де Муавр, видимо, не осознавал всей важности своей формулы, и только в 1810-х Пьер-Симон, маркиз де Лаплас, понял весь ее потенциал. Лаплас изучал так называемую производящую функцию моментов, которая позволяет однозначно определить распределение через его моменты[45]45
Если имеется случайная величина Χ, то ее k-м начальным моментом называется число vk = E(Χk), где E – математическое ожидание. Аналогично k-м центральным моментом называется число μk = E((Χ – EΧ)k). В частности, первый начальный момент Χ – среднее значение (математическое ожидание) случайной величины, второй – ее дисперсия, третий характеризует степень симметричности распределения, а четвертый – эксцесс, то есть показывает, насколько остра вершина распределения.
[Закрыть]. Производящие функции моментов позволили Лапласу исследовать, как меняется форма распределения при сложении множества случайных результатов (например, выпадения чисел на колесе рулетки или бросания костей). Лаплас продемонстрировал замечательную вещь: независимо от того, что суммировать, по мере увеличения числа слагаемых моменты суммы всегда становятся всё ближе к моментам нормального распределения.
Потребовалось несколько лет, чтобы справиться с некоторыми хитрыми исключениями в результате Лапласа (к некоторым из них мы вернемся в главе 6). Над теми же вопросами работали в XX веке русский математик Александр Ляпунов и финский математик Ярл Вальдемар Линдеберг. Результат, доказанный Линдебергом в 1920 году, известен сегодня под названием «центральная предельная теорема»[46]46
Обзор истории центральной предельной теоремы можно найти в работе: Le Cam L. The central limit theorem around 1935 // Statistical Science. 1986, Vol. 1. No. 1. Pp. 78–91.
[Закрыть]. Она говорит, что если мы складываем много независимых случайных величин (например, измерений) со средним значением h и среднеквадратичным отклонением σ, то распределение суммы этих величин будет близко к нормальному со средним значением h ∙ n и среднеквадратичным отклонением σ√n.
Чтобы оценить масштабность этого результата, рассмотрим несколько примеров. Суммируя результаты бросания игральной кости, мы получим нормальное распределение. Суммируя результаты последовательных результатов в карточных играх, рулетке или онлайн-казино, – получим также нормальное распределение. И общее количество очков в играх сезона Национальной баскетбольной ассоциации имеет нормальное распределение (см. нижнюю диаграмму на рис. 3)[47]47
Статистика взята с сайта stats.nba.com/search/team-game/.
[Закрыть]. И урожайность имеет нормальное распределение[48]48
Just R. E., Weninger Q. Are crop yields normally distributed? // American Journal of Agricultural Economics. 1999. May. Vol. 81. No. 2. Pp. 287–304.
[Закрыть]. Скорость движения по автостраде тоже. Как и рост людей, их IQ и результаты личностных тестов[49]49
Если быть точнее, центральная предельная теорема говорит, что сумма случайных величин стремится к нормальному закону при числе слагаемых, стремящемся к бесконечности. При любом конечном числе слагаемых сумма лишь приблизительно является нормальной.
[Закрыть].
Везде, где результат обусловлен различными случайными факторами, можно найти нормальное распределение, поэтому уравнение 3 используют для построения доверительного интервала в любой области, где раз за разом происходит повторение одного типа действий или наблюдений.
* * *
В главе 1 я показал, как игрок с преимуществом в 3 % может всего за один год превратить стартовый капитал в 1000 фунтов в сумму 57 миллионов. Если делать ставки и использовать выигрыши в дальнейшей игре, то капитал растет экспоненциально. И здесь я подошел к неизбежной ловушке для моего гипотетического игрока. Я назову этого человека Лизой. Как Лиза узнает, что ее преимущество составляет 3 %?
Нейт Сильвер, создатель и редактор сайта спортивных и политических прогнозов FiveThirtyEight, для объяснения таких ситуаций использует термины «сигнал» и «шум»[50]50
Сильвер Н. Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет. М.: КоЛибри, 2015.
[Закрыть]. В спортивных ставках значение средней прибыли (или потери) при одной ставке (величина h в уравнении 3) – это сигнал. Если у Лизы есть преимущество в 3 %, то в среднем на каждую ставку в 1 фунт она выиграет 3 пенса. Шум при ставке измеряется величиной среднеквадратичного (стандартного) отклонения σ. Как и в случае рулетки, шум в спортивных ставках гораздо больше, чем сигнал. Например, если Лиза ставит 1 фунт на какую-то команду с шансами 1/2, то она либо проиграет 1 фунт, либо выиграет 50 пенсов. С помощью формулы выше можно показать, что стандартное отклонение в этом случае равно 0,71[51]51
Поэтому стандартное отклонение σ = 0,71.
[Закрыть]. Таким образом, шум, измеряемый стандартным отклонением (σ = 0,71), при одной ставке гораздо больше, чем сигнал (h = 0,03). Мы скажем, что отношение сигнала к шуму в нашем случае h/σ = 0,03/0,71 ≈ 1/24.
Казино знает, что у него есть преимущество, поскольку поставило рулетки, его обеспечивающие, и отношение сигнала к шуму равно 1/37. Лиза вынуждена при определении того, есть ли у нее преимущество, опираться на свой прошлый опыт. Именно здесь уравнение уверенности важнее всего для профессионального игрока. Если Лиза получила прибыль в h фунтов на ставку, а стандартное отклонение для ставки равно σ, то доверительный интервал для оценки преимущества h можно найти, поделив части уравнения 3 на n:
Например, если Лиза сделала 100 ставок и получила в среднем 3 пенса на каждую, этот доверительный интервал выглядит так:
Ее преимущество может составлять 17 пенсов (0,03 + 0,14 = 0,17), но оно иногда оборачивается потерей 11 пенсов в среднем. Все возможные величины для преимущества между –0,11 и +0,17 лежат в этом 95 %-м интервале[52]52
На самом деле ее преимущество может быть и больше 17, и меньше –11 пенсов, просто такие события выходят за рамки 95 %-го интервала, то есть имеют в совокупности вероятность менее 5 %. Мы считаем их маловероятными и пренебрегаем ими.
[Закрыть]. Сделанные ею 100 ставок говорят слишком мало о том, работает ее стратегия или нет.
Поскольку доверительный интервал содержит 0, Лиза не может быть вполне уверена, что ее сигнал h положителен и ее игровая стратегия работает. Есть простое эмпирическое правило, которое она может использовать, чтобы узнать, сколько наблюдений нужно, чтобы надежно определить сигнал. Прежде всего округлим 1,96 до 2: для эмпирического правила разница между этими числами мала. Перепишем уравнение уверенности, чтобы определить условие, при котором доверительный интервал не включает ноль[53]53
Эти величины дают нам число наблюдений, которое позволяет на 97,5 % (а не на 95 %) быть уверенными, что мы не сделаем ошибку и на самом деле h = 0 или меньше. Надежность в 97,5 % возникает, поскольку наш 95 %-й доверительный интервал покрывает и нижний, и верхний пределы для h. Существует также 2,5 %-й шанс, что мы недооценили наше преимущество и оно больше, чем дает наш доверительный интервал. Но при оценке выгодности игры недооценка преимущества роли не играет, так что значение имеют только те 2,5 %, что мы переоценили свое преимущество. Для этих величин также предполагается, что преимущество положительно, h > 0. Однако тот же результат получится при отрицательном преимуществе, если вместо h поставить – h.
[Закрыть]:
Таким образом, если мы возьмем n наблюдений, то сможем обнаружить отношение сигнала к шуму, превосходящее 2/√n.
Ниже дана таблица некоторых значений, чтобы вы представляли, как работает это правило.
Преимущество на ставках или в финансовой сфере, как правило, имеет отношение сигнала к шуму примерно 1/20 или даже 1/50; поэтому, чтобы его обнаружить, нужны тысячи и даже десятки тысяч наблюдений. Для отношения сигнала к шуму h/σ = 1/24, как на спортивных ставках у Лизы, потребуется n > 2304 наблюдений. Больше двух тысяч наблюдений – это очень много футбольных матчей. Если Лиза считает, что ее преимущество на рынке английской Премьер-лиги составляет 3 %, то ей придется для уверенности прождать шесть сезонов.
За эти шесть лет другие игроки могут наткнуться на такое преимущество и нивелировать его. Обширные операции Мэттью Бенхэма и Тони Блума постоянно направлены на поиск возможностей. Как только два этих больших Б оказываются в игре, букмекеры корректируют свои коэффициенты и преимущество исчезает. Лиза рискует, поскольку не осознает, что ее преимущество исчезло. Чтобы убедиться, что преимущество существует, требуется больше 1000 матчей. Чтобы понять, что оно исчезло, может потребоваться столько же больших убытков. Прибыль, которая экспоненциально росла, превратилась в такой же экспоненциальный ущерб.
Большинство инвесторов-любителей представляют, что им нужно отделить сигнал от шума, но мало кто понимает важность извлечения квадратного корня в полученном нами правиле. Например, для обнаружения сигнала вдвое меньшей мощности требуется вчетверо больше наблюдений, и, наоборот, увеличив число наблюдений с 400 до 1600, вы сможете заметить всего вдвое большее преимущество. Очень легко недооценить объем данных, необходимых для обнаружения крошечных преимуществ на рынках.
* * *
Я позвонил Яну в Берлин, чтобы спросить, как дела у него с Мариусом. Все шло хорошо – Мариус даже предупреждал Яна, что мне следует говорить. Однако Ян, как обычно, хотел беседовать о цифрах.
– Что я не могу тебе сказать, пока ты не поговоришь снова с Мариусом и не проверишь, что все в порядке? То, что наш оборот составляет 70 миллионов фунтов. За последний месяц мы сделали 50 000 ставок со средним преимуществом 1,5–2 %.
По сравнению с этим те 50 фунтов, которые мы ставили на чемпионате мира, были мелочью. Когда я сказал Яну, что сейчас пишу про доверительные интервалы, он вспомнил ту игровую модель, что мы построили вместе.
– Да, мы на этом заработали, – сказал он. – Однако, если честно, это не то, что мы станем использовать в будущем.
Он оказался прав: наша модель для чемпионата мира была построена на 283 наблюдениях от предыдущих турниров. Теперь же Ян создал базу данных по 15 миллиардам позиций для ставок, охватывавших многие виды спорта за последние девять лет.
– Мы сосредоточиваемся на стратегиях, где у нас есть больше 10 тысяч подтверждающих наблюдений, – сказал он.
Это давало им уверенность, что их стратегия действительно обладает долгосрочным преимуществом.
Главное преимущество Яна и Мариуса основывалось на национальных различиях. Бразильцы ожидают больше голов в своих матчах, чем забивают на самом деле. Немцы – пессимисты и предпочитают ставить на скучные 0:0.
– Норвежцы отличаются точностью, – смеется Ян. – Идеально рациональные скандинавы.
Я вспомнил свой разговор с Мариусом – как раз рациональным норвежцем – во время чемпионата мира, когда мы обсуждали, как забраться в голову игрока. Он всегда считал, что важно иметь базовое объяснение для любой стратегии ставок. Теперь у него есть одно такое объяснение: применение национальных стереотипов.
* * *
Вы ищете гостиницу на сайте TripAdvisor. Вы желаете остановиться в месте, которое получило оценки в 4 звезды или больше, и скептически относитесь ко всему, что оценено в 3,5 звезды и ниже. Сигнал, который вы здесь ищете, – разница в ползвезды. Принципы присвоения звезд на сайте TripAdvisor различны: одни с энтузиазмом раздают пятерки, а несколько недовольных вечно ставят единицы. Однако в целом шум при оценке составляет около одной звезды: большинство людей ставят 3, 4 или 5 звездочек при среднем значении, слегка превышающем 4[54]54
Я проверил среднеквадратичное отклонение у нескольких гостиниц и обнаружил, что оно часто чуть меньше 1 – например, 0,8. Но для примерной оценки нам достаточно взять 1.
[Закрыть].
Мы можем ответить на вопрос, сколько обзоров нам нужно прочитать, чтобы надежно выявить отношение сигнала к шуму, равное 1/2: либо используя табличку выше, либо решив уравнение где 1/2 – отношение сигнала к шуму. Это дает нам √n = 4, что эквивалентно n = 16 оценкам на сайте. Вместо того чтобы искать среднее значение по всем сотням оценок для данной гостиницы, возьмите последние 16 и посчитайте среднее. Это даст вам одновременно и свежую, и надежную информацию.
Звездами можно оценивать не только гостиницы. Джесс не уверена в том, что правильно выбрала работу для карьеры. Она трудится в организации, занимающейся защитой прав человека. Это однозначно хорошее дело, однако руководительница просто несносна. Она целый день названивает Джесс и предъявляет непомерные требования. Ее знакомый Стив шесть месяцев встречается с Анной. Их отношения непостоянны: сейчас горячие, а в следующую минуту уже холодные. Они ужасно ссорятся, но когда разборок нет, то все замечательно.
Уравнение уверенности дает определенные указания и для Джесс – сколько ей оставаться на работе, и для Стива – сколько ему продолжать отношения с Анной, прежде чем расстаться. Сначала им нужно установить подходящие интервалы времени. Стив и Джесс решают оценивать каждый день по шкале от 0 до 5 звезд. Затем они планируют регулярно встречаться и оценивать складывающиеся ситуации.
Вечером в пятницу первой недели у Стива происходит страшная ссора с Анной, потому что она отказывается пойти с ним в компанию друзей. Стив звонит Джесс и жалуется: в результате три дня в его неделе получают по 1 звезде. Джесс напоминает ему, что не надо делать выводы слишком быстро. В конце концов, n = 7, и сигнала в шуме пока не найти. У Джесс на работе все хорошо – в основном потому, что ее проблемная начальница была в командировке, так что все дни получили по 3 и 4 звезды.
Через месяц (n = 30) они встречаются за обедом и начинают лучше понимать, как идут дела. Стив провел с Анной несколько хороших недель. В прошлый уик-энд они ездили в Брайтон, плюс к этому было несколько приятных обедов, где они отлично провели время. У Стива были целые полосы 5-звездочных дней. У Джесс все наоборот: когда ее начальница вернулась, то постоянно сердилась, кричала и теряла терпение по малейшему поводу. Дни у Джесс – это 1–2 звезды и даже найдется несколько 0-звездочных.
Прошло немногим более двух месяцев: n = 64, а 2/√n = 1/4. Теперь степень уверенности втрое выше, чем после первой недели. У Стива хорошие дни перевешивают плохие, но всё равно идут постоянные ссоры: оценки – по 3 и 4 звезды. Босс Джесс – реальная проблема, зато она работает над ценным проектом, на котором всегда хотела сосредоточиться. В лучшем случае она ставит 3 и 4 звезды, но в основном оценки – 1 и 2.
Хотя каждая неделя дает новые наблюдения, правило извлечения квадратного корня означает, что скорость получения Стивом и Джесс новой информации не пропорциональна времени, а ниже. Польза от новых наблюдений уменьшается, поэтому они решают ограничить свои обсуждения и установить срок в 100 дней (три месяца с небольшим), после чего с достаточной уверенностью окончательно решить вопрос о своем будущем.
Итак, этот день настал: n = 100, а 2/√n = 1/5. Они оглядываются не только на последние несколько недель, но и на всё, что происходило за это время. У Стива с Анной ссоры происходят реже. Они вместе стали ходить на уроки кулинарии, по вечерам с радостью готовят и приглашают к себе друзей. Жизнь хороша. Стив определяет доверительный интервал. У него получается средняя оценка h = 4,3 звезды, а стандартное отклонение σ = 1,0. Доверительный интервал для его отношений с Анной: 4,3 ± 0,2. Солидное среднее, уверенно выше четырех звезд. Стив решает прекратить жаловаться на Анну; он убежден, что нашел партнера на всю жизнь.
У Джесс ситуация не так благоприятна. Ее среднее h = 2,1 звезды. По-настоящему хороших дней было очень мало, поэтому стандартное отклонение меньше, чем у Стива: σ = 0,5. Ее доверительный интервал: 2,1 ± 0,1. По сути, у Джесс работа на две звезды. Она уже начала искать новую должность и в понедельник собирается подать заявление об уходе.
* * *
В 1964 году Малькольм Икс сказал: «Неважно, насколько сильно белые уважают и признают меня; пока такое же уважение и признание не проявляется ко всему нашему народу, его для меня не существует».
Идея, выраженная в этих словах, рождается из математики. Опыт одного человека – будь то Малькольм Икс или кто-то еще – дает нам очень мало информации. Это все равно что один раз дернуть ручку игрового автомата. Тот факт, что у Джесс был один хороший день на работе, ничего не говорит о ее карьере за долгий промежуток времени. Когда люди стали прислушиваться к Малькольму Иксу, это не значило ничего, пока они не прислушались к афроамериканцам в целом. Борьба цветных в США против дискриминации во всех формах, рассказанная через истории Малькольма Икса, Мартина Лютера Кинга и других, была и остается борьбой десятков миллионов людей.
Джоанна слышит о вакансии на своей работе. Вечером она встречает на вечеринке Джеймса и рассказывает ему об этом. Тот воодушевляется, говорит, что мечтал о такой работе, и в понедельник подает заявление о приеме. Через несколько дней Джеймс уже приступил к новой работе, а Джоанна вдруг у магазинчика с выпечкой сталкивается с Джамалом. Он спрашивает, как у нее дела, и Джоанна рассказывает, что у них только что начал работать Джеймс. Джамал воодушевляется, говорит, что мечтал о такой работе, и спрашивает Джоанну, нет ли других вакансий…
Джоанна белая. Джеймс тоже. Джамал – нет. Джоанна расистка? Нет. Она действовала бы точно так же, если бы первым встретила Джамала. Просто так случилось, что с Джеймсом она столкнулась раньше.
Однако можно еще поразмышлять о том, почему так вышло. Поскольку Джоанна и Джеймс принадлежат к одной социальной группе, они чаще встречаются и делятся информацией о возможностях. Их взаимная помощь может косвенно дискриминировать Джамала. Он не имеет доступа к тем же социальным возможностям, что Джеймс и Джоанна.
Здесь нужно быть осторожными. Мы не можем делать какие-либо выводы из истории Джоанны. У нас всего одно наблюдение, один случай ее взаимодействия с Джеймсом и Джамалом. По одному событию доверительный интервал не построить. Именно поэтому порой трудно обнаружить расовую дискриминацию. Каждый отдельный случай – всего одно наблюдение, из которого мы узнаем очень мало. Единственный способ понять роль расы в обществе – изучить множество наблюдений и построить доверительный интервал.
* * *
Моа Бёрселл, исследователь и преподаватель кафедры социологии в Стокгольмском университете, два года писала резюме и отправляла заявки на работу в Швеции. Всего она подала заявления больше чем на две тысячи разных должностей в сферах информатики, бухгалтерии, преподавания, в качестве водителя и медсестры. Однако Моа вовсе не искала работу. Она проверяла предвзятость работодателей, которым писала.
Для каждого заявления Моа создавала два отдельных резюме и сопроводительных письма, в которых описывала близкую квалификацию и опыт работы. Затем случайным образом придумывала имена для каждой пары. Одно имя звучало по-шведски, например Йонас Сёдерстрём или Сара Андерссон; второе было не шведским – скажем, Камаль Ахмади или Фатима Ахмед, указывавшие на арабское мусульманское происхождение, или Мтупу Хандуле либо Уасила Балагве, говорившие об африканском не мусульманском происхождении. Схема эксперимента Моа была эквивалентна подбрасыванию монеты. Если работодатели будут беспристрастными, они с равной вероятностью позвонят человеку со шведским и иностранным именем.
Однако этого не происходило. Например, в одном исследовании с n = 187 заявками от шведских и арабских мужчин мужчинам с арабскими именами позвонили вдвое реже, чем шведам[55]55
Arai M., Bursell M., Nekby L. The reverse gender gap in ethnic discrimination: employer stereotypes of men and women with Arabic names // International Migration Review. 2016. Vol. 50. No. 2. Pp. 385–412.
[Закрыть]. Такие результаты нельзя объяснить случайностью. Мы можем увидеть это, построив доверительный интервал. Арабским мужчинам позвонили 43 раза, вероятность такого звонка (сигнал) h = 43/187 = 23 %. Чтобы оценить дисперсию, будем использовать 1 для человека, которому позвонили, и 0 для того, кому не звонили. Теперь, как и в случае рулетки, вычисляем среднеквадратичное расстояние между этими величинами и h и получаем стандартное отклонение σ = 0,649. Если мы подставим эти величины в уравнение 3, то получим доверительный интервал для звонков претендентам с арабскими именами 43 ± 17,3, который содержит значительно меньшие числа, чем 79 звонков, полученных шведами.
Более того, Моа улучшила резюме арабских мужчин, добавив им от одного до трех лет опыта по сравнению со шведскими конкурентами. Это не помогало им найти работу. Более опытному арабу звонили только в 26 случаях – по сравнению с 69 звонками менее квалифицированным шведам; и это значение снова не попадает в доверительный интервал 26 ± 15,9.
«В моих результатах важнее всего то, – сказала она мне, – что их очень просто понять. С цифрами не поспоришь»[56]56
Никак не отрицая наличия расовых предрассудков в обществе, следует отметить, что предубеждения работодателя чаще экономические. Например, южане в шведском климате, вероятно, будут чаще болеть; мусульмане обязаны соблюдать пост длиной в месяц, который может отрицательно сказаться на их работоспособности. На работе скажется и низкий уровень владения шведским языком. Соответственно, иностранцу нужно лучшее резюме, которое перевесит опасения работодателя.
[Закрыть].
Когда Моа читает лекции по этой теме в Стокгольмском университете, она может увидеть реакцию студентов по их лицам. «Когда я смотрю на голубоглазых блондинов, они внимательно слушают. Они не думают, что это честно, но это их не трогает. Зато у людей с карими глазами, темными волосами и темной кожей я вижу другую реакцию, – продолжает она. – Это про них, их друзей, братьев и сестер. Для некоторых это означает окончательное признание. И это может быть облегчением. Они видят, что они не сумасшедшие. Их восприятие реальности подтверждается».
Эти учащиеся часто рассказывают ей о своем опыте, но другие по-прежнему молчат. «Знание о моем расследовании может травмировать, – сказала она мне. – Я вижу, что они расстроены. У них ощущение, словно им сказали: от вас мало толку, вам тут не место».
Моа аккуратно указывает, что из ее работы не следует, будто найти работу невозможно. Смысл исследования – выявить масштабы несправедливости; это не означает, что все в Швеции расисты. Оно показывает, что Камаль Ахмади и Йонас Сёдерстрём должны потратить разное количество времени, если хотят выиграть в этой лотерее вакансий.
Когда реальный Камаль Ахмади подает заявление о работе в Швеции, он не знает наверняка, с каким игровым автоматом имеет дело. Если он подал заявление, а его не вызвали на собеседование, то он не может утверждать, что его дискриминируют. Точно так же реальный Йонас Сёдерстрём не может увидеть преимущество, которое отдает ему этот игровой автомат. Он имеет квалификацию для работы; он подал заявление; ему позвонили и пригласили на собеседование. С его точки зрения, ничего неправильного не произошло.
Я изложил Моа это соображение о Камале и Йонасе, и она сказала: «Это верно, но некоторые люди иногда сами ставят эксперименты. Приехавшие из-за границы рассказывали мне, как искали работу в местном супермаркете и им сообщали, что вакансия уже закрыта. Но когда они потом просили шведского приятеля позвонить по телефону в магазин и узнать, открыта ли еще вакансия, тому сообщали, что можно прийти на собеседование».
Моа и ее коллеги разослали уже свыше 10 000 резюме, чтобы проверить различные гипотезы о шведском рынке труда. Некоторые результаты удручают: дискриминация мужчин арабского происхождения сильнее всего проявляется в ситуациях с низкоквалифицированной работой. Другие результаты вдохновляют больше: дискриминация арабских женщин выражена слабее и исчезает, если у этих женщин больше опыта работы.
Подобные исследования повторялись по всему миру со схожими результатами[57]57
Bertrand M., Mullainathan S. Are Emily and Greg more employable than Lakisha and Jamal? A field experiment on labor market discrimination // American Economic Review. 2004. September. Vol. 94. No. 4. Pp. 991–1013.
[Закрыть]. Работа Моа показывает пример структурного расизма, дискриминации, которую часто трудно увидеть на индивидуальном уровне, но легко обнаружить с помощью уравнения уверенности. Недавно ведущий медицинский журнал The Lancet опубликовал доверительные интервалы для измерения социального неравенства в США – от бедности, безработицы и лишения свободы до заболеваемости диабетом и сердечными недугами[58]58
Bailey Z. D., Krieger N., Agénor M. et al. Structural racism and health inequities in the USA: evidence and interventions // The Lancet. 2017. April. Vol. 389. No. 10077. Pp. 1453–1463.
[Закрыть]. Чернокожие американцы статистически отличались от белых по всем параметрам. Свалки токсичных отходов строятся близко к районам, выделенным по расовому признаку; правительство не может предотвратить попадание свинца в питьевую воду; мелкие оскорбления на расовой почве; пониженная зарплата за одинаковую работу; целевой маркетинг сигарет и содержащих сахар продуктов; принудительная реконструкция и снос жилья; ограничения для избирателей; здравоохранение по сниженным стандартам вследствие явных или неявных предубеждений; исключение из социальных связей, которые могли бы помочь при поиске работы, – список можно продолжать. Психологическое и физическое здоровье отдельных афроамериканцев и коренных американцев ежедневно подвергается мелкой дискриминации, при этом никакого открытого расизма может и не быть.
Вернемся к Джоанне. Сталкивается ли она чаще с Джеймсами, чем с Джамалами? Чтобы это выяснить, она решает прибегнуть к уравнению уверенности. Она вспоминает всех, кому было бы интересно работать в издательстве, где она трудится: талантливых людей, затем собственных друзей, с которыми постоянно общается[59]59
Вот эмпирическое правило, которое я считаю полезным, но оно требует математического обоснования. Для примера пусть среди населения в целом представлена доля p людей определенного типа (например, белых). Дисперсия максимальна при p = 1/2, так что для всех значений p она не превосходит 1/2(1–1/2) = 1/4, и поэтому стандартное отклонение меньше 1/2. Поскольку 1,96 ≈ 2, то это означает, что доверительный интервал для выборочной доли Отсюда и эмпирическое правило.
[Закрыть]. Из 100 друзей Джоанны 93 белые; однако доля белых в населении США 72 %: 93–72 = 21. Ее дружеские отношения имеют перекос в расовом плане. Джоанна проверила свою привилегированность. Она пробудилась и осознала, что люди, с которыми она знакома, не отражают населения в целом и принадлежат к привилегированной группе, которая делится информацией о наличии работы в своей среде. Что Джоанне делать с этим – трудный вопрос.
Вот что я думаю. Не математический ответ на вопрос, а просто мои размышления. Джоанне не надо менять друзей. Она должна дружить с тем, с кем хочет. Но ей нужно подумать, что она может сделать в такой ситуации. Это просто. Она может написать Джамалу и другим семи приятелям из меньшинства, когда слышит о вакансии на работе, или просто поговорить с ними. У Джамала группа общения еще более перекошена: 85 из 100 черные – по сравнению с долей 12,6 % в общем населении США и 25 % в Нью-Йорке, где он живет. Одним быстрым сообщением Джоанна полностью меняет демографию людей, которые знают о вакансии.
Мои взгляды часто именуют политкорректностью. Я предпочитаю называть это статистической корректностью. Речь о статистическом осознании следующего факта: то, что мы ощущаем индивидуально, часто не отражает мир в целом. Каждый из нас как личность должен сам решить, насколько статистически правильны наши жизни и что нам с этим делать.
* * *
Уравнение уверенности, возможно, и было создано для азартных игр, но изменили его именно естественные и в итоге социальные науки. Первым участником «Десятки», осознавшим научную мощь нормальной кривой, был Карл Фридрих Гаусс, который использовал ее свойства в 1809 году, чтобы оценить ошибки в определении местоположения астероида Церера. Сегодня нормальное распределение часто называют гауссовским, что несколько несправедливо, поскольку оно описано уже во втором издании (1738) работы де Муавра «Доктрина шансов»[60]60
Этот вопрос обсуждается, например, в работе: Pearson K. Historical note on the origin of the Normal Curve of Errors // Biometrika. 1924, December. Vol. 16. No. 3–4. Pp. 402–404.
[Закрыть].
Статистика интегрируется в науку благодаря крупным достижениям XIX и начала XX века. После Второй мировой войны доверительные интервалы стали неотъемлемой частью научных работ, что заставило исследователей демонстрировать, почему их результаты не чистая случайность. Последняя моя научная статья содержала более пятидесяти расчетов различных доверительных интервалов. Существование бозона Хиггса было подтверждено только тогда, когда уровень статистической значимости достиг 5σ; это означает, что вероятность получить такие результаты эксперимента при отсутствии бозона Хиггса составляет 1 к 3,5 миллиона.
Изначально прогресс «Десятки» в социальных науках шел медленнее, чем в естественных. До недавнего времени карикатурное изображение кафедры социологии могло изображать мужчин в потрепанной одежде, поклоняющихся умершим немецким мыслителям, и женщин с волосами пурпурного цвета, что появились в 1970-е, чтобы встряхнуть мир постмодернистскими идеями. Они спорят и дискутируют, но никогда не приходят к согласию. Они создают определения и рамки для обсуждения и спорят дальше. Сторонние наблюдатели понятия не имеют, о чем речь. Вплоть до начала нового тысячелетия эта карикатура во многом была правдива. Статистику и количественные методы применяли, однако способом изучения общества считались социологическая теория и идеологическое обсуждение. За несколько быстро пролетевших лет «Десятка» разрушила этот старый мир. Внезапно с помощью Facebook и Instagram исследователи смогли измерить наши социальные связи. Они учли все блоги с мнениями и поняли наши методы коммуникации. Они смогли использовать государственные базы данных, чтобы определить факторы, которые заставляют нас переходить с одной работы на другую и менять место жительства. Благодаря доступности данных и статистических тестов, определивших доверительный уровень для каждого случая, раскрылась структура нашего общества.
Идеологические споры и теоретические рассуждения оказались вытесненными за пределы социальных наук. Теория ничего не стоит без данных, ее подтверждающих. Некоторые социологи старой гвардии присоединились к этой революции данных, другие же отстали, однако любой человек из университета не смог бы отрицать, что общественные науки навсегда изменились.
* * *
Не все заметили эту трансформацию социальных наук вследствие использования данных. Иногда я читаю сетевой журнал Quillette. Он гордится тем, что продолжает традиции научного диалога, восходящие к Ричарду Докинзу в 1980-е и 1990-е. Его заявленная цель – давать платформу для свободного мышления, даже для опасных идей; это означает, что он с радостью публикует мнения о гендере, расе и IQ, которые обязательно «политически корректны».
Статьи в Quillette регулярно нападают на работы в области социальных наук. Одна из любимых мишеней – политика идентичности. Недавно я закончил читать одну статью, написанную ушедшим на пенсию профессором социологии, который заявил, что общественные науки превращаются в «сумятицу и бессмыслицу». Он возражал против книги Тукуфу Зубери и Эдуардо Бонилья-Сильвы «Белая логика, белые методы: расизм и идеология»[61]61
T. Zuberi, E. Bonilla-Silva, eds. White Logic, White Methods: Racism and Methodology. Lanham, MD: Rowman & Littlefield Publishers, 2008.
[Закрыть]. В ней исследовалось, насколько методы в социальных науках определяются «белой» культурой. Основываясь на своих сомнениях в утверждениях о «белых методах», профессор выступил со встречным заявлением, что он не смог нигде в обществе найти систематических признаков расизма. Он предположил, что наблюдаемые нами различия лучше объясняются «способностями и интересами афроамериканцев»[62]62
Staddon J. The devolution of social science // Quillette, 7 October 2018 // quillette.com/2018/10/07/the-devolution-of-social-science/.
[Закрыть].
Авторы многих других статей в Quillette вместо рассмотрения данных стараются разжечь дискуссию с учеными-социологами и левыми активистами. Меньше внимания обращено на цифры, больше – на войну идей. Как я покажу в главе 7, внутренняя разница между биологическими расами мала (фактически такого понятия, как биологическая раса, вообще не существует), но есть множество доказательств структурного расизма в США – например, в вышеупомянутой статье в The Lancet.
Я отправил по электронной почте автору публикации в Quillette копию статьи из The Lancet с предложением ознакомиться с ее содержанием. Мы обменялись несколькими дружескими электронными письмами. Оказалось, что в сфере изучения поведения животных у нас довольно много общих интересов.
Спустя несколько недель он прислал мне свой новый труд – нападение на саму идею структурного расизма. Среди прочего он заявлял, что доказать расизм невозможно, поскольку необходимо исключить слишком много других факторов. Профессор на пенсии, похоже, упустил из виду весь смысл сбора статистических данных – выявления дискриминации по большому числу повторяющихся наблюдений. Он повторил свои утверждения о значительной разнице в биологии рас.
В ответ на американский вариант исследования резюме, проведенного Моа Бёрселл, в котором продемонстрировали предубеждение против афроамериканских имен, профессор написал: «Это расизм? Мы не знаем предыдущего опыта нанимателя. Возможно, у него есть опыт неудачного найма темнокожих».
Это расизм? Да. Здесь не нужны доверительные интервалы. К моему крайнему удивлению, через несколько месяцев Quillette опубликовал эти его размышления. К счастью, фраза «прошлый опыт неудачного найма темнокожих» была убрана. Однако статья выдерживала тот же тон, бездоказательно отрицая факты из статьи в журнале The Lancet.
Не только Quillette использует такой подход к социальным наукам. Британское интернет-издание Spiked, сетевая реинкарнация бумажного журнала Living Marxism («Живой марксизм»), регулярно нападает на гендерную политику и идею существования структурного расизма. Раздел «Культурная волна» на сайте Reddit позволяет всем желающим присоединиться к дебатам. Те же понятия пронизывают The intellectual dark web («Темная сеть интеллектуалов») – самопровозглашенное движение за свободные идеи, высказывающееся на YouTube и в подкастах за право всех быть услышанными. Участники этой группы не просто пишут о гендере и расе, а оспаривают политкорректность; и обычно дискуссия быстро переходит к этим двум «табу», как они это называют.
Король «Темной сети интеллектуалов» – Джордан Питерсон. Как и Quillette, он ведет войну против того, что считает политкорректностью, захватившей общественные науки. Питерсон утверждает, что левая идеология заставила ученых сосредоточиться на вопросах пола и расовой идентичности. Он описывает университеты как места, где боятся сказать что-то не то. В итоге это оказывает негативное воздействие на общество в целом. Белые подвергаются несправедливым нападкам за их привилегированность, а женщинам предоставляются несправедливые преимущества при приеме на работу.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?