Электронная библиотека » Cет Cтивенс-Давидовиц » » онлайн чтение - страница 3


  • Текст добавлен: 3 февраля 2018, 11:20


Автор книги: Cет Cтивенс-Давидовиц


Жанр: Зарубежная компьютерная литература, Зарубежная литература


Возрастные ограничения: +18

сообщить о неприемлемом содержимом

Текущая страница: 3 (всего у книги 18 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +

Верно ли это расхожее мнение?

Давайте посмотрим на факты. Не существует всеобъемлющего источника данных о социоэкономике игроков НБА. Но, проведя тщательное исследование целой кучи источников (basketball-reference.com, ancestry.com, бюро переписи США и некоторые другие), мы можем понять, какие семьи больше всего способствуют успеху в НБА. Обратите внимание: в этом исследовании были использованы различные источники данных, некоторые побольше, другие поменьше, одни онлайновые, другие – вне Сети. Интересно, что, активно черпая из новых цифровых источников, хороший специалист по анализу данных не гнушается пользоваться и старомодными – если это может принести пользу. Самый лучший способ получить правильный ответ на вопрос – объединить все доступные данные.

Первая релевантная информация – родина каждого игрока. Сначала я записал, сколько черных и белых мужчин родилось в 1980-х годах в каждом округе США. Затем – сколько из них попали в НБА. При этом сравнил эти данные со средним доходом семьи в соответствующем округе. Я также проконтролировал расовую демографию округа, поскольку (но это тема для другой книги) чернокожие мужчины попадают в НБА примерно в 40 раз чаще, чем белые.

Факты говорят нам о том, что человек имеет значительно больше шансов попасть в НБА, если он родился в более богатом округе. Например, у черного парня, появившегося на свет в одном из самых богатых округов США, вдвое больше шансов попасть в НБА, чем у черного ребенка из беднейшего округа. Вероятность попадания в НБА белого малыша, родившегося в одном из самых богатых округов, на 60 % выше, чем у белого ребенка из самого бедного округа.

Это говорит о том, что, вопреки расхожему мнению, бедные люди на самом деле имеют меньше шансов попасть в НБА. Однако эти данные не идеальны, поскольку многие богатые округи США – такие, например, как графство Нью-Йорк (Манхэттен) – включают в себя и бедные кварталы вроде Гарлема. Поэтому тяжелое детство теоретически все-таки может помочь вам попасть в НБА. Нам все еще нужно больше зацепок, больше данных.

Тогда я начал исследовать семьи игроков НБА. Информацию о них находил в новостях и в социальных сетях. Эта методология оказалась довольно трудоемкой, поэтому я ограничил анализ сотней чернокожих игроков, родившихся в 1980-х годах и набравших на площадке наибольшее количество очков. По сравнению со среднестатистическим афроамериканцем, вероятность рождения суперзвезды НБА у матери-подростка или у незамужней матери на 30 % меньше. Другими словами, семейные обстоятельства лучших чернокожих баскетболистов также позволяют предположить, что хорошая семья для достижения успеха является преимуществом.

Таким образом, ни средний уровень доходов в округе, ни семейный фон ограниченной выборки игроков не дают точной информации о детстве всех баскетболистов. Поэтому я все еще не был уверен в том, что полные семьи со средним доходом производят больше звезд НБА, чем неполные и малообеспеченные. Чем больше фактов мы можем собрать для ответа на этот вопрос, тем лучше.

Потом я вспомнил еще один момент, который мог бы существенно помочь. В работе двух экономистов, Роланда Фрайера и Стивена Льюитта, было высказано предположение, что имя афроамериканца – это показатель его социально-экономического статуса{23}23
  Roland G. Fryer Jr. and Steven D. Levitt, «The Causes and Consequences of Distinctively Black Name» («Причины и последствия явно чернокожих имен»), Quarterly Journal of Economics 119, no. 3 (2004).


[Закрыть]
. Фрайер и Льюитт просмотрели свидетельства о рождении в Калифорнии за 1980-е годы и обнаружили, что бедные, необразованные и одинокие чернокожие мамы дают своим детям не такие имена, как родители из среднего класса, образованные и состоящие в браке.

Выше вероятность, что детям из более состоятельных слоев будут даны более привычные имена вроде Кевина, Криса и Джона. А вот детей из неблагополучных семей, скорее всего, назовут уникальным именем, таким как Ноушон, Уник или Брейоншей. У афро-американских детей, рожденных в нищете, вдвое выше вероятность получения имени, которым не будет назван ни один другой ребенок, родившийся в том же году.

Так что насчет имен чернокожих игроков НБА? Они звучат скорее как имена среднего класса или как имена бедняков? Баскетболисты, рожденные в Калифорнии в один и тот же период времени, имели уникальные имена в два раза реже, чем средний чернокожий мужчина того же возраста. Это статистически значимое отличие.

Вы знаете кого-то, кто считает, что НБА – это лига для детей из гетто? Скажите ему, чтобы он просто прислушался к репортажу со следующей игры. Предложите ему обратить внимание, как часто Расселл обходит Дуайта, а затем пытается проскользнуть мимо протянутой руки Джоша и передать мяч в ожидающие руки Кевина. Если бы НБА действительно была наполнена чернокожими парнями, вышедшими из бедных семей, репортаж звучал бы совершенно по-другому. В нем было бы намного больше упоминаний людей с такими именами, как у Леброна.

Итак, мы собрали три разных ключевых показателя – место рождения, семейное положение матерей лучших игроков и их имена. Ни один источник не идеален, но все они поддерживают одну и ту же версию. Чем выше социально-экономический статус, тем выше шанс попасть в НБА. Иными словами, общепринятое представление дало осечку.

Среди всех афроамериканцев, родившихся в 1980-х годах, около 60 % не имели состоявших в браке родителей{24}24
  «Центр по контролю и профилактике заболеваний, США, 2009», Таблица 9, внебрачные дети с подробной разбивкой по расам, происхождению и возрастам матери: США, 1970–2006 годы.


[Закрыть]
. Но, по моим оценкам, среди чернокожих, рожденных в том десятилетии и попавших в НБА, значительное большинство выросло в полной семье. Другими словами, у большинства баскетболистов детство было иным, чем у Леброна Джеймса. Среди них было больше таких, как Крис Бош, росший в Техасе с двумя родителями, которые привили ему интерес к электронным гаджетам. Или как Крис Пол, второй сын родителей, относящихся к среднему классу, из Льюисвилла, Северная Каролина.

Цель специалиста по обработке и анализу данных – понять мир. Как только находится кажущийся алогичным результат, можно попробовать взять больше научных данных и объяснить, почему мир устроен не так, как нам кажется. Почему, например, мужчины из семей среднего класса имеют преимущество в баскетболе по сравнению с выходцами из бедных семей? Есть как минимум два объяснения.

Во-первых, потому, что мужчины из бедных семей, как правило, ниже ростом. Ученым давно известно, что уход за детьми и правильное питание играют большую роль и способствуют здоровью. Именно поэтому средний человек в развитых странах сейчас на 10 см выше{25}25
  Крис Пол: «Не просто типичный качок: интересы форварда «Майами Хит» Криса Боша выходят далеко за рамки баскетбола», PalmBeachPost.com, 15 февраля 2011 года, http://www.palmbeachpost.com/news/sports/basketball/not-just-a-typical-jock-miami-heat-forward-chris-b/nLp7Z/; Dave Walker, «Chris Paul’s Family to Compete on ‘Family Feud’» nola.com, October 31, 2011, http://www.nola.com/tv/index.ssf/2011/10/chris_pauls_family_to_compete.html.


[Закрыть]
, чем полтора века назад. Статистика показывает, что американцы из бедных семей из-за плохих здравоохранения и питания в детстве вырастают более низкими{26}26
  «Почему наш вид становится выше?» Scientific American, http://www.scientificamerican.com/article/why-are-we-getting-taller/. Интересно, что американцы перестали расти. Amanda Onion, «Why Have Americans Stopped Growing Taller?» («Почему американцы перестали расти?»), ABC News, 3 июля 2016 года, http://abcnews.go.com/Technology/story?id=98438&page=1. Я утверждаю: одной из причин наблюдаемого огромного притока игроков НБА, родившихся в других странах, является то, что другие страны догоняют США по росту. Количество родившихся в США в период с 1946 по 1980 годы баскетболистов НБА ростом более 180 см увеличилось в 16 раз. С тех пор этот показатель выровнялся, поскольку американцы перестали расти. Между тем, число игроков ростом более 210 см из других стран существенно возросло. Иностранные баскетболисты чрезвычайно высокого роста приезжают из таких стран, как Турция, Испания и Греция, где в последние годы отмечается заметное улучшение здоровья детей и увеличение роста взрослых.


[Закрыть]
.

Статистика также может рассказать нам о влиянии роста на попадание в НБА. Вы, несомненно, догадываетесь, что высокий рост – это преимущество для начинающего баскетболиста. Просто сопоставьте этот параметр у типичного игрока на площадке и у типичного фаната на трибунах[8]8
  Средний рост игрока НБА – 201 см, средний рост американского мужчины – 179 см*. – Прим. авт.
  * Carmen R. Isasi et al., «Association of Childhood Economic Hardship with Adult Height and Adult Adiposity among Hispanics/Latinos: The HCHS/SOL Socio-Cultural Ancillary Study», PloS One 11, no. 2 (2016); Jane E Miller and Sanders Korenman, «Poverty and Children’s Nutritional Status in the United States» («Бедность и детское питание в США»), American Journal of Epidemiology 140, no. 3 (1994); Harry J. Holzer, Diane Whitmore Schanzenbach, Greg J. Duncan, and Jens Ludwig, «The Economic Costs of Childhood Poverty in the United States» («Экономические последствия нищеты у детей в Соединенных Штатах»), Journal of Children and Poverty 14, no. 1 (2008).


[Закрыть]
.

Насколько большое значение имеет высокий рост? Говоря о нем, баскетболисты иногда немного привирают, да и полного списка распределения ростов американских мужчин не существует. Но работая с грубой математической оценкой, можно прикинуть это распределение и сопоставить его с ростом игроков НБА. Нетрудно убедиться, что влияние роста огромно – пожалуй, даже больше, чем мы могли бы подозревать. На мой взгляд, каждый дополнительный дюйм удваивает ваши шансы попасть в НБА. И это верно для всей шкалы. Мужчина ростом 170 см имеет вдвое больше шансов попасть в НБА, чем мужчина ростом 167,5 см. Мужчина ростом 211 см имеет вдвое больше шансов попасть в НБА, чем мужчина ростом 208,5 см. Оказывается, в НБА попадает всего один из двух миллионов мужчин ростом меньше 183 см. А для тех, чей рост превышает 213 см, шанс попасть в НБА составляет где-то один к пяти.

Обратите внимание: эти данные показывают, почему моя мечта о баскетбольной славе не сбылась. Дело не в том, что я был воспитан в пригороде. Дело в том, что мой рост 175 см и я белый (не говоря уж о том, что у меня очень медленная реакция). Кроме того, я ленив. И у меня плохо с выносливостью, ужасная подача, а иногда, когда мяч попадает ко мне в руки, и панические атаки.

Вторая причина, по которой некоторые мальчики из не слишком хороших семей, могут не попасть в НБА – отсутствие определенных социальных навыков. Используя данные о тысячах школьников, экономисты обнаружили, что в семьях с двумя родителями, относящимися к среднему классу{27}27
  Cheryl D. Fryar, Qiuping Gu, and Cynthia L. Ogden, «Anthropometric Reference Data for Children and Adults: United States, 2007–2010» («Антропометрические справочные данные для детей и взрослых: США, 2007–2010»), статистика департамента здравоохранения, серич 11, №. 252 (2012).


[Закрыть]
, воспитание детей поставлено в целом существенно лучше. И там уделяют большое внимание выработке таких навыков, как дисциплинированность, настойчивость, целеустремленность и организованность.

Каким же образом недостаточно наработанные социальные навыки пускают под откос потенциально успешную баскетбольную карьеру?

Давайте посмотрим на историю Дага Ренна, одного из самых талантливых и перспективных баскетболистов 1990-х годов. Его тренер в колледже Джим Кэлан из университета Коннектикута, подготовивший многих будущих звезд НБА, заявил, что Даг прыгал выше любого человека{28}28
  Tim Kautz, James J. Heckman, Ron Diris, Bas Ter Weel, and Lex Borghans, «Fostering and Measuring Skills: Improving Cognitive and Non-Cognitive Skills to Promote Lifetime Success» («Поощрение измерительных навыков: совершенствование когнитивных и некогнитивных навыков, содействующих успеху в жизни»), National Bureau of Economic Research Working Paper 20749, 2014.


[Закрыть]
, с которым он когда-либо работал. Но характер у Ренна{29}29
  Desmond Conner, «For Wrenn, Sky’s the Limit» (Для Ренна небо – не предел»), Hartford Courant, Hartford Courant, 21 октября 1999 года.


[Закрыть]
был очень сложным. Он был воспитан матерью-одиночкой на Блад Элли – в одном из самых неблагополучных районов Сиэтла. В Коннектикуте он постоянно конфликтовал с окружающими. Ему нравилось дразнить игроков, он постоянно изводил тренеров вопросами и, в нарушение правил команды, носил свободную одежду. У него также были проблемы с законом – он украл обувь из магазина и набросился с кулаками на сотрудников полиции. Терпению Кэлана пришел конец, и Дага выгнали из команды.

Второй шанс Ренн получил в университете Вашингтона. Но и там сполна проявилась его неспособность ладить с людьми. Парень ссорился со своим тренером из-за игрового времени, а с партнерами – из-за передач мяча. В общем, его выгнали из команды и здесь. Ренн не пришелся ко двору в НБА, поиграл за разные команды низших лиг, переехал к своей матери и в конечном счете попал в тюрьму. «Моя карьера закончилась, – сказал Ренн в интервью «Сиэтл Таймс» в 2009 году. – Мои мечты, мои стремления закончились. Даг Ренн мертв{30}30
  История Дага Ренна была рассказана в Percy Allen, «Former Washington and O’Dea Star Doug Wrenn Finds Tough Times» («Для Дага Ренна, бывшей звезды Вашингтона, и О’Деа наступают трудные времена»), Seattle Times, 29 марта 2009 года.


[Закрыть]
. Как баскетболист я мертв. Все кончено». Ренн был талантлив и мог стать не просто игроком НБА, а легендарным игроком. Но он никогда не пытался справиться со своим характером, чтобы хотя бы остаться в команде колледжа. Возможно, если бы у него было более радужное детство, он мог бы стать следующим Майклом Джорданом.

Кстати, Майкл Джордан как раз совершил впечатляющий рывок к вершинам. У него были огромное самомнение и высокая конкурентоспособность – его характер мало чем отличался от характера Ренна. Джордан был трудным ребенком{31}31
  Там же.


[Закрыть]
. В 12 лет его выгнали из школы за драку. Но у него по крайней мере было то, чего не хватило Ренну – хорошее воспитание, характерное для среднего класса. Его отец был инженером-механиком и начальником смены в «Дженерал Электрик»{32}32
  Melissa Isaacson, «Portrait of a Legend» («Портрет легенды»), ESPN.com, 9 сентября 2009 года, http://www.espn.com/chicago/columns/story?id=4457017&columnist=isaacson_melissa. Хорошую биографию Джордана написал Роланд Лейзенби, Roland Lazenby, Michael Jordan: The Life (Boston: Back Bay Books, 2015).


[Закрыть]
, а мать работала в банке. И они помогали ему принять решение в карьере.

Действительно, жизнеописание Джордана наполнено историями о том, как семья помогала ему обойти ловушки{33}33
  Barry Jacobs, «High-Flying Michael Jordan Has North Carolina Cruising Toward Another NCAA Title», People, 19 марта, 1984.


[Закрыть]
, в которые могла попасть эта талантливая и стремящаяся к постоянному соперничеству личность. После того, как Майкла выгнали из школы, мама взяла его с собой на работу. Ему не разрешили выйти из машины, вместо этого мальчишке пришлось сидеть в ней на стоянке и читать книги. После того, как его взяли в команду «Чикаго Буллз», родители, братья и сестры по очереди навещали его, чтобы убедиться, что он избегает искушений, которые приходят вместе со славой и деньгами.

Карьера Джордана закончилась не так, как у Ренна с его интервью в «Сиэтл Таймс». Майкл завершил свой славный путь речью перед введением его в баскетбольный Зал славы{34}34
  Isaacson, «Portrait of a Legend» («Портрет легенды»).


[Закрыть]
, которую смотрели миллионы людей. В своем выступлении Джордан сказал, что он всегда старался «концентрироваться только на хорошем – вы же знаете, как люди воспринимают вас, если вы их уважаете… как вас воспринимают публично». «Остановитесь на минуту и подумайте о том, что вы делаете. И все это – благодаря моим родителям».

Факты говорят нам, что Джордан был абсолютно прав, поблагодарив своих женатых родителей, относящихся к среднему классу. Факты говорят нам, что в неблагополучных семьях, в неблагополучных общинах есть талантливые люди, которые вполне годятся для игры в НБА, но которые никогда туда не попадут. Эти люди имеют подходящие гены, имеют амбиции, но они никогда не занимались формированием характера, необходимого для того, чтобы стать суперзвездами баскетбола.

И, как подсказывает нам интуиция, даже пребывание в обстоятельствах настолько ужасных, что баскетбол становится «вопросом жизни и смерти», не помогает. Это отлично иллюстрируют истории вроде судьбы Дага Ренна. А факты подтверждают интуитивное представление.

В июне 2013 года Леброн Джеймс дал интервью{35}35
  Речь Майкла Джордана в баскетбольном Зале славы, видео на Ютуб, опубликовано 21 февраля 2012 года, https://www.youtube.com/watch?v=XLzBMGXfK4c. Наиболее интересный аспект речи Джордана не в том, что он был так несдержан, говоря о родителях, а в том, что он все еще чувствовал потребность указать на обиды начала своей карьеры. Возможно, обида на всю жизнь – необходимое условие для того, чтобы стать величайшим баскетболистом всех времен.


[Закрыть]
на телевидении после того, как во второй раз победил в чемпионате НБА. (С тех пор он уже победил и в третий раз.) «Я Леброн Джеймс – объявил он – из Акрона, штат Огайо. Городской житель. Я даже не должен был быть здесь»{36}36
  «Я Леброн Джеймс из Акрона, штат Огайо», видео на YouTube, опубликовано 20 июня 2013 года, https://www.youtube.com/watch?v=XceMbPVAggk.


[Закрыть]
. Twitter и другие социальные сети немедленно разразились критикой. Как мог такой высокоодаренный человек, которому еще в невероятно раннем возрасте прочили блестящее баскетбольное будущее, говорить о своем аутсайдерском статусе? На самом же деле любой, кто находился в похожих тяжелых начальных условиях, независимо от своих спортивных способностей, не имел бы никаких шансов. Другими словами, достижения Джеймса еще прекраснее и значительнее, чем кажутся на первый взгляд. И факты также подтверждают это.

Часть II
Могущество больших данных

Глава 2
Возможно, Фрейд был прав?

Недавно я слышал, как идущего по улице мужчину обозвали – «penistrian» (игра слов: pedestrian – пешеход, penis – пенис; получается «членоход»). Вы уловили? «Penistrian» («Членоход») вместо «pedestrian» («Пешеход»). Я видел подобное во многих поисковых запросах. Человек видит, как кто-то шагает, и пишет слово «Penis» («пенис»). Это ведь должно что-то означать, правда?

Недавно я узнал об одном мужчине, которому ужасно хотелось банан в тот момент, когда он шел к алтарю навстречу своей будущей жене. Я видел подобное в подборках больших данных о фантазиях, которыми люди делятся в сети. Мужчина думает о поедании фрукта фаллической формы в момент, когда собирается жениться на женщине. Это же что-то значит?

Возможно, Фрейд был прав? С того самого момента, когда его теории впервые были вынесены на суд широкой общественности, самым честным ответом на этот вопрос будет пожатие плечами. Ясность внес Карл Поппер – австрийско-британский философ. Он утверждал, что теорию Фрейда нельзя подделать. Не было никакого способа проверить, истинны они или ложны.

Фрейд мог бы сказать: человек, написавший «penistrian», возможно, проявил таким образом свое подавляемое сексуальное желание. А человек мог бы ответить, что он ничего не проявляет, что это вполне могла быть невинная опечатка – такая же, как, например, «pedaltrian» («педалеход»). Это просто ситуация из серии «он сказал, она сказала». Фрейд мог бы утверждать, что господин, мечтающий в день своей свадьбы о том, чтобы съесть банан, думает о пенисе – и это раскрывает его тайное желание выйти замуж за мужчину, а не жениться на женщине. На что сей джентльмен мог бы ответить, что он просто хотел банан. Идя к алтарю, он с тем же успехом мог бы думать о яблоке.

Не было никакого способа по-настоящему испытать теорию Фрейда. До настоящего времени.

Наука о данных делает многие моменты теории Фрейда опровержимыми, и это позволяет проверить ее на прочность. Начнем с фаллических символов во сне. Используя огромный массив данных из записанных снов, мы можем легко заметить, как часто в них появляются предметы фаллической формы. Еда – хороший объект, на котором можно сосредоточить свое внимание. Она появляется во многих снах, и многие продукты имеют форму фаллоса{37}37
  Я посчитал, что продукты имеют форму фаллоса, если их длина значительно больше их ширины и они, как правило, круглые. Я насчитал: огурцы, кукуруза, морковь, баклажаны, кабачки и бананы.


[Закрыть]
 – бананы, огурцы, сосиски и т. д.

Мы можем измерить факторы, которые заставляют нас видеть во сне одни продукты чаще других: как часто их едят, насколько вкусными находит их большинство людей, и – да! – действительно ли у них фаллический вид.

Можно протестировать два одинаково популярных продукта, один из которых имеет форму фаллоса. Насколько чаще в снах появляется тот или другой продукт? Если еда, имеющая форму фаллоса, не появляется в наших снах чаще продуктов другой формы, значит, фаллические символы не являются значимым фактором наших сновидений. Благодаря большим данным эту часть теории Фрейда можно реально опровергнуть.

Я получил сведения от Shadow – приложения, предлагающего пользователям записывать свои сны, – и проанализировал продукты, включенные в десятки тысяч снов.

В целом, что заставляет нас видеть во сне еду? Основным прогностическим фактором является то, как часто мы едим именно эти продукты. Вещество, которое мы видим во сне чаще всего – вода. В первую двадцатку продуктов из сновидений входят курица, хлеб, бутерброды и рис. Заметьте, все не по Фрейду.

Второй прогностический фактор, показывающий, насколько часто тот или иной продукт будет появляться в наших снах, это то, насколько вкусным мы его считаем. Два продукта, которые мы наиболее часто видим во сне, также не согласуются с теорией Фрейда: это шоколад и пицца.

А что относительно фаллической формы продуктов? Возможно, еда такой формы проникает в наши сны неожиданно часто? Ни в коей мере.

Бананы являются вторым по частоте появления в снах плодом. Но они также являются вторым по частоте употребления фруктом. Поэтому для объяснения того, почему мы так часто видим во сне бананы, Фрейд нам не нужен. Огурцы – седьмой по частоте появления в снах овощ. Но они занимают седьмое место в списке наиболее потребляемых овощей. Так что не надо объяснять их присутствие в наших снах формой. Хот-доги снятся гораздо реже, чем гамбургеры. Это верно, учитывая тот факт, что люди едят больше бургеров, чем хот-догов.

В целом, используя регрессионный анализ (метод, позволяющий ученым при сборе и анализе данных разделить воздействия нескольких факторов), я обнаружил: еда в форме фаллоса не появляется в наших снах с большей вероятностью, чем можно было бы ожидать при популярности каждого продукта. И это верно для всех фруктов и овощей. Таким образом, эта теория Фрейда является опровергаемой и, по крайней мере согласно собранной мной информации, ложной.

Далее рассмотрим оговорки по Фрейду. Великий психолог предположил, что наши устные или письменные оговорки или описки раскрывают наши подсознательные желания, часто сексуальные. Можем ли мы использовать большие данные, чтобы проверить это? Вот один из способов: посмотреть, не сводятся ли наши оговорки к сексуальным мотивам. Если наши подавленные сексуальные желания способны проникнуть в письмо или речь, должно быть огромное количество ошибок с внедрением таких слов, как «член» и «секс».

Вот почему я изучил набор из более 40 000 опечаток, собранных исследователями корпорации Microsoft{38}38
  Набор данных может быть загружен на https://www.microsoft.com/en-us/download/details.aspx?id=52418. Ученые попросили пользователей Amazon Mechanical Turk описать изображения. Они проанализировали логи кликов и отметили любой момент, когда кто-то исправлял слово. Более подробную информацию можно найти в Yukino Baba and Hisami Suzuki, «How Are Spelling Errors Generated and Corrected? A Study of Corrected and Uncorrected Spelling Errors Using Keystroke Logs» («Как исправлять орфографические ошибки? Исследование корректируемых и некорректируемых ошибок с помощью журналов нажатия клавиш»), Proceedings of the Fiftieth Annual Meeting of the Association for Computational Linguistics, 2012.


[Закрыть]
. Эти данные включали ошибки, которые люди делали, но потом сразу же исправляли. Среди этих десятков тысяч ошибок во многих имелся различного рода сексуальный подтекст. Был там и вышеупомянутый «penistrian». И еще нашелся запрос, в котором напечатали «sexurity» вместо «security» («безопасность») и «cocks» (просторечное обозначение пенисов) вместо «rocks» («камни, скалы»). Но также имелось и множество невинных опечаток. Люди печатали «pindows», «fegetables», «aftermoons» и «refriderators».

Может быть, количество сексуальных опечаток необычно велико?

Чтобы проверить это, я использовал вышеуказанный набор для того, чтобы смоделировать, как часто люди путают определенные буквы. Сперва подсчитал, как часто они заменяют t и c, g и h. Затем написал программу, которая делала ошибки так же, как это могли бы сделать люди. Мы могли бы назвать эту программу Error Bot. Этот бот заменял t на c с той же частотой, что и люди в исследовании Microsoft. И g на h. И так далее. Я запустил программу, набирая те же слова, которые хотели напечатать люди в исследовании Microsoft. Другими словами, бот пытался набрать слова «пешеход», «скалы», «окна» и «холодильник». Но он так же часто, как люди, путал r и t и писал, например, вместо «rocks» – «tocks» («ягодицы»). И так же часто, как люди, путал r и с и писал вместо «rocks» – «cocks».

Так что же мы узнаем из сравнения программы Error Bot с обычными небрежными людьми? Сделав несколько миллионов ошибок, просто путая буквы так же, как это делают люди, Error Bot сделал множество опечаток по Фрейду. Вместо «seashell» программа писала – «sexshell», вместо «lipstick» – «lipsdick», вместо «luckiest» – «fuckiest» и делала много других подобных опечаток. И вот ключевой момент. Error Bot, у которого, конечно же, нет подсознания, делал ошибки с той же вероятностью, что и реальные люди, опечатки которых воспринимаются как сексуальные. С оговоркой – как мы, социологи, любим говорить, – что необходимо провести дополнительные исследования. Это означает, что сексуально ориентированные ошибки встречаются не чаще, чем просто случайные.

Иными словами, когда люди делают опечатки и пишут «penistrian», «sexurity» и «cocks», совсем необязательно существование какой-то связи между ошибками и запретным. Не факт, что посредством этих описок разум людей раскрывает свои тайные желания. Эти опечатки могут быть объяснены обычными промахами пальцев. Люди делают много ошибок. И если у вас это случается достаточно регулярно, в конце концов обязательно получится что-то вроде «lipsdick», «fuckiest» и «penistrian». Если обезьяна достаточно долго будет бить по клавишам, она в конце концов напишет «быть или не быть». Если человек достаточно долго печатает, он в конце концов может написать «penistrian».

Теория Фрейда о том, что оговорки демонстрируют содержание нашего подсознания, является, согласно моему анализу данных, ложной.

Большие данные говорят нам, что банан – это всегда просто банан, а «penistrian» – просто «pedestrian», но напечатанный с ошибкой.

Но неужели Фрейд промахнулся со всеми своими теориями? Не совсем. Когда я впервые получил доступ к данным PornHub, меня посетило откровение: я наконец нашел то, что показалось мне хоть в чем-то фрейдистским. По сути, это один из самых удивительных моментов, обнаруженных в ходе моей работы с данными: шокирующее количество людей, посещающих наиболее крупные порносайты, ищут изображение инцеста.

16 из 100 наиболее частых поисковых запросов мужчин на одном из самых популярных порносайтов PornHub посвящены видео инцеста. Честно предупреждаю: это довольно живописная картина. Среди них «брат и сестра», «мачеха трахает пасынка», «мама и сын», «мать трахает сына» и «реальные брат и сестра». Больше всего поисковых запросов по кровосмесительным связям мужчины делают относительно сцены с участием матери и сына. А женщины? Девять из ста наиболее частых поисковых запросов женщин на PornHub по поводу видео инцеста включают похожие образы, хотя пол родителя и ребенка, как правило, прямо противоположные. То есть женщины ищут кровосмесительные сцены с участием отцов и дочерей.

Нетрудно предположить в этих фактах хотя бы слабое эхо эдипова комплекса, описанного Фрейдом. Он предположил, что в детстве почти у всех возникает желание половых отношений с родителем противоположного пола, которое позже подавляется. Если бы австрийский психолог прожил достаточно долго, он мог бы применить свои аналитические навыки к данным PornHub, где столь ярко и четко выражена совсем не подавленная заинтересованность взрослых людей к родителю противоположного пола.

Конечно, данные PornHub не могут точно показать, о ком фантазируют люди, когда смотрят подобное видео. Они и в самом деле представляют секс с собственным родителем? Поисковые запросы в Google могут подтвердить, что в мире есть много людей с подобными желаниями.

Рассмотрим все запросы, начинающиеся со слов «я хочу секса с…»{39}39
  Полные данные – предупреждение: в графическом виде – выглядят следующим образом:
  «Я хочу заниматься сексом с…»


[Закрыть]
. На первом месте среди завершающих слов стоит «мама». В целом 82,7 % поисковых запросов в подобной форме являются кровосмесительными. И это не связано с конкретной формулировкой. Например, при поиске в форме «меня привлекает…» признаний кровосмесительных желаний еще больше. Теперь я, рискуя разочаровать господина Фрейда, не исключаю, что это не особо распространенные поисковые запросы: ежегодно в США во влечении к своей матери признаются несколько тысяч человек. Кому-то даже придется подготовить господина Фрейда к новости о том, что поисковые запросы в Google (о чем в этой книге будет говориться позже) лишь иногда перекашиваются в сторону запретного.

Но все же… У людей много неподходящих желаний, которые, как мне казалось, должны чаще проявляться в поисковых запросах. Босс? Служащий? Студент? Терапевт? Пациент? Лучшая подруга жены? Лучшая подруга дочери? Сестра жены? Жена лучшего друга? Ни одно из этих желаний, проявившихся в поисковых запросах, не может конкурировать с желанием обладать матерью. Возможно, в сочетании с данными PornHub это действительно что-то да значит.

Кстати, главное утверждение Фрейда о том, что сексуальность может быть сформирована в детстве, поддерживается данными Google и PornHub. Они дают понять, что мужчины по крайней мере сохраняют невероятное количество фантазий, связанных с детством. По данным поисковых запросов жен о своих мужьях, некоторые из самых популярных фетишей мужчин – желание носить памперсы и чтобы их кормили грудью. Особенно, как уже говорилось раньше, это распространено в Индии. Нельзя не упомянуть и о большой популярности порномультфильмов{40}40
  Например, порно – это одно из самых распространенных слов в поисковых запросах Google для различных чрезвычайно интересных анимационных программ, как показано ниже.
  Мультфильмы с порно (чаще всего запрашиваемые в Google)
  Гриффины порно
  эпизоды Гриффины
  Гриффины бесплатно
  Смотреть Симпсонов
  Симпсоны порно
  Симпсоны фильм
  Футурама порно
  Футурама Лила
  Футурама онлайн
  Скуби Ду игры
  Скуби Ду мультфильм
  Скуби Ду велма


[Закрыть]
 – анимированных откровенных сексуальных сцен с участием персонажей из шоу, любимых мальчиками-подростками. Или рассмотрим вопрос о профессии женщин, чаще всего востребованной мужчинами в порно. Мужчины в возрасте 18–24 года чаще всего вводят в поисковый запрос профессию няни{41}41
  По расчетам автора, это самые популярные женские профессии в поисковых порнозапросах мужчин, с разбивкой по возрасту последних:
  Профессии в поисковых запросах порно у мужчин с разбивкой по возрасту


[Закрыть]
. То же самое можно сказать и о мужчинах в возрасте 25–64 года, и о мужчинах от 65 лет и старше. Кроме того, для мужчин каждой возрастной группы в первую четверку наиболее привлекательных профессий входят учительница и черлидерша. Очевидно, что в формировании взрослых мужских фантазий первые годы жизни играют важную роль.

Я пока не в состоянии использовать все эти беспрецедентные данные о сексуальности взрослых для определения, как именно формируются сексуальные предпочтения. В течение следующих нескольких десятилетий социологи – и я в том числе – смогут создать новые опровергаемые теории о сексуальности взрослых людей и проверить их с помощью фактов.

Но уже сейчас могу предсказать некоторые основные темы, которые, несомненно, станут частью теории о взрослой сексуальности, возникшей на базе большого объема данных. Она явно не будет идентична теории Фрейда с его отдельными, четко определенными универсальными стадиями детства и подавления. Но, основываясь на моем первом обзоре данных PornHub, я абсолютно уверен: в окончательный вердикт о взрослой сексуальности некоторые ключевые обозначенные Фрейдом темы обязательно будут включены. Главную роль будет играть детство человека. И его мать.


Наверное, еще десять лет назад было бы невозможно анализировать теорию Фрейда подобным образом. И конечно, нечто подобное было неисполнимо 80 лет назад, когда Фрейд был еще жив. Итак, давайте подумаем, почему эти источники данных смогли нам помочь? Благодаря такому упражнению мы поймем, из-за чего большие данные настолько могущественны.

Помните, мы уже говорили, что даже наличие целой россыпи фактов само по себе не позволит нам автоматически генерировать полезные выводы. Ученые переоценили объем данных. Но почему же тогда большие данные настолько могущественны? Почему они оказались способными революционно преобразовать наше видение самих себя? Я утверждаю, что существуют четыре уникальные особенности больших данных, и анализ Фрейда способен отлично проиллюстрировать это.

Прежде всего, вы, наверное, заметили: обсуждая теории Фрейда, мы довольно серьезно отнеслись к порнографии. Более того, в этой книге мы намерены достаточно часто обращаться к анализу порносайтов. Это довольно странно, ведь данные, полученные из такого источника, редко используются большинством ученых. Последние обычно удобно опираются на результаты традиционных опросов – и именно на них выстраивают свои карьеры. Но если немного подумать, становится ясно, что широкое использование данных порносайтов (а также поиск по ним и обработка полученных таким образом сведений) позволяет лучше понять человеческую сексуальность. На самом деле это, наверное, самое важное на свете. Получив такие данные, Шопенгауэр, Ницше, Фрейд и Фуко визжали бы от восторга, однако в то время, когда они жили, подобных данных не существовало. Их не было еще пару десятилетий назад, но они есть сейчас. Существует множество уникальных источников информации по различным темам, открывающих нам глаза в областях, о которых ранее мы могли только догадываться. Способность предложить нам новые типы фактов – первая могущественная особенность больших данных.

Данные порносайтов и поисковых запросов Google не только новые, они самые правдивые. В доцифровое время люди прятали свои постыдные мысли от других. В эпоху цифровых технологий они продолжают их прятать – но не от интернета и, в частности, не от сайтов вроде Google и PornHub, где поддерживается анонимность. Подобные сайты играют роль своего рода цифровой сыворотки правды – именно это позволило нам открыть популярность темы инцеста. Большие данные позволяют нам наконец увидеть, чего люди хотят на самом деле, а не то, что они говорят или делают. Предоставление самых правдивых фактов является второй могущественной особенностью больших данных.

Поскольку сейчас существует огромное количество разнообразных сведений, можно найти содержательную информацию даже о самом небольшом популяционном срезе. Мы в состоянии сравнить, скажем, количество людей, видящих во сне огурцы, с теми, кто видит во сне помидоры. Возможность пристально вглядеться в самые мелкие подмножества людских сообществ – это третья могущественная особенность больших данных.

Большие данные обладают еще одной внушительной возможностью – той, которую я не использовал в своем кратком исследовании теории Фрейда, но которую я наверняка применю в будущем: она дает возможность проводить быстрые контролируемые эксперименты. Это позволяет определить причинно-следственную связь, а не просто корреляцию. Такие тесты в основном используются коммерческими предприятиями, но они станут мощным инструментом в руках социологов. Возможность проводить многочисленные причинно-следственные эксперименты – это четвертая могущественная особенность больших данных.


Страницы книги >> Предыдущая | 1 2 3 4 5 | Следующая
  • 4.4 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации