Текст книги "Все лгут. Поисковики, Big Data и Интернет знают о вас всё"

Текст добавлен: 3 февраля 2018, 11:20

Автор книги: Cет Cтивенс-Давидовиц

Жанр: Зарубежная компьютерная литература, Зарубежная литература

Возрастные ограничения: +18

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 6 (всего у книги 18 страниц) [доступный отрывок для чтения: 6 страниц]

Скачать книгу

Шрифт:

- 100% +

Благодаря чудесам интернета Генцкоу и Шапиро смогли проанализировать лексику большинства национальных газет. Ученые использовали два вебсайта – news-library.com и proquest.com, – где имеется оцифрованный архив 433 газет. Затем они подсчитали, как часто там употреблялась тысяча подобных политически заряженных выражений – для определения политической ориентации самих СМИ. Самой либеральной по этому показателю оказалась «Philadelphia Daily News». А самой консервативной – «Billings (Montana) Gazette».

Когда у вас появляются первые обстоятельные мерила пристрастий такого широкого спектра СМИ, вы, пожалуй, можете ответить на самый важный вопрос о прессе: почему одни публикации демонстрируют сдвиг влево, а другие – вправо{63}63
Jonah Berger and Katherine L. Milkman, «What Makes Online Content Viral?» («Что делает онлайн-контент вирусным?»), Journal of Marketing Research 49, no. 2 (2012).

[Закрыть]?

Экономисты быстро сосредоточили свое внимание на одном ключевом факторе: политических настроениях в том или ином регионе. Если он в целом либеральный – как Филадельфия и Детройт, – доминирующая газета, скорее всего, будет либеральной. Если же он более консервативен – как Биллингс и Амарилло, штат Техас, – основная часть газет там будет консервативной. Иными словами, факты убедительно свидетельствуют: газеты склонны давать своим читателям то, чего те хотят.

Вы можете сказать, что владелец газеты имеет влияние на направление взглядов своего издания. Но нет. Как правило, на политическую направленность газеты он влияет меньше, чем мы могли бы предположить. Обратите внимание на то, что происходит, когда один и тот же человек или компания владеет газетами на различных рынках. Рассмотрим компанию «Нью-Йорк Таймс». Генцкоу и Шапиро обнаружили, что она владеет как либеральной «Нью-Йорк Таймс» в Нью-Йорке, где около 70 % населения являются демократами, так и (на момент исследования) консервативной «Spartanburg Herald-Journal» в Спартанбурге, Южная Каролина, где около 70 % населения – республиканцы. Конечно, есть и исключения: новостная корпорация Руперта Мердока{64}64
Эти исследования опираются на статью Matthew Gentzkow и Jesse M. Shapiro, «What Drives Media Slant? Evidence from U. S. Daily Newspapers» («Куда направлен уклон СМИ? Данные из ежедневных газет США»), Econometrica 78, no. 1 (2010). Хотя, когда этот проект стартовал, Генцкоу и Шапиро были всего лишь аспирантами, теперь они звезды в мире экономистов. Генцкоу, ныне профессор Стэнфордского университета, в 2014 году получил медаль Джона Бейтса Кларка и был объявлен ведущим экономистом моложе сорока лет. Шапиро, ныне профессор университета Браун – редактор престижного журнала политической экономики. Их совместная статья относительно уклона СМИ является одним из самых цитируемых статей в библиографии каждого.

[Закрыть] владеет всеми признанной консервативной газетой «Нью-Йорк пост». Но в целом полученные данные свидетельствуют о том, что рынок определяет направленность газет в гораздо большей степени, чем воля хозяев.

Исследование имеет огромное влияние на наше представление о новостных СМИ. Многие люди, особенно марксисты, рассматривали американскую журналистику как нечто, управляемое кучкой богатых людей или корпораций с целью воздействия на массы, для того, чтобы подтолкнуть людей к определенным политическим взглядам. Однако в статье Генцкоу и Шапиро показано: это не основная мотивация владельцев газет. Они, прежде всего, стремятся дать массам то, чего те хотят – чтобы владельцы газет могли стать еще богаче.

Да, есть же еще один вопрос – важный, спорный и, возможно, еще более провокационный. Куда, в среднем, больше склоняются американские СМИ – влево или вправо? Другими словами, СМИ в Америке скорее либеральные или консервативные?

Генцкоу и Шапиро обнаружили, что в основном газеты имеют левый уклон. Средняя газета, по используемым в ней словам, больше похожа на конгрессмена-демократа, чем на конгрессмена-республиканца.

«Ага! – могут завопить консервативно настроенные читатели. – Я же говорил!» Многие консерваторы давно подозревали, что газеты, пытаясь манипулировать массами, пишут предвзято – чтобы поддержать левые взгляды.

Нет, это неверно, отвечают авторы статьи. На самом деле либеральный уклон в газетах хорошо откалиброван и заточен на то, что читатели хотят увидеть. Последние, в среднем, имеют небольшой уклон влево. (У исследователей есть данные об этом). И газеты, в среднем, также имеют небольшой уклон влево – чтобы подать своим читателям ту точку зрения, которую они желают видеть.

В этом нет никакого великого заговора. Есть только капитализм.

Новостные СМИ, по данным Генцкоу и Шапиро, часто действуют как любая другая отрасль на планете. Точно так же, как супермаркеты выясняют, какое мороженое люди предпочитают, и заполняют им свои полки, газеты выясняют, какие оценки люди хотят видеть, и заполняют ими свои страницы. «Это просто бизнес», – сказал мне Шапиро{65}65
То, что консервативная «Нью-Йорк пост» принадлежит Мердоку, можно объяснить тем фактом, что Нью-Йорк очень большой, и в нем могут существовать газеты с различными точками зрения. Однако, очевидно, что «Пост» постоянно теряет деньги. См., например, Joe Pompeo, «How Much Does the ‘New York Post’ Actually Lose?» («Сколько теряет сегодня «Нью-Йорк Пост»?), Politico, 30 августа 2013 года, http://www.politico.com/media/story/2013/08/how-much-does-the-new-york-post-actually-lose-001176.

[Закрыть]. Вот что вы можете узнать, когда разберете на составные части и количественно оцените такие мудреные явления, как новости, анализ и мнения.

Изображения как данные

Традиционно когда ученые или бизнесмены хотели собрать информацию, они проводили исследования. Данные аккуратно формировались на основе чисел или флажков в окошках опросников. Сейчас все иначе. Дни структурированных, чистых и простых полученных в результате исследований данных закончились. Идя по жизни сегодня, мы повсюду оставляем свои грязные следы, которые и становятся основным источником информации.

Как мы уже видели, слова – это данные. Клики – это данные. Ссылки – это данные. Опечатки – это данные. Бананы во сне – данные. Тон голоса – данные. Хрипы – данные. Сердечный ритм – данные. Размер селезенки – данные. Я утверждаю, что поисковые запросы – наиболее разоблачительные данные.

Оказывается, фотографии – тоже данные.

Так же, как слова, собранные в книгах или в периодике и хранившиеся на пыльных полках, фотографии были вытащены из фотоальбомов и картонных коробок и оцифрованы. Они тоже были превращены в биты и байты и запущены в облако. Как текст может преподать нам урок – продемонстрировав, например, как менялась манера людей излагать свои мысли, – так и фотографии могут показать нам историю США – например, изменением способов позирования перед камерой.

Я считаю гениальным исследование группы четырех ученых-компьютерщиков в университетах Браун и Беркли. Они воспользовались достижением цифровой эпохи: многие вузы отсканировали ежегодные фотографии выпускников{66}66
Я взял интервью у Мэтта Генцкоу и Джесси Шапиро 16 августа 2015 года в Королевском отеле Бостон.

[Закрыть] и сделали их доступными онлайн. В интернете исследователи нашли 949 ежегодников с фотографиями учеников американских средних школ за период 1905–2013 годов. Это собрание включало десятки тысяч снимков. Используя компьютерные программы, ученые смогли создать по фотографиям «обычное» лицо каждого десятилетия. Другими словами, они смогли выяснить среднее расположение и конфигурацию носа, глаз, губ, волос. Здесь представлены типичные лица более чем за век – с разбивкой по полу:

Ничего не замечаете? Американцы – и особенно женщины – стали улыбаться. В начале XX века они фотографировались почти с каменным выражением, а в конце – просто сияли.

Так в чем причина? Разве американцы стали счастливее?

Нет. Ответить на этот вопрос помогли другие ученые. Причина – по крайней мере, на мой взгляд – просто удивительна. На заре фотографии люди относились к ней, как к живописи{67}67
Kate Rakelly, Sarah Sachs, Brian Yin, and Alexei A. Efros, «A Century of Portraits: A Visual Historical Record of American High School Yearbooks» («Век портрета: визуальный исторический портрет американского школьника»), доклад, представленный на Международной конференции по компьютерной визуализации, 2015. Фото печатается с разрешения авторов.

[Закрыть]. Они не могли сравнить этот процесс ни с чем другим. Таким образом, фотосюжеты были скопированы с сюжетов картин. А поскольку люди, позирующие художнику для картины, не могли сохранять улыбку в течение долгих часов, они принимали серьезный вид. Люди, которых снимал фотограф, также делали серьезные лица.

Что же в итоге заставило их поменять выражение лица? Бизнес, прибыль, маркетинг, конечно. В середине ХХ века Kodak – компания, продававшая пленку и камеры – была расстроена тем, что люди делают не слишком много снимков. Тогда была разработана стратегия приучения людей снимать все больше и больше. Рекламные кампании Kodak стали ассоциировать фотографии с понятием счастья. Их целью было заставить людей приобрести привычку делать фото всякий раз, когда они хотели показать другим, что в их жизни произошло нечто хорошее. Так что улыбки в ежегодниках являются результатом этой успешной кампании (как и большинство фотографий, которые вы видите в Facebook и в Instagram сегодня).

Но данные, полученные на основе фотографий, могут рассказать нам гораздо больше, чем обозначение периода времени, когда старшеклассники начали говорить: «Сы-ы-ыр». Удивительно, но снимки в состоянии поведать нам даже о положении дел в экономике.

Познакомьтесь с одной провокационно озаглавленной научной работой: «Измерение экономического роста из космоса». Когда у документа название вроде такого, можете держать пари: я обязательно прочитаю его. Авторы работы – Вернон Хендерсон, Адам Соригард и Дэвид Н. Вайль – начали с замечания, что во многих развивающихся странах существующие измерения валового внутреннего продукта (ВВП) являются неэффективными. Это происходит потому, что значительная часть экономической активности остается незафиксированной в бухгалтерских книгах, а ресурсы правительственных учреждений, в задачу которых входит измерение производительности экономики, довольно ограничены.

Авторы озвучили неординарную мысль. Они говорят, что могли бы измерять ВВП, исходя из того, насколько светло в этих странах ночью{68}68
См., например, Christina Kotchemidova, «Why We Say ‘Cheese’: Producing the Smile in Snapshot Photography» («Почему мы говорим «сыр»: Создание улыбки на фотографии»), Critical Studies in Media Communication 22, no. 1 (2005).

[Закрыть] – получив эту информацию из фотографий со спутника ВВС США, который делает полный оборот вокруг Земли 14 раз в сутки.

Почему свет в ночное время может быть хорошим показателем ВВП? В очень бедных частях мира людям трудно заплатить за электричество. В результате при плохих экономических условиях в домах резко уменьшалось количество света, которое жители позволяли себе включать ночью.

В Индонезии в результате Азиатского финансового кризиса 1998 года количество света ночью резко снизилось. А в Южной Корее в период с 1992 по 2008 год объем ночного освещения увеличился на 72 %, что соответствовало исключительно высоким экономическим показателям в тот период. В Северной Корее в то же время количество освещения ночью уменьшилось, что соответствовало удручающим экономическим показателям.

В 1998 году в южной части Мадагаскара было обнаружено большое скопление рубинов и сапфиров. Городишко Илакака из практически стоянки для грузовиков превратился в крупный торговый центр. До 1998 года там почти не было ночного освещения, а после обнаружения месторождения за пять лет количество света в ночное время взрывообразно увеличилось.

Авторы признают, что их оценка экономической активности по уровню ночного освещения далека от идеала. Вы не можете точно оценить состояние экономики только по тому, сколько света улавливает спутник. Авторы не рекомендуют использовать этот показатель для развитых стран, где существующие экономические данные дают более точную картину. И, по правде говоря, они обнаружили, что даже в развивающихся странах оценка количества света ночью столь же бесполезна, как и официальные показатели. Но сочетание ущербных правительственных данных и несовершенных показателей ночного освещения дает более точный результат, чем может обеспечить лишь один источник. Другими словами, с помощью снимков, сделанных из космоса, вы можете просто улучшить свое понимание уровня развития экономик той или иной страны.

Джозеф Райзингер, доктор наук в области информатики, разделяет разочарование авторов идеи о ночном освещении в отношении существующих баз данных с информацией об экономиках развивающихся стран. В апреле 2014 года Райзингер отметил, что Нигерия обновила информацию об объеме ВВП с учетом новых секторов, которые тамошние чиновники, возможно, пропустили при опубликовании предыдущих оценок. По их нынешним оценкам, ВВП Нигерии сейчас на 90 % выше{69}69
J. Vernon Henderson, Adam Storeygard, and David N. Weil, «Measuring Economic Growth from Outer Space» («Измерение экономического роста из космоса»), American Economic Review 102, no. 2 (2012).

[Закрыть].

«Это крупнейшая экономика в Африке, – сказал Райзингер{70}70
Kathleen Caulderwood, «Nigerian GDP Jumps 89 % As Economists Add in Telecoms, Nollywood» («ВВП Нигерии подскочил на 89 %, когда экономисты добавили в «Телекомс», «Нолливуд»), IBTimes, 7 апреля 2014 года, http://www.ibtimes.com/nigerian-gdp-jumps-89-economists-add-telecoms-nollywood-1568219.

[Закрыть], и его голос постепенно начал набирать силу. – Мы даже не знаем, какие основные параметры мы хотели бы знать об этой стране».

Он хотел найти способ более четко оценивать различные экономические показатели. Его решение – это отличный пример того, как можно переосмыслить данные и какова их реальная ценность.

Райзингер основал компанию «Premise», в которой работают группы сотрудников из развивающихся стран, вооруженные смартфонами. В чем заключается их работа? Фотографировать интересные происшествия, которые могут иметь какое-либо экономическое значение.

Сотрудники, вооружившись смартфонами, могут делать снимки АЗС или фруктовых корзин в супермаркетах. Они фотографируют одни и те же места снова и снова. Фотографии отправляются в головной офис компании, где вторая группа сотрудников – компьютерщики – превращают фотографии в информацию.

Специалисты компании могут проанализировать все – от длины очередей на заправках до того, сколько яблок лежит в корзине в супермаркете, и до цены этих яблок. На основе самых разных фотографий любых видов деятельности компания может начать оценивать уровень экономической активности и инфляции. В развивающихся странах длинные очереди на АЗС – основной индикатор экономических проблем. Равно как недозрелые яблоки и их отсутствие. Снимки, сделанные в Китае, помогли обнаружить продовольственную инфляцию в 2011 году и продовольственную дефляцию в 2012 году – задолго до появления официальных данных.

«Premise» продает эту информацию банкам или хедж-фондам, а также сотрудничает со Всемирным банком.

Как и многие хорошие идеи, «Premise» продолжает приносить пользу. Недавно Всемирный банк заинтересовался размерами теневой экономики на Филиппинах, связанной с сигаретами. В частности, он хотел знать последствия недавних шагов правительства, включавших случайные рейды против производителей сигарет, не уплачивающих налоги. Что придумала компания «Premise»? Фотографировать табачные киоски на улице. Посмотрим, на скольких из них имеются акцизные марки, которые отличают законные сигареты. Было обнаружено, что эта часть теневой экономики, бывшая достаточно обширной в 2015 году, в 2016-м стала значительно меньше. Усилия правительства принесли результат, хотя для того, чтобы понять объем скрытого товара (нелегальных сигарет), требуются новые данные.

Как мы видели, эпоха цифровых технологий принесла совершенно новое понимание того, что считать данными, и из новой информации было сделано много интересных выводов. Знание причин, заставляющих СМИ смещать тональность своих выступлений влево или вправо, обеспечивающих успех первого свидания и возможность выявления хорошо развивающиейся экономики – это только начало.

Неслучайно на основе этих новых данных было сделано немало денег – начиная с десятков миллиардов господ Брина и Пейджа. Джозеф Райзингер также работает не в убыток себе. Обозреватели подсчитали, что годовой доход «Premise» сегодня составляет десятки миллионов долларов. Недавно инвесторы влили в компанию еще 50 миллионов{71}71
Я взял интервью у Джо Райзингера по телефону 10 июня 2015 года.

[Закрыть]. Это означает, что некоторые из них считают «Premise» одним из самых выгодных предприятий в мире – в первую очередь, в области создания и использования фотографий. То есть в той же лиге, что и «Playboy».

Другими словами, новые типы данных имеют огромное значение как для ученых, так и для предпринимателей. При этом понятие данных в последнее время значительно расширилось. Сегодня специалисты не должны ограничивать себя узким или традиционным представлением о них. В наши дни фотографии очередей в супермаркетах – ценные данные. Наполнение полок там же – данные. Спелость яблок – данные. Фотографии из космоса – данные. Кривизна линии губ – тоже данные. Любая информация!

И все эти новые сведения мы наконец можем увидеть даже сквозь прикрывающую их ложь.{72}72
Leena Rao, «SpaceX and Tesla Backer Just Invested $50 Million in This Startup» («Spacex и Tesla Backer просто вложили 50 миллионов долларов в стартап»), Fortune, 24 сентября 2015 года.

[Закрыть]

Глава 4
Цифровая сыворотка правды

Все врут. О том, сколько выпили по дороге домой. О том, как часто ходят в тренажерный зал, сколько стоят эти новые туфли, будут ли читать эту книгу. Они говорят, что больны, когда вполне здоровы. Они говорят, что будут на связи, когда не собираются этого делать. Они утверждают, что говорят не о вас, хотя именно вас они и обсуждали. Они говорят, что любят вас, хотя на самом деле это не так. Они говорят, что счастливы, хотя в действительности хандрят. Они говорят, что им нравятся женщины, тогда как предпочитают мужчин. Люди врут друзьям. Боссам. Детям. Родителям. Они обманывают врачей и мужей. Лгут женам. Они врут сами себе.

И они – я совершенно в этом уверен – врут во время опросов.

Вот вам краткий обзор:

Вы когда-нибудь жульничали на экзамене?

Вы когда-нибудь мечтали кого-нибудь убить?

Вам когда-нибудь хотелось соврать? Многие люди при опросах занижают количество случаев неловкого поведения и дурных мыслей. Они хотят хорошо выглядеть, хотя большинство опросов анонимны. Это называется «социально приемлемое смещение».

Одна серьезная статья 1950 года{73}73
Hugh J. Parry and Helen M. Crossley, «Validity of Responses to Survey Questions» («Достоверность ответов на вопросы анкеты»), Public Opinion Quarterly 14, 1 (1950).

[Закрыть] представила веские доказательства того, как опросы могут пасть жертвой этого явления. Исследователи собрали из официальных источников данные о жителях Денвера: сколько процентов из них голосовали, давали деньги на благотворительность и имеют читательский билет в библиотеке. Затем они сами опросили денверцев – чтобы увидеть, насколько эти показатели совпадают с реальностью. Результаты оказались шокирующими. То, что люди сообщали в анкетах, сильно отличалось от сведений, собранных учеными. Хотя никто не подписывал анкету, все в основном преувеличивали свой регистрационный статус избирателя, стремление голосовать и участие в благотворительности.

Изменилось ли что-либо за 65 лет? В век интернета отсутствие библиотечного читательского билета никого больше не смущает. Но несмотря на изменение представлений о неудобном или нежелательном, стремление людей обманывать социологов остается весьма сильным.

Во время недавнего исследования выпускникам университета Мэриленда задавали различные вопросы об их жизни во время учебы{74}74
Frauke Kreuter, Stanley Presser, and Roger Tourangeau. «Social Desirability Bias in CATI, IVR, and Web Surveys» («Смещение социальной желательности в CATI, IVR и веб-опросах», Public Opinion Quarterly 72(5), 2008.

[Закрыть]. Ответы сопоставлялись с официальными отчетами. Люди постоянно давали неверную информацию, что позволяло им выглядеть лучше, чем они были на самом деле. Меньше 2 % опрошенных сообщили, что закончили обучение со средним баллом ниже 2,5 (в действительности таких было около 11 %). А 44 % заявили, что в прошлом году они сделали пожертвование университету (в действительности таких было около 28 %).

Вполне возможно, именно ложь сыграла роль в провале опроса{75}75
Относительно статьи, утверждающей, что ложь может быть проблемой, мешающей предугадать поддержку Трампа, см. Thomas B. Edsall, «How Many People Support Trump but Don’t Want to Admit It?» («Сколько людей поддерживают Трампа, но не хотят признать это?»), New York Times, 15 мая 2016 года, SR2. Но аргумент, что это не самый серьезный фактор, вы найдете в статье Andrew Gelman, «Explanations for That Shocking 2 % Shift» («Объяснение того, что вызвало 2 %-ный сдвиг»), с Statistical Modeling, Causal Inference, and Social Science, 9 ноября, 2016 года, http://andrewgelman.com/2016/11/09/explanations-shocking-2-shift/.

[Закрыть], не сумевшего предсказать победу Дональда Трампа в 2016 году. Исследования в среднем недооценивали его поддержку примерно на два процентных пункта. Некоторые люди могли постесняться сказать, что собираются голосовать за него. Другие, возможно, утверждали, что затрудняются ответить, в то время как все время были за Трампа.

Зачем люди дают ложную информацию в ходе анонимных опросов? Я спросил об этом Роджера Туранго, почетного профессора университета штата Мичиган и, возможно, лучшего специалиста в мире по отклонению от социально желательного поведения. «Наша слабость в отношении «белой лжи» является важной частью проблемы, – пояснил он. – В реальной жизни люди врут примерно в трети случаев. Эта привычка переносится и на опросы»{76}76
Я брал интервью у Роджера Туранго по телефону 5 мая 2015 года.

[Закрыть].

То есть существует странная привычка – иногда мы лжем сами себе. «Имеет место нежелание признаться самому себе, что, мол, ты облажался как студент», – говорит Туранго.

Привычка лгать самому себе может объяснить, почему так много людей утверждают, будто их результат выше среднего{77}77
Это обсуждается в Adam Grant, «Originals: How Non-Conformists Move the World» («Оригиналы: как нонконформисты перемещаются по миру») (Нью-Йорк: Викинг 2016). Оригинальный источник – David Dunning, Chip Heath, and Jerry M. Suls, «Flawed Self-Assessment: Implications for Health, Education, and the Workplace» («Ущербная самооценка: последствия для здоровья, образования и работы»), Psychological Science in the Public Interest 5 (2004).

[Закрыть]. Насколько велика эта проблема?

Более 40 % инженеров одной компании заявили, что входят в 5 % лучших работников.

Более 90 % преподавателей колледжей говорят, что уровень их квалификации выше среднего. Четверть старшеклассников считают, что они входят в 1 % лучших учеников по умению ладить с другими людьми. Если вы не честны с самим собой, то наверняка не будете честны и при опросе.

Еще один фактор, способствующий вранью при опросах – сильное желание произвести хорошее впечатление на незнакомца, проводящего собеседование (если опрос проводится в устной форме). Как добавляет Туранго, «приходит человек, который выглядит как ваша любимая тетя… Вы готовы рассказать вашей любимой тете, как в прошлом месяце курили марихуану?»[13]13
Еще одной причиной лжи* является стремление просто напакостить исследователям. Хотя в обычной жизни это не такая уж большая проблема, она огромна для любых опросов, связанных с подростками – и принципиально усложняет нам возможность разобраться в поведении этой возрастной группы. Первоначально ученые обнаружили взаимосвязь: приемные дети (подростки) чаще ведут себя асоциально – в частности принимают наркотики, выпивают, прогуливают школу. Но последующие исследования показали, что эту взаимосвязь полностью сочинили 19 % подростков, назвавших себя приемными, не будучи таковыми. Дальнейший анализ опросов выявил, что значительный процент подростков сообщил во время исследования, что их рост – более семи футов (213,5 см), а вес – более 400 фунтов (181,5 кг). В ходе другого опроса выяснилось, что 99 % студентов, сообщивших о том, что у них установлены протезы, просто решили подшутить над учеными-исследователями. – Прим. авт.
* Anya Kamenetz, «Mischievous Responders’ Confound Research on Teens» («Хулиганство респондентов, ошибочные исследования подростков»), nprED, 22 мая 2014 года, http://www.npr.org/sections/ed/2014/05/22/313166161/mischievous-responders-confound-research-on-teens. Исходные исследования, обсуждаемые в данной статье – Joseph P. Robinson-Cimpian, «Inaccurate Estimation of Disparities Due to Mischievous Responders» («Неточная оценка неравенства из-за хулиганства респондентов»), исследователь в области образования Education al Researcher 43, №. 4 (2014).

[Закрыть]

Вы готовы признать, что не дали денег на свою старую добрую альма-матер?

Именно поэтому чем более обезличенными будут условия получения информации, тем больше честных ответов вы получите. Для этого лучше проводить интернет-опросы, а не телефонные, которые, в свою очередь лучше проводимых интервьюерами. Люди в большей степени готовы давать правдивые ответы, находясь в одиночестве, чем если рядом с ними в комнате есть кто-то еще.

Однако при проведении опроса на деликатные темы каждый метод обследования будет приводить к значительному искажению информации. В этом случае Туранго использует слово, часто применяемое экономистами: «стимул». У людей нет стимула говорить правду.

Так как же мы можем узнать, что в действительности они думают и делают?

В некоторых случаях имеются официальные источники данных, из которых мы можем узнать правду. Например, даже если люди лгут о своих благотворительных пожертвованиях, можно получить реальные цифры по регионам от самих благотворительных организаций. Но когда мы пытаемся узнать о поведении, которое не заносится в официальные отчеты, или хотим выяснить, что люди думают – то есть их истинные убеждения, чувства и желания, – нет никакого другого источника информации, кроме того, что люди соизволят сказать в ходе опроса. До сих пор так и было.

И это второй важный аспект больших данных: некоторые интернет-ресурсы, служа своего рода цифровой сывороткой правды, заставляют людей признать то, что они не признают больше нигде. Вспомните о поисковых запросах в Google. Помните условия, делающие людей более честными. Онлайн? Есть. В одиночестве? Да. Нет человека, осуществляющего опрос? Все верно.

Есть еще одно огромное преимущество поиска в Google, заставляющее людей говорить правду – стимулы. Если вам нравятся расистские шутки, у вас нет причин поделиться этим фактом в ходе опроса. Тем не менее для поиска лучших новых расистских шуток онлайн они есть. Если вы считаете, что страдаете от депрессии, у вас нет мотива признать это во время опроса. Но он у вас есть, когда вы начинаете узнавать в Google о симптомах и возможных методах лечения.

Даже если вы врете самому себе, Google все же может узнать правду. За пару дней до выборов вы и некоторые из ваших соседей можете считать, что обязательно пойдете на избирательный участок и проголосуете. Но если ни вы, ни они не искали информацию о том, как и где голосовать, специалисты по поиску и обработке данных вроде меня могут сказать: явка в вашем районе будет низкой. Точно так же, возможно, вы еще не признались самому себе, что страдаете от депрессии – даже когда делаете в Google запросы о неконтролируемом плаче и о том, что с трудом вылезаете из постели. Это будет ясно по поисковым запросам о депрессии, о которых я говорил ранее.

Проанализируйте свой опыт общения с Google. Полагаю, время от времени вы вводите в поле запроса нечто такое, что выдает поведение или мысли, в которых вы постеснялись бы признаться в приличном обществе. В самом деле, очевидно, что подавляющее большинство американцев сообщают Google некоторые очень личные сведения. Например, они ищут «порно» чаще, чем «погода»{78}78
https://www.google.com/trends/explore?date=all&geo=US&q=porn,weather.

[Закрыть]. Это, кстати, мало согласуется с результатами одного опроса, в котором только около 25 % мужчин и 8 % женщин признаются в просмотре порнографии{79}79
Amanda Hess, «How Many Women Are Not Admitting to Pew That They Watch Porn?» («Сколько женщин не признаются в том, что они смотрят порно?»), 11 октября 2013, Slate, http://www.slate.com/blogs/xx_factor/2013/10/11/pew_online_viewing_study_percentage_of_women_who_watch_online_porn_is_growing.html.

[Закрыть].

Вы могли бы отметить определенную честность в результатах поиска Google, глядя на то, как поисковик автоматически пытается выполнить ваши запросы. Его предложения основаны на наиболее распространенных поисковых запросах, сделанных другими людьми. Таким образом, автоматический подбор информации по запросам показывает нам, что люди ищут в Google. На самом деле автозаполнение может немного вводить в заблуждение. Google не вставляет определенные слова, которые он считает неуместными{80}80
Nicholas Diakopoulus, «Sex, Violence, and Autocomplete Algorithms» («Секс, насилие и алгоритмы автозаполнения»), Slate, 2 августа 2013 года, http://www.slate.com/articles/technology/future_tense/2013/08/words_banned_from_bing_and_google_s_autocomplete_algorithms.html.

[Закрыть], вроде мата и «порно». Это означает, что, согласно автозаполнению, мысли человека, выраженные в Google, менее скабрезны, чем на самом деле. Но даже несмотря на это, все-таки порой происходят довольно пикантные недоразумения.

Если вы введете в строку поискового запроса «почему…», то первые два варианта в Google, в настоящее время автоматически завершающие вопросы – «Почему небо голубое?» и «Почему существует високосный год?» Система предполагает, что это две наиболее распространенные цели поиска. Третий вариант: «Почему мои какашки зеленые?» И это автозаполнение в Google может вызвать у вас беспокойство. Сегодня, если вы введете в поисковую строку: «Нормально ли – хотеть…», первое предложение автозаполнения – «убить». Если вы введете: «Нормально ли – хотеть убить…», то первый вариант автозаполнения – «мою семью».

Хотите больше доказательств того, что поиск Google может показать другую картину мира, отличную от той, которую мы обычно видим? Рассмотрим поисковые запросы, связанные с сожалениями относительно решения иметь или не иметь детей. Прежде чем принять это решение, некоторые пары опасаются сделать неправильный выбор, и почти всегда вопрос ставится именно так: будут ли они жалеть, что у них нет детей. Люди в семь раз чаще спрашивают у Google, будут ли они жалеть об отсутствии детей, чем о наличии.

После принятии решения, родить (усыновить/удочерить) ребенка или нет, люди иногда признаются в том, что раскаиваются в сделанном выборе. Это может показаться шокирующим, но после принятия решения цифры меняются местами. Взрослые с детьми в 3,6 раза чаще сообщают Google, что жалеют о своем решении, чем взрослые без детей{81}81
По моим оценкам, каждый месяц насчитывается около 1730 поисковых запросов американцев в Google в различных формулировках, где явно говорится: они сожалеют, что завели детей. И только около 50 выражают сожаление о том, что у них нет детей. Насчитывается около 15,9 млн бездетных американцев в возрасте старше 45 лет. Есть около 152 миллионов американцев, у которых есть дети. Это означает, что люди, имеющие детей, примерно в 3,6 раза чаще выражают сожаление Google, чем люди без детей. Очевидно, как уже упоминалось в тексте книги и подчеркивается здесь еще раз, эти исповеди в Google очень небольшого числа людей. По-видимому, подобные чувства достаточно сильны – настолько, что люди на мгновение забыли: Google не может помочь им.

[Закрыть].

Есть один нюанс, который следует иметь в виду, читая эту главу: Google может показывать смещение в сторону неблаговидных мыслей, которые люди наверняка не могут обсуждать с кем-либо еще. При этом, если мы пытаемся раскрыть эти мысли, возможности Google могут оказаться весьма полезны. И большое различие между сожалениями о решении иметь и не иметь детей может многое сообщить нам об этих неуместных мыслях.

Давайте на мгновение остановимся и задумаемся, что на самом деле означает поисковый запрос вроде:

«Я сожалею, что завел(-а) детей». Компания Google позиционирует себя как источник, непосредственно из которого мы можем черпать информацию на такие темы, как погода, кто выиграл вчерашний матч или когда была возведена статуя Свободы. Но иногда мы печатаем в Google свои мысли без оглядки на цензуру, без особой надежды на то, что эта система даст нам прямой ответ. В этом случае поисковое окно служит своего рода исповедником.

Ежегодно фиксируются тысячи поисковых запросов вроде «Я ненавижу холодную погоду», «Меня раздражают люди» и «Мне грустно». Конечно, эти тысячи «мне грустно» представляют собой лишь малую часть из сотен миллионов людей, которым в этом году было тоскливо. Мои исследования показали: запросы, выражающие мысли вместо поиска определенной информации, принадлежат лишь небольшой части тех, кому эти идеи приходят на ум. Аналогично мои исследования показывают, что тысячи американцев, ежегодно вводящих в поисковик фразу «Я сожалею, что у меня есть дети», представляют собой лишь небольшую выборку из тех, кому в голову пришла эта мысль.

Дети, безусловно, огромная радость для многих – скорее всего, для большинства. И несмотря на страх моей мамы, что «ты и твой глупый анализ данных» может ограничить количество ее внуков, это исследование не изменило моего желания иметь детей. Но это неприглядное сожаление интересно – это другой аспект человечества, о котором мы вряд ли могли бы узнать на основе традиционных данных. Наша культура постоянно заваливает нас изображениями прекрасных, счастливых семей. Большинство людей никогда даже не предполагали, что могут пожалеть о наличии детей. Но некоторые жалеют. И они не могут признаться в этом никому – кроме Google.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Купить легальную копию

Страницы книги >> Предыдущая | 1 2 3 4 5 6

Скачать книгу "Все лгут. Поисковики, Big Data и Интернет знают о вас всё"

- 88
- 1
- 2
- 3
- 4
- 5
4.4 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?

Текст книги "Все лгут. Поисковики, Big Data и Интернет знают о вас всё"

Автор книги: Cет Cтивенс-Давидовиц

Жанр: Зарубежная компьютерная литература, Зарубежная литература

Глава 4
Цифровая сыворотка правды

Популярные книги за неделю

Жанры библиотеки

Популярные серии книг

По году издания

Рекомендации

Текст книги "Все лгут. Поисковики, Big Data и Интернет знают о вас всё"

Автор книги: Cет Cтивенс-Давидовиц

Жанр: Зарубежная компьютерная литература, Зарубежная литература

Глава 4Цифровая сыворотка правды

Популярные книги за неделю

Жанры библиотеки

Популярные серии книг

По году издания

Рекомендации

Глава 4
Цифровая сыворотка правды