Электронная библиотека » Андреас Вайгенд » » онлайн чтение - страница 5


  • Текст добавлен: 27 сентября 2018, 11:40


Автор книги: Андреас Вайгенд


Жанр: Базы данных, Компьютеры


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 5 (всего у книги 20 страниц) [доступный отрывок для чтения: 6 страниц]

Шрифт:
- 100% +

Разумеется, по мере своего роста компания Facebook поняла, что она, как и Google, может зарабатывать на рекламе в интернете. Содержание постов создавало даже больше возможностей для адресной рекламы, чем электронные письма. Люди указывали свое семейное положение, уровень образования, политические взгляды и религиозные убеждения; создавали списки любимых фильмов, телесериалов, книг и музыкальных произведений; отчитывались о своих путешествиях; делились мнениями об огромном количестве брендов и рекламных кампаний. Они выкладывали фото – свои, своих детей, любимых собак и кошек. Все это предназначалось аудитории друзей и родственников. Летом 2008 года я оказался в главном офисе Facebook как раз в тот день, когда компания начала размещать на сайте персонализированную рекламу[85]85
  Я посещал одного из своих бывших студентов, ставшего одним из первых специалистов по обработке и анализу данных компании.


[Закрыть]
. На рекламных объявлениях нового типа присутствовала кнопка обратной связи. Если пользователю не нравилось то, что ему показывают, его просили объяснить почему. Чтение поступающих отзывов стало откровением. Люди жаловались не на то, что рекламщики используют слишком много личных данных, которые они разместили в Facebook, а на то, что они используют их недостаточно. Типичный пример: «В моем профайле черным по белому написано, что я мужчина, который интересуется мужчинами. С какой стати я получаю рекламу, предлагающую «знакомства с женщинами за пятьдесят»?» Пользователи просили рекламировать то, что может им действительно понадобиться.

В 2016 году Facebook стукнуло тринадцать. Скоро мы увидим поколение, о детстве которого во всех подробностях рассказали в Facebook родители, бабушки и дедушки еще задолго до того, как детишки смогли официально открыть собственный аккаунт. В прошлом у выпускника средней школы была на руках куча документов: свидетельство о рождении, карта вакцинации, диплом и табель успеваемости. У подавляющего большинства были и водительские права[86]86
  В разных странах удостоверением личности могут служить разные документы. Сегодня в США водительские права есть примерно у половины восемнадцатилетних, и это резкое падение по сравнению с ситуацией десятилетней давности, когда они были у двух третей их тогдашних сверстников. См. Halsey, Ashley III, “Fewer Teens Get Driver’s Licenses”, Washington Post, July 31, 2013, http://www.washingtonpost.com/local/trafficandcommuting/fewer-teens-get-drivers-licenses/2013/07/31/60a32aae-f9c7–11e2-a369-d1954abcb7e3_story.html. В 2012 году паспорт был у трети граждан США, а в 1989-м – у ничтожных трех процентов. См. Bender, Andrew, “Record Number of Americans Now Hold Passport”, Forbes, January 30, 2012, http://www.forbes.com/sites/andrewbender/2012/01/30/record-number-of-americans-now-hold-passports.


[Закрыть]
. У некоторых были рекомендательные письма от работодателей или религиозных наставников, а возможно, и паспорт. Сравните тех подростков с нынешними детьми, которые подходят к пубертатному возрасту с полным набором открытой информации о себе, созданной родителями, дедушками и бабушками, тетями, дядями, старшими братьями и сестрами и друзьями семьи. Можно найти снимки УЗИ, сделанные до рождения, комментарии о трудностях воспитания малыша, молитвы о поправке здоровья и любые подробности относительно внешности, навыков и увлечений. Почему Facebook все еще запрещает заводить аккаунты тем, кому не исполнилось тринадцати? Гораздо разумнее было бы открывать страницу каждому появившемуся на свет младенцу[87]87
  Возможно, Facebook выбрала возраст 13 лет, чтобы компании было проще соответствовать требованиям Закона о защите конфиденциальности детей в интернете (COPPA) 1998 года, требующего, чтобы коммерческие сайты, предназначенные для лиц младше тринадцати, получали согласие их родителей или опекунов на сбор личных данных. См. https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule.


[Закрыть]
. Это сможет обеспечить каждому уникальный общепринятый идентификатор, который можно использовать или не использовать по собственному усмотрению. Кроме того, социальные данные будут привязаны к учетной записи, что позволит людям самостоятельно определять их содержание по достижении возраста, в котором законодательство будет это разрешать.

Мы проделали путь от открытого очага, подразумевающего публичность человеческого существования с минимальными возможностями для частной жизни, до законодательного признания права на тайну личной жизни в стенах своих спален, а также конфиденциальности в кабинках для голосования. По мере вплетения интернета в ткань общественной жизни мы не огорчились тому, что наша частная жизнь будет «предана гласности» в обмен на возможность бесплатного и прямого контакта с родными, близкими и совершенно незнакомыми людьми. Период с момента зарождения понятия приватности до отказа от нее занял всего пару веков – не более чем мимолетное мгновение истории человечества.


деревенские сплетни

отсутствие частной жизни


камины и миграция в города (1600-е годы)

социальная обособленность и появление понятия частной жизни


четвертая поправка к Конституции США (1792 год) и переход к тайному голосованию (1856–1896 годы)

приватность приходит в политику


«Право на неприкосновенность частной жизни» (1890 год)

тайна частной жизни узаконена


Google, Facebook и иже с ними (наши дни)

тайна частной жизни – иллюзия, и нам нравится делиться информацией о себе


Мы заботливо оберегали свою частную жизнь на протяжении последних ста лет, но настало время признать, что ее тайна – всего лишь иллюзия. Мы хотим иметь возможность привлекать к себе внимание, ощущать себя частью чего-то большего и контактировать с людьми. Идея, осенившая судью Брэндиса, была прекрасна, но это была идея его эпохи, когда информация была скудной, общественная жизнь ограничивалась рамками местного сообщества, а коммуникации стоили дорого. Тогда было просто предотвратить публикацию своей фотографии в случае, если она вам не нравилась. Сегодня это не так. Кроме того, для демократии анонимность не является настройкой по умолчанию. Лучше создать новые нормы, учитывающие реалии настоящего и возможности будущего, чем идеализировать приватность и надеяться на то, что законы прошлого будут защищать нас и впредь. Чтобы поставить информацию на службу людям, нужны прозрачность и свобода выбора.

Вместо того чтобы тратить силы на разграничение личного и публичного и выстраивать стены, ограждающие информацию (или ограждающие от нее), давайте сосредоточимся на возможности быть самими собой. Это позволит нам в полной мере использовать инфопереработку и достичь баланса между потенциально негативными и потенциально позитивными последствиями распространения социальных данных.

Все в интернете знают, что ты собака

В том, что касается социальных данных, тайны частной жизни не существует. Ее больше нет. Подпись под знаменитой карикатурой из журнала «Нью-Йоркер» гласила: «В интернете никто не знает, что ты собака»[88]88
  Газета «Нью-Йорк Таймс» пишет, что эта карикатура, опубликованная 5 июля 1993 года, вопроизводилась в других СМИ больше, чем любая другая за всю историю существования журнала. См. Fleishman, Glenn, “Cartoon Captures Spirit of the Internet”, New York Times, December 14, 2000, http://www.nytimes.com/2000/12/14/technology/cartoon-captures-spirit-of-the-internet.html.


[Закрыть]
. С 1993 года, когда была опубликована эта карикатура, изменилось очень многое. Сегодня правильнее было бы сказать: «Весь интернет знает, что ты собака. Ошейник у тебя синий. Ты гоняешь кошек. А твои хозяева уехали отдыхать». Это потому, что ты сам сообщил эту информацию инфопереработчикам, чтобы иметь возможность общаться с друзьями и получать персональные рекомендации. Это твоя плата за возможность ознакомиться с рекламой кормов Purina Puppy Chow. А все думали, что в интернете можно оставаться анонимным.

Но информация была привязана к «удостоверению личности» задолго до появления Facebook. В середине 1990-х годов теоретик информатики Латания Суини решила выяснить, насколько в действительности анонимна «анонимная» база данных о состоянии здоровья[89]89
  Суини провела этот эксперимент, будучи студенткой магистратуры МТИ. Сейчас она преподает государственное управление и технологии в Гарвардском университете и является директором его Лаборатории защиты информации


[Закрыть]
. Штат Массачусетс решил, что предоставление научному сообществу информации о посещениях госслужащими врачей в клиниках соответствует государственным интересам. Не будучи совсем дураками, чиновники понимали, что передавать эти данные с указанием имен людей нельзя, и удалили ряд идентификаторов – фамилии, адреса и номера карточек социального страхования. Но поскольку статистика предназначалась для целей совершенствования системы здравоохранения, кое-какие данные о пациентах в ней оставили – пол, дату рождения и почтовый индекс. Сопоставив эти три элемента информации с другой базой данных – списками избирателей, зарегистрированных по городскому округу Кембриджа, официально доступных любому человеку за плату в двадцать долларов, Суини смогла вычислить медицинскую карту губернатора штата. После чего доктор Суини «сделала театральный жест, направив копию медицинской карты губернатора со всеми диагнозами и выписанными рецептами прямо ему в офис»[90]90
  Ohm, Paul, “Broken Promises of Privacy: Responding to the Surprising Failure of Ano-nymization”, UCLA Law Review 57, no. 6 (August 2010), p. 1720, http://www.uclalawreview. org/broken-promises-of-privacy-responding-to-the-surprising-failure-of-anonymization-2.


[Закрыть]
.

По оценке Суини, зная пол, возраст и почтовый индекс человека, можно идентифицировать 87 процентов населения США[91]91
  Sweeney, Latanya, Uniqueness of Simple Demographics in the U. S. Population, Laboratory for International Data Privacy working paper LIDAP-WP4–2000, http://dataprivacylab.org/projects/identifiability/index.html.


[Закрыть]
. Более поздние исследования понизили этот показатель до примерно 63 процентов – тоже поразительно много, учитывая, что это можно сделать без использования намного более точных сведений, которыми люди постоянно делятся в Facebook и на других сайтах, где собирают социальные данные[92]92
  Golle, Philippe, “Revisiting the Uniqueness of Simple Demographics in the U. S. Population”, Proceedings of the 5th ACM Workshop on Privacy in the Electronic Society (New York: Association for Computing Machinery, 2006), pp. 77–80, http://dl.acm.org/citation. cfm?id=1179615.


[Закрыть]
. Почему для идентификации личности человека нужно столь мало информации, поясняет порядковый расчет. В США примерно 40 000 активных почтовых индексов и около 300 миллионов человек населения, из чего следует, что на один почтовый индекс приходится примерно по 7000 жителей, которые приблизительно поровну делятся на мужчин и женщин[93]93
  US Post Office FAQ, http://faq.usps.com. Если бы были присвоены все 90 000 возможных номеров (10000–99999), процент возможности точной идентификации людей был бы еще выше. Другая причина невозможности более высокого процента возможности точной идентификации состоит в неравномерном распределении населения США по почтовым индексам.


[Закрыть]
. Если предположить, что количество новорожденных равномерно распределяется по количеству дней в году, то получается, что «привязанными» к одному почтовому индексу будут по десять мужчин или женщин с одинаковым днем рождения.

Теперь посмотрим на социальные данные, которыми обычно располагает инфопереработчик. Представление о том, что человека нельзя идентифицировать по его цифровому следу, рассыпалось в пух и прах после того, как два крупнейших инфопереработчика поделились «обезличенными» социальными данными с учеными. Сначала интернет-провайдер AOL предоставил для исследовательских целей историю поиска 658 000 пользователей за трехмесячный период. Однако по чьей-то оплошности эти данные оказались в сети, и двум журналистам из газеты «Нью-Йорк таймс» удалось установить личности нескольких человек по их поисковым запросам[94]94
  Barbaro, Michael, and Tom Zeller, Jr., “A Face Is Exposed for AOL Searcher No. 4417749”, New York Times, August 9, 2006, http://www.nytimes.com/2006/08/09/technology /09aol.html.


[Закрыть]
. Это оказалось довольно просто, поскольку люди любят искать информацию о самих себе или своих родственниках или прокладывать маршруты от своего домашнего адреса. Затем интернет-видеосервис Netflix устроил конкурс на самый точный прогноз оценки, которую зритель поставит фильму, на основе анализа предыдущих оценок других пользователей. Для построения алгоритмов участникам нужны были данные, и компания предоставила «100 миллионов оценок, поставленных 480 000 клиентами, с датой каждой оценки»[95]95
  Singel, Ryan, “Netflix Spilled Your Brokeback Mountain Secret, Lawsuit Claims”, Wired, December 17, 2009, http://www.wired.com/2009/12/netflix-privacy-lawsuit.


[Закрыть]
. Имена клиентов не раскрывались, но двум ученым из Университета штата Техас в Остине, Арвинду Нараяну и Виталию Шматикову, удалось деанонимизировать людей из базы данных путем сопоставления обезличенной информации с рецензиями, опубликованными на сайте IMDB.com[96]96
  Narayan, Arvind, and Vitaly Shmatikov, “Robust De-Anonymization of Large Sparse Datasets”, paper presented at the 2008 IEEE Symposium on Security and Privacy, Oakland, CA, May 18–21, 2008, pp. 111–125, http://dl.acm.org/citation.cfm?id=1398064.


[Закрыть]
. В чем, собственно, проблема, если эти рецензии уже были достоянием гласности? А в том, что клиенты Netflix не выкладывают отзывы о всех фильмах, которые смотрят, и некоторые из репертуара «тайно любимых» ими фильмов были весьма показательными. По крайней мере, так утверждала истица, чье имя не разглашается, подавшая на Netflix в суд. У нее возникли опасения, что теперь каждый из 50 000 ученых, получивших доступ к базе данных конкурса, знает, что она лесбиянка.

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше[97]97
  Судя по Google Trends, “большие данные” не были на слуху у общественности до 2011 года.


[Закрыть]
.

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство»[98]98
  Что касается темы самоубийства, метаанализ, проведенный учеными Оксфордского университета, показал, что «существенно более половины (59 процентов) опрошенных молодых людей сказали, что вели поик в интернете по слову ‘самоубийство’». См. Daine, Kate, Keith Hawton, Vinod Singaravelu, Anne Stewart, Sue Simkin, and Paul Montgomery, “The Power of the Web: A Systematic Review of Studies of the Influence of the Internet on Self-Harm and Suicide in Young People”, PLoS One 8, no. 10 (October 30, 2013), http://journals.plos.org/plosone/article?id=10.1371/journal. pone.0077555.


[Закрыть]
. Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек[99]99
  Эту цифру назвал сержант Калифонийской дорожной полиции Кевин Бриггс, выступая с рассказом о патрулировании моста Золотые Ворота на TED Talk. См. Briggs, Kevin, “The Bridge Between Suicide and Life”, TED Talk, March 21, 2014, https://www.ted.com/talks/kevin _briggs_the_bridge_between_suicide_and_life.


[Закрыть]
. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас[100]100
  Вы можете сделать это на своей страничке “My Amazon”: https://www.amazon.com/gp/yourstore /iyr.


[Закрыть]
. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.

Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать[101]101
  Facebook называет это «удалением», но эта информация не удаляется насовсем. Происходит это потому, что найти и вычистить все случаи ее появления на серверах значительно дороже, чем сохранять их, изменив способ пользования. Кроме того, в главе 3 мы убедимся, что Facebook постоянно экспериментирует, чтобы усовершенствовать взаимодействие с пользователями и повысить их активность. В одном из исследований рассматривалась самоцензура – случаи, когда люди начинали писать апдейты и комментарии, но в конечном итоге решали не публиковать их. Отмененные апдейты и комментарии нельзя удалить, поскольку их не публиковали, и тем не менее в Facebook изучают их контекст – всевозможные «как и где». См. Das, Sauvik, and Adam Kramer, “Self-Censorship on Facebook”, Proceedings of the 7th International AAAI Conference on Weblogs and Social Media, Cambridge, MA, July 8–11, 2013 (Palo Alto: AAAI Press, 2013), https://www.aaai.org/ocs/index.php/ICWSM/ICWSM13/paper/viewFile/6093/6350.


[Закрыть]
.

Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа[102]102
  Bachrach, Yoram, Michal Kosinski, Thore Graepel, Pushmeet Kohli and David Stillwell, “Personality and Patterns of Facebook Usage”, Proceedings of the 4th Annual ACM Conference on Web Sciences, Evanston, IL, June 22–24, 2012 (New York: Association for Computing Machinery, 2012), pp. 24–32, http://dl.acm.org/citation.cfm?id=2380722.


[Закрыть]
. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.

В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека[103]103
  Kosinski, Michal, David J. Stillwell and Thore Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, Proceedings of the National Academy of Sciences USA 110, no. 15 (April 9, 2013), p. 5802, http://www.pnas.org/content/early/2013/03/06/1218772110. Одна из трудностей, возникающих при оценке состоятельности подобных научных трудов, вызвана статистикой свойств личности. Так, если модель построена исходя из предпосылки гетеросексуальной ориентации 100 процентов анализируемых мужчин, она будет точной в 90 процентов случаев, поскольку примерно 10 процентов пользователей мужского пола указывают на наличие у себя «интереса к мужчинам». Тем не менее, выводы исследования на основе приложения YouAreWhatYouLike представляют интерес, особенно в силу того, что такие индивидуальные особенности, как, например, уровень интеллектуального развития, выявляются другими методами.


[Закрыть]
. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan[104]104
  Хип-хоп-группа. – Ред.


[Закрыть]
[105]105
  Kosinski, Stillwell, and Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, p. 5804.


[Закрыть]
. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости[106]106
  Для доступа к лайкам в Facebook исследователи использовали программный интерфейс приложения (API); им было труднее идентифицировать тех, кто использовал настройки приватности для ограничения доступа к своим лайкам, даже несмотря на их согласие участвовать в оценке индивидуальных особенностей. См. http://applymagicsauce.com. В интервью Косински говорил: «Это может приносить огромную пользу в деле подбора персонала»; Adams, Stephen, “‘Like’ Curly Fries on Facebook? Then You’re Clever”, Telegraph, March 12, 2013, http://www.telegraph.co.uk/technology/news/9923070/Like-curly-fries-on-Facebook-Then-youre-clever.html.


[Закрыть]
.

Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью[107]107
  Simonite, Tom, “Facebook’s New AI Research Group Reports a Major Improvement in Face-Processing Software”, MIT Technology Review, March 17, 2014, http://www.technologyreview.com/news/525586/facebook-creates-software-that-matches-faces-almost-as-well-as-you-do; Taigman, Yaniv, Ming Yang, Marc’Aurelio Ranzato, and Lior Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”, paper presented at the IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, June 24–27, 2014, pp. 1701–1708, https://www.cs.toronto.edu/~ranzato/publications/taigman_cvpr14.pdf.


[Закрыть]
. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее[108]108
  Синтия использует этот пример в своей лекции под названием «Я – в базе данных (Но никто об этом не знает)»; I’m in the Database (But Nobody Knows), Dean’s Lecture, University of California – Berkeley School of Information, February 4, 2015, http://www.ischool.berkeley.edu/newsandevents/events/deanslectures/20150204.


[Закрыть]
.

Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это так называемые малые данные. Они не сопоставимы с уму непостижимым количеством «следов», которые накапливают современные центры обработки «больших данных». Чтобы получить от инфопереработчика нечто действительно полезное, надо предоставить ему точные исходные данные, например о ваших интересах и предпочтениях. Если вы не готовы поделиться этой информацией, придется удовлетвориться рекомендациями для среднестатистического гражданина, то есть тем, что пользуется популярностью или подходит большинству обывателей. Если вы предоставите неверные исходные данные, то, скорее всего, получите совершенно бесполезные результаты на выходе. Альтернатива выглядит так – незначительный выигрыш в приватности оборачивается проигрышем в полезности.

Что за псевдонимом?

Решение предоставлять или не предоставлять личную информацию влечет за собой последствия. В одной ситуации раскрытие своих идентификационных данных может оказаться рискованным или вредным; в другой ситуации то же самое может произойти, если они не предоставлены. Цифровые следы, оставленные нами, делают анонимность практически невозможной.

Тем не менее использование реальных имен на социальных платформах начало становиться нормой только с появлением Facebook. До этого обычно использовались псевдонимы. Отчасти это было обусловлено чисто техническими причинами. Некоторые имена распространены настолько широко, что в случае использования настоящих имен различать пользователей было бы невозможно; кроме того, некоторые сайты не принимали имена с большим количеством букв. В то же время были люди, осознанно не желавшие раскрывать имя, опасаясь хищений личных данных или неприятностей в связи со своими высказываниями, не совпадающими с общепринятым мнением. Так или иначе, но при желании можно было создавать разные имена пользователей или даже несколько для каждого сервиса или интернет-форума. В результате в первые десятилетия существования интернет предоставлял неслыханные ранее возможности для фрагментирования собственной персоны. А различные псевдонимы позволяли человеку исследовать новые способы взаимодействия с окружающими.

Исторически человека идентифицировали по ряду простых признаков, вроде имени, даты рождения, роста, цвета глаз, национальности и места жительства. Эта базовая информация использовалась для подтверждения того, что человек действительно тот, кем он представляется. Возможность подтвердить личность – необходимое условие выполнения многих законов и правил. Веками для доказательства права на посещение территорий использовались паспорта[109]109
  Формат паспортов стран был стандартизирован лишь вскоре после Первой мировой войны, но сама идея государственного документа, удостоверяющего личность путешественника, значительно старше – слово «паспорт» появилось в английском языке около 1540 года. См. Benedictus, Leo, “A Brief History of the Passport: From a Royal Letter to a Microchip”, Guardian, November 17, 2006, http://www.theguardian.com/travel/2006/nov/17/travelnews.


[Закрыть]
, а чеки и гарантийные письма служили подтверждением того, что в каком-то далеком банке у нас есть средства, достаточные для оплаты покупки[110]110
  Подлинность чеков требовалось удостоверить – на ранних этапах это делалось путем сличения подписи на чеке с оригиналом из банковского досье. См. Quinn, Stephen, and William Roberds, “The Evolution of the Check as a Means of Payment: A Historical Survey”, Economic Review 93, no. 4 (December 2008), https://www.frbatlanta.org/-/media/Documents/research/publications/economic-review/2008/vol93no4_quinn_roberds.pdf.


[Закрыть]
. Возраст или гражданство предоставляют определенные права и обязанности по отношению к обществу, например избирательное право или право употреблять алкоголь в общественных местах, или обязанность платить налоги, или нести воинскую повинность. Мы приучены к тому, что в огромном количестве жизненных ситуаций необходимо предъявить официальное удостоверение личности или сообщить его номер, ввести пароль или ответить на ряд вопросов, диапазон которых – от количества часов, проводимых в авиаперелетах, до домашних животных, которые были у нас в детстве.

Многие из оставляемых вами цифровых следов создаются через взаимодействие с физическими устройствами, и в этом взаимодействии есть немало характерных особенностей, позволяющих вас идентифицировать. Поскольку для выхода в интернет все чаще используются мобильные телефоны и планшеты, многие инфопереработчики вкладывают значительные ресурсы в исследования возможностей идентификации личности на основе устойчивых особенностей поведения при использовании разных устройств. Самым простым способом является требование регистрации пользователя, однако существуют более тонкие признаки, например установленные шрифты. Кроме того, многим людям свойственно постоянно делать одни и те же опечатки. Эта особенность также может быть установлена.

Оставляет след и само физическое взаимодействие с устройством. Сооснователь израильской компании BioCatch Ури Ривнер считает, что цифровые «отпечатки пальцев», то есть манера пользователя работать с компьютером, планшетом или мобильным телефоном, являются «одним из способов опознания личности»[111]111
  Цитируется по: Leber, Jessica, “Forget Passwords: This Startup Wants to Authenticate Your Mind”, Fast Company Exist, July 24, 2014, http://www.fastcoexist.com/3033383/forget-passwords-this-startup-wants-to-authenticate-your-mind.


[Закрыть]
. BioCatch создает свою коллекцию данных, заставляя не догадывающихся об этом пользователей выполнять действия, подтверждающие их личности. Компанию не интересует, что именно вы ищете, зато ее интересует, как вы это делаете. Вы бодро ударяете по тачскрину или мягко пошлепываете по нему? Насколько сильно дрожит ваша рука с мобильным телефоном? Где именно на экране вы указываете прокрутку вверх или вниз? Как быстро вы двигаете мышкой? Предпочитаете открывать новые вкладки через ссылки или перемещаетесь между несколькими вкладками? В числе заказчиков BioCatch – банки, которым требуются дополнительные способы аутентификации клиентов[112]112
  O’Hear, Steve, “Pre-Crime Startup BioCatch Authenticates Users via Touch and Your Phone’s Accelerometer”, TechCrunch, July 7, 2015, http://techcrunch.com/2015/07/07/pre-crime-startup-biocatch-authenticates-users-via-touch-and-your-phones-accelerometer.


[Закрыть]
. Анализ данных в режиме реального времени может быть полезен для идентификации личности и в других случаях, например, когда документов недостаточно или нет при себе в данный момент.

Детские игровые сайты и приложения вызывают целый ряд вопросов – от безопасности пользователя до адекватности контента. Самый простой пример – сайт, предлагающий игры для пользователей в возрасте от шести до шестнадцати лет, должен обеспечить правильное предложение для игроков соответствующего возраста. При этом разработчиков игр не слишком заботит, что восьмилетний ребенок может начать игру, предназначенную для подростков, – считается, что слишком трудная игра ребенка быстро разочарует, а слишком простая так же быстро ему наскучит. Ориентироваться на введенные регистрационные данные сайт не может, поскольку ребенок имеет возможность зайти на сайт с компьютера, которым пользуется кто-то из других членов семьи. Поэтому для оценки возраста пользователя сайты анализируют его взаимодействие с игрой. Часто для обеспечения безопасности в чатах игроков им оставляют только возможность использовать набор готовых фраз – это позволяет избежать риска неумышленного предоставления ребенком домашнего адреса или другой важной информации взрослому, изображающему ребенка. Оказалось, что дети старшего возраста используют другие, чем малыши, готовые фразы. Кроме того, системы игровых сайтов могут определять возраст ребенка с точностью до трех-шести месяцев по характеру движений мышью, которые тесно коррелируют с уровнем развития мелкой моторики, различной в разных возрастах[113]113
  Рост моторных навыков ребенка останавливается примерно в тринадцатилетнем возрасте (беседа автора с Лэйном Меррифилдом – генеральным директором FreshGrade и сооснователем Club Penguin, 21 января 2016 года). После приобретения Club Penguin компанией Disney в 2007 году Лэйн стал исполнительным вице-президентом интернет-подразделения этой медийной компании, а сейчас занимается над образовательным технологическим стартапом FreshGrade.


[Закрыть]
.

Обмануть алгоритмы машинного осмысления, рассматривающие подобные неявные следы, намного сложнее, чем подделать явные отличительные признаки. Если вы находитесь в больнице и человек в белом халате и со стетоскопом на шее просит вас раздеться, вы, скорее всего, решите, что это врач. Но в то же время хорошо известно, что люди по тем или иным причинам порой выдают себя за других. В январе 2015 года в одном из медицинских центров штата Флорида полиция задержала семнадцатилетнего молодого человека, в течение месяца выдававшего себя за доктора. Чтобы проходить через охрану на входе, ему было достаточно белого халата и стетоскопа.

Исторически псевдонимы служили одним из средств обеспечения свободы слова. Статьи из цикла «Федералист»[114]114
  Цикл из 85 статей в поддержку ратификации Конституции США, печатавшихся с октября 1787 года по август 1788-го в нью-йоркских газетах The Independent Journal и The New York Packet. – Ред.


[Закрыть]
, первая из которых увидела свет в 1787 году, содержали решительную отповедь резкой критике только что увидевшего свет проекта Конституции США. Они были подписаны псевдонимом Публий, скрывавшим авторство Александра Гамильтона, Джеймса Мэдисона и Джона Джея. Лишь немногие из участников той дискуссии выступали под своими настоящими именами[115]115
  О первых попытках компьютерного анализа словесных моделей в статьях см. Mosteller, Frederick, and David Wallace, Inference and Disputed Authorship: The Federalist (Reading, MA: Addison-Wesley, 1964).


[Закрыть]
. Позже англичанка Мэри Энн Эванс использовала псевдоним Джордж Элиот, чтобы не стать жертвой шаблонного снисходительного отношения к женщинам-писательницам, характерного для XIX века. В своем (тоже анонимном) эссе она отзывалась о написанных дамами романах как о «глупых, поверхностных, банальных, ханжеских или поучающих»[116]116
  Anonymous, “Silly Novels by Lady Novelists”, Westminster Review, new series, vol. 10 (October 1856), p. 442.


[Закрыть]
. Ей хотелось, чтобы ее творчество воспринималось всерьез, и она опасалась, что это будет невозможно, если читатели увидят на обложке женское имя.

Иногда причиной для использования псевдонима является не столько стремление к свободе самовыражения, сколько желание порвать с прошлым. В 1947 году человек по имени Ганс Фаллада (настоящее имя – Рудольф Дитцен) написал роман «Каждый умирает в одиночку» – историю немецкой супружеской четы, молчаливо сопротивляющейся нацистскому режиму. Сюжет книги был частично основан на реальных событиях: советский атташе по культуре поручил Фалладе ознакомиться с архивами гестапо и создать великое антифашистское произведение[117]117
  Wilkes, Geoff, “Afterword”, in Alone in Berlin [Английское название романа Jeder stirbt für sich allein (“Каждый умирает в одиночку”)] (London: Penguin, 2009), pp. 578–579.


[Закрыть]
. Фалладу не сильно заботило, что его хорошо известное писательское имя будет связано с политическим заказом. Псевдоним он взял за много лет до этого: похоже, он хотел вырвать свою литературную репутацию из кольца личных проблем[118]118
  Фаллада не только совершил попытку самоубийства, что само по себе было сочтено постыдным, он договорился о совместном самоубийстве с другим человеком, которого ему удалось тем самым погубить. См. Oltermann, Philip, “The Cow, the Shoe, Then You”, London Review of Books 34, no. 5 (March 8, 2012), p. 27.


[Закрыть]
.

У этих знаменитых псевдонимов есть одна общая черта: обладатели хотели сделать их реальными именами с собственной репутацией. Все статьи Публия были написаны в поддержку ратификации Конституции. Все произведения Элиота и Фаллады были опубликованы под этими именами. Авторы хотели, чтобы их творчество идентифицировалось именно так.

На заре интернета возможность использования нескольких псевдонимов казалась превосходным вариантом. К сожалению, с этим была некая проблема: создать новый псевдоним легко, но можно ли быть уверенным в том, что он не связан с человеком, которого вытурили с сайта за неделю до этого? Сайт может потребовать, чтобы с каждым псевдонимом регистрировался и адрес электронной почты, но создать новый адрес тоже не проблема. Некоторые сайты отреагировали усложнением регистрационных форм, заполнение которых требовало несколько более серьезных усилий при создании аккаунта, но это не остановило мошенников, которые стали нанимать для заполнения анкет людей или использовать специальные программы – боты. Искоренить такими способами то, что экономист Эрик Фридман и информатик Пол Резник назвали «социальными издержками дешевых псевдонимов», невозможно[119]119
  Основополагающая научная работа по этой теме – Friedman, Eric J., and Paul Resnick, “The Social Cost of Cheap Pseudonyms”, Journal of Economics and Management Strategy 10, no. 2 (Summer 2001), pp. 173–199, http://onlinelibrary.wiley.com/doi/10.1111 /j.1430–9134.2001.00173.x/abstract.


[Закрыть]
.

В каких случаях целесообразно использовать псевдоним, а в каких – реальное имя? Это зависит от ситуации. Когда взаимное доверие требуется с самых первых шагов взаимодействия, например, когда речь идет о банковских счетах или о выпуске кредитной карточки, политика «реального имени» полностью оправдана, поскольку включает в информационное поле и историю поведения клиента в прошлом. Напротив, использование псевдонима подразумевает необходимость выстраивания репутации с нуля.

Когда я работал в Amazon, мы занимались исследованием на тему, какие отзывы пользователи считают более полезными – опубликованные под настоящими именами или под псевдонимами[120]120
  В Amazon обсуждались три варианта: практически анонимные отзывы, когда создать новое имя пользователя не составляет никакого труда; отслеживаемые отзывы под псевдонимом, когда пользователь может выбрать любое имя, но оно будет привязано к его эккаунту, удостоверенному действующей кредитной картой; или отзывы под настоящим именем, привязанным к дейстующей кредитной карте, но с возможностью использования первого инициала автора вместо имени в случае, если он не хочет показывать свой пол.


[Закрыть]
. Выяснилось, что отзывы зарегистрированных пользователей Amazon, опубликованные под псевдонимом, несколько реже считают «бесполезными». Мы также убедились в том, что пользователи придают большее значение отзывам, опубликованным с указанием имени автора. Даже если пользователь Amazon изменяет свое имя на сайте, то соответственно изменяются и все его подписи под отзывами как текущими, так и сделанными в прошлом, поэтому история отзывов данного человека полностью сохраняется. Идентификация реального человека с историей его отзывов всегда совпадает, в отношении комментариев под псевдонимом этого утверждать нельзя. Можно было бы настаивать на том, чтобы отзывы публиковались под реальными именами, тем более что реальность имен клиентов Amazon подтверждается данными их кредитных карточек. Но оказалось, что наиболее важным фактором является указание на то, что данный пользователь действительно купил этот товар. Люди действительно больше верят мнению реального человека, но более убедительным аргументом для них служит факт того, что товар был куплен, а не имя автора. С учетом этого в Amazon пересмотрели методику расчета средней оценки товаров, придав больший вес отзывам о действительно купленных товарах[121]121
  Rubin, Ben Fox, “Amazon Looks to Improve Customer-Reviews System with Machine Learning”, CNet, June 19, 2015, http://www.cnet.com/news/amazon-updates-customer-reviews-with-new-machine-learning-platform.


[Закрыть]
. (Кроме того, Amazon судилась с некоторыми компаниями, которые предположительно платили потребителям за «пятерочные» отзывы о своей продукции[122]122
  Rubin, Ben Fox, “Amazon Sues Alleged Reviews-for-Pay Sites”, CNet, April 9, 2015, http://www.cnet.com/news/amazon-sues-alleged-reviews-for-pay-sites. Оказалось, что некоторые компании отправляли заказной почтой пустую коробку или конверт, чтобы получить статус «Подтвержденной покупки».


[Закрыть]
.)


Страницы книги >> Предыдущая | 1 2 3 4 5 6 | Следующая
  • 3.4 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации