Электронная библиотека » Эрец Эйден » » онлайн чтение - страница 1


  • Текст добавлен: 15 июля 2016, 14:20


Автор книги: Эрец Эйден


Жанр: Зарубежная компьютерная литература, Зарубежная литература


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 1 (всего у книги 15 страниц) [доступный отрывок для чтения: 4 страниц]

Шрифт:
- 100% +

Эрец Эйден, Жан-Батист Мишель
Неизведанная территория
Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Моему папе, который всегда верил, что я умею считать

– ЭРЕЦ ЭЙДЕН —


Моей семье

– ЖАН-БАТИСТ МИШЕЛЬ —

* * *

Erez Aiden and Jean-Baptiste Michel

Uncharted: Big Data as a Lens on Human Culture


Дизайн обложки: студия OpenDesign

Печатается с разрешения авторов и литературного агентства Brockman, Inc.


Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.


Фото Эреца Эйдена © Eliza Grinnel

Фото Жана-Батиста Мишеля © Bret Hartman

© Erez Lieberman Aiden and Jean-Baptiste Michel, 2013

© Павел Миронов, перевод, 2014

© Издание на русском языке AST Publishers, 2016

Глава 1
Зазеркалье

Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?

Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (are full, множественное число) южан. Мы также говорим, что северные штаты полны (are full) северян или что штаты Новой Англии полны (are full) жителями. Однако мы говорим: the United States is full of citizens (то есть «США полон жителей», единственное число). Почему мы используем единственное число? Вопрос лежит не только в области грамматики – это, скорее, вопрос нашей национальной идентичности.

После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).

И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах и их договорах с ее Британским Величеством» (курсив наш. – Э. Э. и Ж.-Б. М.). В наше время для президента США это совершенно немыслимо.

Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]1
  В самой Конституции Соединенные Штаты упоминаются во множественном числе. К примеру: «Государственной изменой Соединенным Штатам считается только ведение войны против них…» См. U.S. Const., art. III, § 3. (Здесь и далее примечания авторов, если не оговорено иное. – Прим. ред.)


[Закрыть]

Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]2
  Цит. по.: McPherson James M. Battle Cry of Freedom. Oxford: Oxford University Press, 1988. P. 859. (Здесь и далее для удобства читателя в ссылках на литературу имя автора следует за фамилией. Имена приводятся в том виде, в каком они написаны авторами. – Прим. ред.)


[Закрыть]
:

…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.

До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.

Макферсон был не первым, кто выдвинул такое предположение; эта тема обсуждается уже не менее сотни лет. Стоит хотя бы вспомнить выдержку из статьи в газете Washington Post, опубликованной в 1887 году[3]3
  Цитата из статьи в Washington Post (24 апреля 1887 г.), цит. по: Zimmer Ben. Life in These, uh, This United States // Language Log (24 ноября 2005 г.). Доступно в сети Интернет: http://goo.gl/Ug8iX.


[Закрыть]
:

Какое-то время, буквально несколько лет назад, о Соединенных Штатах говорилось во множественном числе. Было принято говорить: «Соединенные Штаты имеют» или «Соединенные Штаты являлись». Однако война все изменила. Вопрос грамматики был навсегда решен на линии огня от Чесапика до Сэбин-Пасс. Решение приняли не Уэллс, не Грин, не Линдли Мюррей, а сабли Шеридана, мушкеты Шермана и артиллерия Гранта… Поражение мистера Дэвиса и генерала Ли означало переход от множественного числа к единственному.

Даже через сто лет после того, как была написана эта потрясающая история о языке, артиллерии и приключениях, сложно сдержать волнение. Кто бы мог представить, что люди станут сражаться за грамматику или что «мушкеты Шермана» решат спор о тонкостях словоупотребления?

Но стоит ли этому верить?

Возможно. Джеймс Макферсон – бывший президент Американской исторической ассоциации и настоящая легенда среди историков. Его самая знаменитая работа «Боевой клич свободы» получила Пулитцеровскую премию. Более того, кто бы ни написал в 1887 году статью в Washington Post, Макферсон, вероятнее всего, сам испытал этот синтаксический переворот, и его свидетельству сложно не верить.

Тем не менее Джеймс Макферсон, каким бы великим он ни был, не непогрешим. А свидетели иногда неправильно интерпретируют факты. Можно ли с этим что-то сделать?

Возможно. Давайте предположим, что мы попросили нашего робота – гипотетического робота, прочитавшего все книги из всех библиотек, – поделиться с нами своим механистическим мнением.

Представим, что в ответ на наш вопрос услужливый робот-историк обращается к своей бездонной памяти и рисует график[4]4
  Обратите внимание, что использование строчной буквы позволяет избежать неточностей в формулировках. Например, в выражении the Senate of the United States вполне понятно, что речь идет не о самих Соединенных Штатах, а о Сенате Соединенных Штатов.


[Закрыть]
. На нем показано, насколько часто использовалось с течением времени понятие «Соединенные Штаты» в единственном или множественном числе в книгах на английском языке, опубликованных в США. Горизонтальная ось – течение времени, год за годом. На вертикальной оси указана частота употребления двух фраз в среднем на каждый миллиард слов текста за год. К примеру, робот прочитал 313 388 047 слов в книгах, опубликованных в 1831 году. Внутри этих слов робот видит фразу the United States is (то есть единственное число) 62 759 раз. Иными словами, в этом году данное выражение встречалось 20 раз на миллиард слов, что отражено в высоте синей линии за 1831 год.



Подобный график дает четкое представление о том, когда именно люди стали упоминать Соединенные Штаты в единственном числе.

Есть только одна небольшая проблема: судя по гипотетическому графику гипотетического робота, история, которую мы вам рассказываем, неверна. Во-первых, переход от множественного числа к единственному не был мгновенным. Он был постепенным, начался в 1810-х и продолжался вплоть до 1980-х – то есть более полутора столетий.

Но еще важнее то, что во времена Гражданской войны не происходило никакого резкого перехода. В сущности, период войны не особенно сильно отличался от времени до нее или после. Хотя в послевоенный период и началось некоторое ускорение процесса, однако оно произошло не ранее чем через пять лет после сдачи в плен генерала Ли. Согласно нашему роботу, единственное число не стало общеупотребительным вплоть до 1880 года (спустя пятнадцать лет после окончания войны) [5]5
  Вопрос использования единственного или множественного числа не терял актуальности и до 1901 года, когда Джон У. Фостер, работавший госсекретарем при президенте Бенджамине Гаррисоне, опубликовал в газете New York Times статью, описывавшую преимущества использования единственного и множественного числа. См. Foster John W. Are or Is? Whether a Plural or a Singular Verb Goes with the Words United States // New York Times. Доступно в сети Интернет: http://goo.gl/Ql60b.


[Закрыть]
. И даже сейчас время от времени можно увидеть колыхание знамен лингвистической «конфедерации».

Разумеется, все это выглядит довольно умозрительно, поскольку наша история о роботе с навыками скоростного чтения, превосходящего в своей способности к анализу и свидетеля событий, и историка-лауреата, кажется совершенно надуманной.

Однако все это действительно так.

Макферсон, несмотря на всю свою гениальность, ошибался в вопросе о единственном числе. Свидетель помнил события неточно. А робот, о котором мы вам рассказывали, существует на самом деле. График, приведенный чуть выше, был действительно нарисован роботом. И своей очереди еще ждут миллиарды других графиков. В наши дни миллионы людей по всему миру видят историю совершенно по-новому – цифровыми глазами робота.

Форма света

Стоит сказать, что не впервые на наше видение мира влияет появление той или иной новой линзы.

В конце XIII века по всей Италии получило активное распространение новое изобретение – очки. Всего лишь за несколько десятилетий очки прошли путь от никому не известной вещи до экзотического, а затем и вполне привычного аксессуара. Своеобразный предшественник смартфона, очки стали незаменимой вещью для множества итальянцев, совмещая в себе моду и функциональность. Они стали одним из первых триумфальных примеров использования переносных технологий.

По мере распространения очков по Европе и всему миру оптометрия превратилась в серьезный бизнес, а технологии изготовления линз стали лучше и дешевле. Разумеется, люди начали экспериментировать и изучать, что будет при совместном использовании нескольких линз. Прошло совсем немного времени, и люди поняли, что при должной инженерной сноровке можно достичь невероятной степени увеличения. Появилась возможность изготовления составных линз, с помощью которых можно было открывать новые миры, невидимые невооруженному человеческому глазу[6]6
  Подробная история всех этих открытий отлично описана в книге: Ilardi Vincent. Renaissance Vision from Spectacles to Telescopes. Philadelphia: American Philosophical Society, 2007.


[Закрыть]
.

Например, с помощью таких линз можно было увеличивать изображение самых крошечных вещей. Микроскопы позволили узнать как минимум два факта, связанных с вековой тайной жизни. Во-первых, они показали, что окружающие нас животные и растения состоят из крошечных отдельных частиц. Сделавший это открытие Роберт Гук заметил, что расположение этих частиц напоминает монастырские кельи, и назвал их «клетками» [7]7
  По-английски и келья, и клетка называются одним словом – cell (Прим. ред.). Во время работы над настоящей книгой Эрец посетил Упсальский университет в Швеции, где ему представилась возможность изучить первое издание «Микрографии» (Micrographia: or some physiological descriptions of minute bodies made by magnifying glasses with observations and inquiries thereupon), написанной Гуком в 1665 году. Сделанные Гуком рукописные иллюстрации того, что он увидел через микроскоп, не могут не потрясать даже по современным стандартам. Нельзя даже представить себе, насколько невероятными они казались в то время. «Микрография» была первым научным бестселлером, одним из первых научно-популярных текстов. Тем не менее в наши дни первое издание представляет собой редкость. Добро пожаловать в мир революции цифровых книг: теперь любой человек может изучить оригинал книги в сети Интернет. См. Hooke Robert. Micrographia. London: Jo. Martyn and Ja. Allestry, 1665. Доступно в онлайн-библиотеке: http://lhldigital.lindahall.org/.


[Закрыть]
. Во-вторых, микроскопы позволили нам узнать о существовании микробов[8]8
  Поначалу названные «анималкулами» открывшим их Антони ван Левенгуком. См. Dobell Clifford. Antony van Leeuwenhoek and His «Little Animals». New York: Harcourt, Brace, 1932. В вашем теле бактериальных клеток в 10 раз больше, чем человеческих. См.: Savage D. C. Microbial Ecology of the Gastrointestinal Tract // Annual Review of Microbiology 31 (1977). P. 107. Доступно в сети Интернет: http://goo.gl/hzVlrR. Бактерии, живущие внутри нас, превышают человеческое население планеты примерно в 1014, то есть составляют 100 триллионов.


[Закрыть]
. Эта совершенно отдельная вселенная организмов, часто состоящих из единственной клетки, населена большей частью обитателей нашего мира. До изобретения микроскопа никто даже не представлял себе, что существование подобных форм жизни возможно.

Составные линзы использовались также и для приближения удаленных объектов. Вооружившись телескопом, дающим 30-кратное увеличение – по нынешним стандартам детская игрушка, – Галилей смог заняться разгадкой тайн космоса[9]9
  Первые телескопы Галилея были не столь мощными. 30-кратного увеличения удалось добиться только после нескольких усовершенствований. См. Westfall Richard S. Science and Patronage: Galileo and the Telescope // Isis 76, no. 1 (март 1985 г.). P. 11–30. Доступно в сети Интернет: http://goo.gl/eiPt3U; King Henry C. The History of the Telescope. London: C. Griffin, 1955.


[Закрыть]
. Куда бы он ни посмотрел, телескоп позволял ему видеть больше, чем когда-либо прежде. Направив его на Луну – которая много лет казалась идеальной сферой, – флорентийский ученый видел долины, равнины и горы (а также их тени, всегда направленные в сторону от Солнца). Исследуя яркую полосу звезд на ночном небе, известную нам под названием «Млечный Путь», Галилей обнаружил, что тот состоит из огромного количества слабо святящихся звезд – то, что мы теперь называем Галактикой. Однако самые знаменитые открытия Галилея произошли после того, как он направил свой телескоп на другие планеты. Он увидел и фазы затмения Венеры, и луны Юпитера – новые миры в совершенно буквальном смысле слова.

Наблюдения Галилея позволили окончательно опровергнуть берущее свое начало со времен Птолемея убеждение, что Земля находится в центре всего сущего. Наоборот, было найдено подтверждение гипотезы Коперника о существовании Солнечной системы – то есть Солнца, окруженного вращающимися планетами. В умелых руках Галилея оптическая линза – всего лишь проявление игры света – не только послужила толчком для научной революции, но и изменила роль религии в жизни западного мира. Это было не просто рождение современной астрономии. Это было рождение современного мира[10]10
  См. Whitehouse David. Renaissance Genius: Galileo Galilei and His Legacy to Modern Science. New York: Sterling, 2009; Wootton David. Galileo: Watcher of the Skies. New Haven, CT: Yale University Press, 2010; Brake Mark. Revolution in Science: How Galileo and Darwin Changed Our World. New York: Palgrave Macmillan, 2009; Moss Jean Dietz. Novelties in the Heavens: Rhetoric and Science in the Copernican Controversy. Chicago: University of Chicago Press, 1993; Westman Robert S. The Copernican Question Prognostication, Skepticism, and Celestial Order. Berkeley: University of California Press, 2011.


[Закрыть]
.

Даже в наши дни, спустя пять веков, микроскоп и телескоп играют важнейшую роль в научном познании. Разумеется, сами устройства изменились. Традиционные системы оптического изображения значительно усложнились, а работа некоторых современных микроскопов и телескопов основана на совершенно иных научных принципах. Например, сканирующий туннельный микроскоп опирается на достижения квантовой механики XX века. Тем не менее до сих пор многие области знаний – столь различные, как астрономия, биология, химия и физика, – своим развитием во многом обязаны лучшим из имеющихся у нас микроскопов и телескопов.

В 2005 году оба автора, будучи еще молодыми учеными, работавшими над диссертациями, довольно много размышляли о том, к каким видам «скопов» имеют доступ современные исследователи и каким образом они могли бы способствовать развитию науки. Нас заинтересовала идея, казавшаяся многим довольно странной. В течение длительного периода времени мы увлекались изучением истории. Особенно нас заинтересовал вопрос о том, как меняется со временем человеческая культура. Некоторые из этих изменений революционны, однако часто они оказываются совершенно незаметными для человеческого разума. Как было бы здорово, подумали мы, если бы в нашем распоряжении был какой-нибудь микроскоп для измерения человеческой культуры, выявления и отслеживания мельчайших изменений, совершенно незаметных обычному наблюдателю? Или же телескоп, позволяющий наблюдать с огромного расстояния – на других континентах или много столетий назад? Словом, возможно ли создать некий «скоп», помогающий наблюдать за историческими изменениями, а не физическими объектами?

Разумеется, это не идет ни в какое сравнение с масштабами сделанного Галилеем. Современный мир уже существует; Солнце уже находится в центре Солнечной системы, и так далее, и тому подобное. Все уже знают, что «скопы» – это хорошо. Но, как мы тогда подумали, этот новый вид «скопа» может оказаться достаточно интересным для того, чтобы Гарвард позволил нам наконец защититься. А по сути, это единственное, на что вы можете надеяться, будучи таким же голодным, бедным и слишком образованным, как и типичный соискатель научной степени в Гарварде.

Пока мы размышляли над столь отвлеченными материями, вокруг нас разворачивалась революция, в которую мы смогли сполна погрузиться и даже оказаться в авангарде миллионов людей, разделяющих наше странное увлечение. В основе своей эта революция больших данных связана с тем, каким образом мы, люди, создаем и сохраняем историческую память о своей деятельности. Эта революция изменит то, как мы видим самих себя. Мы сможем создавать новые «скопы», благодаря которым наше общество станет еще эффективнее исследовать свою природу. Большие данные изменят гуманитарные науки, преобразуют общественные науки и заставят пересмотреть природу связей между миром коммерции и «башней из слоновой кости». Чтобы лучше понимать, как это стало возможным, давайте внимательнее взглянем на исторические данные – от скромных истоков до вездесущего настоящего.

Как считать овец

Десять тысяч лет назад доисторические пастухи время от времени теряли своих овец. Воспользовавшись советом других доисторических людей, страдавших от бессонницы, пастухи принялись их считать. Эти первые в истории счетоводы использовали для пересчета овец камни, по аналогии с тем, как нынешние игроки в покер используют фишки для подсчета своего выигрыша.

И это отлично сработало. На протяжении следующих четырех тысяч лет, по мере того как люди обладали все большим количеством различных товаров, они использовали простой инструмент под названием «резец», чтобы вырезать определенные изображения на камнях. Эти значки изображали различные типы объектов, требующих подсчета. Со временем, в IV тысячелетии до н. э., кто-то решил, что иметь дело с огромным количеством камней – аналогом денежной мелочи в каменном веке – крайне неудобно. Куда проще казалось взять один по-настоящему большой камень и использовать резец для того, чтобы покрыть его особыми орнаментами с каждой стороны. Так зародилась письменность[11]11
  Ранняя история человеческого письма стала известной нам во многом благодаря новаторской работе Денис Шмандт-Бессерат. Названный ею «розеттским камнем эпохи фишек» глиняный «амулетик», найденный в иракском Нузи и датируемый II тысячелетием до н. э., представляет собой одну из самых важных находок в области археологии древней письменности. На амулете приведен текст, написанный клинописью и расшифрованный как: «21 овца // 6 ягнят-самок // 8 взрослых баранов // 4 ягненка-самца // 6 беременных коз // 1 козел // 3 козочки // Печать Зикарру, пастуха». Когда амулет открыли, внутри него обнаружилось описание каждого из животных, перечисленных снаружи. Для чего понадобилось такое повторение? К тексту на внешней поверхности довольно легко обратиться, однако его так же легко было видоизменить. С внутренним содержимым дело обстояло наоборот. Соответственно, в случае разногласий между сторонами сделки спор решался открытием амулета и изучением его содержимого. Ученые полагают, что через какое-то время люди пришли к мысли, что можно использовать клинопись как внутри, так и снаружи, – это позволяло им полностью отказаться от изображений и создавать юридические документы на базе одного лишь текста. Практика создания контрактов, в которых часть текста оставалась «открытой» для простоты обращения, а другая часть была «запечатана» на случай возникновения разногласий, получила широкое распространение. Пример такого типа контракта зафиксирован в Еврейской Библии (Иер. 32: 10–11). См. Powell Barry B. Writing: Theory and History of the Technology of Civilization. Chichester, England: Wiley– Blackwell, 2009; Rudgley Richard. The Lost Civilizations of the Stone Age. New York: Free Press, 1999; Schmandt-Besserat Denise. How Writing Came About. Austin: University of Texas Press, 1996; Schmandt-Besserat Denise. Before Writing, vol. 1, From Counting to Cuneiform. Austin: University of Texas Press, 1992; Schmandt-Besserat Denise. Before Writing, vol. 2. A Catalog of Near Eastern Tokens. Austin: University of Texas Press, 1992. Разумеется, у исследователей нет единого мнения в данном вопросе. Кто-то считает, что в Египте письменность возникла совершенно независимо и иным образом. См. Mitchell Larkin. Earliest Egyptian Glyphs // Archaeology 52, no. 2 (март/апрель 1999 г.), доступно в сети Интернет: http://goo.gl/tM3GEQ.


[Закрыть]
.

Теперь может показаться удивительным, что такая обыденная вещь, как желание считать овец, стала стимулом для развития такой фундаментальной вещи, как письменный язык. Однако стремление пользоваться письменными данными всегда шло рука об руку с экономической деятельностью, поскольку сделки не имеют смысла, если вы не можете четко проследить, что кому принадлежит. Как таковая, ранняя человеческая письменность направляется заключением сделок (dealing) и созданием колеса (wheeling) – ставками в спорах, расписками и контрактами. Задолго до того, как у нас появились писания пророков (prophets), люди делали записи о прибылях (profits). По сути, многие цивилизации так никогда и не дошли до настоящей письменности и не оставили после себя ту литературу, которую мы часто связываем с историей культуры. В лучшем случае от этих древних обществ до нас дошли кучи расписок. И если бы не те коммерческие предприятия, которые создали эти данные, мы бы знали куда меньше о культурах, в которых они существовали. Теперь такое положение дел представляется вполне закономерным. В отличие от своих предшественников, многие из коммерческих предприятий в наши дни создают данные не просто как побочный продукт своего бизнеса. Компании типа Google, Facebook и Amazon создают инструменты, позволяющие пользователям представлять себя и взаимодействовать с другими в Интернете. Работа этих инструментов позволяет создавать цифровые, личные и исторические данные.

Основной бизнес таких компаний как раз и заключается в записи человеческой культуры.

И дело касается не только фиксации информации, предназначенной для общего потребления, типа веб-страниц, блогов и онлайн-новостей. Все чаще в Сети происходит и наше частное общение – посредством электронных писем, Skype или систем текстовых сообщений. Значительная их доля сохраняется (можно считать, что и вечно), причем иногда в нескольких копиях. Идет ли речь о Twitter или LinkedIn, наши личные и деловые отношения управляются Сетью и фиксируются в ней. Каждый раз, «плюсуя», «лайкая» тексты или отправляя электронные открытки, мы оставляем цифровые «отпечатки пальцев». Google будет помнить каждое слово написанного нами гневного электронного письма даже тогда, когда мы сами забудем имя человека, которому его отправляли. Фотографии в Facebook напомнят нам о подробностях вечера, проведенного накануне в баре, даже если мы ничего не помним из-за похмелья и жуткой головной боли. Если мы пишем книгу, Google сканирует ее; если мы делаем фотографию, она хранится на Flickr; а если мы снимаем видео, YouTube позволяет желающим его посмотреть.

Проживая современную жизнь, все активнее проводя время в Интернете, мы оставляем все более заметный след из цифровых «хлебных крошек» – личные исторические данные потрясающей глубины и значительного масштаба.

Большие данные

О каком масштабе идет речь?

В компьютерных науках принято считать единицей измерения информации бит (сокращение от binary digit – двоичное число). Бит можно представить себе в виде ответа на вопрос «да или нет», где 1 – это «да», а 0 – это «нет». Группа из восьми битов называется «байт» [12]12
  Классическую игру в «двадцать вопросов» можно также назвать «два с половиной байта», поскольку именно такой объем информации вы должны собрать, прежде чем высказать свою догадку.


[Закрыть]
.

В настоящее время цифровой след обычного человека – то есть годовой объем данных, создаваемых в мире на душу населения, – составляет немногим менее одного терабайта. Это можно сравнить примерно с 8 триллионами ответов на вопрос «да или нет». В совокупности человечество создает каждый год 5 зеттабайт данных: 40 000 000 000 000 000 000 000 (сорок секстиллионов) бит[13]13
  Подсчеты содержатся в отчете IDC Digital Universe report. См. Gantz John, Reinsel David. The Digital Universe in 2020 // EMC Corporation (декабрь 2012 г.). Доступно в сети Интернет: http://idcdocserv.com/1414. См. также: Data, Data Everywhere // Economist (25 февраля 2010 г.). Доступно в сети Интернет: http://goo.gl/VsXh5P. Bohn Roger E., Short James E. How Much Information? 2009 // Global Information Industry Center (январь 2010 г.). Доступно в сети Интернет: http://goo.gl/pt0R; Lyman Peter, Varian Hal R. How Much Information 2003? // University of California at Berkeley. Доступно в сети Интернет: http://goo.gl/vpo9N.


[Закрыть]
.

Такие огромные цифры сложно себе представить, поэтому давайте их как-то конкретизировать. Если бы вы записали вручную всю информацию, содержащуюся в одном мегабайте, то ваша строка из 1 и 0 превысила бы по высоте гору Эверест[14]14
  Мы исходим из предположения, что для записи типичного бита требуется примерно шесть миллиметров. В определенной степени это зависит от соотношения единиц и нулей, поскольку «1» очень узкая. Типичный размер букв в рукописном тексте рассматривается в работе Kamath Vikram et al. Development of an automated handwriting analysis system // ARPN Journal of Engineering and Applied Sciences 6, no. 9 (сентябрь 2011 г.). Доступно в сети Интернет: http://goo.gl/4mlkTm.


[Закрыть]
. Последовательность 1 и 0, составляющая 1 гигабайт, записанная вручную, соответствует длине земного экватора. А длина записанной последовательности цифр, составляющих один терабайт, равна расстоянию от Земли до Сатурна, пройденному туда и обратно 25 раз. Длина последовательности в один петабайт, записанной вручную, равна расстоянию туда и обратно до космического аппарата «Вояджер-1» (самого удаленного от Земли аппарата, созданного человечеством). Длина последовательности в один экзабайт равна расстоянию до альфы Центавра. Длина последовательности в 5 зеттабайт, создаваемых людьми каждый год, равна расстоянию до галактического центра Млечного Пути. Если бы вместо отправки электронных писем и трансляции видео эти пять зеттабайт использовались для той же цели, что и у древних пастухов – то есть для подсчета овец, – то их стадо полностью заполнило бы всю Вселенную, не оставив свободного пространства[15]15
  Таким образом, проблему подсчета овец можно будет считать полностью решенной, если только Вселенная не расширится очень сильно.


[Закрыть]
.

Вот почему люди дали всей этой информации название «большие данные». И большие данные сегодняшнего дня – это лишь верхушка айсберга. Полный цифровой след, оставляемый хомо сапиенс, удваивается каждые два года[16]16
  Согласно расчетам IDC (International Data Corporation), цифровой след человечества вырастет со 130 экзабайт в 2005 году до 40 000 экзабайт (40 зеттабайт) в 2020 г. Иными словами, удвоение объема информации будет происходить каждый год и 10 месяцев. См. выше.


[Закрыть]
, по мере совершенствования технологий хранения данных, повышения скорости обмена информацией и постепенного перемещения нашей жизни в Интернет. Большие данные становятся все больше, больше и больше.


Страницы книги >> 1 2 3 4 | Следующая
  • 4.2 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации