Электронная библиотека » Эрец Эйден » » онлайн чтение - страница 4


  • Текст добавлен: 15 июля 2016, 14:20


Автор книги: Эрец Эйден


Жанр: Зарубежная компьютерная литература, Зарубежная литература


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 4 (всего у книги 15 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +
Не слишком ли много Ципфа

Закон Ципфа был всего лишь пробным камнем, необходимым нам для начала поиска языковых окаменелостей. Почти все в языке следует закону Ципфа – существительные, глаголы, прилагательные, наречия, начинающиеся на букву m, слова для описания профессий, слова, рифмующиеся со словом «рифма», и так далее. Так что если вы натыкаетесь на что-то, не соответствующее универсальному принципу Ципфа, можно смело считать, что что-то тут не то. Подобно куску белого камня, который находят в ходе экспедиции на особенно многообещающем месте, языковое явление, не следующее степенному закону, может оказаться настоящей окаменелостью в эволюции нашего языка.

Именно здесь нужно снова задать тот «детский» вопрос, который в свое время привлек наше внимание: «Почему мы говорим drove, а не drived

Drove – одно из английских слов, называемых неправильными глаголами[57]57
  Довольно подробное рассмотрение этой увлекательной проблемы можно найти в книге Pinker Steven. Words and Rules: The Ingredients of Language. New York: Basic Books, 1999. В зависимости от вашей точки зрения, неправильные глаголы могут казаться либо странными, либо восхитительно причудливыми. Как-то раз одна читательница New York Review of Books опубликовала объявление о поиске партнера, начинавшееся словами: «Можете ли вы назвать себя неправильным глаголом?» См. Pinker Steven. The Language Instinct. New York: William Morrow, 1994. P. 134. (Рус. изд.: Пинкер С. Язык как инстинкт. М.: Либроком, Едиториал УРСС, 2013. – Прим. пер.).


[Закрыть]
. Эти неправильные глаголы – очень странная вещь. Если бы они следовали закону Ципфа, как и все остальные классы слов, то можно было бы ожидать, что они редки. На практике же почти все неправильные глаголы встречаются довольно часто. Хотя к неправильным относится лишь около 3% глаголов, на практике именно они используются чаще других. Проще говоря, неправильные глаголы представляют собой явное и серьезное отклонение от закона Ципфа. Именно их мы и искали, как будто рядом со скелетом тираннозавра кто-то поставил статистические указатели.

Что же представляют собой эти так называемые неправильные глаголы, что они сделали с законом Ципфа и что это значит с точки зрения эволюции языка?

Избранные, гордые и сильные

На первый взгляд, в спряжении английских глаголов нет ничего сложного. Все, что требуется вам для образования прошедшего времени английского глагола, – это добавить к нему – ed: глагол jump («прыгать») превращается в jumped («прыгал»). Этому простому правилу следуют сотни тысяч глаголов. И даже если в языке появляется новый глагол, он будет спрягаться так же. Может быть, я никогда не слышал о действии, называемом flamboozing («алкоголеподжигание»), но я знаю, что если вы решили flambooze («алкоголеподжигать») вчера, то вчера вы flamboozed («алкоголеподжигали»).

Исключением – к немалому огорчению людей, изучающих английский, – выступают неправильные глаголы типа know («знать»). Даже не прочитав это предложение, вы уже знали (knew), что мы не скажем knowed. К этим тремстам неправильным глаголам – которые лингвисты иногда называют «сильными», – относятся десять наиболее часто встречающихся глаголов в английском языке: be/was («быть, был»), have/had («иметь/имел»), do/did («делать/делал»), say/said («говорить/сказал»), go/went («идти/пошел»), get/got («получить/получил»), make/ made («делать/сделал»), know/knew («знать/знал»), see/saw («видеть/видел»), think/thought («думать/думал»). Они встречаются настолько часто, что глагол, который вы собираетесь употребить, с вероятностью 50% будет неправильным.

Откуда возникли неправильные глаголы? Это длинная история. Примерно от 6 до 15 тысяч лет назад активно использовался язык, известный современным ученым как праиндоевропейский. Из этого языка произошли многие современные языки, в том числе английский, французский, испанский, итальянский, немецкий, греческий, чешский, персидский, санскрит, урду, хинди и сотни других. В праиндоевропейском языке было явление, известное ученым как аблаут, при котором одно слово превращалось в другое, близкое, с помощью замены гласных по определенным правилам[58]58
  Если быть более точным, аблаут – это чередование гласных в рамках одной морфемы, выступавших своего рода внутренней флексией, ср., например: собирать – собрать – сбор – соберу (Прим. ред.).


[Закрыть]
. В современном английском языке аблаут можно заметить как раз среди неправильных глаголов.

Вот вам пример: сегодня я пою (sing), вчера я пел (sang), песня была спета (sung). Аналогичным образом: сегодня я звоню (ring), вчера я звонил (rang), телефон прозвонил (rung). И еще один: сегодня я застреваю (stick), вчера я застревал (stuck). Сегодня я копаю (dig), вчера я копал (dug). Отмирая, правила спряжения оставляют после себя окаменелости, которые мы называем неправильными глаголами.

Но если это так, то какой же грамматический астероид уничтожил эти древние правила, оставив нам лишь высохшие кости неправильных глаголов?

Этим астероидом был так называемый дентальный суффикс, имеющий в современном английском языке форму – ed[59]59
  В отличие от сильных неправильных глаголов, правильные известны также под названием «слабые». См. Stark Detlef. The Old English Weak Verbs. Tübingen, Germany: M. Niemeyer, 1982; Howren Robert. The Generation of Old English Weak Verbs // Language 43, no. 3 (сентябрь 1967 г.), доступно в сети Интернет: http://goo.gl/2yf0t.


[Закрыть]
. Применение – ed для обозначения прошедшего времени началось еще в прагерманском языке, на котором говорили в Скандинавии в 500–250 гг. до н. э. Прагерманский был предком всех современных германских языков, включая английский, немецкий, голландский и множество других. Будучи наследником праиндоевропейского языка[60]60
  См. Mallory J. P., Adams D. Q. The Oxford Introduction to Proto-Indo-European and the Proto-Indo-European World. Oxford: Oxford University Press, 2006; Ringe Don. A Linguistic History of English. Oxford: Oxford University Press, 2006.


[Закрыть]
, прагерманский унаследовал у него старую схему для спряжения глаголов на основе аблаута. И чаще всего с ее применением не возникало никаких проблем. Однако время от времени в языке появлялись новые глаголы, и некоторые из них просто не укладывались в старую схему аблаута. Поэтому люди, говорившие на прагерманском, изобрели кое-что новое – теперь образовывать прошедшее время этих молодых, не склонных к конформизму глаголов можно было, добавляя к ним в конце – ed. В прагерманском языке правильные глаголы были скорее исключениями.

Но так было недолго. Использование дентального суффикса для обозначения прошедшего времени оказалось невероятно успешным изобретением, которое получило широкое распространение. Подобно любой другой революционной технологии, новое правило стало понемногу распространяться и применяться лишь в отношении отдельных забавно звучащих глаголов, с которыми не мог справиться аблаут. Однако раз начавшись, этот процесс уже не остановился. Простой и запоминающийся дентальный суффикс начал привлекать все больше приверженцев, поскольку все чаще изменения касались глаголов, прежде использовавших аблаут.

Таким образом, к моменту создания классического староанглийского текста «Беовульф» (примерно 1200 лет назад) более трех четвертей английских глаголов изменялись по новому правилу. После того как у старого аблаута иссякли силы, новое правило с суффиксом – ed стало его повсюду вытеснять. В течение следующей тысячи лет исчезло огромное количество неправильных форм глаголов. Тысячу лет назад я мог бы holp (от глагола help – «помогать») вам. А вот вчера моя помощь вам описывалась бы словом helped.

Сегодняшние лингвисты, глядя на этот процесс в исторической ретроспективе, объясняют его термином «выравнивание». Нужно отметить, что процесс продолжается и сейчас. Рассмотрим глагол thrive («процветать»). Около 80 лет назад заголовок в газете New York Times гласил: Gambling Halls Throve in Billy Busteed’s Day («Игровые залы процветали в день Билли Бастида»). А в 2009 году в разделе «Наука» той же газеты была опубликована статья под заголовком Some Mollusks Thrived After Mass Extinction («Некоторые моллюски процветают после массового уничтожения»). Форма глагола throve (в отличие от этих удачливых моллюсков) пала жертвой массового истребления аблаутов. И пути назад нет. Став правильными, глаголы почти никогда не превращаются в неправильные[61]61
  Как правило, выравнивание представляет собой улицу с односторонним движением, однако и здесь имеются крайне редкие исключения. Одним из них служит неправильная форма snuck (от глагола sneak – «прошмыгнуть»), которая тайком пробралась (sneaked) в английский язык в прошедшем столетии. Следуя примеру неправильных глаголов типа stick – stuck, strike – struck и stink – stunk, каждый год примерно 1% людей, говорящих на английском языке, используют вместо формы sneaked форму snuck. Иными словами, еще один человек начал использовать эту форму, пока вы читали это предложение. Pinker Steven. The Irregular Verbs // Landfall (Autumn 2000). P. 83–85. Доступно в сети Интернет: http://goo.gl/kFFzLm.


[Закрыть]
.

Подобно тремстам спартанцам в Фермопилах, английские неправильные глаголы – эти триста смелых – решительно устояли в безжалостной борьбе, начавшейся против них в 500 г. до н. э. Они вели бой каждый день, в каждом большом и малом городе, на каждой улице, где говорят по-английски. Они отрабатывали навыки выживания в течение 2500 лет. И поэтому они – это не просто исключения. Их можно считать оставшимися в живых счастливчиками.

И процесс, благодаря которому они выжили, мы как раз и намеревались изучить – процесс эволюции языка.

2005: Еще одна одиссея данных

Почему же некоторые неправильные глаголы умерли, а другим удалось выжить? Почему глаголу throve (от глагола thrive – «процветать») не удалось выжить, а глаголу drove (от глагола drive – «ехать») – удалось? [62]62
  На самом деле в современном английском языке нет такого понятия, как полностью неправильный глагол. Правильная форма глагола существует всегда (даже если почти не употребляется и спокойно ждет своего часа). Огромное влияние на это явление оказывает частотность употребления, поскольку часто используемые неправильные глаголы довольно успешно подавляют конкурирующие правильные формы. К примеру, в сравнении с формой drove форма drived почти не используется. Напротив, форма throve на протяжении многих столетий была достаточно уязвимой. Правильная форма thrived, давно бывшая для нее серьезным конкурентом, начала брать верх в XX веке. Это случается довольно часто. В наших списках словных последовательностей («1-грамах») слово found (от глагола find – «находить») (частота 1 на 2000) встречалось в 200 000 раз чаще, чем finded. При этом форма dwelt (от глагола dwell – «обитать») (частота 1 на 100 000) встречалась всего в 60 раз чаще формы dwelled. См. Michel2011. Для целей исследования, проведенного в 2007 году, нам время от времени был нужен список современных неправильных глаголов английского языка, который можно было бы считать «авторитетным». Мы использовали этот список для определения того, какие глаголы приобрели правильную форму, а какие – нет. Самостоятельное составление этого списка лишало нас должной объективности, поэтому мы выбрали список из работы Pinker S., Prince A. On Language and Connectionism: Analysis of a Parallel Distributed Processing Model of Language Acquisition // Cognition 28 (1988). P. 73–193. Мы считали неправильным любой глагол, у которого с точки зрения данного списка была хотя бы одна неправильная форма. Нужно отметить, что время от времени между словарями и другими источниками возникает разногласие в отношении того, какие глаголы считаются неправильными, а какие – нет. К примеру, wed – wed («женить») в указанном выше списке относится к неправильным, но во всех современных словарях приводятся иные формы (кое-кто из носителей языка уже отдает предпочтение форме wed – wedded).


[Закрыть]

У лингвистов уже есть несколько отличных идей относительно того, почему неправильные глаголы имеют столь высокую частотность. Они предположили, что чем меньше мы сталкиваемся с неправильным глаголом, тем сложнее его запомнить и тем проще забыть[63]63
  Дети осваивают неправильные глаголы особенно интересным образом, постепенно, по мере развития мышления. Поначалу они спрягают все глаголы по-своему. Затем они начинают признавать правила языка, на котором говорят люди вокруг. Когда они понимают, что большинство глаголов следует правилу – ed, то переходят на стадию, называемую «гиперкорректностью», при которой воспринимают каждый глагол как правильный и используют формы типа goed, knowed и runned (от глаголов go – «идти», know – «знать» и run – «бежать»). Со временем они понимают, что некоторые глаголы представляют собой исключения из правила – ed, и начинают включать «правильные» неправильные формы в свою речь.


[Закрыть]
. Вследствие чего редкие неправильные глаголы вроде throve исчезают быстрее, чем частые, вроде drove. Со временем неправильные глаголы с низкой частотой употребления полностью исчезали, а неправильные глаголы как группа становились более частыми.

Эта гипотеза показалась нам в высшей степени интересной, поскольку предполагала, что неправильные глаголы проходят через определенный процесс, аналогичный эволюции, путем естественного отбора[64]64
  По этой теме имеется масса интересной литературы. См., к примеру, Sabeti P. C. et al. Detecting Recent Positive Selection in the Human Genome from Haplotype Structure // Nature 419, no. 6909 (2002). P. 832–837. Доступно в сети Интернет: http://goo.gl/TW6SYJ. Varilly P. et al. Genome-Wide Detection and Characterization of Positive Selection in Human Populations // Nature 449, no. 7164 (2007). P. 913–918. Доступно в сети Интернет: http://goo.gl/NfnzeU.


[Закрыть]
. Почему неправильные глаголы встречаются настолько часто, когда, в полном соответствии с законом Ципфа, во всех остальных лексических классах доминируют редкие слова? Потому что естественный отбор, в форме ненасытного правила – ed, обеспечивает простым неправильным глаголам эволюционное преимущество. Чем чаще глагол используется, тем выше его шансы на выживание.

Созданный Ципфом «компас» был на тот момент самым идеальным примером естественного отбора, действующего в человеческой культуре, с которым нам только доводилось сталкиваться. Компас Ципфа указал нам на увлекательную проблему: может ли сформироваться лингвистическое чутье при столь тщательном изучении материала? Это могло бы стать простой, но доходчивой иллюстрацией того, что человеческая культура способна развиваться путем естественного отбора. Теперь нам, как и Ципфу, требовалось лишь найти подтверждение.

Для помощи в поисках мы привлекли к работе двух невероятно талантливых старшекурсников Гарвардского колледжа, Джо Джексона и Тину Тан. В идеале мы надеялись, что Джо и Тина смогут прочитать все источники, когда-либо опубликованные на английском языке, и записать каждый пример неправильного глагола, с которым они сталкивались. Однако оба они сказали нам, что все же хотели бы поработать над своими дипломами (для нас как аспирантов это уже был пройденный и забытый этап). Для решения задачи нам пришлось импровизировать.

К счастью, Джо и Тина учли историю Ципфа, поэтому предложили альтернативный подход. Вместо того чтобы читать абсолютно все, почему бы не ограничиться учебниками по истории английской грамматики? Грамматические тексты, относящиеся, скажем, к средневековому английскому языку, наверняка касались бы вопроса неправильных глаголов и упоминали бы многие из них. Не исключено, что где-то можно было найти и список таких глаголов. Изучив в библиотеке каждый учебник, посвященный истории английского языка различных периодов, мы могли получить довольно точную картину того, какие глаголы считались неправильными и когда[65]65
  К примеру, к этим источникам относятся Emerson Oliver Farrar. A Middle English Reader. New York: Macmillan, 1909, и Sweet Henry. An Anglo-Saxon Primer. Oxford: Clarendon Press, 1887.


[Закрыть]
. Учебники могли бы дать нам то же самое, что дало Ципфу проведенное Хенли исследование «Улисса».

Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники древнеанглийского языка (языка «Беовульфа», на котором говорили примерно в 800 г. н. э.) и средневекового английского (языка Чосера, на котором говорили начиная примерно с XII столетия). Они нашли 177 староанглийских неправильных глаголов, развитие каждого из которых они смогли проследить на протяжении тысячи и более лет. Получив такую картину, мы наконец увидели, как менялся язык.

В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed. Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения[66]66
  Изначально эта работа была опубликована в форме статьи Lieberman Erez et al. Quantifying the Evolutionary Dynamics of Language // Nature 449 (11 октября 2007 г.). P. 713–716. Доступно в сети Интернет: http://goo.gl/3kCMQT.


[Закрыть]
.

Данные показали: на человеческую культуру влияло нечто похожее на естественный отбор, оставляя следы в мире глаголов. Частота употребления была серьезнейшим фактором выживания глаголов – именно она приводила к тому, что некоторые прежние формы глаголов умирали и мы начинали их оплакивать (mourn – mourned), а другие приспособились (fit – fit) выживать.

Выживание наиболее приспособленных

В биологии проще показать сам факт естественного отбора, чем измерить степень родства между определенными признаками и степенью эволюционной приспособленности (легко сказать, что на улице ветрено, но куда сложнее определить, насколько сильно дует ветер). Не имея возможности рассчитать степень приспосабливаемости, мы можем лишь предположить, какие изменения будут успешными с точки зрения эволюции, но мы совершенно не представляем себе, сколько времени потребуется, чтобы эти изменения произошли.

Однако случай неправильных глаголов не очень характерен для биологической эволюции. В биологии для определения степени приспосабливаемости отдельного организма принимаются во внимание тысячи или даже миллионы признаков. Что же касается неправильных глаголов, было ясно, что их выживаемость в значительной степени определяется единственным признаком – частотой употребления. И это значительно упростило работу. Это значило, что мы сможем с довольно большой долей точности рассчитать, насколько быстро исчезнут неправильные формы глаголов.

Однако перед тем как заняться этим вопросом более основательно, позвольте напомнить о самом известном в науке примере исчезновения. Мы имеем в виду теорию радиоактивного излучения.

Радиоактивные материалы используются в массе устройств – от энергетических реакторов до медицинских сканирующих систем и бомб. Эти материалы постоянно находятся в процессе исчезновения, поскольку с течением времени атомы радиоактивного вещества превращаются в стабильные нерадиоактивные атомы. Этот распад высвобождает энергию, часто в форме радиоволн.

Именно поэтому радиоактивные вещества и получили свое название.

Самое важное свойство радиоактивного элемента – это его период полураспада, то есть период времени, в среднем требующийся для распада половины атомов в образце элемента[67]67
  См. Radioactive Decay // Wikipedia (22 июня 2013 г.), доступно в сети Интернет: http://goo.gl/xTYh1; Half-life // Wikipedia (3 июня 2013 г.), доступно в сети Интернет: http://goo.gl/TXn3.


[Закрыть]
. Предположим, что у вас имеется вещество, период полураспада которого составляет один год. Если сначала у вас есть миллиард атомов этого вещества, то через год останется лишь половина миллиарда – другая половина миллиарда распадется на что-то другое. После двух лет у вас останется лишь четверть миллиарда атомов (половина от половины). Через три года останется одна восьмая и так далее.

В процессе изучения трансформации неправильных глаголов в правильные мы обнаружили, что если мы примем во внимание частоту употребления, то процесс выравнивания будет неотличим с математической точки зрения от процесса распада радиоактивного атома. Более того, зная частоту употребления неправильного глагола, мы могли создать формулу для расчета периода его полураспада. Это было замечательно, поскольку в случае радиоактивных атомов период полураспада определяется экспериментальным путем; его обычно невозможно рассчитать. В этом смысле математика радиоактивности лучше подходит неправильным глаголам, а не радиоактивным атомам.

Формула была простой и прекрасной – период полураспада глагола представляет собой квадратный корень от частоты его употребления. Неправильный глагол, использующийся в сто раз реже, приобретет правильную форму в десять раз быстрее.

Например, у глаголов, частота употребления которых находится в пределах между одним из ста и одним из тысячи, – глаголов типа drink («пить») или speak («говорить») – период полураспада составляет примерно 5400 лет. Это сопоставимо с периодом полураспада углерода-14 (5715 лет), изотопа, который чаще других используется для датирования древних артефактов.

Будущее прошедшее

Как только вы рассчитаете период полураспада неправильных глаголов, у вас появляется возможность сделать прогнозы об их будущем. Основываясь на вышеупомянутом анализе, мы предсказали, что к определенному времени один из глаголов из набора begin («начать»), break («ломать»), bring («приносить»), buy («покупать»), choose («выбирать»), draw («рисовать»), drink («пить»), drive («ехать»), eat («есть»), fall («падать») превратится в правильный. Из набора bid («предлагать цену»), dive («нырять»), heave («вздыматься»), shear («стричь»), shed («ронять»), slay («убивать»), slit («перерезать»), sow («сеять»), sting («жалить»), stink («вонять») правильными станут пять глаголов. А если процесс пойдет так и дальше, то к 2500 году неправильными останутся лишь 83 из наших 177 неправильных глаголов.

Мы были настолько рады своим открытиям, что даже создали короткую историю на основе своих прогнозов:

Он был хорошо воспитанным представителем XXVI столетия, поэтому его задели (stinged) слова о том, что используемая им грамматика «воняет» (stunk). «Stinked», – поправил своих собеседников путешественник во времени.

Так что, если вы планируете в ближайшее время заняться путешествиями во времени, вам стоит запомнить эту поучительную историю.

Мы также предсказали судьбу некоторых глаголов. Какие из сегодняшних неправильных глаголов после тысячи лет, проведенных вместе, откажутся от нынешнего партнера по спряжению в пользу «молодой модели»? Как ни парадоксально, это глагол wed – wed («женить»), один из самых редко употребляемых современных неправильных глаголов. К примеру, уже сейчас в обиход входит форма wed – wedded. Так что скоро уже вы как новобрачные не сможете назвать себя newly wed.

И, наконец, мы смогли ответить на «детский» вопрос, с которого начали свое путешествие: «Почему мы говорим drove, а не drived

Причина, по которой мы все еще говорим drove – отказавшись при этом от других неправильных форм типа throve, – состоит в том, что drove используется в сотни раз чаще, чем throve. Это значит – основываясь на нашем небольшом уравнении, – что для drove вероятность стать правильным в десять раз меньше, чем для throve. Разумеется, со временем drove исчезнет, если английский язык проживет достаточно долго[68]68
  Период полураспада неправильного глагола, имеющего ту же частоту, что и drove, составляет 5400 лет, что равнозначно ожидаемому сроку жизни до выравнивания (перехода в правильную форму) на уровне около 7800 лет.


[Закрыть]
. Наши расчеты показывают, что у нас есть примерно 7800 лет, перед тем как глагол drove скроется в лучах заката. Так что дети еще какое-то – довольно долгое – время будут задавать свой детский вопрос.

Блестящая туфля Джона Гарварда

В центре Гарвард-Ярда находится большая статуя, поставленная в честь Джона Гарварда. Эта бронзовая фигура имеет довольно скучный цвет, если не считать сияющей левой туфли. По какой-то странной причине фотография с рукой, касающейся туфли, считается чуть ли не обязательной для любого туриста, посещающего Гарвард.

Почему туфля у статуи Джона Гарварда так сверкает? Большинство считает, что, когда скульптура создавалась, вся она – включая обувь – имела скучный бронзовый цвет и что постепенная полировка тысячами рук туристов позволила проявиться блестящей поверхности.

Однако бронза – это изначально сверкающий металл. Когда скульптура была отлита более 100 лет назад, то она – как и любая другая бронзовая скульптура – сверкала довольно ярко. Верхний матовый слой скульптуры, известный под названием «патина», представляет собой результат коррозии, связанной с природными условиями, усилиями реставраторов и даже желанием самого автора. Подлинный цвет металла выжил лишь в туфле, благодаря частой полировке руками проходящих мимо[69]69
  Сияние происходит не только от прикосновений. Многие старшекурсники мочатся на этот ботинок; в 2013 году 23% выпускников Гарварда признавались, что делали это хотя бы однажды. Это представляет собой один из «основных трех» ритуалов инициации для гарвардских старшекурсников. Второй ритуал связан с обнажением и воплями на публике (и известен под названием «первобытный вопль»). Третий ритуал проводится в библиотеке и предполагает использование книг в качестве весов для силовых тренировок (и понятно, что в данном случае Kindle не может служит заменой тяжелому фолианту). См. Zauzmer Julie M. Where We Stand: The Class of 2013 Senior Survey // Harvard Crimson (28 мая 2013), доступно в сети Интернет: http://goo.gl/1EpfA.


[Закрыть]
.

И это очень похоже на неправильные глаголы. При первой встрече с ними вы не можете не удивиться: почему эти странные исключения дожили до наших дней? Однако, по сути, неправильные глаголы следуют в наши дни тем же закономерностям, что и много столетий назад. Хотя язык вокруг них менялся, частый контакт защищал неправильные глаголы от коррозии. Они представляют собой окаменелости эволюционного процесса, который мы только начинаем понимать. В наши дни мы называем все остальные глаголы правильными или регулярными. Однако регулярность – это не свойство языка по умолчанию. Правило – это могильный камень для тысячи исключений.

Словарь и конкорданс

Книга Word Index to James Joyce’s Ulysses была подлинным триумфом, отражавшим годы настойчивости и внимания к деталям. Во время публикации в 1937 году подобные индексы были доступны лишь для самых важных книг, несмотря на тот факт, что само по себе написание конкордансов имеет долгую и славную историю. Старейшие конкордансы еврейской Библии, известные под названием Масора, возникли более тысячи лет назад.

Все изменилось в 1946 году. В тот год иезуитскому монаху по имени отец Роберто Буса пришла в голову отличная идея. Буса, изучавший творчество плодотворного теолога Фомы Аквинского, захотел создать конкорданс работ Аквината, который бы помогал ему в исследованиях. Компьютерная технология только начинала свое резкое восхождение, и Буса посчитал, что сможет создать конкорданс новым способом, «скормив» текст книги в одну из новых машин. Он отправился с этой идеей прямиком в IBM. Представители компании выслушали его и решили поддержать. Потребовались 30 лет и серьезная помощь со стороны IBM, однако со временем план Бусы сработал – в 1980 году был завершен монументальный Index Thomisticus[70]70
  В 1980 году Буса опубликовал описание своего сотрудничества с IBM, продолжавшегося несколько десятилетий. Это поистине пророческий документ, содержащий множество глубоких замечаний для дальнейшего осмысления. К примеру, предвидя необходимость реформы гуманитарных наук (см. также наше обсуждение этого вопроса в главе 7), Буса пишет: «Представляется, что нынешняя научная жизнь нацелена на проведение краткосрочных исследовательских проектов и быструю публикацию результатов, а не на проекты, требующие совместной командной работы, предполагающей скорее продвижение на один сантиметр в глубину и километр в ширину, чем на километр исследований при сантиметровом их основании». Более тридцати лет спустя Энтони Графтон, занимавший в то время пост президента Американской ассоциации историков, высказал похожую мысль: «По мере того как новые формы научного исследования предлагают историкам исследовательские методы, дополняющие работу с текстами, поскольку цифровые архивы становятся все более масштабными, а цифровые исследовательские методы становятся все более доступными, историкам придется учиться тому, как формировать команды и работать в них… Сотрудничество предлагает – потенциально очень мощный – способ работы для ученых традиционного склада. Они могут создавать глобальные истории экономических, культурных и политических отношений, построенные на мощной архивной и текстовой основе». Работа Бусы, которую можно считать манифестом движения за цифровые методы в гуманитарных науках, не теряет своей актуальности и по сей день. См. Busa R. The Annals of Humanities Computing: Index Thomisticus // Computers and the Humanities 14 (1980). P. 83–90. Доступно в сети Интернет: http:// goo.gl/FgVWQ. Grafton A. Loneliness and Freedom // Perspectives on History (март 2011 г.), доступно в сети Интернет: http://goo.gl/dOx3J.


[Закрыть]
. Мир исследователей был впечатлен. Как и Index Хенли, Index Бусы позволил развиться новой области деятельности. Работа в этой области (известной в наши дни под названием цифровых гуманитарных наук) направлена на выявление того, каким образом компьютеры могут пригодиться для таких традиционных гуманитарных занятий, как история и литература[71]71
  Некоторые конкордансы оказываются мощнее других. Следует отметить, что, даже если оставить в стороне вопрос более сложного исходного источника, конкорданс Бусы значительно масштабнее конкорданса Реймер. К примеру, Index Thomisticus включает в себя полную лемматизацию (приведение всех словоформ к единой словарной форме) исходного текста, группирующую все слова в лексически связанные классы (в английском языке лемматизация предполагает группировку различных родственных слов типа run, running, runs, ran, outrun и also-ran под одним заголовком). Эта лемматизация сама по себе выглядит значительным достижением. Наборы списков данных, с которыми мы работали, не содержат лемматизации (ее очень сложно провести правильно).


[Закрыть]
.

Несмотря на всю важность этих индексов, их можно считать своего рода лебединой песнью. Колоссальная мощность современных компьютеров позволяет использовать для создания конкордансов одну-единственную строчку простого программного кода, который обеспечивает получение нужного результата за считаные секунды. К тому времени как Реймер опубликовала свой алфавитный эксперимент под названием Legendary, Lexical, Loquacious Love – представляющий собой, по сути, конкорданс, но без отсылок на номера страниц, – сам по себе процесс создания конкордансов перестал считаться серьезным занятием, заслуживающим признания. В наши дни ученые редко заботятся о том, чтобы создавать новые конкордансы. В этом нет нужды, поскольку даже дешевый ноутбук почти мгновенно найдет все случаи употребления определенного слова даже в длинном тексте. На первый взгляд, эпоха конкордансов ушла в прошлое.

Однако если вы поднимете крышку современных технологий, вас удивит увиденное внутри. Сегодняшний мир не может прожить без поисковых машин в Интернете, самых мощных инструментов поиска информации из когда-либо созданных. Что такое поисковая машина? По сути, она представляет собой список слов и страниц в сети Интернет, где эти слова появляются. За каждым крошечным белым поисковым окошком кроется огромный цифровой конкорданс.

Конкордансы не умерли со времен Бусы. Напротив, они завоевали этот мир.


Страницы книги >> Предыдущая | 1 2 3 4 5 | Следующая
  • 4.2 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации