Электронная библиотека » Джон Олссон » » онлайн чтение - страница 8


  • Текст добавлен: 13 июня 2018, 11:41


Автор книги: Джон Олссон


Жанр: Документальная литература, Публицистика


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 15 страниц) [доступный отрывок для чтения: 4 страниц]

Шрифт:
- 100% +
Глава 13
Смертельные угрозы в тропиках

Я должен кое в чем признаться. Дело, которое я собираюсь вам представить, всегда озадачивало меня и оставляло во мне ощущение неловкости. Это одно из тех дел, результаты которого вынужденно предварительны, и ни в чем нет полной уверенности. Поэтому тексты, составляющие данное дело, я приведу почти целиком. Я просто предоставляю их на ваше рассмотрение. Не потому что это дело таит в себе потрясающие открытия. Напротив, я даю его как пример нередкой, вопреки расхожему мнению, ситуации в судебной работе, когда судебный лингвист оказывается в неизведанных водах. Однако я уверен, что кто-нибудь из моих читателей сможет увидеть в этих текстах то, что я упустил.

Дело касалось заместителя руководителя благотворительной организации, работающей в тропиках. Борис Обломов (имя изменено), русского происхождения, вырос в Соединенном Королевстве, учился в сельскохозяйственном колледже и вскоре после выпуска отправился работать в Индию в продовольственной программе ООН. Вскоре он набрался опыта в сельском хозяйстве развивающихся стран, особенно в области животноводства. Проведя там несколько лет, он переехал в другую тропическую страну.

Хотя многие воображают, что работники благотворительных организаций роскошно проводят время в самых солнечных уголках мира, на самом деле жизнь большинства из них довольно тяжелая. Они занимаются чем-то посложнее сидения в офисе по нескольку часов в день, подписи пары чеков и походов на пляж. Некоторые из них по-настоящему рискуют своими жизнями, помогая людям в бедных странах, и порой полностью зависят от коррумпированных чиновников, совершенно не заботящихся о положении тех людей, которым работники общественных организаций посланы помогать. На самом деле многие работники общественных организаций подвергаются арестам по малейшему предлогу, а некоторым из них угрожали конфискацией имущества, похищением их родственников и расправой.

Так произошло и с господином Обломовым. Он работал в чужой стране, вдали от дома, и его задачей было создание сельскохозяйственных курсов, которые принесли бы долгосрочную пользу фермерской науке. Проведя в стране совсем немного времени, он получил следующее письмо:


Текст 1: Первое анонимное электронное письмо[32]32
  В тексте по возможности воспроизведены ошибки, содержащиеся в оригинале. – Прим. пер.


[Закрыть]

Господин Обломов,

сообщаю вам по секрету, что некая группа людей запланировала ваше убийство, встретившись в городском баре. некоторые из них, кажется, работали в вашей компании и уволились некоторое время назад. Их их шестеро, трое из нних похожи на [название племени]. Один из [название племени] – известный наемный убийца, работающий в [название города]. Они планировали похитить вас по пути в аэропорт, но вы отбыли на день или два раньше. Они хотели перехватить вас возле [название места] и отвезти в [название места] плантации, и вас бы никто никогда больше не увидел. У всех у них есть ваши фотографии. Они ззнали, что вы поедете на лендровере, бМв или красной хонде. они координируют свои действия по мобильным телефонам. я не знаю, зачем они за вашей жизнью, но они выглядят очень целеустремленно. сейчас они ждут, чтобы вернуться и заполучить вас, они даже знают дату, когда вы собираетесь приехать, и хотят поймать вас по дороге из аэропорта. кто-то из вашей компании помогает им с подробностями.я узнал об этом, сидя за соседним столиком, один из них забыл кое-какие бумаги с подробностями, они не боялись говорить и выглядели слегка пьяными. Я сидел прямо позади них около тридцати минитно совсем не боялся. еще они говорили, что работа стоит 20 000, и что все деньги, которые они при вас найдут, тоже будут их. я советую вам держаться подальше, я не знаю вас, но хочу помочь вам.это настоящие убийцы.


Спустя немного времени господин Обломов получил второе письмо:


Текст 2: Второе анонимное электронное письмо

Борис,

Я – один из четырех работников, все еще находящихся в офисе. Я скрываю свою личность, потому что понял, что тайна перестала быть тайной и автор анонимного документа теперь известен публике. Я пишу по причине искреннего беспокойства.

Мы, работники офиса, убеждены, что существует реальная угроза к вашей жизни, какие-то загадочные люди ищут вас (в разное время разные).Они не те, за кого себя выдают. Копы тоже вас ищут, они говорят, что хотят вернуть вас на скамью подсудимых, и выглядят они так, как будто знают что-то, чего не знаем мы.

с наилучшими пожеланиями.


Как раз перед получением этих писем господин Обломов поссорился с секретарем организации. Обломов заподозрил, что анонимные письма мог послать этот джентльмен, мистер Гонсалес, и отправил нескольких коллег повидаться с ним и доставить письмо, в котором Обломов обрисовал свое беспокойство. Вот что он получил в ответ (выдержка):


Текст 3: Письмо от бывшего работника

Во-первых, я проинформировал их, а теперь хочу также проинформировать и вас о том, что я против вас НИЧЕГО НЕ ИМЕЮ. Вы сказали, что получили угрожающие SMS и электронные письма, и мне было жаль слышать это. Я должен обратить ваше внимание на то, что я также получал похожие сообщения, вероятно, даже хуже. Я показывал эти сообщения своей команде, и они все были в шоке, они все еще на моем телефоне и я их вам покажу. Я также получал электронные сообщения, вы расплачетесь, когда прочтете их. У меня совсем нет времени сидеть и писать такие письма, они выдают очень мелкую личность. Если у меня будет, что вам сказать, я напишу вам прямо и никогда не буду скрываться, какими бы горькими ни были мои слова. Я показал команде единственное SMS, которое я когда-либо писал напрямую вам, и я сделал это из лучших побуждений, прошу прощения, если это задевает вас, я никогда не намеревался этого делать. Все мы пришли к заключению, что кто-то пытается рассорить нас с вами и раздувает это дело; вероятно, он хочет разрушить вашу организацию. Поэтому важно, чтобы вы выяснили источник этой информации, сообщили в полицию и усилили свою личную охрану, пожалуйста, не рискуйте с вашей жизнью.

Наконец, я прошу вас убедить автора этого документа открыться публике, открыться хотя бы вам, пояснить свои претензии, и тогда мы с вами могли бы их обсудить. Давайте оставаться позитивными и развеем впечатление возникшей между нами враждебности, которой нет.

Спасибо вам,

П. У. Гонсалес. 

Первым мне бросилось в глаза то, что в этих текстах несколько раз упоминается «ваша жизнь», каждый раз с разными предшествующими предлогами. Так, в двух анонимных документах встречаются «Я не знаю, зачем они за вашей жизнью, но они выглядят очень целеустремленными» и «Мы, работники офиса, убеждены, что существует реальная угроза к вашей жизни», в то время как в тексте Гонсалеса мы имеем «усилили свою личную охрану, пожалуйста не рискуйте с вашей жизнью». Не обязательно это как-то связано с авторством, но, тем не менее, это интересно в свете вполне компетентного обращения с предлогами в остальном тексте. Другим зачастую сложным для изучающих английский язык аспектом является употребление определенного артикля the. По большей части в данных текстах этот артикль используется довольно грамотно, хотя есть и ошибки, например to airport и from airport вместо to the airport и from the airport («в аэропорт», «из аэропорта»). Однако лексико-грамматика[33]33
  То, как работает словесная грамматика. Когда-то было принято думать, что грамматика и лексика (словарный запас) существуют в языке индивида порознь, но сегодня лингвисты рассматривают их как единую взаимозависимую систему, в которой лексика определяет грамматику. Таким образом, слово нашего личного лексикона – лишь часть нашей личной грамматики, если соблюдены «правила» употребления этого слова. – Прим. авт.


[Закрыть]
очень уверенная: слова «перехватить», «беспокоиться», «целеустремленный», «убеждены» применяются без затруднений. Поэтому местоимение I («я»), несколько раз написанное с большой буквы, и were («были»), написанное как wer, не убеждают меня в том, что автору недостает компетентности и базовых языковых навыков. Рассмотрим также тот факт, что текст 1 начинается с маленькой буквы, secretly в нем написано как secretely («в тайне», «по секрету»), а BMW – как bMw. Вместе с тем leftsometimes (искаж. «уволился некоторое время»), kknew (искаж. «знал») и waitng (искаж. «ждать») и странная расстановка регистров в слове bMw призваны указать на то, что автор якобы не очень уверенно обращается с клавиатурой. Но я полагаю, что на самом деле автор анонимных писем сознательно искажает свой стиль и уровень владения клавиатурой. Кажущееся неумение пользоваться клавиатурой и простейшие опечатки часто применяются в целях сокрытия авторства. Однако этим попыткам продемонстрировать недостаток навыков противоречат признаки хорошего владения языком, в том числе приведенные выше примеры. Поэтому мне стало интересно, действительно ли это письма «искреннего беспокойства», как в них утверждается, и действительно ли их автор хотел «помочь».

Также мне показалось любопытным то, что мистер Гонсалес рассматривает смертельные угрозы в адрес господина Обломова исключительно в плоскости проблем, существующих между ними: «Все мы пришли к заключению, что кто-то пытается рассорить нас с вами и раздувает это дело», – и: «Кое-кто из бывших сотрудников проявил большой интерес к этому делу, и у меня есть предчувствие, что нельзя отметать возможность их участия в раздувании этой ссоры».

Это тоже еще ничего не говорит об авторстве, но подводит нас к следующему пункту: упоминания «кого-то» и особенно фраза «кое-кто из бывших сотрудников» в письме Гонсалеса явно отсылают к словам «некоторые из них, кажется, работали в вашей компании» из первого анонимного письма. Отметим также параллель между «Кто-то из вашей компании помогает им с подробностями» в том же письме и «кто-то слил им сведения». Как и многие анонимные письма, тексты 1 и 2 полны намеков. Так, в анонимках присутствуют расплывчатые фразы «группа людей» и «какие-то загадочные люди», в письме же Гонсалеса присутствует упоминание «кого-то».

Также примечательно, что и в анонимных письмах, и в письме Гонсалеса утверждается, что сведения сливает один человек, а в заговоре участвуют более одного бывшего сотрудника.

Рассматривая ряд анонимных сообщений, важно помнить, что они могут быть написаны более чем одним автором. Мне показались интересными такие связи между текстами, как упомянутые отсылки к «каким-то людям», очевидно, безграмотное использование предлогов со словом «жизнь» – «они за вашей жизнью», «угроза к вашей жизни», «рисковать со своей жизнью» и «настоящие убийцы» вместо «настоящей угрозы». Хотя это определенно не признаки единого авторства, я бы не сказал, что они не могут на него указывать.

Наконец, я обращаю внимание читателя вот на это предложение из текста 2: «автор анонимного документа теперь известен публике». Я думаю, что здесь автор имеет в виду, что «публике» стало известно о получении Обломовым анонимного документа. Это похоже на «Я прошу вас убедить автора документа открыться публике» из письма Гонсалеса тем, как использовано слово «публика». Дело не только в коллокации[34]34
  Collocation: близкое расположение двух слов в тексте. Впервые открытые британским лингвистом Дж. Р. Фитчем в 1951 году, коллокации с тех пор сформировали скелет исследования текста с помощью лингвистического корпуса. – Прим. авт.


[Закрыть]
слов «автор», «документ» и «публика», но и в первую очередь в том, как использовано слово «публика». В пассаже «автор анонимного документа теперь известен публике» под «публикой» пишущий подразумевает людей из компании Обломова, а не широкую публику. Я полагаю, что подобное толкование применимо и к письму мистера Гонсалеса: «Я прошу вас убедить автора этого документа открыться публике, открыться хотя бы вам». Он начинает с предложения Обломову «убедить автора… открыться публике». Однако это вновь не означает того, что автор должен открыться широкой публике, а лишь господину Обломову или компании господина Обломова, как становится понятно из «открыться хотя бы вам». Итак, слово «публика» в обоих текстах используется в очень специфическом значении, во всяком случае – в очень специфическом контексте.

В этом месте анализа я должен сказать, что мне больше нечего добавить: определенно, между письмом Гонсалеса и анонимными текстами есть связь, но больше ничего сказать нельзя. Я, конечно, не стал бы исключать его из списка возможных авторов. К сожалению, я больше не видел ни одного текста этого анонимного автора или авторов, так как вскоре после получения мной этого заказа господин Обломов исчез из виду. По сей день я не знаю, что с ним случилось.

Глава 14
«Профессиональный» анализ: ложное обвинение

Билл Джонсон – бизнесмен со Среднего запада, для которого самым большим удовольствием было слетать на личном самолете в Мексику, чтобы отдохнуть в своем летнем доме. Он был членом одного летного клуба на Среднем западе и часто помогал другим членам клуба, устраивая для них увеселительные воздушные прогулки, консультируя их на тему приобретения авиатехники; он даже помог парочке из них со строительством собственных ангаров на землях аэропорта. Однако летные клубы, подобно клубам рыбаков, шахматным клубам и клубам автолюбителей, бывают рассадниками зависти и соперничества: клубные группировки соревнуются друг с другом за положение в комитете, за лучшие парковочные места для своих машин и за благосклонность председателя. Билл Джонсон давно решил держаться подальше от внутриполитических дрязг клуба – он там был только за тем, чтобы летать. У него было множество клиентов по всем Соединенным Штатам, и ему не было нужды завоевывать положение в клубе. Чаще всего он летал по выходным.

Однажды он получил предложение снять участок земли на территории аэропорта на 25 лет. Он арендовал участок и построил на нем ангар по последнему слову техники. Вообразите же, как он ужаснулся, приехав однажды воскресным утром в аэропорт и обнаружив, что владельцы летного клуба заперли его самолет в его же ангаре. Его даже не пустили туда забрать личные вещи. Причиной для столь резкого шага со стороны клуба было то, что Джонсон якобы инкогнито вел интернет-журнал, который, по мнению правления клуба, вредил доходам их организации. Они показали Джонсону интернет-журнал, редактором которого, по их утверждению, он являлся. Я буду называть этот журнал документом Икс. Статьи в нем содержали умеренную критику в адрес правления летного клуба, но назвать его причиняющим убытки было бы преувеличением. На самом деле это больше походило на веселое, местами полуграмотное описание причуд одних членов клуба, тщеславия и амбиций других и общей неразберихи, которая всегда возникает, когда десяток людей занимаются одним делом и вроде бы должны ладить друг с другом. Джонсон оскорбился, так как в этом журнале слегка хромали грамматика, орфография и пунктуация.

Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента.

В ответ на заявления о своей невиновности Билл Джонсон услышал, что у него «нет шансов». Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента. Они ликующе улыбались, перечисляя принадлежащую ему собственность, о которой, как оказалось, им было известно довольно много. Подозрения касательно их истинных мотивов усиливались у Джонсона с каждой минутой, и он немедленно связался со своим адвокатом для того, чтобы предпринять ответные действия. Осознав, что жертва собирается сопротивляться, клуб пригласил некоего профессора оценить вероятность того, что автором материала Икс является мистер Джонсон. Отчет был составлен, а адвокаты мистера Джонсона наняли меня для того, чтобы узнать, «можно ли что-нибудь сделать».

Во-первых, я должен сказать, что упомянутый профессор весьма известен в своей области и, я полагаю, популярен в своем университете. Однако оказалось, что он не обладает детальным пониманием как судебной лингвистики, так и проблем установления авторства. Я не смог найти каких бы то ни было упоминаний его публикаций по вопросам судебной лингвистики или установления авторства, и, насколько мне известно, он не является и никогда не являлся членом Международной ассоциации судебной лингвистики, которая представляет эту область в академической сфере, издает собственный рецензируемый журнал и регулярно проводит международные конференции.

Отсутствие подобного опыта стало сказываться с самого начала. Например, профессор неправильно подошел к отбору текстов, и, на мой взгляд, некоторые его предположения о распределении слов в речи были ошибочны. Его статистические методики также вызывали вопросы. Однако что подумают судьи? Вот что было самое главное.

Я также заметил, что профессор Уиллерби (имя изменено), по-видимому, не был объективен при написании отчета. К примеру, он утверждал, что его задача заключалась в том, чтобы «предоставить отчет о лингвистических сходствах ряда текстов (писем обычных и электронных), написанных мистером Биллом Джонсоном, и другим рядом текстов, взятых из Икс…» Автор отчета, кажется, уже принял решение о том, что сходства будут значительными, и теперь просто искал подтверждение своим взглядам. Расследование подобного дела должно быть совершенно беспристрастным, и цели его следует заявлять куда более нейтральным тоном, например: «…предоставить отчет о возможных лингвистических сходствах Икс и Игрек». Я также отметил, что Уиллерби не упомянул о том, что его отчет был написан в помощь какому бы то ни было суду. Судебный лингвист работает не ради клиента – даже будучи нанятым, он помогает суду.

В предисловии Уиллерби утверждает, что:


…область судебной лингвистики, занимающаяся подобными вопросами, называется установлением авторства. У этой области давняя история, известная широкой публике главным образом по делам об оспаривании авторства таких известных писателей, как Уильям Шекспир. Однако эти же методы использовались и в таких судебных расследованиях, как идентификация Унабомбера, которая была произведена на основе его личного блокнота и широко распространенного манифеста.


В приведенной цитате, раз уж она выражает взгляд эксперта, есть несколько сомнительных моментов. Во-первых, судебная лингвистика – область сравнительно новая, у нее не было «долгой истории». Термин forensic linguistics («судебная лингвистика») впервые использовал в 1968 году Ян Свартвик. Я однажды спросил его о том, как он придумал это словосочетание, и он сказал, что в 60-х годах смотрел телесериал «Quincy». В каждом эпизоде звучало слово forensics («криминалистика»), и он подумал, что его можно вполне успешно применить в качестве прилагательного к слову «лингвистика». Это же словосочетание стало заглавием самой первой научной работы об этом предмете[35]35
  Svartvik, Jan (1968). The Evans Statements: A Case for Forensic Linguistics. Gothenburg: Acta Universitatis Gothoburgensis. – Прим. авт.


[Закрыть]
. Однако широко этот термин стал употребляться лишь в 1994 году, когда начал издаваться первый академический журнал с этими словами в заголовке. Более того, установление авторства не является подразделом только лишь судебной лингвистики. Оно является обычным делом в литературной поэтике с ее куда более богатой историей. Авторство произведений Шекспира не относится к судебной области: это давний публичный диспут, малоинтересный в академическом смысле, а каноническое литературное авторство относится к области академических исследований, не имеющих никакого законодательного аспекта и поэтому не могущих называться судебной лингвистикой. Ошибочны даже замечания Уиллерби об Унабомбере: сперва он был идентифицирован на основе стилистических факторов, обнаруженных в его письмах к брату и свояченице, а не на основании его блокнотов, как заявляет Уиллерби; блокноты были найдены уже после ареста Унабомбера. Я располагаю этими сведениями из первых рук, от весьма уважаемого спецагента ФБР, работавшего над этим делом, – Джима Фитцджеральда.

Говоря об установлении авторства, Уиллерби заявляет о существовании трех процедур и перечисляет их: 1) неформальный анализ лингвистического своеобразия, 2) статистический анализ распределения служебных слов и 3) обучение нейросетей с помощью технологий искусственного интеллекта.

На самом деле Уиллерби, по-видимому, путается в терминологии. Сначала он говорит о трех типах процедур. Затем упоминает «общий метод», который в дальнейшем называет «процедурой», потом снова «методом» и, наконец, останавливается на «приеме». Из-за этой путаницы в терминологии я полагаю, что Уиллерби не понимает разницы между методами, процедурами и приемами. А о подходах он даже не заговаривает.

Было бы правильно начать с подхода к задаче. Простейшим подходом является субъективная оценка лингвистического своеобразия, то есть черт, специфически присущих некоторому автору (или кажущихся таковыми). У этого подхода есть свои области применения, но кто-то считает его «ненаучным» из-за того, что он плохо поддается численному выражению. Альтернативным подходом является количественный: любой из количественных методов может быть применен к любым лингвистическим аспектам. Три основные области количественного подхода связаны с измерением и статистическим анализом1) лексики текста, 2) служебных слов[36]36
  Лингвисты считают, что лексикон делится на две главные категории – знаменательные слова и служебные слова. Знаменательное слово имеет смысловое значение: «веселый», «стол», «любовь» и так далее. Служебные слова играют грамматическую роль и не имеют собственного значения. Так, the (определенный артикль) является служебным словом, как и of (притяжательный предлог), any («любой»), into («в») и так далее. – Прим. авт.


[Закрыть]
и 3) моделированием языка, например, с помощью алгоритмов сжатия, нейросетей и так далее. В рамках каждого из этих подходов существует множество методов измерения и анализа.

О своем втором «методе» Уиллерби говорит: «Второй общий метод заключается в статистическом анализе распределения контекстонезависимых слов». Затем он цитирует двух авторов, библиографические ссылки на которых приведены в конце отчета, но конкретные номера страниц не указаны. В отчетах и вообще в академических работах совершенно необходимо предоставлять читателю точные ссылки на справочный материал. Просто привести названия работ недостаточно по той простой причине, что у читателя тогда не будет всех сведений, необходимых для проверки утверждений автора отчета.

Затем в отношении своего второго «метода» Уиллерби утверждает, что «эта процедура получила широкое признание в этой области», но я должен возразить. Широкого признания в этой области не получила ни одна процедура. И, в любом случае, о какой области идет речь? Если о судебной лингвистике, то это попросту неверно: я не знаю ни об одном лингвисте, представившем суду отчет по установлению авторства на основании подсчета служебных слов. Если речь идет об области компьютерной лингвистики, которая интенсивно занимается вопросами авторства, но положение которой не позволяет ей сделать вклад в судебную лингвистику, то, возможно, это действительно так. Однако следует отметить, что специалисты по компьютерной лингвистике обычно работают с очень длинными текстами: романами, крупными эссе и прочими объемными трудами. Судебной лингвистике приходится иметь дело с анализом почти исключительно кратких текстов. Нередко приходится проводить расследование, располагая лишь тремя текстами не более нескольких сот слов каждый, а то и меньше пятидесяти. По этой причине приемы судебной лингвистики обычно несколько отличаются от приемов установления авторства литературного произведения. В любом случае я никогда не слышал о специалисте по компьютерной лингвистике, который давал бы в суде экспертную оценку в области установления авторства.

Порой авторы экспертных отчетов делают сильные заявления, не выдерживающие испытания скрупулезным перекрестным допросом. Так, Уиллерби пишет: «Совсем недавно утверждалось, что полный синтаксический анализ обоих текстов является более прямым методом достижения той же цели, хотя он куда более трудозатратен и провести его за время, отведенное для настоящего анализа, было невозможно». Возникает ощущение, что мистер Уиллерби обладает необходимыми знаниями и программным обеспечением для выполнения подобной работы и, самое главное, – таким опытом. Насколько мне известно, лишь несколько аналитиков решились бы провести «полный» анализ документа или набора документов объемом 20 000 слов, и, как бы то ни было, выполнение синтаксического анализа – это работа для узкого специалиста, и мало какой лингвист может ее выполнить.

Также Уиллерби говорит: «Широко признано, что частота многих слов этого типа может служить своего рода отпечатком пальца каждого автора». Может быть, это и широко признано, но с этим не согласны те лингвисты, которые хоть как-то соприкасались с установлением авторства. На самом деле это во многом противоречит нашему пониманию того, как язык усваивается и используется, развивается и атрофируется на протяжении человеческой жизни. Уиллерби не привел никаких подтверждений тому, что подобное представление является «широко признанным».

В своем анализе Уиллерби упоминает печально известный метод установления авторства, отвергнутый судами более десяти лет назад. Он известен как метод накопленных сумм и был совместно разработан викарием и ученым-программистом. Его решительно атаковали как лингвисты, так и психологи. Под заголовком «Анализ служебных слов» Уиллерби утверждает, что метод накопленных сумм был отвергнут из-за того, что «множество двух– и трехбуквенных слов и слов, начинающихся с гласной, не является естественной лингвистической категорией». На самом деле это далеко не главная причина, по которой метод накопленных сумм был отвергнут. Главная причина в том, что он нарушает несколько основополагающих научных принципов и совершенно не учитывает ряда элементарных постулатов лингвистики. Для меня было неожиданностью, что мистер Уиллерби всего этого не знает, учитывая его положение в крупном образовательном учреждении. Я также удивился тому, что в отчете по установлению авторства «эксперт» говорит о методе, давно отвергнутом всем сообществом судебной лингвистики.

Далее по теме анализа служебных слов он добавляет: «В ходе первых исследований в области установления авторства было принято думать, что важным показателем является средняя длина предложения». Ирония здесь в том, что он говорит о работе, проведенной математиками сто лет назад – сначала Аугустусом де Морганом и Т. С. Менденхоллом, а позднее Адни Юлом. Ни один из этих математиков – весьма выдающихся, впрочем, – не был связан с лингвистикой и даже не увлекался серьезно изучением языка. Поэтому называть их работу «первыми исследованиями в области установления авторства» будет по меньшей мере лукавством. Также меня вновь озадачило то, что Уиллерби говорит о методе, а затем отбрасывает его, заявляя, что он не подходит для решения задачи установления авторства.

Еще по теме разбора служебных слов Уиллерби упоминает такую меру, как показатель лексического разнообразия текста. Это лингвистический показатель богатства словарного запаса в некотором объеме текста. Он равен отношению числа разных слов в тексте к длине текста, измеренной в словах. Однако измерение лексического разнообразия обычно не предпринимают в отношении служебных слов. Любопытно, что Уиллерби вновь описывает меру, которая, по его собственному признанию, мало подходит для анализа с целью установления авторства.

Уиллерби говорит, что тексты Джонсона и материала Икс были предоставлены ему в печатном виде. Учитывая то, что материал Икс был размещен в интернете во всеобщем доступе, мне показалось странным то, что он взял распечатанный текст и отсканировал его с применением технологии распознавания символов и последующей уточняющей корректурой. Странно, что аналитик воспроизводит электронный документ, сначала распечатывая его, а затем сканируя и вычитывая, и ожидает, что полученный таким образом текст будет в точности таким же, как оригинальный электронный текст. Уиллерби утверждает, что «каждая страница была вычитана OCR-ассистентом». Он не сообщает, был этот ассистент человеком или компьютерной программой. OCR-ассистенты входят во многие пакеты программного обеспечения и по большей части помогают решать вопросы верстки, организации текста и так далее. Он говорит, что «для исправления ошибок, не встречающихся в исходном тексте, использовалась программа проверки орфографии». Я не уверен в том, что понимаю, что именно он имеет в виду. То, что программа проверки орфографии использовала стандартный орфографический словарь для устранения ошибок, или же то, что эта программа была использована для сохранения ошибок, сделанных в источнике? Не знаю, как подобная программа может в этом помочь; скорее всего, это сделал сам Уиллерби.

Те же замечания относятся и к текстам Билла Джонсона. В большинстве своем это были электронные письма, написанные мистером Джонсоном ранее. Если это уже были электронные документы, то зачем их распечатывать, сканировать и вычитывать? Раньше пакеты OCR-программ для сканеров славились тем, что нагружали процессор и допускали массу ошибок, особенно в таких документах, как электронные письма. Между прочим, в данном контексте со словом «ошибка» следует обращаться очень обдуманно. Под ошибкой здесь подразумевается не грамматическая, орфографическая или пунктуационная ошибка. Речь идет об отличиях текста, произведенного в процессе сканирования, от текста первоначального. Если сканер честно воспроизводит фрагмент текста, содержащий ошибку, то с точки зрения судебной лингвистики – это не ошибка. Сканирование проведено корректно. И напротив, если сканер «исправляет» ошибку посредством встроенного алгоритма проверки орфографии, то это ошибка, несмотря на то что произведенный текст грамматически и орфографически корректен. Обычно назначение корректировщика в распознающем программном обеспечении сканера – исправлять обнаруженные им ошибки правописания; но в судебном контексте важно ничего не исправлять, поскольку текст-свидетельство должен быть представлен как он есть.

Я очень сильно сомневаюсь, что кто-либо способен вычитать 20 000 слов и в соответствии с этими высокими требованиями не допустить ошибок, особенно в условиях ограниченного времени (о котором Уиллерби также говорит в своем отчете). Даже самый аккуратный автор совершает разного рода ошибки, и если они были исправлены в процессе сканирования либо как-то неверно интерпретированы, то версия Уиллерби, весьма вероятно, не вполне точно отражает исходный материал. То же касается и текстов мистера Джонсона. Джонсон попросил дать ему ознакомиться с электронными письмами, использованными для экспертизы, но Уиллерби ему в этом отказал. Это крайне необычно, так как означает невозможность проверить опорные документы на точность и достоверность.

Следующий раздел в отчете Уиллерби озаглавлен «Выбор образцов». Насколько я могу судить, все описанные им методы были отвергнуты. Он до сих пор не упомянул тех методов, которые собирается применить для установления авторства. Более того, в судебной работе проверяемые тексты никогда не называют «образцами» (samples). Все тексты в наборе являются обязательными, так как целью исследования является установление личности их автора, или, выражаясь более научно, выяснить, на каком основании эти тексты можно приписать или не приписать тому или иному автору.

Но самая серьезная лингвистическая слабость отчета Уиллерби еще впереди. Она связана с тем, какого типа тексты были выбраны им для сравнения. Уиллерби говорит, что все они относятся к «объяснительной прозе». Этим термином называют тексты, призванные объяснять что-либо, чаще всего технические. Часть сравнительных текстов Уиллерби действительно подпадают в категорию объяснительной прозы; например, он включил в корпус текстов для сравнения студенческое эссе и часть кандидатской диссертации по лингвистике (возможно, своей собственной?). Однако можно усомниться в том, что электронные письма Билла Джонсона (даже те, которые касаются довольно формальных тем) полностью отвечают критериям объяснительной прозы, поскольку тексты, написанные для асинхронного электронного средства связи[37]37
  Асинхронные электронные средства связи – средства связи, в которых ответ на сообщение отложен. К ним относятся электронная почта, SMS-сообщения, ICQ, интернет-чаты и так далее. – Прим. авт.


[Закрыть]
, зачастую куда менее структурированы по сравнению с более формальной прозой и склонны к неформальности по части [адресованности] и тона. Более того, мы можем усомниться и в том, что один из текстов, включенных Уиллерби в корпус, – написанная им самим лекция для студентов, – относится к прозе в традиционном смысле этого слова, поскольку она писалась для того, чтобы читать ее вслух перед группой людей, а не для того, чтобы кто-то читал ее в индивидуальном порядке. Мне удивительно и то, что в качестве критерия классификации он выбрал объяснительную прозу. Материал Икс определенно не был объяснительной прозой. Если чем он и был, так это умеренной политической сатирой.


Страницы книги >> Предыдущая | 1 2 3 4
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации