Электронная библиотека » Гэри Маркус » » онлайн чтение - страница 6


  • Текст добавлен: 25 марта 2022, 18:20


Автор книги: Гэри Маркус


Жанр: Прочая образовательная литература, Наука и Образование


сообщить о неприемлемом содержимом

Текущая страница: 6 (всего у книги 20 страниц) [доступный отрывок для чтения: 7 страниц]

Шрифт:
- 100% +

История глубокого обучения ярко демонстрирует нам всю красоту и трагедию узкого искусственного интеллекта. Красив он потому, что при благоприятных обстоятельствах экономит нам массу усилий: вам не нужно тратить кучу времени на надоедливую работу по проектированию функций, и, несмотря на это, машина все равно выполнит большую часть того, что вам требуется сделать. Трагедия же здесь в том, что ничто и никогда не гарантирует вам того, что даже самая лучшая система узкого ИИ даст пользователю правильный ответ в реальном мире, когда вам это нужно больше всего, и даже того, что вы сможете настроить ее правильно, если она отказывается работать. Собственно говоря, работа с узким искусственным интеллектом часто гораздо больше похожа на искусство, чем на науку: вы пробуете разные подходы, и, если у вас достаточно данных, они, как правило, рано или поздно начинают работать. Но вы никогда не сможете предсказать это заранее с той точностью, с какой мы доказываем теоремы в геометрии. И ни одна существующая сейчас теория не может точно предсказать, какие задачи глубокое обучение может решить надежно, а какие – не может: это всякий раз приходится проверять эмпирически. Вы видите, что работает, а что нет, и затем многократно переделываете исходную систему и набор данных, пока не получите желаемые результаты. Иногда это легко, а иногда – сложно (рис. 3.12).

Глубокое обучение является очень ценным, даже неотъемлемым инструментом дальнейшего развития узкого искусственного интеллекта; мы ожидаем, что в будущем оно будет играть столь же важную роль, как и в наши дни, и что с его использованием люди изобретут множество творческих приложений, о которых мы сейчас даже не фантазируем. Но вероятнее всего, что при этом со временем оно станет лишь одним из множества компонентов в общем инструментарии искусственного интеллекта, а не автономным решением, противопоставленным остальным.


Рис. 3.12. Так вот как выглядит ваша система машинного обучения! (Рэндалл Манро (Randall Munroe), xkcd.com)


Честная правда о глубоком обучении состоит в том, что люди оказались безмерно очарованы одним конкретным набором алгоритмов, который, без сомнения, очень полезен, но вместе с тем – очень далек от подлинного интеллекта. Представьте себе, что мы изобрели автоматическую отвертку, работающую без участия человека: значит ли это, что теперь нам открылись пути к межзвездным путешествиям? Увы, мы останемся все так же далеки от них. Конечно, в открытом космосе нам очень пригодится автоматическая отвертка, но, чтобы оказаться там, потребуется изобрести нечто гораздо большее. Говоря все это, мы не подразумеваем, что системы глубокого обучения не могут делать вещи, которые внешне выглядят интеллектуальными, но мы хотим подчеркнуть, что глубокое обучение само по себе не обладает гибкостью и адаптивным потенциалом реального интеллекта. Вспомните ставшую крылатой формулировку Закона 31[32]32
  . https://spacecraft.ssl.umd.edu/akins_laws.html.


[Закрыть]
из «Кодекса законов космической инженерии» Акина: «Вы не сможете попасть на Луну, взбираясь последовательно на все более высокие деревья».

В оставшейся части книги мы опишем, что нам потребуется, чтобы, так сказать, добраться до Луны, – ну то есть сконструировать машины, которые смогут мыслить, рассуждать, говорить и читать так, как это делает самый обычный человек, – универсально и адаптабельно. Нам нужно не просто еще более глубокое обучение в смысле количества слоев в нейронной сети, а более глубокое понимание. Нам нужны системы, которые действительно могут рассуждать о сложном взаимодействии сущностей, связанных друг с другом причинно-следственными взаимоотношениями в постоянно меняющемся мире.

Чтобы понять, что мы подразумеваем под этим, следует углубиться в две наиболее сложные области искусственного интеллекта: чтение и роботизацию.

Глава 4
Если компьютеры такие умные, то почему они не могут читать, как люди?

САМАНТА: Итак, чем я могу вам помочь?

ТЕОДОР: Ну… мне кажется, что в моем компьютере некоторый беспорядок, вот и все.

САМАНТА: Вы не возражаете, если я посмотрю, что у вас на жестком диске?

ТЕОДОР: Гм… Ладно.

САМАНТА: Хорошо, давайте начнем с вашей электронной почты. У вас есть несколько тысяч писем по поводу некоего LA Weekly, но, похоже, вы не разбирали их много лет.

ТЕОДОР: А, ну да. Я их сохранял на всякий случай, ну, я подумал, может быть, в некоторых из них написано что-то забавное. Впрочем…

САМАНТА: Да, среди них есть несколько забавных. Я бы сказала, что нам нужно сохранить восемьдесят шесть, а остальные мы можем удалить.

«Она» (2013). Написано и поставлено сценаристом и режиссером Спайком Джонзом

Разве не было бы здорово, если бы машины могли понимать нас так же хорошо, как Саманта понимает Теодора? (Речь идет об операционной системе, озвученной Скарлетт Йоханссон в научно-фантастическом фильме Спайка Джонза «Она».) И если бы они могли мгновенно разобраться в наших электронных письмах, выбрать то, что нам нужно, и удалить все остальное?

Если бы мы могли наделить компьютеры только одним свойством, которое есть у нас, а у них нет, то лучше всего подошел бы дар понимания языка – не только для того, чтобы они могли лучше организовать нашу жизнь, но и для того, чтобы они сумели помочь человечеству в решении некоторых очень крупных проблем, таких как переработка и осмысление огромной научной литературы, которую люди по отдельности просто не в состоянии осилить.

В сфере медицины ежедневно публикуется около семи тысяч статей. Ни один врач или исследователь не может прочитать их все, и это является серьезным препятствием для дальнейшего прогресса во всей области. Открытие новых лекарств задерживается отчасти потому, что в литературе содержится много информации, которую никто не успевает прочитать. Новые методы лечения иногда не применяются из-за того, что у врачей нет времени их изучить и взять на вооружение. Программы искусственного интеллекта, которые могли бы автоматически обобщать необъятную медицинскую литературу, произвели бы настоящую революцию в здравоохранении.

Компьютеры, которые умели бы читать так же хорошо, как и аспиранты, но с вычислительной мощностью Google, способны были бы революционизировать и другие отрасли науки. Мы ожидаем прогресса в каждой ее области, от математики до климатологии и материаловедения. Преобразуются, конечно, не только точные и естественные науки. Историки и биографы смогли бы мгновенно узнать все, что было написано о неизвестном человеке, месте или событии. Авторы, пишущие в различных жанрах художественной литературы, автоматически проверяли бы несоответствия сюжета, логические пробелы и анахронизмы.

Даже гораздо более простые способности оказались бы чрезвычайно полезными. В современных iPhone есть специальная функция: когда вы получаете по электронной почте сообщение, в котором назначается встреча, вы можете нажать на виртуальную кнопку, и телефон добавит встречу в ваш календарь. Это действительно удобно, но лишь тогда, когда все работает правильно. Однако зачастую iPhone добавляет встречу не на тот день, который вы имели в виду, ошибочно ориентируясь, например, на еще какую-то дату, упомянутую в электронном письме. Если вы не отследите ошибку вовремя, это может обернуться серьезными деловыми проблемами.

Когда-нибудь, когда машины действительно научатся читать, наши потомки будут недоумевать, как мы обходились без «компьютерных секретарей», подобно тому как мы сейчас удивляемся – неужели предыдущие поколения обходились без электричества?


На ежегодной конференции TED[33]33
  Аббревиатура названия частного некоммерческого фонда Technology, Entertainment, Design. – Прим. пер.


[Закрыть]
в начале 2018 года известный футурист и изобретатель Рэй Курцвейл, в настоящее время работающий в Google, анонсировал свой последний проект Google Talk to Books, который обещал использовать понимание естественного языка, чтобы «обеспечить совершенно новый способ изучения книг». Журнал Quartz привычно расхвалил новое приложение как «мощный инноваторский поисковый инструмент Google, [который] ответит на любой вопрос, прочитав тысячи книг».

Как вы уже догадываетесь, на этом месте пора задать вопрос: «Что на самом деле умеет эта программа?» Ответ следующий: Google проиндексировал предложения в 100 000 книг, начиная от «Процветания в колледже» (Thriving at College) Алекса Чедиака и заканчивая «Программированием для чайников» (Beginning Programming for Dummies) Уоллеса Вонга и «Евангелием от Толкина» (The Gospel According to Tolkien) Ральфа Вуда, а затем разработал довольно эффективный метод кодирования значений предложений в виде векторных наборов[34]34
  Более ранняя методика – так называемый латентный семантический анализ (англ. Latent Semantic Analysis) – также позволяла преобразовывать выражения естественного языка в векторы. См. Deerwester, Dumais, Furnas, Landauer and Harshman 1990.


[Закрыть]
. Когда вы задаете вопрос, компьютер использует эти векторы, чтобы найти двадцать предложений в базе данных, имеющих векторы, наиболее похожие на заданные. Из этого описания очевидно, что «инновационная» система не имеет ни малейшего представления о том, что вы на самом деле спрашиваете.

Итак, уже зная информацию о входных данных в системе, легко видеть, что утверждение в статье Quartz, будто Talk to Books «ответит на любой вопрос», нельзя ни в коем случае воспринимать буквально. Конечно, «десять тысяч книг» – звучит впечатляюще, но на самом деле это лишь крошечная доля от более чем ста миллионов опубликованных изданий. Учитывая то, что мы поняли из предыдущей главы, насколько глубокое обучение опирается на слепые корреляции, а не на подлинное понимание, неудивительно, что реакция Talk to Books на многие запросы выглядит более чем сомнительной. Например, если задать системе вопрос о каких-то конкретных деталях из освоенных ею романов, ответ, скорее всего, будет достоверным. Но когда мы спросили у нее: «Где Гарри Поттер познакомился с Гермионой Грейнджер?»[35]35
  Эксперимент, проведенный авторами 19 апреля 2018 года.


[Закрыть]
, то ни один из двадцати ответов не имел отношения к тексту книги «Гарри Поттер и философский камень» и сам вопрос о месте знакомства так и не получил ответа. Потом мы спросили: «Правы ли были союзники в том, что продолжили блокаду Германии после Первой мировой войны?» Talk to Books не нашел результатов, которые даже упоминали бы такую блокаду. Так что «ответ на любой вопрос» – это, мягко говоря, сильное преувеличение.

И если походящие ответы не были прямо изложены в предложениях из проиндексированного текста, продукт Google постоянно выдавал ошибки. Так, мы спросили его: «Какие семь крестражей упомянуты в романах о Гарри Поттере?» – и не получили ответа в виде перечня существ и артефактов. Вероятно, система не смогла это сделать потому, что ни одна из множества книг, посвященных Гарри Поттеру, не перечисляет крестражи единым списком. Когда мы спросили: «Кто был старейшим судьей Верховного суда [США] в 1980 году?» – система вообще не сработала, хотя любой из вас, будучи человеком, может открыть тот или иной онлайн-список судей Верховного суда (хотя бы в «Википедии») и за пару минут выяснить, что это был Уильям Бреннан. Talk to Books не смог ничего поделать с этим вопросом именно потому, что в его базе данных нигде не было ни единого предложения, полностью излагающего ответ в явной форме: «Старейшим судьей Верховного суда в 1980 году был Уильям Бреннан». Ни в одном из 100 000 изданий этого предложения не оказалось, а сама система попросту не обладала способностью давать ответы на вопросы, хотя бы на йоту выходящие за пределы буквального содержания книг.

Однако наиболее значимой проблемой оказалось то, что в наших экспериментах мы получали совершенно разные ответы в зависимости от того, как ставился вопрос. Спросим Talk to Books, например, так: «Кто предал своего учителя за 30 сребреников?» Сами понимаете, что это эпизод из широко известной истории, однако из двадцати ответов только шесть содержали имя Иуды Искариота. (Любопытно, что девять – то есть число, большее в полтора раза – ответов хотя и были связаны с Библией, но упоминали гораздо менее известную и понятную историю о Михее Эфраимитском из Ветхого Завета: Книга Судей 17.) Но все пошло гораздо хуже, когда мы отклонились от точной формулировки про «серебряные монеты» или «сребреники» и задали системе чуть менее конкретный вопрос: «Кто предал своего учителя за 30 монет?» Здесь Иуда появился только в двух ответах, причем сама программа наиболее релевантной сочла следующую цитату, совершенно неуместную и неинформативную в данном случае: «Неизвестно, кто был учителем Цзинвана». А когда мы снова слегка перефразировали вопрос, на этот раз изменив «предал» на «продал» (получилось «Кто продал своего учителя за 30 монет?»), то Иуда окончательно исчез из результатов. Итак, чем дальше мы уходим от точного соответствия текста вопроса предполагаемым цитатам, тем больше нелепостей выдает Talk to Books.


Системы машинного чтения, о которых мы мечтаем, – если они появятся, – должны быть способны ответить практически на любой разумный вопрос о том, что они прочитают. Вдобавок они должны научиться объединять информацию, взятую сразу из нескольких документов. Наконец, их ответы будут состоять не только из готовых отрывков, но и содержать обобщение информации, будь то списки крестражей, которые никогда не появляются все вместе в одном и том же произведении, или что-то вроде содержательной выжимки из документации, какую вы бы ожидали от адвоката, собирающего прецеденты из большого числа судебных дел, или от ученого, который способен сформировать гипотезы, объясняющие наблюдения, опубликованные в нескольких статьях. Даже первоклассник может составить список всех хороших и плохих ребят, которые выступают в качестве героев в той или иной серии детских книг. Аналогично, хотя и на другом уровне, студент колледжа, пишущий курсовую работу, может объединить идеи из разных источников, сопоставить их и прийти к новым выводам. Именно так и должна действовать любая машина, которая претендует на то, что умеет читать.

Но прежде, чем мы сможем заставить машины синтезировать информацию, а не просто повторять ее наподобие попугая-всезнайки, нам потребуется создать нечто хотя бы на порядок более простое: машины, которые могут надежно понимать элементарные тексты.

До этого дня нам еще далеко, однако некоторым людям ничто не мешает переживать о порабощении человечества искусственным интеллектом уже сейчас. Чтобы понять, почему это не просто нам не грозит, но даже хотя бы надежное чтение все еще остается довольно отдаленной перспективой для машинного разума, нам полезно будет рассмотреть в деталях, что именно требуется для понимания достаточно простого текста, например детской истории.

Предположим, вы читаете следующий отрывок из книги «Сын фермера» (Farmer Boy) – детской книги Лоры Инглз-Уайлдер, автора книги «Маленький домик в прерии» (Little House on the Prairie). Альманзо, девятилетний мальчик, находит на улице кошелек (тогда его называли «бумажник»), полный денег. Отец Альманзо догадывается, что бумажник (то есть кошелек) может принадлежать мистеру Томпсону, и Альманзо находит мистера Томпсона в одном из городских магазинов.

Альманзо повернулся к мистеру Томпсону и спросил: «Вы не теряли бумажник?»

Мистер Томпсон аж подпрыгнул. Он хлопнул рукой по карману и воскликнул в изумлении:

«Точно! И с ним полторы тысячи долларов! А что? Ты что-то знаешь об этом?»

«Это он?» – спросил Альманзо.

«Да, да, именно!» – воскликнул мистер Томпсон, хватая бумажник. Он открыл его и поспешно пересчитал деньги. Потом пересчитал банкноты еще раз…

Затем он вздохнул с облегчением и добавил: «Что ж, этот проклятый мальчишка ничего не стащил».

Хорошая система чтения должна быть в состоянии ответить хотя бы на такие вопросы:

■ Почему мистер Томпсон хлопнул по карману рукой?

■ Знал ли мистер Томпсон, что потерял свой кошелек, до того, как с ним заговорил Альманзо?

■ Что имеет в виду Альманзо, когда спрашивает: «Это он?»

■ Кто чуть было не потерял 1500 долларов?

■ Все ли деньги остались в кошельке?

На все эти вопросы людям ответить очень легко, но до сих пор еще ни одна система искусственного интеллекта не может толком ничего поделать с подобными задачами. (Вспомните еще раз, как смутили Google Talk to Books слегка перефразированные запросы[36]36
  У Института искусственного интеллекта Аллена (Allen Institute for Artificial Intelligence) существует веб-сайт ai2.org, на котором вы можете опробовать новейшие модели на подобных тестах. Например, 16 ноября 2018 года мы ввели историю Альманзо в самую передовую модель читающей системы, доступную на сайте, и задали четыре вопроса: «Сколько денег было в кошельке?», «Что было в кошельке?», «Кому принадлежит кошелек?» и «Кто нашел бумажник?» На первый и третий вопрос компьютер ответил правильно; на второй дал бессвязный ответ («Посчитал деньги»); а последний ответ оказался неправильным («мистер Томпсон», а не «Альманзо»). Ненадежные результаты, подобные этим, очень типичны для современного уровня интеллектуальной техники.


[Закрыть]
.)

По своей сути каждый из этих вопросов требует, чтобы читатель (будь то человек или кто-либо другой) следовал цепочке умозаключений по событиям, которые в истории лишь подразумеваются. Возьмите первый вопрос. До того как Альманзо заговорил с мистером Томпсоном, тот не знал, что потерял кошелек, и предполагал, что он у него в кармане. Когда Альманзо спрашивает его, не потерял ли он кошелек, Томпсон понимает, что и вправду мог потерять свой бумажник. Именно для проверки этой возможности (потери бумажника) мистер Томпсон хлопает себя по карману. Поскольку кошелька не обнаруживается там, где он обычно хранится, мистер Томпсон приходит к выводу, что он потерял свой кошелек.

Когда дело доходит до сложных цепочек рассуждений, аналогичных приведенным выше, нынешний узкий искусственный интеллект оказывается в замешательстве. Подобные логические цепочки часто требуют, чтобы читатель заранее собрал внушительный набор базовых знаний о людях и предметах и, в более общем смысле, о том, как устроен мир. Ни одна из существующих ИИ-систем не имеет достаточно широкого фонда общих знаний, чтобы хорошо понимать события, происходящие даже в детских историях.

Возьмем некоторые знания, которые вы, вероятно, использовали прямо сейчас, «переваривая» историю про Альманзо и кошелек, – автоматически, даже не осознавая этого.

■ Люди могут ронять вещи, не обратив на это внимания. В истории дан пример знаний о связи между событиями и психическими состояниями людей.

■ Люди часто носят свои кошельки в кармане. Это пример знаний о том, как люди обычно используют определенные объекты.

■ Люди часто носят деньги в своих кошельках, и деньги важны для них, потому что это позволяет им платить за вещи. Следовательно, мы имеем тут пример знаний о людях, их обычаях и экономике.

■ Если люди предполагают, что что-то важное для них является правдой, но внезапно обнаруживают, что это может оказаться неправдой, то они нередко пытаются как можно быстрее это проверить. В отрывке есть пример знания о вещах, которые психологически важны для людей.

■ Вы обычно можете понять, есть ли что-то в вашем кармане, ощупывая его снаружи. Этот пример говорит нам о том, как могут быть объединены различные типы знаний. Конкретно, знания о том, как взаимодействуют друг с другом различные предметы (руки, карманы, кошельки), объединяются со знаниями о том, как работают чувства.

Рассуждения, необходимые, чтобы ответить на другие вопросы, столь же насыщенны. Например, чтобы ответить на вопрос номер три: «Что имеет в виду Альманзо, когда спрашивает: "Это он?"» – читатель должен заранее знать кое-что о языке, а также о людях и предметах, заключив из этого, что наиболее правильной интерпретацией обоих местоимений «он» и «это» будет, очевидно, кошелек (или бумажник). Гораздо более тонким моментом при этом будет то, что указательное местоимение «это» относится к кошельку, который держит Альманзо, в то время как личное местоимение «он» относится к кошельку, который потерял мистер Томпсон. К счастью, в данном случае оба кошелька (тот, что держит Альманзо, и тот, что потерял мистер Томпсон) оказываются одним и тем же предметом.


Рис. 4.1. «Он сравнил ее с „бутылкой винтажного вина“»


Следовательно, для того чтобы справиться со столь простым отрывком, знания читателя о людях, предметах и языке должны быть и обширными, и глубокими, и гибкими. Если обстоятельства в двух похожих внешне текстах отличаются даже в мелких деталях, нам чаще всего приходится довольно основательно адаптировать к ним свое восприятие. Мы не должны ожидать поспешной реакции от мистера Томпсона, если бы Альманзо сказал, что он нашел кошелек своей бабушки. Мы считаем вполне правдоподобным, что мистер Томпсон мог потерять свой кошелек, не зная об этом, но мы были бы удивлены, если бы он не знал, что наверняка останется без бумажника в случае нападения грабителей с ножами. Никто из ученых пока даже близко не подошел к пониманию того, как заставить машину рассуждать столь гибко. Мы не думаем, что это вообще невозможно, и позже мы наметим некоторые шаги, которые следует предпринять в данном направлении, но на сегодняшний момент реальность такова, что требуемые нам новые достижения значительно превосходят те, что были достигнуты в разработке искусственного интеллекта за всю историю этой области. Система Google Talk to Books не имеет даже отдаленного сходства с тем, в чем мы нуждаемся, равно как и «секретари», разработанные их конкурентами из Microsoft и Alibaba, о которых мы упоминали в самом начале книги.

Существует фундаментальное несоответствие между тем, что машины умеют делать сейчас – а именно классифицировать объекты по категориям, – и человеческими рассуждениями и реальным пониманием мира, которые будут необходимы машинам, чтобы овладеть банальной, но критически важной способностью усваивать смысл прочитанного.


Практически все, что вы можете прочесть, – от научных монографий до рекламных плакатов – вызывает аналогичные проблемы. Детская книжка, которую мы обсуждали выше, ничем особенным в этом плане не выделяется. Приведем для сравнения небольшой отрывок из The New York Times за 25 апреля 2017 года.

Сегодня исполнилось бы 100 лет со дня рождения Эллы Фицджеральд. Житель Нью-Йорка Лорен Шенберг одно время играл на саксофоне бок о бок с «первой леди эстрады» в 1990 году, когда карьера певицы уже близилась к концу. Он сравнил Эллу с «бутылкой винтажного вина» (рис. 4.1)…

Любой человек (как некоторые современные ИИ-системы) может легко ответить на вопросы, взятые более или менее прямо из текста (например: «На каком инструменте играл Лорен Шенберг?»), однако большинство вопросов потребуют определенных умозаключений, которые абсолютно неподвластны нынешнему искусственному интеллекту. Вот лишь несколько:

■ Была ли Элла Фицджеральд жива в 1990 году?

■ Была ли она жива в 1960 году?

■ Была ли она жива в 1860 году?

■ Встречал ли Лорен Шенберг когда-либо Эллу Фицджеральд?

■ Считает ли Шенберг, что Фицджеральд была алкогольным напитком?

Ответы на первый, второй и третий вопросы невозможны без понимания (и даже вычисления) того, что Элла родилась 25 апреля 1917 года, исходя из того, что 25 апреля 2017 года ей исполнилось (бы!) 100 лет, и без учета целого ряда общеизвестных естественных законов, в частности, таких.

■ Люди живы во время своей профессиональной деятельности, поэтому Элла Фицджеральд была жива в 1990 году.

■ Люди живы все время между их рождением и смертью, но никогда не бывают живыми до своего рождения или после своей смерти. Таким образом, певица не могла не быть жива в 1960 году, так же как ни в коем случае не могла быть жива в 1860 году.

Ответ на четвертый вопрос включает в себя рассуждение о том, что совместное воспроизведение музыки с кем-то обычно означает непосредственное (хотя бы очень поверхностное) взаимодействие с этим человеком, а также понимание того, что определение «первая леди эстрады» относится здесь именно к Элле Фицджеральд, хотя об этом и не сказано в явной форме.

Наконец, ответ на пятый вопрос требует немалого опыта в понимании того, что люди используют в качестве образных примеров, сравнивая между собой трудносопоставимые объекты, и владения конкретным знанием о том, что Элла Фицджеральд была человеком, а также знания закона природы, согласно которому люди никогда не бывают идентичны спиртным напиткам.

Выберите наугад любую статью в газете, или короткий рассказ, или многотомный роман, и вы тут же обнаружите нечто подобное. Опытные писатели никогда не рассказывают вам всего, они пишут лишь о том, что вам будет интересно прочитать, полагаясь на общие знания, чтобы заполнить пробелы. (Представьте себе, какими скучными были бы повести Уайлдер, если бы ей пришлось каждый раз объяснять вам, что люди держат свои кошельки в карманах и иногда пытаются обнаружить присутствие или отсутствие небольших физических объектов, похлопывая по карманам руками.)

На более ранних этапах разработки искусственного интеллекта одна группа исследователей действительно стремилась решить эти проблемы. Питер Норвиг, в настоящее время директор по исследованиям в Google, написал провокационную докторскую диссертацию о проблемах того, как заставить машины понимать человеческие рассказы. Еще более известен в этой области Роджер Шанк, который в период своей работы в Йельском университете обнародовал целую серию показательных примеров того, как машины могут использовать сценарии, чтобы понять, что происходит, например, когда человек идет в ресторан. Однако понимание нарративных текстов требует гораздо более сложных знаний и внушительного количества их форм, чем сценарии Шанка, поэтому проблема формулирования и сбора всех этих знаний оказывается невероятно сложной задачей. Со временем область, направленная на создание более реально мыслящих машин, заглохла, и ученые перешли к работе над другими, более доступными проблемами, такими как веб-поиск и механизмы выработки рекомендаций, ни одна из которых ни на миллиметр не приближала нас к универсальному искусственному интеллекту.


Конечно, веб-поиск изменил мир – это одна из самых больших историй успеха искусственного интеллекта. Платформы, подобные Google Search, Bing и ряду других, представляют собой мощнейшие и чрезвычайно полезные технические разработки, основанные на машинном разуме: за доли секунды они находят сходство и совпадения среди миллиардов веб-документов.

Самое удивительное здесь то, что, хотя все они работают на базе искусственного интеллекта, они не имеют почти ничего общего с тем типом универсального машинного чтения, к которому мы исходно стремились. Мы и сейчас хотим создать машины, которые способны понять, что они читают, однако поисковые системы не имеют к этому ни малейшего отношения.

Возьмем хотя бы Google Search. В алгоритме Google лежат две основные идеи. Одна из них существовала и до Google, другую же впервые применили именно создатели этой компании. Ни первая, ни вторая не зависят от того, насколько хорошо система понимает содержание документов. Более старая идея использовалась в программах поиска информации уже с начала 1960-х годов, задолго до появления Google и даже самого интернета: вы просто сравниваете слова в запросе со словами в документе. Хотите найти рецепты блюд с приправой из кардамона? Не проблема – просто найдите все сайты, содержащие слова «рецепт» и «кардамон». При этом вовсе не нужно понимать, что кардамон – это пряность, не требуется знать, чем она пахнет и каков ее вкус, не нужна история того, как ее добывают из стручков или какие мировые кухни ее чаще всего используют. Хотите найти инструкции по созданию самолетов? Просто введите в запрос сразу несколько слов, таких как «модель», «самолет» и «как», и вы получите множество полезных советов, хотя машина вообще не понимает, что такое самолет на самом деле, не говоря уже о том, что такое подъемная сила и сопротивление среды или по каким причинам люди летают на настоящих коммерческих самолетах, а не пытаются оседлать пластмассовую модель масштабом один к тысяче.

Вторая, куда более инновационная идея – это знаменитый алгоритм PageRank. Он состоит в том, что можно научить машину использовать «коллективную мудрость» интернета, оценивая, какие веб-страницы имеют более высокий приоритет, путем просмотра того, на какие из них уже существует много ссылок, в особенности ссылок с других страниц с высоким приоритетом. Этот прием позволил Google за короткое время подняться выше всех других веб-поисковых систем того времени. И тем не менее сопоставление слов и подсчеты ссылок, которые ведут с других страниц, не имеет ничего общего с настоящим пониманием текста.

Причина, по которой Google Search неплохо работает без необходимости реального чтения, заключается в том, что на выходе от него не требуется большой точности. Поисковая система не нуждается в понимании содержимого веб-документов, например, опирается ли какой-либо трактат о президентских полномочиях на левые или правые взгляды, – все это может сделать сам пользователь. Единственное, что Google Search нужно оценить корректно, – действительно ли данный документ относится к заданной теме. Как правило, можно получить довольно полное представление о предмете, которому посвящен документ, просто взглянув на некоторые слова и короткие фразы, содержащиеся в нем. Если там есть термины «президент» и «исполнительная привилегия», пользователь, вероятно, будет доволен, получив на него ссылку; если речь там идет о «семействе Кардашьян»[37]37
  Название американского реалити-шоу. – Прим. пер.


[Закрыть]
, то, очевидно, такой документ к делу не относится. Если в документе упоминаются «Джордж», «Марта» и «Битва при Йорктауне», то Google Search может классифицировать такой документ как имеющий отношение к Джорджу Вашингтону, и для этого ему совершенно не обязательно знать что-либо о браке между людьми или о революционных войнах.


Конечно, поисковик Google не всегда настолько поверхностен. Иногда ему удается интерпретировать запросы и показывать пользователю полностью сформулированные ответы, а не просто длинные списки ссылок. Это уже немного ближе к настоящему чтению, но именно что немного, потому что обычно Google читает только запросы, а не сами документы. Если вы спросите: «Как называется столица штата Миссисипи?»[38]38
  Вопросы «Как называется столица штата Миссисипи?» и «Сколько стоит 1,36 евро в рупиях?» были заданы авторами книги в ходе экспериментов, проведенных в мае 2018 года.


[Закрыть]
 – Google правильно проанализирует ваш вопрос и найдет правильный ответ (Джексон) – но лишь в таблице, которая была составлена заранее. Если вы спросите: «Сколько стоит 1,36 евро в рупиях?» – синтаксический анализ справится и с этим, затем система обратится к другой таблице (на этот раз с актуальными курсами валют), задействует калькулятор и рассчитает, что 1,36 евро равны 110,14 индийской рупии, и выдаст буквально такой ответ.

Когда Google сообщает вам ответы подобного рода, то по большей части он вполне надежен (система, вероятно, делает это только тогда, когда ее индикаторы сообщают, что ответ будет правильным с высокой вероятностью). Но описанный механизм все еще очень далек от совершенства, и ошибки, которые он периодически делает, дают хорошие подсказки о том, что происходит у машины внутри. Например, в апреле 2018 года мы задали Google Search такой вопрос: «Кто в настоящее время является членами Верховного суда[39]39
  Вопрос, заданный авторами книги в ходе экспериментов, проведенных в мае 2018 года.


[Закрыть]
[США]?» – и получили очень неполный ответ «Джон Робертс», то есть система назвала всего одного члена из девяти. В качестве бонуса поисковик предоставил список еще из семи судей, которых «также ищут пользователи»: Энтони Кеннеди, Самуэль Алито, Кларенс Томас, Стефен Брейер, Рут Бадер Гинзбург и Антонин Скалия. Все эти люди, конечно, бывали в свое время членами Верховного суда, но Антонин Скалия к тому моменту уже оказалась покойной. Преемник Скалии Нил Горсач и недавно назначенные члены Елена Каган и Соня Сотомайор в списке Google отсутствовали. Похоже, что Google вообще не заметил важный нюанс запроса – «в настоящее время».


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации