Автор книги: Стюарт Рассел
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 22 страниц) [доступный отрывок для чтения: 7 страниц]
Шаблон проектирования интеллектуального помощника предполагает исходное знание занятий людей, способность извлекать информацию из потоков сенсорных и текстовых данных и процесс обучения, адаптирующий помощника к конкретным обстоятельствам пользователя. Одна и та же общая схема может применяться еще по меньшей мере в трех важнейших областях: медицине, образовании и финансах. Для этих сфер система должна отслеживать состояние организма, ума и банковского счета пользователя (в широком смысле). Как и в случае помощника в повседневных делах, предоперационные расходы на создание необходимого знания общего характера в каждой из этих трех сфер распределяются между миллиардами пользователей.
В случае со здоровьем, например, все мы имеем примерно одинаковую физиологию, и подробное знание о ее функционировании уже закодировано в машиночитаемой форме[96]96
Сегодняшние работы в области физиологического моделирования см.: physiome.org. Работы 1960-х гг. над объединенными моделями с тысячами дифференциальных уравнений: Arthur Guyton, Thomas Coleman, and Harris Granger, “Circulation: Overall regulation,” Annual Review of Physiology 34 (1972): 13–44.
[Закрыть]. Системы будут адаптироваться к вашим индивидуальным характеристикам и образу жизни, обеспечивая превентивными рекомендациями и ранним оповещением о проблемах.
В образовательной сфере обещание создания интеллектуальных преподавательских систем давалось еще в 1960-х гг.[97]97
Часть работы над обучающими системами на самом раннем этапе была выполнена Патом Супписом и его коллегами в Стэнфорде: Patrick Suppes and Mona Morningstar, “ Computer-assisted instruction,” Science 166 (1969): 343–50.
[Закрыть], но до реального прогресса было еще очень далеко. Главными причинами оказались недостатки контента и доступа: большинство систем обучения не понимают содержание того, чему призваны учить, и не могут поддерживать двустороннюю коммуникацию с учениками посредством речи или текста. (Представляю, как я преподаю теорию струн, которую не понимаю, на лаосском языке, которым не владею.) Недавний прогресс в распознавании речи означает, что автоматизированные преподаватели могут, наконец, общаться с учениками, пока что не владеющими грамотой в полной мере. Более того, технология вероятностного вывода теперь умеет следить за тем, что учащиеся знают и чего не знают[98]98
Michael Yudelson, Kenneth Koedinger, and Geoffrey Gordon, “Individualized Bayesian knowledge tracing models,” in Artificial Intelligence in Education: 16th International Conference, ed. H. Chad Lane et al. (Springer, 2013).
[Закрыть], и оптимизировать предоставление инструкций для максимально эффективного обучения. Конкурс Global Learning XPRIZE, стартовавший в 2014 г., предложил $15 млн за создание «общедоступного масштабируемого программного обеспечения, которое позволит детям в развивающихся странах самостоятельно обучиться основам чтения, письма и счета за 15 месяцев». Результаты победителей, Kitkit School и Onebillion, позволяют сделать вывод, что эта цель по большей части достигнута.
В сфере личных финансов системы будут отслеживать инвестиции, доходы, обязательные и необязательные расходы, долги, процентные выплаты, сбережения на непредвиденные обстоятельства и т. д. во многом так же, как финансовые аналитики следят за деньгами и перспективами компаний. Интеграция с агентом, обслуживающим повседневную жизнь, обеспечит все более тонкое и детальное понимание, возможно, даже позволит выдавать детям карманные деньги за вычетом штрафов за скверное поведение. Каждый может рассчитывать на получение качественных ежедневных финансовых консультаций, прежде являвшихся прерогативой сверхбогатых.
Если ваша внутренняя «сигнализация», сообщающая о нарушении конфиденциальности, не сработала при чтении предыдущего абзаца, значит, вы не в курсе последних событий. Тема конфиденциальности, впрочем, имеет много уровней. Во-первых, может ли персональный помощник быть действительно полезным, если ничего о вас не знает? Скорее всего, нет. Во-вторых, будет ли он полезным, если не сможет собирать информацию от множества пользователей, чтобы больше узнать о людях в целом и о людях, похожих на вас? Скорее всего, нет. Итак, следует ли из этих двух обстоятельств, что мы должны отказаться от права на конфиденциальность, чтобы пользоваться преимуществами ИИ в быту? Нет. Дело в том, что обучающиеся алгоритмы могут работать с зашифрованными данными, используя методы конфиденциальных вычислений, и обеспечить пользователей возможностью сбора данных без какого-либо ущерба для конфиденциальности[99]99
Пример машинного обучения с использованием зашифрованных данных: Reza Shokri and Vitaly Shmatikov, “ Privacy-preserving deep learning,” in Proceedings of the 22nd ACM SIGSAC Conference on Computer and Communications Security (ACM, 2015).
[Закрыть]. Станут ли поставщики программного обеспечения использовать технологии обеспечения конфиденциальности добровольно, без требований со стороны закона? Поживем – увидим. Представляется, однако, неизбежным, что пользователи будут доверять персональному помощнику, только если его главнейшую обязанность составит служение пользователю, а не корпорации, которая его создала.
«Умные дома» и домашние роботы
Концепция «умного дома» рассматривается уже несколько десятилетий. В 1966 г. Джеймс Сазерленд, инженер фирмы Westinghouse, начал собирать ненужные компьютерные комплектующие, чтобы сделать ECHO, первый контроллер умного дома[100]100
Ретроспективная история первого умного дома, основанная на лекции его создателя Джеймса Сазерленда: James E. Tomayko, “Electronic Computer for Home Operation (ECHO): The first home computer,” IEEE Annals of the History of Computing 16 (1994): 59–61.
[Закрыть]. К сожалению, ECHO весил 360 кг, потреблял 3,5 кВт и управлял лишь тремя цифровыми часами и телевизионной антенной. Последующие системы требовали от пользователей овладеть головоломным интерфейсом управления. Неудивительно, что они не прижились.
С 1990-х гг. было предпринято несколько амбициозных попыток разработать дома, которые управляли бы собой сами при минимальном участии человека, используя машинное обучение, чтобы подстроиться под образ жизни обитателей. Для реализации экспериментов в домах должны были жить реальные люди. К сожалению, частота ошибочных решений сделала эти системы хуже, чем просто бесполезными, – качество жизни обитателей не только не повышалось, но ухудшалось. Например, пользователи проекта 2003 г. MavHome[101]101
Краткий отчет о проекте умного дома на основе машинного обучения и автоматизированного принятия решений: Diane Cook et al., “MavHome: An agent-based smart home,” in Proceedings of the 1st IEEE International Conference on Pervasive Computing and Communications (IEEE, 2003).
[Закрыть] Вашингтонского университета часто были вынуждены сидеть в темноте, если их гости задерживались дольше обычного для хозяев времени отхода ко сну[102]102
Введение в анализ опыта пользователей умных домов: Scott Davidoff et al., “Principles of smart home control,” in Ubicomp 2006: Ubiquitous Computing, ed. Paul Dourish and Adrian Friday (Springer, 2006).
[Закрыть]. Как и в случае с интеллектуальным персональным помощником, подобные провальные результаты проистекали из неполного доступа к информации о занятиях обитателей и неспособности понимать и отслеживать происходящее в доме.
Настоящий «умный дом», оборудованный видеокамерами и микрофонами, – а также обладающий обязательными сенсорными и мыслительными способностями – понимает, чем занимаются жители: ходят в гости, едят, спят, смотрят телевизор, читают, тренируются, готовятся к долгой поездке или беспомощно лежат на полу после того, как оступились. В координации с интеллектуальным персональным помощником дом достаточно хорошо представляет, кто придет в него или выйдет в определенное время, кто где принимает пищу и т. д. Это понимание позволяет дому управлять отоплением, освещением, шторами и системами безопасности, посылать своевременные напоминания и предупреждать пользователей или экстренные службы о возникшей проблеме. Некоторые новые жилые комплексы в США и Японии уже включают такого рода технологию[103]103
Коммерческое объявление об умных домах на основе ИИ: “The Wolff Company unveils revolutionary smart home technology at new Annadel Apartments in Santa Rosa, California,” Business Insider, March 12, 2018.
[Закрыть].
Ценность «умного дома» ограниченна в силу его исполнительных механизмов: намного более простые системы (термостаты с таймером, светильники с датчиками движения и охранная сигнализация) способны обеспечить во многом такую же функциональность, причем более предсказуемым, хотя и менее чувствительным к контексту, образом. «Умный дом» не может заложить белье в бак стиральной машины, вымыть посуду или принести газету. Для всего этого ему необходим робот.
Возможно, нам не придется долго ждать. Роботы уже продемонстрировали многие требуемые навыки. В лаборатории Беркли, возглавляемой моим коллегой Питером Эббилем, «робот Беркли, избавляющий от скучных задач» (Berkeley Robot for the Elimination of Tedious Tasks, BRETT), складывает полотенца в стопки с 2011 г., а робот SpotMini разработки Boston Dynamics умеет подниматься по лестницам и открывать двери (рис. 5). Несколько компаний уже выпускают роботов-поваров, хотя им нужны особые вспомогательные устройства и заранее порезанные ингредиенты и они не могут работать в обычной кухне[104]104
Статья о роботизированных шеф-поварах в качестве коммерческого продукта: Eustacia Huen, “The world’s first home robotic chef can cook over 100 meals,” Forbes, October 31, 2016.
[Закрыть].
Последняя из трех базовых физических способностей, которыми должен обладать полезный домашний робот, – восприятие, движение и ловкость – создает больше всего проблем. По словам Стефани Теллекс, профессора робототехники Университета Брауна: «Большинство роботов не могут подхватить большую часть предметов в большинстве случаев». Отчасти это проблема восприятия посредством тактильных сенсоров, отчасти технологическая (на сегодняшний день создание ловких рук обходится очень дорого) и отчасти алгоритмическая: мы пока не слишком хорошо понимаем, как объединить сенсорное восприятие и контроль, чтобы совершать захваты и манипуляции с громадным разнообразием объектов, имеющихся в типичном доме. Существуют десятки способов захвата только для твердых предметов и тысячи отдельных навыков манипулирования, например способность накапать из бутылки ровно две капли, отклеить этикетку от консервной банки, намазать мягкий хлеб твердым сливочным маслом или вытащить вилкой из кастрюли одну макаронину, чтобы проверить, готова ли она.
Представляется вероятным, что проблемы тактильного восприятия и конструирования руки будут решены благодаря 3D-печати, которая уже используется компанией Boston Dynamics для самых сложных частей ее человекоподобного робота «Атласа». Навыки манипулирования, которыми владеет робот, быстро развиваются, в том числе благодаря глубокому обучению с подкреплением[105]105
Отчет моих коллег из Беркли о глубоком обучении с подкреплением в сфере роботизированного двигательного контроля: Sergey Levine et al., “End-to-end training of deep visuomotor policies,” Journal of Machine Learning Research 17 (2016): 1–40.
[Закрыть]. Последний рывок – собрать все это в единое целое, которое начинает приближаться к потрясающим физическим возможностям роботов из кино, – скорее всего, будет сделан в весьма прозаической складской индустрии. Одна лишь компания Amazon использует труд нескольких сотен тысяч человек, чтобы вынимать товары из коробок на гигантских складах и рассылать их клиентам. С 2015 по 2017 г. Amazon проводила ежегодный «Конкурс подбиральщиков», чтобы ускорить создание роботов, способных выполнить эту задачу[106]106
О возможностях автоматизации работы сотен тысяч складских рабочих: Tom Simonite, “Grasping robots compete to rule Amazon’s warehouses,” Wired, July 26, 2017.
[Закрыть]. Путь пока не завершен, но, когда основные исследовательские проблемы будут решены – вероятно, в течение десятилетия, – можно ожидать очень быстрого распространения высокофункциональных роботов. Сначала они будут работать на складах, затем в других коммерческих сферах, например сельском хозяйстве и строительстве, где спектр задач и объектов достаточно предсказуем. Довольно скоро мы увидим их и в розничной торговле за такими занятиями, как выкладывание товара на полки супермаркета и складывание одежды после примерки.
Первыми, кто действительно выиграет от появления роботов в доме, станут престарелые и немощные, которым полезный робот может обеспечить определенную степень независимости, недостижимую иными средствами. Даже если робот выполняет ограниченный круг заданий и имеет лишь зачаточное понимание происходящего, он может быть очень полезным. В то же время до робота-дворецкого, который уверенно заправляет домом и предупреждает любое желание своего хозяина, еще довольно далеко – для этого необходимо приблизиться к универсальному ИИ человеческого уровня.
Искусственная интеллектуальность во всемирном масштабе
Развитие базовых способностей понимания речи и текста позволит интеллектуальным персональным помощникам делать то же самое, чем занимаются ассистенты-люди (но за грошовую месячную плату вместо зарплаты в несколько тысяч долларов). Базовое распознавание речи и текста также позволяет машинам делать то, на что люди не способны, – благодаря не глубине понимания, а его охвату. Например, машина с базовой способностью чтения сможет еще до обеда прочитать все когда-либо написанное человеческой расой и станет искать, чем бы еще заняться[107]107
Я исхожу из щедрого расчета: одна минута работы ЦП ноутбука на страницу, или около 1011 операций. Тензорный процессор третьего поколения разработки Google выполняет около 1017 операций в секунду, следовательно, может читать 1 млн страниц в секунду, то есть на 8 млн книг ему требуется примерно пять часов.
[Закрыть]. При наличии способности распознавания речи она к вечернему чаю сможет прослушать все радио и телепередачи. Для сравнения: потребовалось бы 200 000 человек на полную рабочую неделю, только чтобы следить за нынешним уровнем мировых печатных публикаций (не говоря уже обо всем письменном наследии прошлого), и еще 60 000, чтобы слушать текущее вещание[108]108
Исследование объема всемирного производства информации во всех каналах за 2003 г.: Peter Lyman and Hal Varian, “How much information?” sims.berkeley.edu/research/projects/how-much-info-2003.
[Закрыть].
Такая система, если бы она умела делать хотя бы простые фактические выводы и интегрировать всю информацию, существующую на всех языках, являлась бы феноменальным устройством для ответов на вопросы и выявления закономерностей – намного более мощным, чем поисковые системы, которые в настоящее время оцениваются примерно в $1 трлн. Ее ценность для исследования в таких областях, как история и социология, была бы безмерна.
Конечно, стало бы также возможным прослушивать все телефонные звонки в мире (работа, которая потребовала бы около 20 млн человек). Определенные тайные ведомства сочли бы эту возможность ценной. Некоторые из них уже много лет занимаются простыми видами крупномасштабного машинного прослушивания, например поиском ключевых слов в разговорах, и сейчас совершают переход к преобразованию разговоров в пригодный для поиска текст[109]109
Подробности использования распознавания речи интеллектуальными агентами: Dan Froomkin, “How the NSA converts spoken words into searchable text,” The Intercept, May 5, 2015.
[Закрыть]. Эти записи-расшифровки, безусловно, полезны, но далеко не так, как одновременное понимание и интеграция контента всех разговоров.
Еще одна «сверхвозможность», доступная машинам, – умение видеть весь мир одновременно. Грубо говоря, спутники каждый день отображают весь мир со средним разрешением около 50 см на пиксель[110]110
Анализ спутниковых визуальных изображений представляет собой задачу колоссального масштаба: Mike Kim, “Mapping poverty from space with the World Bank,” Medium.com, January 4, 2017. По оценке Кима, 8 млн человек пришлось бы работать круглосуточно, что преобразуется в более чем 30 млн человек при 40-часовой рабочей неделе. Я думаю, в действительности это завышенная оценка, поскольку огромное большинство изображений демонстрировали бы пренебрежимо малые изменения в течение дня. В то же время разведывательное сообщество США держит десятки тысяч сотрудников, работающих в огромных помещениях и рассматривающих спутниковые снимки, только для отслеживания того, что происходит в маленьких регионах, представляющих интерес. Так что 1 млн человек в расчете на весь мир, пожалуй, похоже на правду.
[Закрыть]. При таком разрешении каждый дом, корабль, автомобиль, каждая корова и каждое дерево на Земле видимы. Намного больше 30 млн работников с полной занятостью потребовалось бы, чтобы проанализировать все эти изображения; поэтому в настоящее время никто из людей не видит основной массы спутниковых данных. Алгоритмы компьютерного видения могли бы обрабатывать все эти данные, создавая пригодную для поиска базу данных обо всем мире, ежедневно обновляемую, а также визуализации и прогностические модели экономической деятельности, изменения вегетации, миграций животных и людей, последствий изменения климата и т. д. Спутниковые компании, такие как Planet и DigitalGlobe, трудятся над воплощением этой идеи.
Появление возможности получать сенсорную информацию во всемирном масштабе позволит принимать глобальные решения. К примеру, мы могли бы на основе потока спутниковых данных создавать подробные модели для управления мировой окружающей средой, предсказывать последствия экологических и экономических вмешательств и создавать необходимый аналитический задел для достижения объявленных ООН целей устойчивого развития[111]111
Достигнут существенный прогресс в глобальном наблюдении с использованием данных спутниковых изображений в реальном времени: David Jensen and Jillian Campbell, “Digital earth: Building, financing and governing a digital ecosystem for planetary data”, официальный доклад на форуме ООН «Наука, политика, бизнес и окружающая среда» 2018 г.
[Закрыть]. Мы уже видим системы управления «умным городом», призванные оптимизировать контроль за дорожным движением, пассажироперевозки, сбор мусора, ремонт дорог, поддержание окружающей среды и другие функции в интересах граждан, и это можно было бы распространить в масштабах всей страны. До недавнего времени такая степень координации могла быть достигнута лишь усилиями громадных, неэффективных бюрократических систем; они будут неизбежно заменены мегаагентами, занимающимися все большим числом аспектов нашей коллективной жизни. Вместе с этим, разумеется, появятся и возможности нарушения конфиденциальности и внедрения социального контроля во всемирном масштабе, к чему я вернусь в следующей главе.
Когда появится сверхинтеллектуальный ИИ?
Меня часто просят предсказать, когда появится сверхинтеллектуальный ИИ, и обычно я отказываюсь отвечать на этот вопрос. Тому есть три причины. Первая: накопилась долгая история несбывшихся предсказаний такого рода[112]112
Люк Мюльхаузер много писал о предсказаниях в области ИИ, и я благодарен ему за то, что он нашел первоисточники последующих цитат. См.: Luke Muehlhauser, “What should we learn from past AI forecasts?” Open Philanthropy Project report, 2016.
[Закрыть]. Например, в 1960 г. первопроходец в сфере ИИ, нобелевский лауреат, экономист Герберт Саймон писал: «В технологическом отношении… машины научатся, в пределах 20 лет, выполнять любую работу, которую способен делать человек»[113]113
Прогноз появления ИИ человеческого уровня в течение 20 лет: Herbert Simon, The New Science of Management Decision (Harper & Row, 1960).
[Закрыть]. В 1967 г. Марвин Минский, один из организаторов дартмутской рабочей группы 1956 г., открывшей сферу разработки ИИ, писал: «Я убежден, что при жизни одного поколения вне возможностей машин останутся лишь немногие элементы интеллекта – проблема создания “искусственного интеллекта” будет, в сущности, решена»[114]114
Прогноз появления ИИ человеческого уровня в течение жизни одного поколения: Marvin Minsky, Computation: Finite and Infinite Machines (Prentice Hall, 1967).
[Закрыть].
Вторая причина нежелания объявлять дату пришествия сверхинтеллектуального ИИ состоит в отсутствии четкого барьера, который для этого пришлось бы преодолеть. Машины уже превосходят возможности человека в некоторых областях. Эти области будут расширяться и углубляться, и, вероятно, сверхчеловеческие системы общих знаний, сверхчеловеческие системы биомедицинских исследований, сверхчеловечески ловкие и гибкие роботы, сверхчеловеческие системы корпоративного планирования и т. д. появятся задолго до того, как мы получим полностью универсальную сверхинтеллектуальную ИИ-систему. Эти «частично сверхинтеллектуальные» системы, по отдельности и вместе, начнут ставить перед нами многие из тех вопросов, которые следует ожидать от универсальных интеллектуальных систем.
Третья причина, по которой я не предсказываю появление сверхинтеллектуального ИИ, – его принципиальная непредсказуемость. Он требует «концептуальных прорывов», как заметил Джон Маккарти в интервью 1997 г.[115]115
Прогноз Джона Маккарти о появлении ИИ человеческого уровня в интервале «от пяти до пятисот лет»: Ian Shenker, “Brainy robots in our future, experts think,” Detroit Free Press, September 30, 1977.
[Закрыть] Далее он сказал: «Вы хотите получить 0,7 Эйнштейна и 0,3 Манхэттенского проекта, причем сначала Эйнштейна. Я убежден, что это займет от 5 до 500 лет». В следующем разделе я объясню, какими могут быть некоторые из этих концептуальных прорывов. Насколько они непредсказуемы? Вероятно, настолько же, насколько было предсказуемо изобретение Силардом цепной реакции через несколько часов после заявления Резерфорда, что она совершенно невозможна.
Однажды на собрании Всемирного экономического форума в 2015 г. я отвечал на вопрос о том, когда мы можем увидеть сверхинтеллектуальный ИИ. Собрание проходило по правилам Чатем-хауса[116]116
Разговорное название Королевского института международных отношений (брит.). – Прим. пер.
[Закрыть], запрещающим разглашать за его стенами какие бы то ни было замечания любого из присутствующих. Тем не менее я из избытка осторожности начал свой ответ словами: «Строго не под запись…» Я предположил, что, если не помешают никакие катаклизмы, это, вероятно, произойдет при жизни моих детей – которые еще малы и, скорее всего, благодаря достижениям медицины будут жить намного дольше, чем большинство присутствовавших. Не прошло и двух часов, как в The Daily Telegraph вышла статья, цитирующая слова профессора Рассела и дополненная изображениями беснующихся терминаторов. Заголовок гласил: «Роботы-“социопаты” могут обскакать человеческую расу при жизни одного поколения».
Моя оценка сроков, скажем, в 80 лет намного более консервативна, чем у типичного исследователя ИИ. По результатам недавних опросов[117]117
Обзор исследований специалистов по ИИ их собственных прогнозов появления ИИ человеческого уровня см. на сайте aiimpacts.org. Подробное рассмотрение результатов исследования проблематики ИИ человеческого уровня см. в статье: Katja Grace et al., “When will AI exceed human performance? Evidence from AI experts,” arXiv:1705.08807v3 (2018).
[Закрыть], оптимисты ожидают появления ИИ человеческого уровня примерно в середине этого века. Исходя из опыта в отношении ядерной физики, здравомыслие требует допустить, что это произойдет раньше, и подготовиться соответственно. Если бы требовался лишь один концептуальный прорыв, аналогичный идее Силарда о цепной реакции деления ядер, сверхинтеллектуальный ИИ в той или иной форме мог бы появиться, можно сказать, внезапно. Вполне вероятно, мы оказались бы к этому не готовы: если бы мы построили сверхинтеллектуальные машины с любой степенью автономности, то скоро оказались бы не способны контролировать их. Я, однако, убежден, что у нас есть пространство для маневра, потому что для перехода от ситуации сегодняшнего дня к сверхинтеллекту необходим целый ряд принципиальных прорывов.
Какие концептуальные прорывы нас ожидают
Проблема создания универсального ИИ человеческого уровня далека от решения. Это не является вопросом большего количества денег, инженерных разработок или данных, как и более мощных компьютеров. Некоторые футуристы составляют графики, экстраполирующие экспоненциальный рост вычислительной мощности в будущее на основе закона Мура, указывая даты, когда машины превзойдут мозг насекомого, мозг мыши, мозг человека, мозг всех людей в совокупности и т. д.[118]118
Сравнение вычислительной мощности компьютера и возможностей человеческого мозга на графиках: Ray Kurzweil, “The law of accelerating returns,” Kurzweilai.net, March 7, 2001.
[Закрыть] Эти графики бессмысленны, поскольку, как я уже говорил, более быстрые машины всего лишь быстрее дают вам неправильный ответ. Если бы он состоял в том, чтобы собрать всех ведущих экспертов по ИИ в одну команду с неограниченными ресурсами с целью создать интегрированную интеллектуальную систему человеческого уровня путем объединения лучших идей всех нас, результат был бы провальным. В реальном мире система разрушилась бы. Она не понимала бы, что происходит, не могла предсказать последствия своих данных, не знала, чего хотят люди в любой конкретной ситуации, – в общем, была бы до нелепости тупой.
Понимание того, как разрушилась бы система, позволяет исследователям ИИ выявлять проблемы, которые должны быть решены, – области, в которых необходимы концептуальные прорывы, – чтобы достичь ИИ человеческого уровня. Сейчас я опишу некоторые из нерешенных пока проблем. Когда мы справимся с ними, возможно, появятся новые, но их будет не слишком много.
Язык и здравый смысл
Интеллект без знаний – все равно что двигатель без топлива. Люди получают огромные знания от других людей: они передаются через поколения в форме языка. Среди них есть фактические: Обама стал президентом в 2009 г., плотность меди составляет 8,92 г/см3, законы Ур-Намму устанавливают наказания за различные преступления и т. д. Огромный объем знаний заключен в самом языке – в понятиях, которые обусловливают его существование. Президент, 2009, плотность, медь, грамм, сантиметр, преступление и все прочие понятия заключают в себе обширнейшую информацию, представляющую собой выделенное множество процессов открытия и систематизации, благодаря которым, собственно, они и оказались встроены в язык.
Рассмотрим, например, слово медь, обозначающее определенный комплекс атомов во Вселенной, и сравним со словом арглебарглиум, которым я обозначаю столь же крупный комплекс совершенно случайным образом выбранных атомов во Вселенной. Можно открыть много общих, полезных и обладающих предсказательной силой законов о меди – ее плотности, проводимости, пластичности, точке плавления, звездном происхождении, химических соединениях, практическом применении и т. д. Напротив, об арглебарглиуме практически ничего нельзя сказать. Организм, говорящий на языке, который состоит из таких слов, как арглебарглиум, не мог бы функционировать, потому что никогда не открыл бы закономерностей, которые позволили бы ему моделировать и делать прогнозы в своей вселенной.
Машина, действительно понимающая человеческий язык, была бы способна быстро накапливать огромные объемы человеческого знания, что позволило бы ей превзойти результаты 10 000 лет обучения более чем 100 млрд человек, живших на Земле. Представляется попросту нецелесообразным ждать, когда машина заново сделает все эти открытия с нуля, начав с первичных сенсорных данных.
В настоящее время, однако, технология естественного языка не способна выполнить задачу прочтения и понимания миллионов книг, многие из которых поставили бы в тупик даже высокообразованного человека. Такие системы, как Watson от IBM, прославившаяся победой над двумя людьми-чемпионами американской телевизионной игры Jeopardy![119]119
В России выходит под названием «Своя игра». – Прим. ред.
[Закрыть] в 2011 г., способны извлекать простую информацию из четко сформулированных фактов, но не может строить комплексные структуры знания на основе текста, как и не в состоянии отвечать на вопросы, требующие построения длинных логических цепочек и использования информации из нескольких источников. Например, задача прочитать все доступные документы, относящиеся к концу 1973 г., и оценить (с объяснением) вероятный результат Уотергейта – процесса, приведшего к отставке президента Никсона, – далеко выходила бы за рамки сегодняшних возможностей.
Предпринимаются серьезные усилия по углублению анализа языка и выделению информации. Например, проект Aristo Института изучения ИИ им. Аллена ставит целью разработку систем, способных сдать школьные экзамены по естественным наукам после прочтения учебников и методических пособий[120]120
Проект Aristo Института изучения ИИ им. Аллена: allenai.org/aristo.
[Закрыть]. Вот вопрос из теста за четвертый класс[121]121
Анализ знания, необходимого для получения хороших результатов в тесте для четвертого класса на понимание и здравый смысл: Peter Clark et al., “Automatic construction of inference-supporting knowledge bases,” in Proceedings of the Workshop on Automated Knowledge Base Construction (2014), akbc.ws/2014.
[Закрыть]:
Четвероклассники решили устроить гонки на роликовых коньках. Какая поверхность подойдет для этого лучше всего?
(А) гравий, (Б) песок, (В) асфальт, (Г) трава.
Машина сталкивается по крайней мере с двумя типами трудностей при ответе на этот вопрос. Во-первых, это классическая проблема понимания языка – уяснения смысла предложения: анализ синтаксической структуры, идентификация значимых слов и т. д. (Чтобы убедиться в этом, воспользуйтесь онлайновым переводчиком, чтобы перевести предложение на незнакомый вам язык, затем с помощью словаря этого языка попробуйте сделать обратный перевод на английский.) Во-вторых, это необходимость обыденного знания. Нужно сообразить, что «гонки на роликовых коньках» – это, по всей видимости, состязание на скорость между людьми, обутыми в коньки на роликах (имеющими их на ногах), а не гонки роликовых коньков. Нужно понять, что «поверхность» – то, на чем будут состязаться гонщики, а не сидеть зрители. Нужно знать, что означает «лучше всего» применительно к поверхности для гонки, и т. д. Подумайте, как изменился бы ответ, если заменить «четвероклассников» на «садистов-инструкторов армейского тренировочного лагеря».
Эти трудности можно обобщить, сказав, что чтение требует знания, а знание приобретается (по большей части) из чтения. Иными словами, перед нами классическая ситуация с курицей и яйцом. Можно рассчитывать на процесс бутстрэпа – «спасения утопающих силами самих утопающих», – когда система читает какой-нибудь простой текст, получает определенные знания, использует их для чтения более сложного текста, получает дополнительные знания и т. д. К сожалению, на деле происходит противоположное: приобретенное знание оказывается по большей части ошибочным, что вызывает ошибки при чтении, приводящие к еще более ошибочному знанию, и т. д.
Например, проект «Бесконечное изучение языка» (Never-Ending Language Learning, NELL) Университета Карнеги – Меллона является, пожалуй, самым амбициозным проектом бутстрэп-обучения языку, осуществляемым в настоящее время. С 2010 по 2018 г. NELL усвоил более 120 млн утверждений, читая англоязычные тексты в интернете[122]122
Проект машинного чтения NELL описан в статье: Tom Mitchell et al., “Neverending learning,” Communications of the ACM 61 (2018): 103–15.
[Закрыть]. Часть этих утверждений верна, например, что «Мейпл Лифс»[123]123
«Торонто Мейпл Лифс» – профессиональный хоккейный клуб. – Прим. пер.
[Закрыть] играют в хоккей и выиграли Кубок Стэнли. Помимо фактов NELL постоянно учит новые слова, категории и семантические отношения. К сожалению, он уверен лишь в 3 % своих утверждений и нуждается в экспертах-людях, чтобы регулярно исправлять ложные или бессмысленные утверждения – например, что «Непал – это страна, также известная как Соединенные Штаты», а «ценность – сельскохозяйственный продукт, который обычно режут на базис».
Я подозреваю, что может не произойти единого прорыва, который обратил бы нисходящую спираль вспять. Базовый процесс бутстрэп-обучения кажется правильным: программа, которая знает достаточно фактов, может сообразить, на какой из них ссылается новое предложение, и, таким образом, узнать новую текстуальную форму выражения фактов, что впоследствии позволит ей открыть больше фактов, и так процесс продолжится. (Сергей Брин, сооснователь Google, опубликовал важную статью об идее бутстрэп-обучения в 1998 г.[124]124
Идея самостоятельного получения выводов из текста принадлежит Сергею Брину: “Extracting patterns and relations from the World Wide Web,” in The World Wide Web and Databases, ed. Paolo Atzeni, Alberto Mendelzon, and Giansalvatore Mecca (Springer, 1998).
[Закрыть]) Безусловно, этому способствует предварительная подготовка в виде большого количества закодированного вручную знания и лингвистической информации. Повышение сложности репрезентации фактов – позволяющей отображать комплексные события, причинно-следственные связи, верования и отношения других и т. д., – а также совершенствование работы с неопределенностью в значениях слов и предложений могут постепенно вылиться в самосовершенствующийся, а не вырождающийся процесс обучения.
Кумулятивное изучение понятий и теорий
Около 1,4 млрд лет назад примерно в 13 секстиллионах километров отсюда две черные дыры, одна в 12 млн раз, другая в 10 млн раз массивнее Земли, сблизились настолько, что стали обращаться вокруг друг друга. Постепенно теряя энергию, они двигались по спирали все теснее и быстрее, достигнув орбитальной частоты вращения 250 оборотов в секунду при расстоянии 350 км, когда, наконец, столкнулись и слились[125]125
Визуализация слияния черных дыр, зарегистрированного LIGO: LIGO Lab Caltech, “Warped space and time around colliding black holes,” February 11, 2016, youtube.com/watch?v=1agm33iEAuo.
[Закрыть]. В последние несколько миллисекунд энергия излучения в форме гравитационных волн в 50 раз превышала совокупную выделенную энергию всех звезд во Вселенной. 14 сентября 2015 г. эти гравитационные волны достигли Земли. Они попеременно растягивали и сжимали само пространство в отношении примерно 1 к 2,5 секстиллионов, что эквивалентно изменению расстояния до Проксимы Центавра (4,4 световых года) на толщину человеческого волоса.
К счастью, за два дня до этого детекторы Advanced LIGO (лазерно-интерферометрической гравитационно-волновой обсерватории) в Вашингтоне и Луизиане были введены в эксплуатацию. Методом лазерной интерферометрии они смогли измерить это ничтожное искажение пространства. С помощью расчетов на основе общей теории относительности Эйнштейна (ОТО) исследователи LIGO предсказали – и поэтому именно ее и искали – точную форму гравитационной волны, ожидаемой при таком событии[126]126
Первая публикация с описанием наблюдения гравитационных волн: Ben Abbott et al., “Observation of gravitational waves from a binary black hole merger”, Physical Review Letters 116 (2016): 061102.
[Закрыть].
Это стало возможным благодаря накоплению и передаче знания и идей тысячами человек в течение столетий наблюдений и исследований. От Фалеса Милетского, натиравшего янтарь шерстью и наблюдавшего возникновение статического заряда, через Галилея, бросавшего камни с Падающей башни в Пизе, к Ньютону, следившему за падением яблока с ветки, и далее, через тысячи других наблюдений, человечество постепенно, слой за слоем, накапливало понятия, теории и устройства: масса, скорость, ускорение, сила, ньютоновские законы движения и гравитации, уравнения орбитального движения, электрические явления, атомы, электроны, электрические поля, магнитные поля, электромагнитные волны, специальная теория относительности, ОТО, квантовая механика, полупроводники, лазеры, компьютеры и т. д.
В принципе, мы можем представить процесс совершения открытия как преобразование всех сенсорных данных, когда-либо полученных всеми людьми, в очень сложную гипотезу о сенсорных данных, полученных учеными LIGO 14 сентября 2015 г., когда они следили за своими компьютерными мониторами. Это понимание обучения исключительно сквозь призму данных: данные на входе, гипотеза на выходе, посередине черный ящик. Если бы это работало, это был бы апофеоз подхода к разработке ИИ на основе глубокого обучения – «большие данные, большие сети», – но это невозможно. Единственная жизнеспособная идея, имеющаяся у нас о том, как интеллектуальные системы могли бы прийти к такому колоссальному достижению, как регистрация слияния двух черных дыр, состоит в том, что предшествующее знание физики в сочетании с наблюдаемыми данными позволило ученым LIGO вывести заключение, что произошло слияние. Более того, это предшествующее знание само по себе было результатом обучения на основе предшествующего знания, и так далее, вглубь истории на всем ее протяжении. Итак, у нас есть приблизительная кумулятивная картина того, как интеллектуальные системы могут обретать прогностические возможности, используя знание как строительный материал.
Я говорю «приблизительная», поскольку, разумеется, за столетия наука иногда сворачивала не в ту сторону, временно увлекаясь погоней за такими иллюзорными феноменами, как флогистон и светоносный эфир. Однако мы достоверно знаем, что кумулятивная картина есть то, что действительно произошло, в том смысле, что ученые постоянно описывали свои открытия и теории в книгах и статьях. Последующие поколения ученых имели доступ лишь к этим формам эксплицитного знания, а не к исходному сенсорному опыту предшествующих, давно ушедших поколений. Будучи учеными, члены команды LIGO понимали, что все фрагменты знания, которым они пользуются, включая ОТО Эйнштейна, находятся (и всегда будут находиться) в периоде апробации и могут быть сфальсифицированы в результате эксперимента. Как оказалось, данные LIGO предоставили убедительное подтверждение ОТО, а также дальнейшие свидетельства того, что гравитон – гипотетическая частица гравитации – не имеет массы.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?