Читать книгу "Искусственный интеллект – для вашего бизнеса. Руководство по оценке и применению"

Текст добавлен: 13 октября 2020, 20:06

Автор книги: Эндрю Берджесс

Жанр: Прочая образовательная литература, Наука и Образование

Возрастные ограничения: 16+

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 6 (всего у книги 23 страниц) [доступный отрывок для чтения: 6 страниц]

Скачать книгу

Шрифт:

- 100% +

Кластеризация

Все описанные до сих пор функции работают над преобразованием неструктурированных данных (изображений, звуков, текста) в структурированные данные. Четвертая функция – кластеризация – наоборот, работает со структурированными данными и ищет среди них шаблоны и кластеры сходства; то есть, по сути, это компьютерный классификатор. Другой особенностью данной функции, которая отличает ее от трех предыдущих, является то, что она способна к неконтролируемому обучению, хотя это ни в коем случае не значит, что она «обязана» учиться только так. В неконтролируемом обучении задействованы специфические и сложные статистические алгоритмы, которые опять-таки зависят от объема данных – чем их больше, тем полезнее функция классификации.

Кластеризация обычно применяется в самом начале серии автоматизированных операций, которые имеют своей целью тот или иной вариант прогнозирования. Например, кластеризация отвечает за извлечение информации из новых данных на основе их сравнения с некоторыми исходными шаблонами; или за выявление среди новой информации различных аномалий, то есть их несоответствия ожидаемым шаблонам. Чтобы иметь возможность создавать прогнозы или идентифицировать аномалии, нужно для начала обнаружить сами шаблоны или кластеры сходства.

В своем простейшем виде этот тип искусственного интеллекта использует статистические методы, чтобы построить «линию наилучшего соответствия» для всех данных. Делается это обычно «методом наименьших квадратов»: в математических терминах, ИИ находит такую линию, до которой квадрат расстояния от всех точек является минимальным. Естественно, эти статистические операции становятся тем сложнее, чем больше число параметров у анализируемых данных. Если данных недостаточно, решение может оказаться нереалистичным по причине так называемого «чрезмерного соответствия». Иначе говоря, рассчитанная при недостатке данных теоретическая линия наилучшего соответствия весьма хорошо работает с уже введенными данными, но она мало похожа на реальные закономерности, что можно обнаружить, только «скормив» алгоритму больше новой информации. Следовательно, чем больше у вас данных, тем больше вы можете быть уверены в обнаруженных программой шаблонах.

Хороший пример использования кластеризации – классификация потребителей по группам в соответствии, скажем, с данными о покупательском поведении клиентов. Люди, как правило, неплохо выявляют шаблоны в небольших по объему данных и часто используют для этого свой предыдущий опыт. Однако там, где приходится иметь дело с тысячами или миллионами записей, каждая из которых содержит множественные характеристики и функции, люди не в состоянии обработать всю эту массу информации, а вот искусственный интеллект оказывается в своей родной стихии.

Преимущество этого подхода, помимо возможности использовать огромные вычислительные мощности для быстрого анализа данных, состоит в том, что искусственный интеллект полностью «наивен», точнее, непредвзят в отношении любых данных. Он ищет только цифры в цифрах, и эти цифры могут относиться к чему угодно, включая рост человека, его зарплату, цвет глаз, почтовый индекс, пол, симпатии, антипатии и историю предыдущих покупок. Когда вы заполняете анкету при получении карты постоянного покупателя, вы, возможно, даже не подозреваете, что существует какая-то связь между цветом глаз покупателя и его склонностью покупать йогурт (сейчас я фантазирую, конечно), однако если она существует, то искусственный интеллект ее непременно обнаружит. Большинству людей, скорее всего, не придет в голову сопоставить эти два параметра, и поэтому, если бы они использовали традиционные инструменты обработки информации для бизнеса, то вопрос бы даже не возник. Искусственный интеллект способен дать людям совершенно иной взгляд на многие ситуации, и как раз в этом состоит значительная часть приносимой им пользы.

Подобно другим функциям искусственного интеллекта, относящимся к группе «сбор информации», операции по кластеризации данных уже сейчас достаточно хорошо развиты и широко используются в бизнесе – они, в сущности, являются основой аналитики в прогнозировании. Чтобы посмотреть, как все это работает, достаточно просто купить что-нибудь через интернет: вы очень быстро обнаружите, что вас «посчитали», то есть расклассифицировали в соответствии с вашими запросами, – и вот уже вам предлагают купить то, что покупали в прошлом похожие на вас клиенты. Возможно, вы получали «специальное предложение» от вашего оператора мобильной связи, потому что некоторые особенности вашего пользования телефоном и тарифным планом указывают на то, что вы вскоре можете «упорхнуть» от них к другому провайдеру, и теперь они хотят сохранить вас в качестве клиента. Или, вероятно, вам звонили сотрудники вашего банка, потому что некоторые из ваших расходов не вписываются в обычные схемы поведения той группы клиентов, к которым вас отнес искусственный интеллект. Такие отклонения с немалой вероятностью могут свидетельствовать о том, что вашу карту похитили или «взломали». Приведенные примеры хорошо объясняют, почему именно функция кластеризации используется в современном бизнесе с таким размахом.

Понимание естественного языка

Теперь мы можем переходить к следующей «цели» искусственного интеллекта – выявлению процессов. Начнем с первой функции этой группы, называемой пониманием естественного языка (NLU).

Понимание естественного языка является важнейшей стороной деятельности искусственного интеллекта, поскольку именно оно придает смысл всем тем текстам, что градом сыплются на нас, и при этом позволяет не прибегать к помощи множества сотрудников, только чтобы прочитать все эти документы и письма. Функция NLU действует подобно «переводчику» между людьми и машинами, причем самую тяжелую работу должна выполнять именно машина. Понимание естественного языка тесно связано с функцией поиска информации, которую мы обсуждали выше: некоторые эксперты фактически объединяют и поиск информации, и распознавание смысла под единым термином «анализ естественного языка» (NLP), однако я предпочитаю рассматривать их по отдельности, поскольку в бизнесе они обычно используются для различных целей. То же самое можно сказать и о распознавании речи, но опять-таки в управлении бизнесом распознавание служит одним целям, а выявление смысла – другим. Понимание естественного языка до сих пор в определенной степени включает и превращение неструктурированных данных языкового предложения в структурированные данные, но все же его главная цель – определить, как собрать слова в правильную и пригодную для понимания структуру (синтаксический анализ), и выявить истинный смысл слов и предложений (семантический анализ).

Анализ естественного языка занимает в истории искусственного интеллекта особое место, потому что он лежит в основе так называемого теста Тьюринга. Это тест, который английский эрудит Алан Тьюринг разработал в 1950-х годах, чтобы определить, можно считать данную вычислительную машину примером искусственного интеллекта или нет. В тесте оценивающий человек ведет письменный разговор одновременно с компьютером и человеком, причем вслепую, поскольку оба собеседника скрыты за экранами. Компьютер считается прошедшим тест, если оценщик не смог сказать, какой из разговоров он вел с компьютером, а какой – с человеком (или же ошибся в оценке). Тест Тьюринга в настоящее время является предметом многочисленных дискуссий – он не только оказал огромное влияние на кибернетику, особенно при обсуждении философских проблем искусственного интеллекта, но и подвергается довольно резкой критике. Ряд искусственных систем, в частности широко известный русскоязычный чат-бот «Евгений Густман», по заявлениям разработчиков, уже прошли тест, однако реальная проблема нашего времени, когда ИИ продвинулся несравненно дальше по сравнению с пятидесятыми, заключается в первую очередь в ответе на вопрос: действительно ли тест Тьюринга способен доказать наличие у машины «интеллекта»?

Модели NLU используют методы контролируемого обучения для создания модели входящего текста. Все такие модели являются вероятностными, что означает, что ИИ может принимать более свободные, не фиксированные жестко решения о том, что означают те или иные слова. Понимание естественного языка – труднейшая область исследования, и я не буду вдаваться в подробности того, как разрабатываются применяемые здесь алгоритмы. Достаточно сказать, что проблем существует множество: способность справиться с синонимией (когда разные слова имеют сходное или одинаковое значение) и многозначностью (когда одно и то же слово имеет несколько значений). Отлично демонстрирует проблему многозначности (полисемии) популярное среди англоязычных лингвистов предложение «Время летит как стрела» (англ. «Time flies like an arrow»), которое помимо своего всем известного иносказательного значения («время движется стремительно») легко может быть воспринято носителями английского языка как совершенно бессмысленная, но синтаксически абсолютно корректная фраза «Мухам времени нравится стрела». (Сходным примером из русского языка может быть объявление на столбе: «Лечу от всех болезней» – с ехидным комментарием, написанным под ним шариковой ручкой: «От всех не улетишь!». – Прим. пер.)

Все мы постоянно наблюдаем NLU в действии и пользуемся этим. Такие приложения, как Siri, Cortana или Alexa, имеют удобные интерфейсы на родных языках многих пользователей (хотя, конечно, пока доступны далеко не все языки). В большинстве ситуаций они хорошо воспринимают слова, которые вы произносите (используя распознавание речи), и затем превращают их в значимые фразы типа пользовательских команд. Если эти системы не работают должным образом, то это либо потому, что слова не были правильно восприняты из-за помех или неучтенных алгоритмами особенностей произношения (самая распространенная причина), либо заданный вопрос (команда) не имеет смысла. В принципе, они способны понять разные версии одного и того же вопроса («Какой был счет в матче между…?», «Кто выиграл футбольный матч…?», «Пожалуйста, вы можете сказать мне результат футбольного матча …?» и т. п.). Но если вы просто спросите: «Счет?», они не смогут догадаться, о каком, собственно, счете идет речь – ресторанном, футбольном или банковском. Большинство систем, если они не могут решить, что именно вы спрашиваете, дают ответы «по умолчанию», статистически наиболее частые, но такие ответы необязательно подойдут вам в каждой ситуации.

Так называемые чат-боты, которые печатают вопросы и ответы, тоже используют NLU, но здесь уже нет проблем распознавания звуковой речи. Поэтому, когда компании стремятся создать интерфейсы NLU для своих клиентов, чат-боты являются более простым и предпочтительным решением. Однако использование распознавания живой речи все же не следует сбрасывать со счетов, если условия благоприятны для этого интерфейса, а его преимущества (скажем, скорость общения) для вас всерьез значимы.

И конечно же, все эти «личные помощники» могут произнести или напечатать вам ответы, но, как правило, лишь некие «ключевые фразы», подсказки или команды (как в навигаторах). Для получения большего количества индивидуальных ответов требуется определенный поднабор NLP, называемый генерированием естественного языка (Natural Language Generation, NLG). Генерацию естественного языка можно рассматривать как процесс, обратный NLU, и она, вероятно, представляет собой самую сложную область во всем анализе естественного языка – вот почему подобные интерфейсы лишь недавно стали коммерчески доступными. Вместо ограниченного набора ответных фраз, используемых в большинстве чат-ботов, в NLG возможно создание предложений, абзацев и даже статей «с нуля». Существующие ныне приложения умеют создавать узколокальные прогнозы погоды на основе более обширных данных или финансовые отчеты на основе данных о доходах компании или показателей фондового рынка. Каждое из таких сообщений представляет собой краткое изложение той или иной темы на естественном языке, которое порой непросто отличить от рассказа, созданного человеком.

Понимание естественного языка пытаются использовать и для распознавания эмоций, стоящих за той или иной фразой, – эту область называют «анализ настроений» (англ. sentiment analysis). В своей простейшей форме анализ настроений ищет наличие или отсутствие «полярности», то есть определяет, является ли текст эмоционально положительным, отрицательным или нейтральным. Помимо этого, он будет искать тип выражаемой эмоции, например, счастлив ли говорящий (пишущий), грустен ли, спокоен или зол. С этой целью искусственный интеллект, разумеется, будет искать в первую очередь конкретные слова в тексте, но он все же попытается поместить их в контекст или даже выявить сарказм и другие косвенные приемы, используемые носителями естественного языка.

Анализ настроений уже широко используется для оценки сообщений, поступающих от клиентов, например, через Twitter и TripAdvisor. Это позволяет компаниям оценить, как их продукты или услуги воспринимаются на рынке, без лишнего анкетирования и опросов и позволяет им реагировать на возникающие проблемы в режиме реального времени. Для более узкоспециализированных нужд создаются конкретные модели со специальной терминологией и даже жаргоном – например, для понимания того, насколько клиентам понравился номер в отеле, требуется совсем иной вокабуляр, нежели для выяснения того, как они оценивают достоинства и недостатки нового мобильного телефона.

Другое широко распространенное применение технологий анализа естественного языка – это машинный перевод, когда компьютер переводит фразу или текст с одного языка на другой. Это очень сложная проблема, в которой остается много несделанного, но недавние разработки в области глубокого обучения сделали эту технологию гораздо надежнее и удобнее. Ключ к успеху, как и в большинстве аспектов искусственного интеллекта, заключается в наличии массовых данных, и такие компании, как Google, используют в качестве учебного материала транскрипты переговоров в Европейском парламенте, где речи переводятся людьми на 24 различных языках. По этой причине перевод, скажем, с английского на французский уже стал весьма точным, в то время как для менее распространенных языков, таких как, скажем, кхмерский (официальный язык Камбоджи), переводы выполняются с использованием промежуточной стадии (как правило, через английский язык). Китайские тексты и речи, как известно, переводить особенно трудно, потому что редактировать предложения здесь намного сложнее – иногда приходится выстраивать в нужном порядке буквально произвольные наборы символов, что часто приводит к неверным результатам.

Естественная эволюция машинного перевода должна привести к автоматическому переводу свободной речи в режиме реального времени [в качестве фантастического прототипа можно вспомнить Вавилонскую рыбку (Babel fish) из фильма «Автостопом по Галактике»]. Приложения для компьютеров и смартфонов уже научились читать и переводить текстовые знаки (используя распознавание изображений, NLU и машинный перевод) и, в принципе, могут выступать в качестве переводчиков между двумя людьми, разговаривающими друг с другом на разных языках. Пока такие возможности куда менее надежны, чем письменный перевод, и работают только для более или менее распространенных языковых пар, но потенциал этой технологии для применения в бизнесе поистине огромен.

Понимание естественного языка лидирует по частоте применения искусственного интеллекта в бизнесе. Оно позволяет нам общаться с компьютерами наиболее удобным образом – нам уже необязательно быть компьютерными гениями, чтобы эффективно взаимодействовать с «машинным разумом». Но по своей сути NLU остается лишь технологическим приемом (пусть и очень сложным), и его всегда будут сравнивать с возможностями человека и оценивать по степени приближения к нашим способностям – в отличие от других функций искусственного интеллекта, таких как кластеризация, где ИИ с легкостью превзошел ограничения человеческого мозга. Следовательно, до тех пор, пока не будет окончательно доказано, что лингвистически NLU неотличим от нас (то есть пока он действительно не пройдет тест Тьюринга), его успехи всегда будут предметом для критики. Однако, применяя его в подходящих условиях и с ясно поставленными целями, можно получить от него действительно серьезную выгоду для вашего бизнеса.

Оптимизация

Все функции искусственного интеллекта, которые мы обсуждали до сих пор, оперируют данными, чтобы преобразовать их из одной формы в другую (изображения в описания, звуки в слова, слова в значения, текст в информацию и массовые данные в метаданные). Но даже несмотря на то, что после преобразования исходные данные стали для нас гораздо полезнее, мы еще ничего не сделали с ними кардинально важного. Вот здесь-то и наступает черед оптимизирующей функции ИИ.

Оптимизация больше всего соответствует тому, что люди обычно думают о возможностях искусственного интеллекта. В мире компьютерного «мышления» это самая близкая аналогия тем процессам, которые происходят в человеческом мозгу, за исключением собственно Понимания с большой буквы.

Слово «оптимизация» я использую лишь для краткости, но на самом деле оно включает в себя решение проблем, планирование и сопоставление различных вариантов, что делает саму задачу чрезвычайно обширной – ее автоматизация невозможна без «большой» науки. Более точное определение модели оптимизации можно дать, например, так: если вы знаете набор возможных начальных состояний, желаемую цель и описание всех возможных действий, которые помогут вам достичь поставленной цели, искусственный интеллект может выявить то решение, которое приведет к этой цели, используя оптимальную последовательность действий от любого из начальных состояний.

Исторически, как я уже говорил в начале главы 2, оптимизация достигалась с помощью экспертных систем, которые на самом деле были не более чем «деревьями решений», причем проектировать и настраивать их должны были сами люди. С появлением машинного обучения большую часть «проектирования» и настройки уже выполняет искусственный интеллект с использованием некоей экстремальной версии метода проб и ошибок. (Впрочем, в современном мире все еще есть место для систем искусственного интеллекта, основанных именно на знаниях, о чем я расскажу позднее.)

Хороший пример проявления возможностей оптимизирующих компьютерных моделей – обучение искусственного интеллекта компьютерным играм. Исследователи используют компьютерные игры как своего рода индикатор: насколько умна данная система, сможет ли данный алгоритм победить чемпиона среди людей в определенной игре? Этот пример позволяет нам изучить процесс оптимизации с разных сторон.

Так, чтобы научиться побеждать в шахматы Гарри Каспарова, компьютеру потребовалась «грубая сила»: системы просчитывали ходы в партии намного дальше, чем может человек. Это имеет отношение не столько к искусственному интеллекту, сколько к быстроте операций и размеру библиотеки шахматных партий и позиций. Однако чтобы учиться и побеждать в Space Invaders или Breakout, нужны глубокие нейронные сети и то, что называется «обучением с помощью подкрепления» (подробнее о нем позже). В самом начале компьютеру дают лишь голую цель – максимизировать набранные очки, но никакой информации о том, как играть. Исходя из этого искусственный интеллект «изучает» состояние экрана, пробуя множество разных подходов, пока не станет набирать баллы (для этого нужно «стрелять в инопланетян», не подвергать себя «бомбардировкам» и т. д.). Затем с помощью метода подкрепления ИИ начинает разрабатывать стратегии (такие как получение мяча за стеной в Breakout), которые приносят больше очков. Это отличный пример самообучения, но все же в относительно простой ситуации.

Для обучения искусственного интеллекта китайской игре го требуются куда более сложные процедуры. До недавнего времени компьютер, способный играть в го, был для исследователей искусственного интеллекта недостижимым идеалом – главным образом потому, что в этой игре следует больше полагаться на интуицию, чем на логику, а также потому, что число возможных комбинаций ходов в триллионы (!) раз больше, чем в шахматах (говорят даже, что ходов в го больше, чем атомов во Вселенной). Тем не менее в 2016 году искусственный интеллект, разработанный британской компанией DeepMind, принадлежащей Google, победил лучшего в Европе игрока в го, выиграв четыре партии при одном проигрыше. Эта система, называемая AlphaGo, использует ту же концепцию обучения с подкреплением. Сначала ИИ изучает 30 млн ходов из партий в го, выигранных людьми. Затем система разыгрывает различные версии партий сама против себя, чтобы выработать наилучшие стратегии. И наконец, искусственный интеллект использует эти стратегии в долгосрочном планировании ходов в реальных партиях.

Во втором матче против AlphaGo человек-игрок Ли Седол, очевидно, уже не мог обрести контроль над собой (тут мог сказаться и общий страх перед «искусственным разумом», который, приходится признать, разделяют многие люди). Ну а через некоторое время после описываемых событий AlphaGo обыграла и лучшего в мире игрока в го, Ке Джи, выиграв три партии и не проиграв ни одной.

Итак, самой принципиальной характеристикой оптимизирующей функции ИИ является наличие цели, которую нужно достичь (это может быть идея, которую необходимо обосновать, проблема, которую нужно решить, или план, который необходимо составить). В простейшем виде наилучшее решение формируется с помощью итеративного метода проб и ошибок: в среду вносятся небольшие изменения или сама система предпринимает некоторые действия, после чего ситуация оценивается, чтобы определить, ближе система к цели или нет. Если ближе, система продолжает идти по тому же пути и вносит дальнейшие изменения, если нет – она пытается найти другой путь.

Рассматривая игровые примеры, я указывал, что описание все же слишком упрощено и существуют некоторые тонкости, которые создают оптимизирующую функцию искусственного интеллекта. Ниже я объясняю суть некоторых наиболее распространенных подходов, причем в основном связанных друг с другом.

Современные системы когнитивного мышления являются эквивалентом старых экспертных систем, поэтому некоторые люди избегают называть их сегодня «настоящим» искусственным интеллектом. Системы когнитивного мышления работают, создавая так называемую «карту знаний» в конкретной моделируемой области; это означает, что им не требуется вводить никакие данные, нужно лишь, чтобы их могли тренировать люди – эксперты в данной области. Карты знаний связывают между собой понятия (скажем, «еда» или «человек»), реальные примеры (допустим, «чипсы» и «Эндрю Берджесс») и различные виды взаимоотношений («любимая» еда и т. п.). Виды отношений могут иметь разный вес или вероятности в зависимости от их ожидаемости, благодаря чему у системы можно запросить те или иные рекомендации. В отличие от деревьев решений, система может запускаться из любой точки на карте знаний при условии, что определена цель («какая любимая еда у Эндрю?», «какой человек любит чипсы?»), и может справиться с гораздо более сложными задачами, нежели деревья решений: при выработке рекомендации «ум» системы движется от исходной точки к конечной, используя кратчайший маршрут на карте, а не по развилкам, зависящим от последовательности вопросов. По сравнению с подходами машинного обучения у систем когнитивного мышления есть огромное преимущество: сделанные ими рекомендации полностью прослеживаются. Здесь и в помине нет того «черного ящика», каким выглядят для нас алгоритмы, основанные на машинном обучении. Это делает системы когнитивного мышления идеальными для тех отраслей бизнеса и промышленности, которые подлежат регулированию и поэтому должны демонстрировать принципы своей работы (рис. 3.2).

Если не считать систем когнитивного мышления, большинство оптимизирующих моделей искусственного интеллекта основаны на алгоритмах. Базовая концепция искусственного интеллекта состоит в том, чтобы разбить большую проблему на мелкие, а затем «вспомнить» решения каждой из них. Этот подход, известный как динамическое программирование, реализуется, например, в решении проблемы размена денег. Общий вопрос при этом звучит следующим образом: как можно получить определенную сумму денег с наименьшим количеством монет различного номинала? Если мои деньги представлены монетами по 1, 4, 5, 15, 20 и общая сумма, которую мне нужно получить, составляет 23, то система, которая рассматривала бы задачу как серию независимых «слепых» решений, начала бы с самой большой монеты и затем добавляла бы монеты меньшего достоинства, пока общее количество не сравнялось бы с заданным: это будет 20 + 1 + 1 + 1, то есть использовано четыре монеты. Однако при динамическом программировании система разбила бы данную задачу на более мелкие подзадачи и сохранила бы для каждой из них оптимальное решение. В этом случае мы получили бы ответ 15 + 4 + 4, то есть на одну монету меньше, чем в первом решении.

Система делает свое дело, рассматривая множество различных способов достижения нужной цели, и анализирует большую выборку отдельных шагов, которые можно предпринять. Те примеры действий, которые приводят к желаемой цели или приближаются к ней, запоминаются как благоприятные и, следовательно, будут выбраны с большей вероятностью.

Самый распространенный подход, использующий этот метод, называется поиском по дереву Монте-Карло (англ. Monte Carlo Tree Search, MCTS). Например, когда вы играете в ту или иную карточную игру, система может разыграть за обоих игроков множество различных ходов, причем каждый ход создает ветвящееся дерево дочерних ходов. Используя метод «обратной передачи ошибок обучения» (одна из форм обучающей обратной связи, англ. backpropagation), система запоминает те ходы, которые позволяют достичь желаемой цели, и укрепляет связи между каждым из узлов, которые приводят к нужному результату, так что в дальнейшем они будут воспроизводиться с большей вероятностью.

Подходы, подобные MCTS, имеют несколько недостатков: так, необходимо сбалансировать широту охвата как можно большего числа ходов и влияние небольшого размера выборки карт (это приводит к некоторой рандомизации, встроенной в выбор дочерних узлов). Кроме того, скорость обработки данных для получения оптимального решения у них недостаточно высока.

Обучение с подкреплением – еще одна область искусственного интеллекта, где в настоящее время наблюдается большая исследовательская активность. Ее использование помогает смягчить некоторые недостатки систем MCTS. Обучение с подкреплением по сути является одним из расширений динамического программирования (его иногда называют «приблизительным динамическим программированием») и используется там, где проблемы намного сложнее, чем размен монет или простые настольные игры, и где каждый предпринятый ход содержит больше неизвестных параметров. В обучении с подкреплением используются экстремальные версии метода проб и ошибок, позволяющие системе обновить свой «опыт» и затем использовать его для выявления наилучшего шага к цели. Этот подход немного отличается от метода контролируемого обучения, который я описывал в главе 1. Отличие состоит в том, что «правильный ответ» машина от человека не получает никогда и ее ошибки не исправляются явным образом: программа «изучает» все это сама посредством повторяющихся проб и ошибок.

Тактика, которая обычно используется в обучении с подкреплением, заключается в том, чтобы системы искусственного интеллекта играли друг против друга. Программа AlphaGo, созданная компанией DeepMind, была обучена игре Го на примере партий, сыгранных людьми, но затем все время играла сама против себя. Точнее сказать, друг с другом играли две слегка отличающиеся версии AlphaGo, оттачивая свою технику в тысячах партий между собой. Если бы они учились только на реальных «человеческих» партиях, то максимум смогли бы дойти до уровня лучших игроков среди людей, но, играя друг с другом, машина (или обе машины) превзошла человека в мастерстве. Этот подход, известный как «генеративно-состязательные сети» (англ. Generative Adversarial Networks), вместе с возможностью для алгоритмов настраиваться самостоятельно является очень действенным методом проверки систем искусственного интеллекта на жизнеспособность, а также создания различных сценариев для «военных» компьютерных игр.

Существует и еще одно слабое место в оптимизирующей функции искусственного интеллекта. Оно кроется в «склонности» автоматизированных алгоритмов предпочитать краткосрочные выгоды в ущерб выгодам более долгосрочных стратегий. Однако недавние разработки в области искусственного интеллекта позволили создать целый ряд «двойных» систем, которые позволяют постоянно отслеживать как долговременную, так и кратковременную стратегии, особенно там, где анализируемая область является сложной. В двойных системах алгоритм «управления» будет всегда искать следующий лучший шаг, а алгоритм «значимости» следит за тем, как будет решена проблема или как закончится игра. Эти два алгоритма призваны работать «в связке», чтобы обеспечить результат, лучший со всех точек зрения.

Разработчики приложений «Фейсбука» уже смогли обучить чат-ботов вести переговоры на некоторые простые темы, и в некоторых случаях машина делает это почти так же «естественно», как и человек. Отдел Facebook по исследованию искусственного интеллекта сначала использовал контролируемое обучение, чтобы обучить чат-боты большому количеству сценариев, возможных в переговорах между реальными людьми. Этот этап помог сотрудникам успешно имитировать действия людей (сопоставление языка и значения), но не помог им в достижении конечной цели («гуманизации» чат-ботов). Поэтому ученые перешли к обучению с подкреплением, в котором два «агента» искусственного интеллекта практиковались в переговорах друг с другом. Поразительная деталь: на этом этапе людям пришлось навязать ботам неизменяемую языковую модель, потому что выяснилось, что, если агентам будет разрешено продолжать изучение языковых элементов, они начнут создавать свой собственный язык для «личного общения». В конце каждых переговоров система тем или иным образом «вознаграждалась», в зависимости от достигнутой «сделки». Затем «вознаграждение» передавалось через модель, чтобы зафиксировать результат обучения и тем самым сделать чат-бот еще на один шаг ближе к человеческим возможностям. Хорошо обученный чат-бот вполне мог бы вести переговоры с людьми по «пройденным» вопросам, демонстрируя подчас почти те же навыки в беседе, что и живые участники переговоров.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!