Текст книги "Машина, платформа, толпа. Наше цифровое будущее"
Автор книги: Эндрю Макафи
Жанр: Экономика, Бизнес-Книги
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 23 страниц) [доступный отрывок для чтения: 8 страниц]
Что стало причиной этого взлета и почему он оказался таким быстрым и неожиданным? Как часто бывает в случае прогресса, здесь соединилось несколько факторов, и определенную роль сыграли упорство разработчиков и счастливая случайность. Многие специалисты считают, что единственным важным фактором был закон Мура. По мере увеличения размера нейронные сети становятся намного более мощными и производительными, и только недавно по-настоящему крупные сети стали достаточно дешевы, чтобы быть доступными для большого числа ученых.
Исследователи с небольшим бюджетом также получили доступ к изучению искусственного интеллекта с помощью облачных вычислений. По словам предпринимателя Эллиота Тёрнера, к осени 2016 года вычислительные мощности, необходимые для осуществления передового проекта машинного обучения, можно было получить у провайдера облачных сервисов, например Amazon Web Services, в среднем за 13 тысяч долларов[193]193
Elliott Turner, Twitter post, September 30, 2016 (9:18 a.m.), https://twitter.com/eturner303/status/781900528733261824.
[Закрыть]. Как ни странно, рост популярности видеоигр также стал значительным толчком для машинного обучения. Оказалось, что специализированные графические процессоры, которые установлены в современных игровых приставках, хорошо подходят к типам вычислений, нужным для нейронных сетей, так что эти устройства в больших количествах привлекаются для выполнения таких задач. Исследователь искусственного интеллекта Эндрю Ын[194]194
Иногда в русскоязычной литературе его имя передают как Эндрю Нг. Прим. перев.
[Закрыть] сказал нам: «Ведущие группы делают с помощью графических процессоров такие безумно сложные вещи, каких я не мог вообразить два-три года назад»[195]195
Эндрю Ын, интервью, данное авторам в августе 2015 г.
[Закрыть].
Появление больших данных – то есть недавнее взрывообразное увеличение количества цифрового текста, изображений, звуков, видео, показаний датчиков и тому подобного – было почти таким же важным для машинного обучения, как и закон Мура. Подобно тому как ребенок для изучения языка должен слышать множество слов и предложений, системам машинного обучения нужно иметь множество примеров, чтобы улучшать распознавание речи, классификацию изображений и решать другие задачи[196]196
Большие данные и аналитика также изменили принятие решений людьми; об этом мы рассказываем в статье, написанной для Harvard Business Review: Andrew McAfee and Erik Brynjolfsson, «Big Data: The Management Revolution», Harvard Business Review 90, no. 10 (2012): 61–67.
[Закрыть]. Сейчас данные поступают, по сути, непрерывно, причем их становится все больше. Системы типа тех, что создали Хинтон, Лекун, Ын и другие, обладают весьма полезным свойством: чем больше примеров они видят, тем лучше работают. Хинтон сказал с определенной скромностью: «Если посмотреть назад, то [успех в машинном обучении] был просто вопросом количества данных и количества вычислений»[197]197
Paul Voosen, “The Believers,” Chronicle of Higher Education, February 23, 2015, http://www.chronicle.com/article/The-Believers/190147.
[Закрыть].
Возможно, Хинтон принижает собственный вклад. Благодаря ему нейронные сети значительно продвинулись вперед, а одна из его разработок дала новое название всей этой сфере. Статья 2006 года «Алгоритм быстрого обучения для глубоких сетей доверия»[198]198
G. Hinton, S. Osindero, and Y. Teh, “A Fast Learning Algorithm for Deep Belief Nets,” Neural Computation 18, no. 7 (2006): 1527–54.
[Закрыть], написанная Хинтоном в соавторстве с Саймоном Осиндеро и И-Вай Те, продемонстрировала, что довольно мощные и надлежащим образом настроенные нейронные сети могут учиться сами, без вмешательства человека. Например, если такой сети показать множество написанных от руки цифр, она придет к правильному заключению, что в этих данных есть десять различных образцов, соответствующих цифрам от 0 до 9, и в дальнейшем будет точно распределять любые рукописные цифры по десяти категориям.
Такой тип неконтролируемого обучения остается относительно редким. Самые успешные системы основаны на контролируемом обучении, в ходе которого, как правило, сначала они получают набор вопросов и правильных ответов, а уже потом им предлагают самостоятельно ответить на какие-либо новые вопросы. Так, системе машинного обучения можно дать большой набор звуковых файлов с человеческой речью и файлов с соответствующими текстами в письменном виде. Система использует эти пары, чтобы создать ассоциации в рамках своей нейронной сети, которые позволят ей трансформировать в текст новые примеры речи. Поскольку оба подхода к машинному обучению – и контролируемый, и неконтролируемый – используют алгоритмы, описанные Хинтоном и его коллегами в статье 2006 года, сейчас основанные на них программы и устройства обычно называют системами глубокого обучения.
Демонстрация и применение искусственного интеллектаЕсли не считать весьма небольшого числа более ранних случаев (вроде системы Лекуна для распознавания рукописных номеров на чеках), можно сказать, что коммерческому применению глубокого обучения всего несколько лет. Однако такие технологии распространяются с удивительной скоростью. Разработчик программного обеспечения Джефф Дин[199]199
Благодаря своим работам Дин стал настоящей легендой среди сотрудников Google. Его коллеги даже сделали подборку шутливо гиперболизированных «фактов о Джеффе Дине». Вот типичный «факт»: «Когда-то скорость света в вакууме была равна примерно 35 милям в час, но потом Джефф Дин потратил выходной на оптимизацию физики» (Кентон Варда, пост в Google+ от 28 января 2012 года, https://plus.google.com/+KentonVarda/posts/TSDhe5CvaFe).
[Закрыть], который возглавлял программы Google по использованию глубокого обучения, отмечает, что еще в 2012 году компания не применяла эту технологию для улучшения таких продуктов, как поиск Google, Gmail, YouTube или Google Maps[200]200
“Large-Scale Deep Learning for Intelligent Computer Systems,” по состоянию на 26 января 2017 года, http://www.wsdm-conference.org/2016/slides/WSDM2016-Jeff-Dean.pdf.
[Закрыть]. Однако к третьему кварталу 2015 года глубокое обучение стало использоваться примерно в 1200 проектах компании и показало большую производительность по сравнению с другими методами.
Компания DeepMind особенно продвинулась в сочетании глубокого обучения с другой технологией, известной как обучение с подкреплением[201]201
Обучение с подкреплением связано с созданием программных агентов, которые могут предпринимать эффективные действия в какой-либо среде, чтобы максимизировать вознаграждение. Первой публичной демонстрацией DeepMind своих возможностей была система deep Q-network (DQN), созданная для игры в классические видеоигры Atari 2600, например Space Invaders, Pong, Breakout и Battlezone. Программисты не сообщали системе DQN, в какую игру она играет, какие есть правила, какие стратегии эффективны или какие средства управления и действия ей доступны. Фактически ей даже не сообщали, что она играет в какую-то игру. Ей просто показывали экран каждой игры и просили максимизировать набор очков с помощью перемещения какого-либо контроллера. DQN смогла быстро превзойти результат игроков-людей более чем в половине из 49 представленных ей игр (Volodymyr Mnih et al., “Human-Level Control through Deep Reinforcement Learning,” Nature 518 (February 28, 2015): 529–33, https://storage.googleapis.com/deepmind-data/assets/papers/DeepMindNature14236Paper.pdf).
[Закрыть], сосредоточив внимание не только на информационных продуктах, предоставляемых клиентам, но и на важных процессах реального мира. Google ввела в строй несколько крупнейших в мире дата-центров, которые потребляют очень много энергии. В этих зданиях расположены 100 тысяч серверов, которые должны не только получать питание, но и охлаждаться. Проблема с охлаждением усугубляется тем фактом, что общая вычислительная нагрузка для центра, или общее количество запрашиваемых серверов, непредсказуемо изменяется во времени. Кроме того, на необходимость охлаждения влияет погода.
Как правило, всеми насосами, вентиляторами, охладительными башнями и прочим оборудованием, которое поддерживает нужную температуру в дата-центрах, управляют люди. Они следят за термометрами, датчиками давления и прочими сенсорами и принимают решения, как лучше охлаждать здание. Компания DeepMind захотела узнать, можно ли вместо этого использовать машинное обучение. Специалисты использовали данные прошлых лет о вычислительной нагрузке, показаниях датчиков, факторах окружающей среды (температуре и влажности), чтобы обучить систему нейронных сетей управлять всем имеющимся оборудованием для охлаждения. В каком-то смысле разработчики подошли к дата-центру как к гигантской видеоигре и дали указания своим алгоритмам постараться набрать максимальное количество очков; в рассматриваемом случае очки начислялись за оптимальную эффективность энергопотребления.
Когда реальный дата-центр перешел под управление этой системы, результаты появились немедленно и поражали воображение[202]202
Richard Evans and Jim Gao, “Deep-Mind AI Reduces Google Data Centre Cooling Bill by 40 %,” DeepMind, July 20, 2016, https://deepmind.com/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-40.
[Закрыть]. Общее количество энергии, используемой для охлаждения, снизилось на целых 40 процентов, а ситуация с непроизводительными потерями – энергией, которая не использовалась непосредственно для IT-оборудования и включала дополнительные нагрузки и потери, – улучшилась примерно на 15 процентов. Один из основателей DeepMind Мустафа Сулейман сказал нам, что это одно из самых крупных улучшений, которые когда-либо видела команда дата-центров Google. Сулейман также подчеркнул, что подход DeepMind очень хорошо поддается обобщению. Нейронные сети необязательно полностью перестраивать для каждого нового дата-центра. Их просто нужно обучить с использованием максимально подробных данных за несколько лет. Такое обучение – тонкая и сложная работа[203]203
Может показаться, что наладить правильную работу нейронной сети легко: нужно просто ввести данные и подождать, пока система не построит ассоциативные связи. На самом деле в настоящее время это трудоемкая и тонкая работа, которая кажется тяжелой даже людям с большим опытом в информатике.
[Закрыть], но она определенно окупается.
Наиболее эффективные системы машинного обучения, используемые сегодня для самых разных приложений – от управления энергией в дата-центрах до распознавания речи, классификации образов и автоматического перевода – удивительно похожи. Это просто варианты глубокого обучения, а сама сфера применения существенно не изменяет технологию. Это означает, что такой подход к искусственному интеллекту способен с большой скоростью проникать в различные области промышленности и экономики. Новые нейронные сети можно почти мгновенно дублировать и масштабировать, обучать с помощью данных, а потом применять в деле.
Технологические гиганты, включая Microsoft, Amazon, Google и IBM, разработали собственные технологии машинного обучения и сделали их доступными для других компаний[204]204
Tom Simonite, “Google and Microsoft Want Every Company to Scrutinize You with AI,” MIT Technology Review, August 1, 2016, https://www.technologyreview.com/s/602037/google-and-microsoft-want-every-company-to-scrutinize-you-with-ai.
[Закрыть] посредством сочетания облака и программных интерфейсов приложений (API), которые, по сути, являются ясными, согласованными и открытыми правилами, определяющими то, как части программного обеспечения взаимодействуют друг с другом. API значительно облегчают комбинирование кода из различных источников в единое приложение, а облако обеспечивает его доступность по запросу в любой точке мира.
С такой инфраструктурой появляется возможность быстрого распространения машинного обучения по всему миру. Однако по причинам, описанным в главе 1, мы предполагаем, что это будет происходить неравномерно, поскольку в ведущих компаниях перестраиваются процессы и возникают новые модели ведения бизнеса. Это уже произошло кое-где, в том числе в некоторых неожиданных местах.
Когда японец Макото Коикэ в 2015 году приехал к родителям на огуречную ферму, он увидел возможность применить машинное обучение. Ранее он работал инженером по аппаратному и программному обеспечению в автомобильной промышленности, поэтому был сведущ в создании оборудования, сочетающего коды и механизмы. Он нашел приложение своим талантам, взявшись за сортировку огурцов, которой ранее занималась его мать. Используя свой многолетний опыт, она вручную сортировала всю продукцию фермы на девять категорий[205]205
В Японии огурцы разделяются на девять категорий в зависимости от формы, размера и других параметров. Дороже всего стоят крупные прямые огурцы. Прим. перев.
[Закрыть]. Работа не казалась сложной, поскольку ферма была небольшая (средний размер японской фермы, за исключением тех, где выращивают рис, составляет всего 1,5 гектара[206]206
“Field Work: Farming in Japan,” Economist, April 13, 2013, http://www.economist.com/news/asia/21576154-fewer-bigger-plots-and-fewer-part-time-farmers-agriculture-could-compete-field-work.
[Закрыть], то есть примерно полтора бейсбольных или два футбольных поля[207]207
Metric Views, “How Big Is a Hectare?” November 11, 2016, http://metricviews.org.uk/2007/11/how-big-hectare.
[Закрыть]), но мать сильно уставала. Во время пика созревания она работала до восьми часов в день.
Макото Коикэ был впечатлен[208]208
Kaz Sato, “How a Japanese Cucumber Farmer Is Using Deep Learning and TensorFlow,” Google, August 31, 2016, https://cloud.google.com/blog/big-data/2016/08/how-a-japanese-cucumber-farmer-is-using-deep-learning-and-tensorflow.
[Закрыть] способностями AlphaGo к сравнению изображений и заинтересовался технологией машинного обучения TensorFlow, которую Google открыла для широкой общественности в ноябре 2016 года. Инженер решил использовать TensorFlow, чтобы узнать, можно ли автоматизировать работу по сортировке огурцов на семейной ферме. Хотя у него не было опыта в области машинного обучения, он освоил TensorFlow, а затем обучил систему, взяв 7 тысяч изображений огурцов различных категорий. Используя недорогие камеры, компьютеры и контроллеры, Макото построил полностью автоматический сортировщик, который в первый год работы добился 70-процентной точности. Улучшить результат почти наверняка можно будет с помощью изображений более высокого разрешения и нового поколения программного обеспечения для машинного обучения, использующего облако. Макото говорит об этих технологиях так: «Мне не терпится их опробовать»[209]209
Kaz Sato, “How a Japanese Cucumber Farmer Is Using Deep Learning and TensorFlow,” Google, August 31, 2016, https://cloud.google.com/blog/big-data/2016/08/how-a-japanese-cucumber-farmer-is-using-deep-learning-and-tensorflow.
[Закрыть]. Работы, подобные описанной, заставляют нас согласиться с мнением Каза Сато из Google, заметившего: «Я не преувеличу, если скажу, что варианты применения машинного обучения и глубокого обучения ограничены только нашим воображением»[210]210
Kaz Sato, “How a Japanese Cucumber Farmer Is Using Deep Learning and TensorFlow,” Google, August 31, 2016, https://cloud.google.com/blog/big-data/2016/08/how-a-japanese-cucumber-farmer-is-using-deep-learning-and-tensorflow.
[Закрыть].
Когда мы писали книгу, почти все коммерчески успешные системы в этой сфере использовали методы контролируемого обучения и лишь немногие применяли неконтролируемое обучение (как в случае с оптимизацией дата-центра компанией DataMind). Однако люди в основном учатся с помощью неконтролируемого обучения. Ребенок каждый день изучает физику, играя с кубиками, выливая воду из стакана, бросая мячик и опрокидывая стулья, а не изучая законы Ньютона и не запоминая уравнения типа F = ma. Ян Лекун метко обрисовал широту и почти полную невостребованность неконтролируемого обучения с помощью такой метафоры: «Если сравнивать машинное обучение с кексом, то неконтролируемое обучение будет собственно кексом, контролируемое – сахарной глазурью, а обучение с подкреплением – вишенкой наверху. Мы знаем, как делать сахарную глазурь и где взять вишенку, но мы пока не в силах испечь кекс»[211]211
Carlos E. Perez, “‘Predictive Learning’ Is the New Buzzword in Deep Learning,” Intuition Machine, December 6, 2016, https://medium.com/intuitionmachine/predictive-learning-is-the-key-to-deep-learning-acceleration-93e063195fd0#.13qh1nti1.
[Закрыть]. Он считает, что разработка улучшенных алгоритмов неконтролируемого обучения станет важна, если мы когда-нибудь создадим общий искусственный интеллект.
РАЗУМ И МАШИННОЕ ОБУЧЕНИЕ
Мы не раз слышали, как создатели нынешнего поколения нейронных сетей пренебрежительно именуют предыдущий, основанный на правилах подход «конструированием признаков». Сейчас многие специалисты считают неверным подход, при котором сначала все соответствующие ситуации правила собираются, а затем вводятся в компьютер. Они полагают, что гораздо продуктивнее создавать системы, способные изучать правила самостоятельно. Статистический лагерь исследователей искусственного интеллекта сейчас занимает лидирующие позиции и уже выполнил по меньшей мере некоторые обещания из тех, что были даны более полувека назад.
И как же в таких условиях свести вместе разум и машину? Есть несколько разных способов. Один был описан в предыдущей главе; его сторонники, Пол Мил и Том Дэвенпорт, полагают, что люди, наделенные здравым смыслом, будут наблюдать за решениями и действиями искусственного интеллекта и вмешиваться, если заметят что-то неладное. Именно это делала компания DeepMind, когда оптимизировала обслуживание дата-центра с помощью нейронных сетей. Люди-контролеры никуда не делись, в любой момент они могли перехватить контроль у компьютера.
Автопроизводители, которые встраивают в машины технологии автоматического управления, пользуются таким же методом. Они подчеркивают, что человек и в буквальном, и в переносном смысле находится на месте водителя и отвечает за безопасное функционирование автомобиля даже в то время, когда тот едет сам. Многим участие человека в схеме управления кажется благоразумным, поскольку невнимательность может быть фатальной. Летом 2016 года машина марки Tesla Джошуа Брауна врезалась в борт грузового прицепа, водитель погиб[212]212
Anjali Singhvi and Karl Russell, “Inside the Self-Driving Tesla Fatal Accident,” New York Times, July 12, 2016, https://www.nytimes.com/interactive/2016/07/01/business/inside-tesla-accident.html.
[Закрыть]. Фура белого цвета совершала левый поворот с автострады на боковую дорогу. Браун ехал по противоположной стороне шоссе. Поскольку машина Tesla не затормозила перед катастрофой, похоже, ни Браун, ни видеокамера автомобиля не заметили белый прицеп на фоне яркого неба Флориды[213]213
Tesla, “A Tragic Loss,” June 30, 2016, https://www.tesla.com/blog/tragic-loss.
[Закрыть]. Возможно, Браун слишком полагался на систему автоматического вождения, так как видел ее эффективность во многих предыдущих случаях и привык не обращать особого внимания на дорогу.
Google считает, что, поскольку человеческая невнимательность – это вечная проблема, нужно полностью исключить людей из управления транспортным средством. Крис Урмсон, бывший руководитель проекта компании по машинам с автоматическим управлением, говорит: «Общепринятая точка зрения такова, что нам нужно взять существующие системы помощи водителю и каким-то образом постоянно улучшать их, тогда у нас со временем появятся самоуправляемые автомобили. Что ж, я отвечу так: это равнозначно утверждению, что если я буду усердно учиться прыгать, то когда-нибудь научусь летать. На самом деле действовать нужно несколько иначе»[214]214
Chris Urmson, “How a Driverless Car Sees the Road,” TED Talk, June 2015, 15:29, https://www.ted.com/talks/chris_urmson_how_a_driverless_car_sees_the_road/transcript?language=en.
[Закрыть]. Вот почему компания работает над созданием на сто процентов автономных машин, которые не требуют участия человека, – это называется автономностью пятого уровня[215]215
Выделяют шесть уровней автономности автомобилей, от нулевого до пятого. На нулевом уровне машиной полностью управляет человек, на пятом абсолютно все делает автоматика. Прим. перев.
[Закрыть].
Их возможности впечатляют. На конференции TED[216]216
TED (Technology, Entertainment, Design) – американская организация, проводящая ежегодные конференции под девизом «Идеи, стоящие распространения». Прим. перев.
[Закрыть] 2015 года Урмсон сообщил: «Наши автомобили проезжали через Маунтин-Вью, и вот с чем мы столкнулись. Одна женщина на электрическом кресле-коляске гонялась кругами за уткой. В правилах дорожного движения ничего не написано о том, что нужно делать в таком случае, однако наши машины смогли обнаружить препятствие, снизить скорость и проехать дальше»[217]217
Chris Urmson, “How a Driverless Car Sees the Road,” TED Talk, June 2015, 15:29, https://www.ted.com/talks/chris_urmson_how_a_driverless_car_sees_the_road/transcript?language=en.
[Закрыть]. Автономных машин, способных безопасно ездить в любых условиях и ситуациях, пока еще нет. Тем не менее, по нашему мнению, они скоро появятся.
Способность машин преодолевать парадокс Полани начинает применяться в работе бэк-офисных подразделений «белых воротничков», которая в данный момент удивительно плохо поддается полной автоматизации. «Бэк-офис» – обобщающий термин для умственной работы, происходящей вне поля зрения клиента и включающей закупки, бухгалтерию и IT. Как мы говорили ранее, наиболее масштабные и распространенные операции бэк-офиса давно автоматизированы корпоративными системами, тем не менее в большинстве компаний все равно остается масса ручной работы. Один из способов автоматизировать хотя бы часть такой работы – спросить выполняющих ее людей, какими правилами они руководствуются, каковы исключения из них, когда нужно использовать другой набор правил или директив и прочее. Однако на сбор такой информации с помощью опросов ушло бы много времени, и это отвлекло бы сотрудников от работы и, вероятно, не оправдало бы себя. Лица, выполняющие менее рутинную работу, по всей вероятности, не способны точно и исчерпывающе изложить кому бы то ни было, как они действуют.
Японская страховая компания Fukoku Mutual Life использует другой подход[218]218
Dave Gershgorn, “Japanese White-Collar Workers Are Already Being Replaced by Artificial Intelligence,” Quartz, January 2, 2017, https://qz.com/875491/japanese-white-collar-workers-are-already-being-replaced-by-artificial-intelligence.
[Закрыть]. В декабре 2016 года она объявила о попытке использовать созданную IBM технологию искусственного интеллекта Watson, чтобы хоть частично автоматизировать работу людей, имеющих дело с заявлениями о наступлении медицинского страхового случая. Система будет извлекать соответствующую информацию из документов, предоставленных больницами и другими медицинскими учреждениями, и использовать ее для заполнения надлежащих кодов для страховых выплат, а затем выдаст эту информацию людям. В перспективе же система будет «изучать историю оценивания прошлых выплат, чтобы перенять опыт и квалификацию оценщиков»[219]219
Google Translate, “December 26, Heisei 28, Fukoku Life Insurance Company,” по состоянию на 30 января 2017 года, https://translate.google.com/translate?depth=1&hl=en&prev=search&rurl=translate.google.com&sl=ja&sp=nmt4&u=http://www.fukoku-life.co.jp/about/news/download/20161226.pdf.
[Закрыть]. Другими словами, технологии предстоит обучаться по ходу дела, и со временем она сможет освободить людей от большого объема работы.
Мы ожидаем, что в ближайшее время появится немало таких проектов, и прогнозируем быстрое распространение глубокого и других видов машинного обучения. Например, значительная часть работы с клиентами заключается в том, что сотрудник выслушивает заказчика, чтобы понять, чего тот желает, а затем предоставляет ему ответ или услугу. Современные технологии смогут взять на себя вторую часть описанной процедуры, как только овладеют правилами взаимодействия. Гораздо труднее будет автоматизировать не нахождение ответа, а первый этап – выслушать и понять. Распознавание речи и другие аспекты обработки естественного языка крайне сложны для искусственного интеллекта с самого его зарождения по причинам, описанным в этой главе. Доминировавший ранее символический подход с такими задачами не позволял справиться вовсе, однако ему на смену пришли новые подходы, основанные на глубоком обучении, которые развиваются очень быстро даже на удивление экспертов.
В октябре 2016 года группа из Microsoft Research объявила, что сконструированная ею нейронная сеть достигла «уровня распознавания разговорной речи, сравнимого с человеческим»[220]220
Allison Linn, “Historic Achievement: Microsoft Researchers Reach Human Parity in Conversational Speech Recognition,” Microsoft (blog), October 18, 2016, http://blogs.microsoft.com/next/2016/10/18/historic-achievement-microsoft-researchers-reach-human-parity-conversational-speech-recognition/#sm.0001d0t49dx0veqdsh21cccecz0e3.
[Закрыть]. Такая фраза была в названии их статьи. Их система работала точнее, чем профессиональные люди-транскрибаторы[221]221
Транскрибатор – человек, который занимается переводом аудиозаписей в текст. Прим. перев.
[Закрыть], причем справлялась как с аудиозаписями по установленным темам, так и с обычными разговорами между друзьями и членами семьи. Комментируя этот результат, профессор Джеффри Паллум написал: «Должен признаться, я никогда не думал, что доживу до такого дня. В 1980-х я считал, что полностью автоматическое распознавание связной речи (слушание и точная запись сказанного) слишком трудно для машин… Специалисты достигли этого, не опираясь на какой-либо синтаксический анализ[222]222
Другими словами, они не использовали подход, основанный на правилах.
[Закрыть]: они проделали чисто техническую работу с помощью статистического моделирования, основанного на гигантском объеме исходных данных… Я не только не думал, что когда-либо это увижу, – я уверенно поставил бы на обратное»[223]223
Mark Liberman, “Human Parity in Conversational Speech Recognition,” Language Log (blog), October 18, 2016, http://languagelog.ldc.upenn.edu/nll/?p=28894.
[Закрыть].
Легендарный ученый Фредерик Йелинек, работавший в области информатики, точно подметил причину масштабного сдвига внутри сообщества разработчиков искусственного интеллекта от подхода, основанного на правилах, к статистическому подходу. В середине 1980-х он сказал: «Каждый раз, когда я увольняю лингвиста, качество распознавания речи улучшается»[224]224
Julia Hirschberg, “ ‘Every Time I Fire a Linguist, My Performance Goes Up,’ and Other Myths of the Statistical Natural Language Processing Revolution” (speech, 15th National Conference on Artificial Intelligence, Madison, WI, July 29, 1998).
[Закрыть]. К середине 2010-х в самых успешных группах, работавших над задачами преобразования речи в текст, лингвистов не было, и результаты удивили мир. Мы уверены, что нас еще ждут новые сюрпризы.
Мы согласны с CEO[225]225
CEO (Chief Executive Officer) – высшая управленческая должность в корпорации. Несмотря на то что название должности буквально переводится как главный исполнительный директор, по функциям CEO ближе к генеральному директору в России, а не к исполнительному. Прим. перев.
[Закрыть] компании Salesforce и пионером индустрии высоких технологий Марком Бениоффом в том, что мы двигаемся к «миру с лидерством искусственного интеллекта»[226]226
Julie Bort, “Salesforce CEO Marc Benioff Just Made a Bold Prediction about the Future of Tech,” Business Insider, May 18, 2016, http://www.businessinsider.com/salesforce-ceo-i-see-an-ai-first-world-2016-5.
[Закрыть]. Как и мы, он видит бесчисленные возможности в перспективе заменить людей, принимающих решения, чем-то намного более эффективным. Марк Бениофф пишет: «Многие бизнесы по-прежнему принимают важные решения, опираясь на интуицию, а не на информацию… В ближайшие несколько лет это изменится, так как искусственный интеллект становится все более распространенным и потенциально делает каждую компанию и каждого работника умнее, быстрее и производительнее»[227]227
Marc Benioff, “On the Cusp of an AI Revolution,” Project Syndicate, September 13, 2016, https://www.project-syndicate.org/commentary/artificial-intelligence-revolution-by-marc-benioff-2016-09.
[Закрыть]. Несколько лет назад такой прогноз показался бы ужасным преувеличением, сегодня же он выглядит беспроигрышной ставкой.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?