Электронная библиотека » Мартин Форд » » онлайн чтение - страница 9


  • Текст добавлен: 6 октября 2016, 14:20


Автор книги: Мартин Форд


Жанр: Зарубежная образовательная литература, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 9 (всего у книги 26 страниц) [доступный отрывок для чтения: 9 страниц]

Шрифт:
- 100% +
Вопрос об этичности

Если вернуться к удвоению одного пенса как средству измерения экспоненциального роста в мире цифровых технологий, становится очевидным, что текущий громадный баланс счета технологий является результатом усилий бесчисленного числа людей и организаций, трудившихся на протяжении многих десятилетий. А если попытаться прочертить траекторию прогресса, то начинать ее придется по крайней мере с начала XVII в., когда Чарльз Беббидж изобрел свою механическую разностную машину.

Несмотря на всю свою безусловную значимость, инновации, которым обязана своим фантастическим богатством и влиянием современная информационная экономика, не идут ни в какое сравнение с революционной работой, проделанной такими первопроходцами, как Алан Тьюринг и Джон фон Нейман. Вся разница в том, что сегодня для дальнейшего увеличения накопленного громадного баланса достаточно даже небольших поэтапных изменений. В известном смысле современных успешных инноваторов можно уподобить участнику Бостонского марафона, который прославился тем, что в 1980 г. присоединился к бегущим всего лишь за полкилометра до финишной линии.

Разумеется, все инноваторы опираются на достижения предшественников. Например, Генри Форд вряд ли бы придумал «Форд-Т», если бы не использовал опыт других. Однако, как мы уже могли убедиться, в мире информационных технологий все совершенно иначе. Уникальная способность информационных технологий обеспечивать масштабирование машинного интеллекта в рамках организаций с последующим сокращением штата, а также присущая им тенденция к созданию ситуаций, развивающихся по сценарию «победитель получает всё», будут иметь очень серьезные последствия как для экономики, так и для общества.

Наступит момент, когда нам придется ответить на фундаментальный этический вопрос: должны ли все остальные заявить о своем праве на часть этого накопленного на технологическом счету баланса? Конечно, стремительное развитие цифровых технологий приносит обществу немалую выгоду в виде снижения затрат и свободного доступа к информации и развлечениям в удобной форме. Но это возвращает нас к проблеме, упомянутой в связи с замечанием Курцвейла о мобильных телефонах: все эти вещи не приносят никакого дохода.

Кроме того, следует помнить, что в значительной мере фундаментальные исследования, обеспечившие прогресс в секторе информационных технологий, финансировались из кармана американских налогоплательщиков. Например, компьютерная сеть, эволюция которой в конечном итоге привела к появлению Интернета, была создана на деньги Управления перспективных исследований Министерства обороны США (Defense Advanced Research Projects Agency, DARPA)[23]23
  Кроме того, управление DARPA, например, профинансировало работы по созданию Siri (технологии, которая сейчас обеспечивает работу одноименного виртуального помощника в устройствах компании Apple), а также компенсировала IBM расходы по разработке новых чипов SyNAPSE, реализующих технологии когнитивных вычислений. – Прим. авт.


[Закрыть]
. Сам закон Мура отчасти является результатом университетских исследований, проводившихся при финансовой поддержке Национального научного фонда (National Science Foundation). Ассоциация полупроводниковой промышленности (Semiconductor Industry Association), защищающая интересы производителей на политическом уровне, активно лоббирует выделение дополнительных инвестиций на исследования из федерального бюджета. В какой-то мере современные компьютерные технологии существуют благодаря тому, что миллионы налогоплательщиков из среднего класса поддерживают финансирование фундаментальных исследований за счет федерального бюджета на протяжении нескольких десятилетий после Второй мировой войны. С большой долей уверенности можно сказать, что, выступая в поддержку такого финансирования, налогоплательщики рассчитывали, что плоды этих исследований помогут обеспечить процветание их детям и внукам в будущем. Однако, если судить по тенденциям, рассмотренным нами в предыдущей главе, мы движемся в совершенно другом направлении.


Если оставить в стороне вопрос о том, является ли этичным фактический захват всего накопленного обществом технологического капитала горсткой людей, образующих элиту, остается ряд проблем практического характера, касающихся общего состояния экономики, в которой неравенство доходов достигает столь высокого уровня. Непрерывность прогресса зависит от сохранения потребности в будущих инновациях на рынке, а это, в свою очередь, предполагает рациональное распределение покупательской способности.

В следующих главах мы рассмотрим более подробно некоторые из экономических и социальных последствий неудержимого роста цифровых технологий. Но сначала давайте взглянем на то, как эти инновации создают все более реальную угрозу для рабочих мест, требующих высокой квалификации и занимаемых выпускниками колледжей или даже людьми с научными степенями.

Глава 4
Белые воротнички под угрозой

11 октября 2009 г. Los Angeles Angels обыграли Boston Red Sox в плей-офф Американской лиги, заработав право сразиться с New York Yankees за звание чемпиона лиги и место в Мировой серии. Для Angels эта победа была наполнена особым смыслом: всего за шесть месяцев до того один из самых многообещающих игроков команды питчер Ник Аденхарт погиб в аварии, виновником которой был пьяный водитель. Один спортивный журналист начал свою статью об игре следующими словами:

«Когда в воскресенье на стадионе „Фенуэй Парк“ в девятом иннинге Angels проигрывали с разницей в две пробежки, никто уже не верил в их победу, но лосанджелесцы сумели переломить ход игры благодаря важнейшему синглу Владимира Гуэрреро, вырвав победу у Boston Red Sox со счетом 7–6.

Гуэрреро принес Angels два рана. Cчет на подаче был 2–4.

"Если вспоминать о Нике Аденхарте и апрельской трагедии в Анахайме, да, пожалуй, это был самый важный хит [в моей карьере], – сказал Гуэрреро. – Так что я посвящаю эту победу своему бывшему товарищу по команде, парню, которого с нами уже нет".

Гуэрреро хорошо себя проявил во всех играх сезона, особенно в дневных. В дневных играх он показал OPS [процент занятия базы плюс слаггинг] на уровне 0,794. Он выбил пять хоумранов и принес 13 ранов в 26 дневных играх»{117}117
  David Carr, «The Robots Are Coming! Oh, They're Here», New York Times (Media Decoder blog), October 19, 2009, http://mediadecoder.blogs.nytimes.com/2009/10/19/the-robots-are-coming-oh-theyre-here.


[Закрыть]
.

Автору этого текста, наверное, вряд ли стоит рассчитывать на какие-либо награды за свой писательский труд. Тем не менее приведенный выше рассказ – поразительное достижение: дело не в том, что он хорошо читается, в нем нет грамматических ошибок и он содержит точное описание бейсбольного матча; просто его автор – компьютерная программа.

Эту программу (под названием StatsMonkey) создали студенты и преподаватели Лаборатории интеллектуальной информации (Intelligent Information) при Северо-Западном университете. StatsMonkey предназначена для автоматизации процесса написания материалов о спорте за счет превращения объективных данных об отдельно взятой игре в захватывающее повествование. Возможности системы выходят далеко за рамки простого перечисления фактов; скорее, она описывает события, добавляя в рассказ все те основные атрибуты спортивной журналистики, которые присущи работам журналистов-людей. Для выявления значимых событий, имевших место во время матча, StatsMonkey выполняет статистический анализ; затем она использует естественный язык для создания текста, в котором кратко описывается ход игры, а также уделяется особое внимание решающим моментам и ключевым игрокам, определившим ее исход.

В 2010 г. исследователи из Северо-Западного университета, которые руководили работавшей над StatsMonkey группой студентов, специализировавшихся в области вычислительной техники и журналистики, получили финансовую поддержку от венчурных инвесторов и основали новую компанию под названием Narrative Science, Inc. с целью коммерциализации данной технологии. Компания наняла лучших специалистов в области вычислительных систем и инженеров; новая команда избавилась от первоначального кода StatsMonkey и создала значительно более мощную и комплексную систему искусственного интеллекта, которая получила название Quill.

Технология Narrative Science используется крупнейшими средствами массовой информации, в том числе Forbes, для написания статей на различные темы, включая спорт, бизнес и политику. Разработанное компанией ПО генерирует новостные материалы приблизительно каждые 30 секунд; при этом многие из них публикуются на популярных сайтах, которые предпочитают не афишировать свою связь с данным сервисом. В 2011 г. в ходе отраслевой конференции корреспондент Wired Стивен Леви попросил одного из основателей Narrative Science Кристиана Хэммонда оценить, какой будет доля новостных материалов, написанных с помощью программных алгоритмов, в ближайшие 15 лет. В ответ он услышал: более 90 %{118}118
  Steven Levy, «Can an Algorithm Write a Better News Story Than a Human Reporter?», Wired, April 24, 2012, http://www.wired.com/2012/04/can-an-algorithm-write-a-better-news-story-than-a-human-reporter.


[Закрыть]
.

Narrative Science строит далекоидущие планы, не собираясь ограничиваться одной лишь индустрией новостей. Назначение Quill – служить универсальной платформой для анализа и написания нарративных текстов, составлять высококачественные отчеты как для внутреннего пользования, так и для публикации в ряде отраслей. Работа Quill начинается со сбора данных из различных источников, включая базы данных о транзакциях, системы финансовой и торговой отчетности, сайты и даже социальные медиа. Затем система выполняет анализ собранных данных, выбирая самые важные и интересные факты и выводы. Наконец, она сплетает из всей этой информации связное повествование, которое, по заверениям компании-разработчика, сопоставимо с результатами труда лучших аналитиков. После соответствующей настройки система Quill способна практически мгновенно формировать бизнес-отчеты с заданной периодичностью – и все это без вмешательства человека{119}119
  Адрес корпоративного сайта компании Narrative Science: http://narrativescience.com.


[Закрыть]
. Учитывая, что одним из первых инвесторов, поддержавших Narrative Science в самом начале пути, было In-Q-Tel – подразделение ЦРУ, отвечающее за венчурные проекты, можно с большой долей уверенности утверждать, что разработанные компанией инструменты будут использоваться для автоматического преобразования потоков необработанных данных, собираемых специалистами американской разведки, в удобный для понимания повествовательный формат.

Пример технологии Quill демонстрирует, насколько уязвимыми для автоматизации оказываются задачи, которые когда-то считались исключительной прерогативой высококвалифицированных профессионалов с высшим образованием. Разумеется, связанная со знаниями работа обычно предполагает наличие широкого круга навыков и талантов. Среди прочего аналитик должен уметь извлекать информацию из различных систем, строить статистические или финансовые модели, а затем доходчиво доносить результаты своей работы до аудитории в виде отчетов или презентаций. Может показаться, что писательский труд – в котором, как ни крути, столько же искусства, сколько и науки, – относится к видам деятельности, в последнюю очередь поддающимся автоматизации. Но, как оказывается, это совсем не так, а алгоритмы с каждым днем становятся все более совершенными. Более того, учитывая то, что для автоматизации профессий, связанных с умственным трудом, достаточно одного лишь ПО, соответствующие рабочие места во многих случаях могут оказаться более уязвимыми, чем рабочие места для людей с низкой квалификацией, предполагающие физический труд.

Стоит отметить, что письменная речь относится к тем навыкам, которые, судя по жалобам работодателей, чаще всего недостаточно хорошо развиты у выпускников колледжей. По данным одного из недавних опросов работодателей, около половины всех принятых на работу выпускников, проведших в колледже два года, и более четверти выпускников с четырехлетним образованием не умеют письменно излагать свои мысли, а в некоторых случаях еще и недостаточно хорошо читают{120}120
  George Leef, «The Skills College Graduates Need», Pope Center for Education Policy, December 14, 2006, http://www.popecenter.org/commentaries/article.html?id=1770.


[Закрыть]
. Если интеллектуальное ПО способно, как это утверждают специалисты Narrative Science, составить конкуренцию самым талантливым аналитикам, рост потребности в специалистах, чья работа связана с умственным трудом, в будущем оказывается под большим вопросом. Это касается всех выпускников колледжей, в особенности наименее подготовленных.

Большие массивы данных и машинное обучение

Система написания нарративных текстов Quill – лишь один из многих примеров нового прикладного ПО, разрабатываемого с целью обеспечения максимально эффективного использования тех огромных объемов данных, которые собирают и хранят частные компании, организации и государственные органы повсюду в мире. По некоторым оценкам, общий объем хранимых в мире данных в настоящее время измеряется тысячами экзабайт (1 экзабайт равен 1 млрд гигабайт); причем эта величина постоянно растет в соответствии с законом, напоминающим закон Мура, удваиваясь приблизительно каждые три года{121}121
  Kenneth Neil Cukier and Viktor Mayer-Schoenberger, «The Rise of Big Data», Foreign Affairs, May/June 2013, http://www.foreignaffairs.com/articles/139104/kenneth-neil-cukier-and-viktor-mayer-schoenberger/the-rise-of-big-data.


[Закрыть]
. Почти все эти данные сегодня хранятся в цифровом формате, а значит, компьютеры могут работать с ними напрямую. Одни только серверы Google ежедневно обрабатывают около 24 петабайт (1 петабайт равен 1 млн гигабайт) данных, главным образом относящихся к поисковым запросам миллионов пользователей{122}122
  Thomas H. Davenport, Paul Barth, and Randy Bean, «How 'Big Data' Is Different», MIT Sloan Management Review, July 20, 2012, http://sloanreview.mit.edu/article/how-big-data-is-different.


[Закрыть]
.

Все эти данные поступают из множества разнородных источников. Если взять один только Интернет, это будут данные о посещениях сайтов, поисковых запросах, сообщениях электронной почты, общении в социальных медиа, переходах по рекламным ссылкам и многое, многое другое. Если брать бизнес-сектор, то следует упомянуть данные о транзакциях, договорах с клиентами, внутренних коммуникациях, а также данные из финансовых, бухгалтерских и маркетинговых систем. На заводах, в больницах, автомобилях, самолетах и бесчисленных устройствах бытового и промышленного назначения непрерывно собираются данные в режиме реального времени.

Подавляющее большинство этих данных представляют собой то, что специалисты по компьютерным вычислениям называют «неструктурированными» данными. Другими словами, они поступают в различных форматах, которые трудно поддаются сопоставлению или сравнению. Это очень сильно отличает их от содержимого традиционных реляционных баз данных, в которых информация хранится в виде аккуратно упорядоченных строк и столбцов, что обеспечивает высокую скорость, надежность и точность поиска. Обработка неструктурированных данных потребовала создания новых инструментов, специально предназначенных для углубленного анализа информации, собранной из различных источников. Стремительный прогресс в этой области – всего лишь еще один пример того, как компьютеры, пускай и в довольно упрощенной форме, учатся делать то, что совсем недавно было доступно только людям. Все-таки способность непрерывно обрабатывать поток неструктурированной информации из множества различных источников во внешней среде всегда относилась к числу уникальных для человека механизмов адаптации. Разница, разумеется, в том, что человек никогда не сможет оперировать большим объемом данных в тех же масштабах, что и компьютеры. Большие данные оказывают революционное воздействие на широкий круг областей, включая бизнес, политику, медицину и практически все группы естественных и социальных наук.

Благодаря большим данным крупнейшие ретейлеры могут получить небывало подробное представление о покупательских предпочтениях отдельных потребителей, что дает им возможность формулировать адресные предложения и тем самым увеличивать собственную выручку, при этом повышая лояльность клиентов. Полицейские по всему миру обращаются к алгоритмическому анализу для прогнозирования наиболее вероятных мест и периодов совершения преступлений и распределяют свои силы в соответствии с полученными результатами. На специальном портале жители Чикаго могут ознакомиться как с ретроспективными, так и с актуальными данными, относящимися к самым разным сферам жизни и отражающими самые разные аспекты существования в большом городе, включая потребление энергии, уровень преступности, показатели эффективности работы транспортной инфраструктуры, школ, учреждений здравоохранения и даже количество выбоин и ям на дорогах, которые латали в конкретный период времени. Благодаря инструментам, которые реализуют новые способы визуализации данных, полученных путем анализа общения в социальных медиа, а также поступающих с датчиков, встроенных в двери, турникеты и эскалаторы, градостроители и сотрудники городской администрации могут наблюдать за тем, как люди перемещаются, работают и общаются в пределах городской среды, получая возможность оперативно корректировать свои действия с целью повышения эффективности работы городских служб и создания максимально комфортных условий для жизни.

Однако у этой тенденции есть и обратная сторона. Деятельность компании Target, Inc. является примером куда более спорного подхода к использованию огромных массивов чрезвычайно подробных данных о клиентах в коммерческих целях. Эта компания наняла специалиста по анализу и обработке данных, который обнаружил сложный набор корреляций, позволяющих с очень большой долей вероятности предсказывать наличие беременности на раннем сроке у покупательниц на основе анализа продаж по двадцати пяти различным видам косметической и медицинской продукции. Проводимый компанией анализ был настолько точным, что даже позволял с высокой степенью точности определять срок беременности у конкретной женщины. Получив эти данные, сотрудники Target начинали забрасывать женщин предложениями о покупке товаров для беременных, да еще и на столь раннем сроке, что во многих случаях ближайшее окружение женщины даже не знало о ее положении. В начале 2012 г. в The New York Times была опубликована статья, в которой рассказывалось об одном любопытном случае: ничего не подозревавший отец девочки-подростка пожаловался руководству магазина на неподобающие рекламные материалы, присылаемые на почтовый адрес семьи, а потом узнал, что сотрудники Target фактически были лучше осведомлены о жизни его дочери, чем он сам{123}123
  Charles Duhigg, «How Companies Learn Your Secrets», New York Times, February 16, 2012, http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html.


[Закрыть]
. Некоторые критики опасаются, что эта не самая приятная история – лишь начало и что большие данные все чаще и чаще будут использоваться для получения информации, которая может нарушать неприкосновенность частной жизни или даже угрожать свободе.

Выводы, получаемые при анализе больших данных, как правило, основываются исключительно на корреляциях и ничего не говорят о причинах изучаемого феномена. Алгоритм может выяснить, что если A соответствует действительности, то и B, скорее всего, тоже верно. Но он не способен установить причинно-следственную связь между A и B и уж тем более не может установить, обусловлены ли A и B каким-либо иным внешним фактором. Во многих случаях, однако, и в особенности в мире бизнеса, где абсолютным критерием успеха является прибыльность и эффективность, а не глубина понимания, даже простая корреляция сама по себе может представлять очень большую ценность. Большие данные могут стать для менеджмента источником подробнейших сведений по самому широкому кругу вопросов: все – от параметров работы каждого отдельного станка до общих результатов работы международной корпорации – может быть потенциально подвергнуто анализу с такой степенью подробности, которая прежде была просто невозможна.

Непрерывно увеличивающийся в объеме массив данных все чаще рассматривается в качества своего рода ресурса, который, если за него взяться как следует, может стать источником ценной информации, причем не только сейчас, но и в будущем. Глядя на компании в добывающих отраслях (например, нефтегазовой), год за годом с успехом пользующихся плодами технического прогресса, легко представить, как, вооружившись возросшей вычислительной мощью компьютеров, а также усовершенствованным ПО и новыми методами анализа, корпорации во всех секторах экономики препарируют данные, извлекая из них знания, которые сразу превращаются в дополнительную прибыль. Более того, как раз вера инвесторов в то, что все так и будет, судя по всему, и является главным фактором, обуславливающим такую громадную рыночную стоимость компаний, работающих с большими объемами данных, т. е. таких, как Facebook.

Машинное обучение – метод, при котором компьютер перебирает данные и, по сути, пишет собственную программу на основе обнаруженных статистических закономерностей, – является одним из наиболее эффективных средств извлечения самой ценной информации. Как правило, процесс машинного обучения разбивается на два этапа: сначала алгоритм обучается на имеющихся данных, а затем применяется к новой информации для решения похожих задач. Самый очевидный пример использования машинного обучения на практике – фильтры спама в электронной почте. На этапе обучения алгоритм обрабатывает миллионы сообщений, заранее помеченных как спам или не спам. При этом никто не садится и не программирует систему напрямую так, чтобы она могла распознавать все мыслимые способы написания слова «виагра». Вместо этого программа учится самостоятельно распознавать нужную информацию. Результатом обучения является приложение, которое способно автоматически идентифицировать основной массив нежелательной почты и при этом постоянно совершенствоваться и адаптироваться по мере появления новых образцов спама. Алгоритмы машинного обучения, работающие на основе тех же самых принципов, используются и при подборе рекомендуемых книг на Amazon, фильмов – на Netflix и потенциальных партнеров – на Match.

Одним из самых впечатляющих примеров эффективности машинного обучения стал созданный Google онлайн-переводчик. Используемые в нем алгоритмы основаны на подходе, который можно назвать подходом Rosetta Stone[24]24
  Программный продукт, предназначенный для обучения иностранным языкам. Разработан компанией Rosetta Stone Inc. – Прим. пер.


[Закрыть]
и который предполагает анализ и сравнение миллионов страниц текста, который уже был переведен на различные языки. Разработчики Google начали с официальных документов Организации Объединенных Наций, а затем расширили круг исходных текстов, включив в него содержимое Всемирной паутины. Чтобы найти достаточное количество примеров для ненасытных алгоритмов самообучения, они использовали поисковую систему Google. Если судить по одному только количеству документов, использовавшихся в процессе обучения системы, то становится очевидно, что ничего подобного прежде не было. Специалист в области компьютерных вычислений Франц Ок, который руководил проектом, отметил, что его команда выстроила «очень-очень большие языковые модели, намного более масштабные, чем все, что было прежде за всю историю человечества»{124}124
  Цит. по: Steven Levy, In the Plex: How Google Thinks, Works, and Shapes Our Lives (New York: Simon and Schuster, 2011), p. 64.


[Закрыть]
.

В 2005 г. система Google приняла участие в ежегодном соревновании по машинному переводу, проводимом Национальным бюро стандартов и технологий, подразделением Министерства торговли США, отвечающим за публикацию стандартов измерения. Алгоритмы машинного обучения Google легко обошли всех остальных участников. До этого победа обычно доставалась лингвистам и языковедам, которые тратили немало сил на то, чтобы помочь своим системам перевода не увязнуть в трясине противоречивых и непоследовательных грамматических правил того или иного естественного языка. Главный вывод, который можно сделать из этой победы: даже самые лучшие программисты не способны создать что-нибудь сравнимое с тем объемом знаний, который заключен в наборе данных большого размера. По качеству система Google пока еще не может конкурировать с квалифицированными переводчиками-людьми, но главное ее преимущество – она способна работать более чем с пятьюстами языковыми парами, переводя в обе стороны. Это самая настоящая революция в области общения: впервые в человеческой истории практически любой может мгновенно и совершенно бесплатно получить приблизительный перевод почти любого документа на любом языке.

Существует ряд подходов к машинному обучению, но наиболее эффективной и удивительной является методика, связанная с использованием искусственных нейронных сетей – систем, спроектированных в соответствии с теми же фундаментальными принципами, что лежат в основе работы человеческого мозга. Мозг состоит из 100 млрд нейронных клеток и многих триллионов межклеточных связей, но для построения эффективных обучаемых систем достаточно куда более простой системы искусственных нейронов.

Работу отдельного нейрона можно сравнить с выскакивающими пластиковыми фигурками развивающих игрушек, которые так нравятся малышам. Когда ребенок нажимает клавишу, перед ним появляется цветная фигурка – это может быть, например, персонаж мультфильма или животное. Легкое нажатие на клавишу ни к чему не приводит. Даже если нажать чуть сильнее, все равно ничего не произойдет. Но достаточно достигнуть определенного порога усилия – и фигурка тут как тут. Приблизительно так и работает нейрон, за исключением того, что вместо клавиши для его активации требуется определенная комбинация входных параметров.

Чтобы наглядно представить нейронную сеть, вообразите устройство наподобие машины Руба Голдберга[25]25
  Машина Руба Голдберга – хитроумное устройство, выполняющее простейшие операции максимально сложным способом. – Прим. пер.


[Закрыть]
, которое состоит из нескольких таких развивающих игрушек, составленных рядами на полу. Над каждой клавишей, приводящей в действие фигурки, три механических пальца. Правда, вместо того, чтобы просто выпрыгивать, фигурки так расположены, что срабатывание одной из них приводит к опусканию нескольких механических пальцев в последующих рядах игрушек и нажатию связанных с ними клавиш. Ключевым фактором, определяющим способность нейронной сети обучаться, является возможность регулирования усилия, с которым палец нажимает на соответствующую клавишу.

Чтобы обучить нейронную сеть, необходимо загрузить имеющиеся данные в первый ряд нейронов. В качестве примера можно представить ввод изображений написанных от руки писем. При получении входных данных некоторые механические пальцы нажимают на кнопки с различным усилием, уровень которого зависит от их настройки. Это, в свою очередь, приводит к активации некоторых нейронов и срабатыванию клавиш в следующем ряду. Результатом срабатывания последнего ряда нейронов становятся выходные данные, т. е. ответ. В нашем примере в качестве выходных данных будет получен двоичный код, который укажет на букву алфавита, соответствующую полученному на входе изображению. Сначала ответ будет неверным. Но нужно помнить, что у нашей машины есть встроенный механизм сравнения и формирования обратной реакции. Выходные данные сравниваются с правильным ответом, который известен, что автоматически приводит к корректировке усилия у механических пальцев во всех рядах, а это, в свою очередь, изменяет последовательность срабатывания нейронов. По мере ввода в сеть все новых и новых изображений, сопровождающегося непрерывной калибровкой усилия, с которым пальцы нажимают на клавиши, сеть будет все чаще и чаще выдавать верный ответ. Обучение считается оконченным, когда достигается состояние, при котором частота правильных ответов перестает расти.

Если вкратце, то именно так выглядит процесс, благодаря которому нейронные сети приобретают способность распознавать изображения и речь, переводить с одного языка на другой и выполнять множество иных задач. Результатом обучения является программа – по сути, список всех последних настроек механических пальцев, располагающихся над клавишами активации нейронов, – которая затем может быть использована для конфигурирования новых нейронных сетей. Иными словами, после загрузки программы эти сети смогут автоматически формировать ответы на основе новых данных без повторения обучения.

Впервые идея искусственной нейронной сети возникла в конце 1940-х гг., когда был проведен ряд экспериментов. В течение долго времени они использовались для выявления закономерностей. Однако в последние годы был совершен ряд революционных открытий, которые привели к значительному увеличению производительности, особенно при использовании многоярусных нейронных сетей, построенных по технологии, которая получила название «углубленное обучение» (deep learning). Системы углубленного обучения уже применяются при распознавании речи в голосовом помощнике Siri компании Apple; ожидается, что их внедрение будет способствовать ускорению темпов развития во многих прикладных областях, предполагающих выявление и анализ закономерностей. Например, в 2011 г. ученые из Университета Лугано в Швейцарии спроектировали нейронную сеть со способностью к углубленному обучению, которая смогла правильно идентифицировать свыше 99 % изображений из обширной базы данных о дорожных знаках – с таким уровнем точности не смог сравниться никто из соревновавшихся с системой людей. Исследователи из Facebook также разработали экспериментальную систему, состоящую из девяти уровней искусственных нейронов, которая может определить, что на двух фотографиях изображен один и тот же человек, в 97,25 % случаев, несмотря на условия освещения и ориентацию лица. Для сравнения: участвовавшие в эксперименте люди давали правильный ответ в 97,53 % случаев{125}125
  Tom Simonite, «Facebook Creates Software That Matches Faces Almost as Well as You Do», MIT Technology Review, March 17, 2014, http://www.technologyreview.com/news/525586/facebook-creates-software-that-matches-faces-almost-as-well-as-you-do/.


[Закрыть]
.

Один из ведущих экспертов в этой области Джеффри Хинтон из Университета Торонто отмечает, что технология углубленного обучения «отлично поддается масштабированию. Просто сделайте ее больше и быстрее, и она будет лучше работать»{126}126
  Цит. по: John Markoff, «Scientists See Promise in Deep-Learning Programs», New York Times, November 23, 2012, http://www.nytimes.com/2012/11/24/science/scientists-see-advances-in-deep-learning-a-part-of-artificial-intelligence.html.


[Закрыть]
. Другими словами, даже если оставить в стороне совершенствование принципов работы таких сетей, можно с уверенность утверждать, что системы машинного обучения на основе сетей со способностью к углубленному обучению ждет этап стремительного роста – этот простой вывод следует из закона Мура.

По мере того как работодатели – и в особенности большие корпорации – все больше и больше усиливают контроль над режимом работы и социальными связями своих сотрудников, постоянно расширяя круг отслеживаемых показателей и параметров, большие данные и используемые для их обработки сложные алгоритмы начинают напрямую влиять на условия работы и карьерный рост сотрудников. Так называемая «аналитика трудовых ресурсов» (people analytics) играет все большую роль при принятии компаниями решений о найме, увольнении, оценке результативности и повышении сотрудников. Объем собираемых данных о конкретных людях и о выполняемой ими работе поражает воображение. Некоторые компании контролируют каждое нажатие клавиши каждым сотрудником. Сообщения электронной почты, расшифровки телефонных разговоров, поисковые запросы, обращение к базам данным, доступ к файлам, нахождение на территории работодателя – все эти, а также другие данные самых разных видов, точное количество которых даже трудно определить, подлежат сбору и анализу (в одних случаях с согласия самих сотрудников, а в других – без их ведома){127}127
  Don Peck, «They're Watching You at Work», The Atlantic, December 2013, http://www.theatlantic.com/magazine/archive/2013/12/theyre-watching-you-at-work/354681/.


[Закрыть]
. Разумеется, изначально целью сбора и анализа всех этих данных являются повышение эффективности управления и оценка результатов работы сотрудников. Но в определенный момент эти данные могут быть использованы совсем для других целей: например, для разработки ПО, автоматизирующего большую часть выполняемой работы.

Если говорить о последствиях революции в области больших данных для будущего профессий, связанных с умственным трудом, вероятно, стоит выделить два самых главных. Во-первых, во многих случаях собранных данных может оказаться достаточно для автоматизации конкретных задач и даже целых видов профессиональной деятельности. Подобно тому, как человек может научиться новой профессии, изучив опыт предшественников и опробовав его на практике при решении конкретных задач, современные сложные алгоритмы, по сути, способны проделать то же самое и полностью заменить человека. Чтобы убедиться в этом, достаточно вспомнить, что в ноябре 2013 г. компания Google подала заявку на регистрацию патента, описывающего систему, предназначенную для автоматического создания персонализированных сообщений электронной почты и ответов в социальных сетях{128}128
  Патент США № 8,589,407, «Automated Generation of Suggestions for Personalized Reactions in a Social Network», November 19, 2013, http://patft.uspto.gov/netacgi/nph-Parser?Sect=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&f=G&l=50&d=PALL&S1=08589407&OS=PN/08589407&RS=PN/08589407.


[Закрыть]
. Принцип работы системы таков: сначала она анализирует существующие письма и посты в социальных сетях определенного человека. Основываясь на полученных знаниях, она затем автоматически пишет ответы на новые сообщения электронной почты, сообщения в Twitter и посты в блоге, используя при этом характерные для данного человека индивидуальный стиль и манеру письма. Легко представить, как такая система может быть использована в будущем для автоматизации существенной части повседневного общения.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9
  • 4.8 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации