Электронная библиотека » Пол Доэрти » » онлайн чтение - страница 3


  • Текст добавлен: 5 февраля 2024, 08:20


Автор книги: Пол Доэрти


Жанр: Зарубежная деловая литература, Бизнес-Книги


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 3 (всего у книги 17 страниц) [доступный отрывок для чтения: 6 страниц]

Шрифт:
- 100% +

Однако имеются предпосылки к тому, что объединение символьных подходов с нейросетями даст результаты, более похожие на выводы человеческого разума. Цель таких систем – выдать правильный ответ и его обоснование.

Например, часто разочаровывают пользователей чат-боты и голосовые помощники. Эти приложения действительно легко поставить в тупик, но даже когда они приходят к верному ответу, то не могут дать ему разумного обоснования. Компания Salesforce, специализирующаяся на облачных сервисах и каузальном маркетинге, стремится изменить ситуацию с помощью своего голосового ассистента Einstein.

Разработки компании направлены на создание нейросетей, способных не только давать правильные ответы, но и правдоподобно объяснять логику таких действий. Голосовые помощники для предприятий вообще редкость, поэтому Einstein дает компании большое преимущество в сфере обслуживания и привлечения клиентов.

Помимо этого, результаты в сфере сближения ИИ и здравого смысла, очевидно, пригодятся там, где решающее значение имеет способность объяснять: в здравоохранении, финансовом секторе, безопасности и государственном управлении. Логика здравого смысла также способна помочь преодолеть некоторые ограничения систем визуального распознавания. Например, донести до искусственного интеллекта общеизвестный факт: наезд на дорожный конус существенно менее страшен, чем наезд на пешехода.

«Здравый смысл – важнейший компонент для создания искусственного интеллекта, способного понимать прочитанное, управлять роботами, эффективно и безопасно работающими среди людей, а также разумно взаимодействовать с людьми, – говорит Гэри Маркус, ведущий эксперт по искусственному интеллекту и основатель Robust.AI. – Здравый смысл – это не только самая сложная проблема для искусственного интеллекта; в долгосрочной перспективе она же является и самой важной»[38]38
  Gary Marcus, “AI’s Hardest Problem? Developing Common Sense,” LinkedIn, October 4, 2019, https://www.linkedin.com/pulse/ais-hardest-problem-developing-common-sense-gary-marcus/.


[Закрыть]
.

Отслеживание эмоций

Только в 2018 году так называемое рассеянное, или отвлеченное, вождение унесло в Соединенных Штатах жизни 2841 человека, в том числе 1730 водителей, 605 пассажиров, 400 пешеходов и 77 велосипедистов[39]39
  “Distracted Driving,” National Highway Traffic Safety Administration, n. d., https://www.nhtsa.gov/risky-driving/distracted-driving.


[Закрыть]
. Отвлечением считаются любые действия, отрывающие внимание водителя от дороги: переписка, разговор по телефону, еда и питье, общение с пассажирами, настройка звуковой или навигационной системы.

Особенно опасно за рулем писать сообщения. Но и отвлечься от дороги на 5 секунд на скорости около 90 км/ч, чтобы прочитать чье-то послание, все равно что проехать с закрытыми глазами футбольное поле[40]40
  “Drowsy Driving: Asleep at the Wheel”, Centers for Disease Control and Prevention, November 7, 2019, https://www.cdc.gov/features/dsdrowsydriving/index.html.


[Закрыть]
. Однако еще опаснее заснуть за рулем: по вине задремавших водителей каждый год происходит до 6000 ДТП со смертельным исходом.

Другая причина аварий – опасное вождение. Около 94 % всех дорожно-транспортных происшествий происходит из-за ошибки водителя, и до трети из них связаны с поведением, характеризующимся как опасное вождение[41]41
  “Road Rage Statistics Filled with Surprising Facts”, https://drivingschool.net/road-rage-statistics-filled-surprising-facts/.


[Закрыть]
.

Эти цифры могут резко снизиться, если система искусственного интеллекта, способная распознавать эмоции водителя, станет для автомобилей обыденной, как ремни безопасности. В настоящее время над такой системой работает Affectiva, основанный в 2009 году исследователями из Media Lab Массачусетского технологического института бостонский стартап (в середине 2021 года его приобрела шведская компания Smart Eye).

Алгоритмы Affectiva сканируют лица людей, чтобы определить их эмоциональное состояние и временные когнитивные нарушения. Система призвана помочь водителям сохранять спокойствие, быть внимательными и бодрыми, поэтому она автоматически вмешивается в процесс вождения, вынося предупреждения или предлагая действия. Но это чрезвычайно сложная задача.

Когнитивные нарушения наподобие сонливости развиваются постепенно; отображение эмоций на лице может различаться из-за возраста, пола, этнической принадлежности и культурных норм.

Компания разработала систему отслеживания эмоций, которая позволяет медиа и рекламодателям понимать, как на их контент реагирует целевая аудитория. Система основана на анализе более чем 7,6 миллиона лиц в 87 странах мира. Примерно четверть компаний из списка Fortune Global 500 использовали эту технологию для тестирования своей рекламы по всему миру, и это помогло им спрогнозировать намерение совершить покупку, рост продаж или вероятность того, что контент станет вирусным[42]42
  Elizabeth Bramson-Boudreaum, “When Our Devices Can Read Our Emotions: Affectiva’s Gabi Zijderveld”, MIT Technology Review, Feb 28, 2019, https://www.technologyreview.com/2019/02/28/136839/when-our-devices-can-read-our-emotions-Affectivas-gabi-zijderveld/.


[Закрыть]
.

Эмоциональные вычисления, или, как говорят, эмоциональный ИИ, были использованы в работе с детьми-аутистами, чтобы помочь им понимать и выражать свои эмоции. По словам Габи Зийдервельд, ранее работавшей в компании Affectiva, а теперь – в Smart Eye, создатели системы руководствовались «идеей о том, что технология может распознавать человеческие эмоции и реагировать на них, чтобы, по сути, улучшить взаимодействие человека с технологией, сделать его более уместным, более подходящим, а также, возможно, помочь человеку лучше понимать эмоции или лучше их контролировать»[43]43
  Bramson-Boudreaum, “When Our Devices Can Read Our Emotions”.


[Закрыть]
.

Рана эль Калиуби, основательница компании Affectiva, а ныне заместитель генерального директора в Smart Eye, не понаслышке знает о переполняющих эмоциях. Она родилась на Ближнем Востоке, а в 1990 году, когда она была еще ребенком, Ирак вторгся в Кувейт. «В одночасье наш мир изменился, – пишет она. – Мои родители потеряли работу, дом, сбережения. На меня обрушился такой поток эмоций, какого я никогда больше в жизни не испытывала»[44]44
  Rana el Kaliouby, “Emotionally Aware Technology Could Help Us Beat Zoom Fatigue,” Fast Company, June 15, 2020, https://www.fastcompany.com/90515714/emotionally-aware-technology-could-help-us-beat-zoom-fatigue.


[Закрыть]
.

Глубокие потрясения, вызванные COVID-19, заставили эль Калиуби задуматься, что и тут может пригодиться работающий с эмоциями цифровой мир. Массовый переход на онлайн-обучение, виртуальные встречи и телемедицина, а также изоляция, вызванная социальным дистанцированием, всех лишили таких естественных и обыденных элементов общения.

Сотрудники жаловались на «Zoom-усталость». Профессора и спикеры не имели возможности узнать, как на самом деле реагирует аудитория на их слова. Врачи и психологи, принимавшие пациентов виртуально, испытывали трудности с оценкой их настроения и общего самочувствия. Программное обеспечение для отслеживания эмоций способно восстановить хотя бы часть связей между людьми, нарушаемых при онлайн-общении, и помочь контролировать и укреплять психическое здоровье.

Рана эль Калиуби пишет: «Наша зависимость от технологий для связи с миром будет только усиливаться. Дополнение технологий искусственным эмоциональным интеллектом может стать единственным способом сохранить то, что изначально делает нас людьми: эмпатию, эмоции и содержательное общение»[45]45
  El Kaliouby, “Emotionally Aware Technology Could Help Us Beat Zoom Fatigue.”


[Закрыть]
.

Машины постигают теорию разума

Ребенок, возвращающий случайно упавший карандаш и игнорирующий специально брошенный, обладает моделью психического состояния. Дети понимают, что у других людей есть эмоции, намерения, желания и знания, и используют это, чтобы анализировать чужое поведение и реагировать на него. Модель психического состояния принципиально важна для бесчисленных повседневных взаимодействий, которые мы считаем само собой разумеющимися.

Но она имеет значение и для роботов, взаимодействующих с другими роботами или людьми. Например, созданный для заботы об одиноких людях робот должен уметь понимать эмоции и желания человека, вполне возможно ограниченного в возможности их выразить.

Попытки наделить роботов теорией разума идут по нескольким направлениям, и в каждом случае приходится преодолевать барьеры, связанные с глубоким обучением. Подход глубокого обучения «снизу вверх» основан на всеобъемлющем эмпиризме (богатом опыте), необходимом для распознавания объектов.

Например, построенная на глубоком обучении система визуального распознавания пропускает изображение объекта через огромное количество обучающих данных нейросети. Поиск все более сложных паттернов продолжается до тех пор, пока система уверенно не определит, что же перед ней находится.

Как мы уже отмечали, недостатками этого подхода являются его зверский аппетит, требующий колоссальных массивов данных, и невозможность объяснить сделанные выводы.

Исследователи из DeepMind компании Google пытаются преодолеть эти ограничения, используя нейросети с так называемой машинной моделью психического состояния[46]46
  Neil C. Rabinowitz, Frank Perbet, H. Francis Song, Chiyuan Zhang, S. M. Ali Eslami, and Matthew Botvinick, “Machine Theory of Mind”, arXiv, March 12, 2018, https://arxiv.org/abs/1802.07740.


[Закрыть]
. Их нейросеть ToMnet («Теория разума») строит на основе метаобучения и простого наблюдения модели внешних агентов. При относительно небольшом количестве наблюдений ToMnet получает тем не менее сильную предварительную модель поведения агентов и способность к начальной загрузке для более точного прогнозирования их характеристик и ментальных состояний. Как и другие системы глубокого обучения, ToMnet совершенствуется с опытом.

Сущности искусственного интеллекта DeepMind – простые агенты в виртуальной комнате – собирали цветные коробки и получали за это очки, а ToMnet «наблюдал»[47]47
  Matthew Hutson, “Artificial Intelligence Has Learned to Probe the Minds of Other Computers”, Science, July 27, 2018, https://www.sciencemag.org/news/2018/07/computer-programs-can-learn-what-other-programs-are-thinking.


[Закрыть]
. Одни из агентов были слепыми, другие забывали свои последние шаги, а третьи могли и видеть, и помнить.

Слепые агенты, как правило, следовали вдоль стен; агенты с пораженной памятью искали ближайшие объекты; а те, которые могли и видеть, и помнить, разработали стратегию и собирали коробки в определенном порядке, чтобы заработать больше очков. После обучения ToMnet смог быстро определять агентов каждого типа и правильно предугадывать их поведение.

Подобные эксперименты завязаны на жестко заданный контекст и ограничены взаимодействием с очень простыми агентами. Зачаточные способности ToMnet очень далеки от человеческого умения постигать происходящее в чужой голове. Но направление подобной работы, даже если в ней задействованы нейросети, соответствует повороту в сторону подходов «сверху вниз», требующих меньшего количества данных.

Еще один подход «сверху вниз» предполагает, что разум создает модели мира, позволяющие проверить даже очень разреженные данные. Искусственный интеллект не обучается моделировать, а использует симуляторы, помогающие проверять гипотезы и предугадывать действия двигающихся поблизости агентов.

Исследователи из Университета Западной Англии изучили возможности мобильного робота с учетом его собственной модели, других двигающихся агентов и окружающей среды[48]48
  Christian Blum, Alan F. T. Winfield, and Verena V. Hafner, “Simulation-Based Internal Models for Safer Robots”, Computational Intelligence in Robotics, January 11, 2018, https://www.frontiersin.org/articles/10.3389/frobt.2017.00074/full.


[Закрыть]
. Внутренняя модель, основанная на симуляции и работающая в режиме реального времени, оказалась способна прогнозировать последствия своих действий и действий других агентов, находящихся поблизости.

Например, при движении по узкому коридору навстречу другому роботу искусственный интеллект может определить, какое действие позволит избежать столкновения, и смоделировать поворот налево или направо либо продолжить двигаться вперед[49]49
  Shelly Fan, “Thinking Like a Human: What It Means to Give Al a Theory of Mind”, SingularityHub, September 19, 2018, https://singularityhub.com/2018/09/19/thinking-like-a-human-what-it-means-to-give-ai-a-theory-of-mind/.


[Закрыть]
. Роботы, конечно, преуспели в таких маневрах и без моделирования, но здесь мы хотим доказать, что подобные симуляции открывают путь к искусственной модели психического состояния.

Разумное отношение к интеллекту

Подобно отражающимся в боковом зеркале автомобиля объектам, более естественные когнитивные и эмоциональные способности искусственного интеллекта могут находиться ближе, чем кажется. Как мы уже видели, они разрабатываются и совершенствуются в научно-исследовательских институтах (наподобие AI2), а также стартапах вроде Covariant и Affectiva / Smart Eye и глобальных корпорациях (Zappos, Salesforce, Google и многих других). Эта технология уже здесь, она с каждым днем набирает обороты и помогает заложить основу для будущей конкуренции.

Доверие – ключ ко всему, и более похожий на человеческий искусственный интеллект позволит завоевать лояльных клиентов, увеличивая разрыв между лидерами и аутсайдерами.

Кроме того, радикально человеческий машинный интеллект перенесет нас из прошлого, где клиенты и сотрудники с трудом учились использовать навязанные им технологии и приспосабливались к новым методам, в будущее, где люди охотно принимают новшества, поскольку теперь уже технологии адаптируются к человеку.

По мере приближения этого будущего компаниям придется сокращать использование старых дорогостоящих и громоздких подходов к машинному интеллекту и сосредоточиваться на методах, более ориентированных на человека.

Точной формулы этой трансформации нет, но руководители уже сейчас могут предпринять некоторые шаги, чтобы подготовить к ней всю компанию с ее широкой экосистемой – от руководства и до технических специалистов (и даже далее). Процесс должен начинаться сверху – с генерального директора, с топ-менеджеров компании. Им следует удостовериться: у них есть команды, которые изучают искусственный интеллект и экспериментируют с новыми подходами к нему в бизнес-контексте.

Эти команды должны сосредоточиться на алгоритмах, которые наиболее точно имитируют когнитивные способности человека, дают объяснимые результаты и предлагают максимально доступные и инновационные решения бизнес-задач.

Компании в целом следует стремиться к распространению того, что мы называем цифровой беглостью. Мы подробно рассмотрим это явление в главе 6, посвященной талантам. Вкратце идея заключается в том, чтобы перейти от цифровой грамотности – простого знакомства с терминами искусственного интеллекта – к погружению в язык, методы и применение интеллектуальных технологий.

Сотрудники, владеющие цифровыми технологиями, особенно если вплотную занимаются клиентами или внутренними проблемами компании, способны именно в нужный момент находить отличные решения.

За пределами офиса вам необходимо стать частью более широкого мира технологических партнеров, исследователей и представителей отрасли. Они способны помочь быстрее собрать воедино элементы новых подходов к интеллекту, наиболее актуальные для вашего бизнеса. Это принципиально важный шаг к скоординированному стратегическому сотрудничеству в экосистеме: оно все больше характеризует конкуренцию в мире, где никто не обладает монополией на огромное количество технологических прорывов, происходящих практически ежедневно.

Решительный переход к человеческому интеллекту, влекущий за собой глубокие последствия для процессов, продуктов и услуг вашей компании, отчасти будет обеспечен поворотом к требующему меньшего количества данных искусственному интеллекту, дополняющему устоявшиеся подходы к большим данным и способному выровнять игровое поле для всех конкурентов. К этому мы обратимся в следующей главе.

Глава 2. Данные
От максимума к минимуму и обратно

Фраза «рычаг для бизнеса» – неважно, понимаются под ним капитал, талант, исследования, технологии или рабочие процессы – используется так часто, что утратила всю свою выразительность. «Рычаг» теперь не более чем «усилитель эффективности». Но стоит вдуматься в буквальный смысл этой метафоры: подразумевается, что небольшое количество ресурсов приносит большую прибыль.

Эта динамика нигде не проявляется так ярко, как при использовании данных в искусственном интеллекте, когда они перемещаются от периферии – локального устройства – к облачному хранилищу, а иногда и обратно (к устройству).

Конечно, требующий большого количества данных искусственный интеллект в какой-то степени непременно продвинет компанию. Каким бы он ни был прожорливым и дорогим, он все равно способен принести больше прибыли, чем альтернативные варианты (например, ручная обработка).

Но последние достижения в области малых данных позволяют использовать искусственный интеллект непосредственно в их источнике и обрабатывать локально: на смартфонах, датчиках, машинах с автопилотом, дронах и – потенциально – на любых других устройствах с достаточно надежными микрочипами, генерирующими потоки данных.

Из этих малых данных складывается нечто большое: по оценкам IDC, к 2025 году подобные устройства, подключенные к интернету вещей (IoT), будут генерировать 73 зеттабайта (триллиона гигабайт, 1021 байтов) данных, что в четыре раза больше, чем в 2019 году[50]50
  “IoT Growth Demands Rethink of Long-Term Storage Strategies, Says IDC”, IDC, July 27, 2020, https://www.idc.com/getdoc.jsp?containerId=prAP46737220.


[Закрыть]
.

Использование малых данных, полученных на периферии, для анализа больших данных позволит извлечь больше пользы из искусственного интеллекта, которому потребуется гораздо меньше ресурсов: времени на обучение, вычислительных мощностей, инфраструктуры, сотрудников и инвестиций. Такой «накачанный данными» искусственный интеллект, в свою очередь, прокачивает всю компанию, переводя ее на новый уровень.

Мастерство сочетать искусственный интеллект, малые и большие данные обеспечит конкурентные преимущества многим компаниям. Особенно тем, которые ввязались в информационную гонку вооружений и вряд ли иначе смогут победить.

Проблема максимального объема данных

Компания Starsky Robotics казалась одной из восходящих звезд в области автономных транспортных средств. Запатентованная компанией система искусственного интеллекта вела большие грузовики по широким магистралям и небольшим проселочным дорогам, позволяя человеку-водителю в удаленном операционном центре иногда брать управление.

В Starsky не возводили воздушных замков и не мечтали однажды обрушить отрасль. Компания владела активами, нанимала бывших дальнобойщиков в качестве удаленных операторов и реализовывала бизнес-модель, которая, казалось, опережала таких амбициозных конкурентов, как Waymo и Uber.

У Starsky были и другие достижения, и каждое из них впечатляло сильнее предыдущего.

Так, в 2016 году самоуправляемый грузовик Starsky стал первым автомобилем, официально допущенным к эксплуатации без человека за рулем. В 2018 году он проехал более 10 километров по закрытой дороге во Флориде – первый в истории пробег полностью беспилотного грузовика.

В 2019 году он стал первым беспилотным грузовиком, проехавшим по дороге общего пользования: он миновал остановку для отдыха, выехал на магистраль Florida Turnpike и преодолел 15 километров со средней скоростью 90 км/ч. Только первый и последний отрезки пути – всего около трех сотен метров – грузовик прошел под контролем оператора, находившегося за 320 километров, в Джексонвилле.

В 2020 году Starsky закрылась.

Что пошло не так? Основатель компании Стефан Зельц-Аксмахер в горьком прощальном сообщении в своем блоге подробно описал многочисленные проблемы, от которых страдает индустрия автономных транспортных средств.

Самая большая из них: контролируемое машинное обучение не оправдывает надежд, особенно при работе с нестандартными ситуациями, также известными как крайние случаи (не путать с передовым ИИ Edge AI!). «Широко известно, что самое сложное при работе с ИИ – научить его справляться с ситуациями, которые происходят редко, – писал основатель Starsky. – На самом деле чем лучше ваша модель, тем сложнее найти надежные наборы данных для новых крайних случаев. Кроме того, чем лучше ваша модель, тем более точные данные вам понадобятся для ее усовершенствования. Вместо того чтобы в соответствии с законом Мура наблюдать экспоненциальное улучшение качества работы искусственного интеллекта, мы наблюдаем экспоненциальное увеличение стоимости совершенствования ИИ-систем»[51]51
  Stefan Seltz-Axmacher, “The End of Starsky Robotics”, Medium, March 19, 2020, https://medium.com/Starsky-robotics-blog/the-end-of-Starsky-robotics-acb8a6a8a5f5.


[Закрыть]
.

Это была классическая история убывающей отдачи: количество обучающих примеров растет по экспоненте, а точность увеличивается только линейно.

В отличие от младенцев, способных обучиться на единичном примере и экстраполировать полученный опыт, искусственный интеллект в основном работает на алгоритмах, которым для обучения требуются горы данных. Беспилотные автомобили вроде грузовиков Starsky обучаются на максимально возможном количестве дорожных ситуаций. (Люди-водители, чтобы получить права, обычно проходят 20–30 часов теории и накатывают около 10 часов за рулем[52]52
  По российским стандартам положено 130 часов теории и 56 часов практики. Прим. ред.


[Закрыть]
, и все же они способны мгновенно реагировать на нестандартные ситуации.) Первая компьютерная программа, обыгравшая профессионального игрока в древнюю настольную игру го, была обучена на 30 миллионах партий[53]53
  Gary Marcus and Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust (New York: Pantheon Books, 2019), 56.


[Закрыть]
.

Модели искусственного интеллекта для диагностики заболеваний работают, потому что им скормили данные миллионов пациентов, из которых можно узнать, как часто людям с таким же набором симптомов ставили тот или иной диагноз.

Подходы к искусственному интеллекту, требующие огромных объемов данных для обучения и поддержания работы и основанные на глубоком обучении и обучении с учителем, в настоящее время сталкиваются с некоторыми серьезными ограничениями. Рассмотрим основные.


Нет датасетов для искусственного интеллекта

Есть большие данные, а есть датасеты, и важно различать эти понятия. Термин «большие данные» (big data) относится к методам статистического анализа, которые применяют к огромным объемам данных для извлечения закономерностей. Датасет (big datasets, или просто datasets) – это данные, организованные в определенную структуру (например, перечень имен и контактов).

Большие датасеты – коллекции наподобие ImageNet с его более чем 14 миллионами размеченных вручную изображений – позволяют машине самообучаться. Но для большинства стоящих перед искусственным интеллектом задач не существует датасетов, по объему подобных ImageNet. Это означает: прежде чем всего лишь рассмотреть возможность применения данных, их нужно кропотливо собрать и разметить, а это трудоемкий и дорогостоящий процесс.

С течением времени вдобавок меняются направления работы конкретных приложений искусственного интеллекта, и обучающие датасеты могут постепенно терять актуальность.

Точно так же для большинства бизнес-задач или бизнес-возможностей нет датасетов, «очищенных» и готовых для использования системами искусственного интеллекта. Фактически самым большим препятствием для комплексных ИИ-решений остаются зашумленные, разреженные или неполные данные, большая часть которых не структурирована или структурирована недостаточно.

Этот фейерверк беспорядочных данных генерируют файлы журналов (лог-файлы), сведения из кол-центров, видеозаписи, посты в социальных сетях, транзакции и всевозможные информационные устройства. Например, Walmart собирает 2,5 петабайта (2,5 миллиона гигабайт, 1015 байт) неструктурированных данных от 1 миллиона клиентов каждый час. Это в 167 раз больше, чем содержится во всех книгах Библиотеки конгресса США[54]54
  “How Big data Analysis Helped Increase Walmart’s Sales Turnover?” ProjectPro, July 4, 2021, https://www.dezyre.com/article/how-big-data-alysis-helped-increase-Walmarts-sales-turnover/109.


[Закрыть]
.

К 2025 году каждый человек будет создавать примерно 3,4 эксабайта (1 миллиард гигабайт, 1018 байт) данных в день, в основном за счет использования социальных сетей, общения, а также просмотра и пересылки видео[55]55
  Jacquelyn Bulao, “How Much Data Is Created Every Day in 2021?” Techjury, May 18, 2021, https://techjury.net/blog/how-much-data-is-created-every-day/#gref.


[Закрыть]
.

Ситуация со всеми этими неструктурированными данными усложняется тем, что, кроме них, есть еще горы структурированных данных, которые часто хранятся в устаревших корпоративных хранилищах, закрытых и потому отчасти дублирующих информацию.

Все это ограничивает обмен данными и внедрение инноваций.


Нехватка инфраструктуры

Глубокое обучение попало в замкнутый круг. Чем больше данных в распоряжении искусственного интеллекта, тем лучше он может выполнять свои задачи, какими бы они ни были, – от управления транспортными средствами до диагностики заболеваний и классификации объектов на изображениях. Это требует все более крупных нейросетей с миллиардами параметров, аппаратного обеспечения и сложной вычислительной инфраструктуры.

По словам бывшего руководителя подразделения AI Products Group компании Intel, «стремительный рост размеров нейросетей опережает способность “железа” идти в ногу со временем»[56]56
  Alex Woodie, “Deep Learning Has Hit a Wall, Intel’s Rao Says”, Datanami, November 13, 2019, https://www.datanami.com/2019/11/13/deep-learning-has-hit-a-wall-Intels-rao-says/.


[Закрыть]
.

При этом объем данных из поисковых систем, социальных сетей, систем планирования ресурсов предприятия и бесчисленных других источников продолжает расти экспоненциально. Facebook[57]57
  Здесь и далее: название социальной сети, принадлежащей Meta Platforms Inc., признанной экстремистской организацией на территории РФ.


[Закрыть]
обучала распознавать изображения на наборах публичных изображений, самый большой из которых насчитывал 3,5 миллиарда изображений и 17 000 хештегов[58]58
  Dhruv Mahajan, Ross Girshick, Vignesh Ramanathan, Manohar Paluri, and Laurens Van Der Maaten, “Advancing State-of-the-Art Image Recognition with Deep Learning on Hashtags”, Facebook*, May 2, 2018, https://ai.facebook.com/blog/advancing-state-of-the-art-image-recognition-with-deep-learning-on-hashtags/.


[Закрыть]
.

Огромные и очень быстро растущие массивы данных требуют все более масштабных моделей искусственного интеллекта, которым, в свою очередь, нужна все большая вычислительная мощность. С 2013 года ее объем, необходимый для подготовки к работе модели глубокого обучения, увеличился в 600 000 раз[59]59
  Roy Schwartz, Jesse Dodge, Noah A. Smith, and Oren Etzioni, “Green AI”, arXiv, August 13, 2019, https://arxiv.org/abs/1907.10597.


[Закрыть]
.


Астрономический рост затрат

Исследователи из Массачусетского университета в Амхерсте проанализировали затраты на обучение и разработку нескольких известных глубоких нейросетей для обработки естественного языка (NLP) как наиболее точных и требовательных к данным[60]60
  Emma Strubell, Ananya Ganesh, and Andrew McCallum, “Energy and Policy Considerations for Deep Learning in NLP”, arXiv, June 5, 2019, https://www.technologyreview.com/s/613630/training-a-single-ai-model-can-emit-as-much-carbon-as-five-cars-in-their-lifetimes/.


[Закрыть]
. Они обнаружили, что обучение одной модели относительно недорого, а вот стоимость полного цикла НИОКР для нового датасета быстро начинает зашкаливать.

Например, затраты только на облачные вычисления для обучения модели Transformer с ее 213 миллионами параметров и функцией поиска нейронной архитектуры могут составить от 1 до 3 миллионов долларов. Это не слишком большая сумма для крупной IT-корпорации, но очень существенная для небольших компаний или групп исследователей.

Необходимость постоянно подстраивать модели приводит к еще большему увеличению затрат.


Нереалистичные требования к ресурсам

Для глубокого обучения нужны ресурсы, недоступные многим организациям. Лишь ограниченное число компаний – Alibaba, Amazon, Apple, Google, Microsoft и еще некоторые из списка Global 1000 – может идти в ногу со временем.

Создававшиеся в цифровом бизнесе компании способны эффективно собирать огромное количество данных для обучения и настройки, так как изначально укомплектованы специалистами по работе с данными, программистами и экспертами и поэтому (подобно прочим крупным организациям) могут позволить себе расходы на масштабные системы глубокого обучения.

Кроме того, по мере роста систем глубокого обучения с ними работает все меньшее число специалистов, нередко находящихся вне научных лабораторий. У профессоров или аспирантов с новой многообещающей идеей для дорогостоящего в вычислительном отношении искусственного интеллекта просто нет возможности ее протестировать.


Проблемы конфиденциальности

Появление больших данных и датамайнинга породило причудливые проблемы безопасности. В век повсеместного машинного обучения системы могут содержать бесчисленные персональные данные и характеристики, что ставит под угрозу конфиденциальность. Пути утечки персональных данных трудно предугадать, а значит предотвратить.

И это не теоретические опасения. Страны и муниципалитеты по всему миру используют достижения в области распознавания лиц и аналитики для создания всепроникающих систем наблюдения, обученных на данных миллиардов граждан. Там же, где искусственный интеллект может быть более полезным, – например, в медицине, – его ограничивают законодательные требования по защите персональных данных.

Государственное регулирование (вроде GDPR – Общего регламента ЕС о защите персональных данных) поднимает особо острые вопросы для зависящих от глубокого обучения систем. Например, GDPR требует, чтобы лица, в отношении которых на основе их персональных данных принимаются автоматизированные решения, могли получить объяснение того, как именно эти решения были приняты. Это требование, скорее всего, вновь поднимет пресловутую проблему черного ящика, связанную с глубоким обучением.

Пандемия COVID-19 вызвала дискуссию о правомерности использования полученных со смартфонов GPS-данных для контроля над перемещениями людей, которые могли подвергнуться воздействию вируса, а также о последствиях, к которым приведет использование приложений для отслеживания социальных контактов. В США конгрессмены продвигают инициативу, которая запрещает делать это без согласия человека[61]61
  “COVID-19 Consumer Data Protection Act of 2020”, Congress.gov, https://www.congress.gov/bill/116th-congress/senate-bill/3663.


[Закрыть]
.

Делать больше с меньшими данными

На каждый датасет с 1 миллиардом записей приходится 1000 датасетов с 1 миллионом записей и 1 миллион датасетов всего с 1000 записей[62]62
  Bradley Arsenault, “Why Small Data Is the Future of AI,” Towards Data Science, August 7, 2018, https://towardsdatascience.com/why-small-data-is-the-future-of-ai-cb7d705b7f0a.


[Закрыть]
. Последние позволяют компаниям на порядки увеличить свои возможности, особенно если дополнить эти малые датасеты собственными или приобретенными данными.

Поскольку 90 % работы с искусственным интеллектом состоит из очистки, нормализации и обработки данных, то использование их небольших объемов позволяет взаимодействующим с ним сотрудникам сосредоточиться на более важных задачах. Объемные же датасеты имеет смысл использовать для стратегически важных целей.

Сейчас некоторые ведущие организации стремятся использовать неструктурированные наборы данных меньшего размера способами, недоступными конкурентам. Если пересмотреть сложившееся представление о полезных данных, то информация об их местонахождении, а также высвобождение и задействование в приложениях, инфраструктуре и подразделениях могут стать фундаментом инноваций.

Так, осенью 2021 года Apple объявила: Siri будет обрабатывать голосовые команды непосредственно на новейших iPhone (а не отправлять их для этого в облако), используя встроенный процессор для искусственного интеллекта Neural Engine, как и Google, который с 2019 года расшифровывает голос без подключения к интернету на своих телефонах Pixel. Подобные приложения все еще приходится обучать в облаке на актуальных данных, однако ожидается, что системы периферийного ИИ будут обучаться самостоятельно[63]63
  Christopher Mims, “How AI Is Taking Over Our Gadgets,” Wall Street Journal, June 26, 2021, https://www.wsj.com/articles/how-ai-is-taking-over-our-gadgets-11624680004?page=1.


[Закрыть]
.

Тем временем компании-первопроходцы вместе с исследователями-первопроходцами находят инновационные способы сбалансировать большие и малые датасеты и сделать их взаимодополняемыми. При этом решаются три разные проблемы: 1) большие и зашумленные данные затрудняют доступ к небольшому набору релевантных высококачественных данных, необходимых для обучения искусственного интеллекта; 2) объем данных для обучения искусственного интеллекта невелик; 3) релевантных данных нет вообще.

Фильтруем шум

Компания Wayfair, занимающаяся онлайн-торговлей, поддерживает обширный каталог из более чем 14 миллионов товаров для дома – от мебели до систем хранения, от освещения до декора и т. д.; некоторые категории включают сотни тысяч наименований. Это дает богатый выбор, но и создает трудности, если покупателю нужен один-единственный вариант. Ситуация осложняется, если вы никогда прежде ничего не покупали на этом сайте: компания еще не знает ваших предпочтений и не может предложить подходящие товары. Однако Wayfair нашла способ упростить поиск для новичков.

Проблема описанной ситуации сложнее, чем кажется. Пытаясь определить наиболее привлекательные товары, специалисты по обработке данных сталкиваются с эффектом положения, создаваемым алгоритмом сортировки. В верхней части первой страницы оказываются товары, которые чаще заказывают, – их внутренняя привлекательность для покупателей не учитывается. В некоторых случаях представленный вверху страницы товар заказывают в два раза чаще, чем показанный ниже с лучшими характеристиками.

Чтобы скорректировать эффект положения, можно рассчитать коэффициент привлекательности товара исходя из разницы между количеством заказов на него и средним показателем для любого продукта, находящегося на определенной позиции. При достаточном количестве данных такого расчета было бы достаточно, но сайт обрабатывает до 9 миллионов заказов в квартал, заказы распределены по миллионам товаров, поэтому на каждый товар приходится всего несколько заказов.

«Расчеты на основе малого числа данных недостаточно надежны, поэтому нам приходится всегда держать в уме, что один продукт может быть оценен выше другого по случайности, – пишут специалисты по обработке данных компании Wayfair. – Например, трудно сказать, действительно ли товар, на который оформили три заказа, лучше того, который заказали два раза, или ему просто повезло»[64]64
  David J. Harris and Tom Croonenborghs, “Bayesian Product Ranking at Wayfair”, Wayfair, January 20, 2020, https://tech.Wayfair.com/data-science/2020/01/bayesian-product-ranking-at-Wayfair/.


[Закрыть]
.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации