Автор книги: Ричард Йонк
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 22 страниц) [доступный отрывок для чтения: 7 страниц]
Глава 5
Начало эмоциональной экономики
Лас-Вегас, Невада – 5 ноября 2029 года
Джейсон откинулся на спинку кресла, глядя поверх карт на соперников. У него два короля и две двойки. Непростая ситуация, но до середины игры еще далеко. Даже с учетом того, что это финал чемпионата мира по эмо-покеру, спонсируемого Budweiser.
Игроки смотрели друг на друга через стол, оценивая соперников. Точнее, использовали специальные программы, чтобы присмотреться друг к другу. К их визорам крепились веб-камеры и пара считывающих контактов, передающих данные непрерывным потоком. Разумеется, потоки шифровались с помощью квантовых алгоритмов, чтобы ни у кого не было возможности подключиться к чужому устройству и перехватить сигнал. Ставки были высоки.
Джейсон сосредоточился на Дмитрии, бесспорно, самом крутом и сильном игроке из всех, кого он когда-либо встречал. Джейсон знал свою роль: оставаться настолько холодным и нечитаемым, насколько это возможно для человека, и пусть эмоционеры делают свою волшебную работу. Его дыхание было медленным и ровным, и данные начали поступать потоком.
Дмитрий был уверен в себе. До крайней степени. Его показатели уверенности в 99,1% были почти нереально высокими. Практически недосягаемыми. Последний раз Джейсон видел подобное в Рио, когда перед ним с небывалой уверенностью выложили флэш-рояль. Тогда он проигрался в хлам. Но что-то было не так, и это что-то было на границе потока данных. Нюанс, которого не должно было быть. Он тщательно проверил данные и наконец заметил. Видеотрансляция выражения лица Дмитрия показывала намек, крошечный намек на удовольствие как после секса.
Разумеется, он маскировался. Как и все остальные. Это был единственный способ добиться такого уровня игры. Но его маскировка была другой. Он хотел отвлечь внимание. Но от чего?
Едва уловимое выражение, почти незаметный блеск в нижней части глаза Дмитрия выдал его. Противником Джейсона был не он. Он был отвлекающим маневром. Блефом. Подсадкой, чтобы сбить Джейсона с толку. Он не играл; он держал свою симпатическую нервную систему под жутким контролем. Настоящим соперником Джейсона был Григор, сидевший справа от него на дальнем конце стола. И Джейсон знал, что Григор не расслаблялся. Намеренной неосторожной улыбкой Джейсон раскрыл блеф Дмитрия. Это был его турнир. И Джейсон собирался выиграть.
* * *
Мы находимся на пороге новой эмоциональной экономики, и, как в партии в покер, ставки в ней высоки.
Хотя это самое начало, наши технологические возможности и рыночный спрос уже достигли того этапа, когда то, что раньше было диковинным, становится практически неизбежным.
Как это будет проявляться? Как и в случае с другими новыми научными разработками, их будут активно продвигать в новых бизнес-проектах, и между ними возникнет конкуренция за возможность первыми появиться на рынке. Но, как было сказано раньше, выход первым на рынок не гарантирует продукту ни долговечности, ни успеха1. Это далеко не первое поколение технологий, и мы чему-то научились за время их развития. Спонсоры будут вкладывать деньги в поисках нескольких победителей, чей продукт будет долговечным. Оценки взлетят, возможно, даже дойдя до смешного, а потом пузырь или лопнет, или сдуется до прежних размеров. В результате наступит период недовольства, а потом несколько отчаянных инвесторов будут осторожно прощупывать почву, и цикл повторится. Так начнется второе поколение эмоционального программирования.
На рынке появится экосистема компаний и заполнит еще незанятые экономические ниши. Упрочив свои позиции на рынке, они поддержат и дадут начало новым компаниям и услугам, существование которых ранее не было возможным.
Прошедшие пятьдесят лет эпохи цифровых технологий предоставили такую возможность. Компьютеры, искусственный интеллект, интернет и технология Web Х.О прошли практически через закономерность взлетов и падений на стадии разработки и инвестирования. Все они дали начало инфраструктуре, необходимой для появления новой эмоциональной экономики. У компаний появляется возможность использовать и распространять давшиеся им с огромным трудом технологии самыми различными способами. Прикладные программные интерфейсы (API) и пакеты средств разработки программного обеспечения (SDK) предоставляют компаниям, отдельным людям и даже конкурентам средства, позволяющие объединить новые технологии с собственными процессами. В то же время программное обеспечение как услуга (SaaS) доступно всем, от владельцев лицензий и подписчиков до поддерживаемых за счет рекламы интернет-сайтов и приложений. Благодаря всему этому (и многому другому) создаются новые функции и предложения, удовлетворяющие потребности рынка. Затем развивается новая инфраструктура и создаются инновации, которые были невозможны, пока не появилась поддерживающая их технология.
Мировой рынок продуктов эмоционального программирования будет стремительно расти с 9,3 миллиарда долларов в 2015 году до 42,5 миллиарда долларов в 2020 году.
Интересно, что подобная конъюнктура рынка создает спрос на еще большее количество продуктов и услуг там, где прежде спроса не было. Эта полоса везения продолжается некоторое время для каждого поколения новой технологии. Насколько масштабным и быстрым будет рост? Согласно отчету об исследовании рынка 2015 года, мировой рынок продуктов эмоционального программирования будет стремительно расти с 9,3 миллиарда долларов в 2015 году до 42,5 миллиарда долларов в 2020 году. Доля США на рынке составит 22,65 миллиарда. Не так уж и скромно для рынка, которого еще десять лет назад просто не существовало.2
Компания AfFectiva, которую Пикард и эль Калиуби основали в апреле 2009 года, стала первой компанией, применившей технологии эмоционального программирования в коммерческих целях. Первоначально они планировали сосредоточиться на создании ряда продуктов, основанных на эмоциональном программировании. В частности, на вспомогательных технологиях для людей, испытывающих трудности с восприятием и переживанием эмоций, страдающих расстройствами аутического спектра. В течение года они подписали соглашение с первым сторонним инвестором – Благотворительным фондом Петера Сагера Валленберга – на сумму в 2 миллиона долларов. Последующие инвестиции принесли им еще 18 миллионов. Отношения и связи, оставшиеся со времени работы в Междисциплинарной исследовательской лаборатории, означали, что AfFectiva стартовала с уже имеющейся клиентской базой. Среди их первых продуктов были AfFdex, технология по оценке и анализу эмоций на основе FaceSense, и Q Sensor, усовершенствованная версия браслета iCalm.
Когда компания начала работу, у них был список из двадцати четырех крупных компаний, в основном входивших в рейтинг Fortune Global 500, которым нужна была их технология. Пикард отмечает: «К сожалению, все они хотели воспользоваться технологией в своих целях. Нельзя начинать работу с двадцатью четырьмя разными продуктами. Одно дело – заставить алгоритмы работать, и совсем другое – создать специальный продукт и интерфейс для совершенно разных людей, когда ты только начинаешь собственный бизнес. Так что потребовалось много времени, чтобы решить, каким именно из двадцати четырех продуктов заняться. Угодить всем просто невозможно».
Для начала Affectiva полностью обновила код приложения FaceSense, которое впоследствии стало коммерческим приложением Affdex. Дело в том, что технология распознавания образов и другие области искусственного интеллекта слишком изменились с момента создания. Например, искусственные нейронные сети (ИНС) с 1990-х годов были не в чести. Однако в 2006 году вышли две важные статьи Джеффри Хинтона и Руслана Салахутдинова. Авторы предложили ряд серьезных улучшений, после чего ИНС стала одной из передовых технологий в исследовании искусственного интеллекта3. Исследователи представили новые методы создания и обучения многоуровневых нейронных сетей, которые со временем изменят облик многих отраслей промышленности. Новые методы, от распознавания голоса и перевода до поиска изображений и обнаружения мошенничества, стали использоваться практически повсеместно.
Нейросети – моделируемые по образцу человеческого мозга4 – строятся как соединения программных и аппаратных узлов (представляющих синапсы и нейроны) по слоям, которые постепенно улучшают решение для входной информации, например изображения. Некоторые слои скрыты, это значит, что они принимают входную информацию и производят расчеты, а решение передают на следующий слой, где процесс повторяется. В случае распознавания изображений это означает, что каждый последующий слой нейросети считывает признаки более высокого уровня. Наконец результат передается на выходной слой. Слои называются скрытыми, поскольку точно не известно, как происходят вычисления, ведь нейросети постепенно умнеют, используя методы машинного обучения с учителем и без. Определение оптимального количества нейронов, слоев, информации на входе и методов обучения составляет часть проблемы отладки сетей.
В общем, при большем количестве скрытых слоев сеть способна функционировать с большей точностью. (Хотя есть момент, при достижении которого точность начинает падать.) Дилемма стремления к большей точности состоит в том, что чем больше используется нейронов и слоев, тем больше требуется времени для вычислений. К счастью, практически в то же время, когда вышли статьи 2006 года, стали более доступными и дешевыми графические процессоры. С ними удалось на порядок ускорить обучение нейросетей, поскольку сжатие изображений, на которое раньше уходили недели, теперь можно было выполнить за несколько дней или даже часов. Различные подходы улучшили техники глубинного обучения, в том числе ограниченную машину Больцмана и рекуррентную нейронную сеть. Улучшенные алгоритмы глубинного обучения использовались во многих разновидностях распознавания образов. Прогресс в скорости расчетов привел к значительным успехам искусственного интеллекта в течение последнего десятилетия. Например, технология DeepFace, используемая в социальной сети Facebook, способна распознавать человеческие лица с точностью до 97 %. В 2012 году команда ученых Торонтского университета по исследованию искусственного интеллекта, в которую входили Хинтон и двое его студентов, победила в соревновании между исследовательскими группами по широкомасштабному распознаванию образов в базе данных. Их нейросеть на основе глубинного обучения не оставила соперникам ни одного шанса на победу5. Совсем недавно компания Google DeepMind использовала техники глубинного обучения для разработки ИИ, играющего в го, под названием AlphaGo. Программа AlphaGo обучалась самостоятельно при помощи базы данных, в которую были занесены тридцать миллионов записанных ходов из игр уровня эксперта. В марте 2016 года AlphaGo выиграл у гроссмейстера по го мирового уровня Ли Седоля четыре партии из пяти. Игра в го считается более сложной для искусственного интеллекта, чем игра в шахматы. Разработчики ИИ не ожидали игры на таком уровне еще по крайней мере в течение десятилетия.
Метод обучения не менее важен, чем используемые алгоритмы. Вот почему компании Affectiva пришлось изменить код приложения FaceSense. Ведь в обучении первоначального приложения участвовало относительно мало исследователей. Как только была завершена новая система, Affectiva запустила пилотный проект, в котором рекламный ролик Супербоула[1]1
Супербоул – в американском футболе название финальной игры за звание чемпиона Национальной футбольной лиги Соединенных Штатов Америки. – Прим. перев.
[Закрыть] транслировали зрителям, давшим согласие на участие в проекте, а выражение их лиц при просмотре анализировалось через веб-камеру. Таким образом команда эль Калиуби получила результаты, необходимые для переобучения системы, на этот раз – на примерах подлинных реакций реальных людей. Дополнительное изучение рекламы и другого медиаконтента с участием зрителей позволило собрать дополнительные данные о выражениях лиц реальных людей. Это было крайне важно. Система училась распознавать трудноуловимые нюансы выражений лиц. Оттенки были настолько незаметными, что даже хороший актер не смог бы изобразить выражение лица человека, по-настоящему переживающего ту или иную эмоцию. Чем больше было образцов эмоциональных реакций на рекламные ролики, тем умнее становилась система. Вот как объяснила это эль Калиуби в своем основном докладе.
Мы фиксируем эмоции, глядя на лицо. Лицо – один из самых надежных каналов сообщения социальной и эмоциональной информации. Мы используем компьютерное зрение и алгоритмы машинного обучения, которые отслеживают ваше лицо, его черты – глаза, брови – и соотносим их с эмоциональными ориентирными точками. Затем мы накладываем информацию на карту эмоциональных состояний, таких как смущение, интерес, удовольствие. И за последнюю пару лет, начав обрабатывать собранные данные, мы обнаружили, что чем больше данных мы предоставляем, тем точнее становятся систематизаторы эмоций. Когда мы обучали подобные систематизаторы лишь с сотней образцов, их точность не превышала 75 %. Но когда количество позитивных учебных образцов составило 100 000, точность превысила 90 %. Это по-настоящему захватывающе, и мы продолжили пополнять массив данных новой информацией, чтобы достичь большей точности6.
Работа с большими данными и машинным обучением была грандиозной. Фактически успех привел к еще большему успеху.
Затем, в начале 2011 года британская международная фирма по исследованию рынка Millward-Brown пригласила Affectiva продемонстрировать для них технологию Affdex. Годом ранее Millward-Brown учредила собственный отдел, занимающийся нейронауками, в надежде применить новые технологии к тестированию рекламы7. Но, как и многие до них, они обнаружили, что технология, работающая в лаборатории, не обязательно работает в других условиях. Системы, в которых к зрителю присоединяют электроды и сенсоры, не только громоздки, но еще и медленно работают – не говоря уже о том, что могут искажать эмоции, вызывая неудобство и тревогу.
Итак, руководство Millward-Brown предложило команде Affectiva проанализировать на своем программном обеспечении реакцию зрителей на четыре рекламных ролика (протестированных сотрудниками). В случае успеха Millward-Brown становилась клиентом и инвестором молодой компании Affectiva. Одним из роликов было видео «Атака» от компании Unilever, получившее награду Фонда Самооценки Dove. Реклама была направлена на повышение информированности о стандартах красоты, навязанных коммерцией. Ролик, в котором невинную юную девочку в буквальном смысле атакуют рекламные картинки и обращения, иллюстрировал, как средства массовой информации создают образ женщины: «Поговори со своей дочерью, пока этого не сделала индустрия красоты». Приложение компании Affectiva отследило реакции более сотни зрителей и подтвердило то, что уже было известно Millward-Brown: при просмотре ролика зрители чувствовали дискомфорт. Но система, созданная Affectiva, также обнаружила, что в конце ролика дискомфорт исчез. Услышав финальное послание, зрители испытали облегчение. Реакция была мимолетной, и не каждый зритель мог ее описать, если бы для тестирования использовались традиционные методики и опросники. Приложение точно определило то, что упустили другие техники.
Тест был пройден, Millward-Brown сдержала обещание и вложив в Affectiva 4,5 миллиона долларов8. С помощью приложения протестировали тысячи рекламных роликов. К началу лета доход компании превышал 1 миллион долларов. Затем Affectiva запустила первый набор средств (SDK), позволявший другим компаниям и частным лицам использовать приложение для повышения эффективности собственных программ. Это расширило экосистему искусственного интеллекта и позволило за счет просмотра рекламных роликов увеличить базу данных Affectiva. Система продолжала обучаться и становилась все точнее. Сейчас Affdex используется для анализа более двадцати тысяч рекламных роликов, и свыше четырех миллионов лиц генерируют более пятидесяти миллиардов эмоциональных опорных точек. Кроме того, приложение используется в 75 странах. В базе данных представлены лица всех типов и культур, что еще раз доказывает универсальную природу эмоциональной экспрессии.
Десятки компаний стремятся занять свою нишу в сфере технологий распознавания голоса. Одни разрабатывают собственные продукты с нуля, другие пользуются интерфейсами программирования и наборами средств для разработки приложений от сторонних производителей.
Во время становления Affectiva как компании Дэвид Берман, на тот момент ее генеральный директор, постепенно отходил от вспомогательных технологий в более прибыльный сегмент исследования рынка. Здесь было больше возможностей для привлечения инвесторов. В результате Пикард, ориентировавшаяся на портативные устройства для отслеживания физиологических параметров, утратила авторитет. Постепенно Q Sensor отодвинули на второй план, а в апреле 2013 года компания официально прекратила его продажи. Пикард эффективно выжили из компании Affectiva, и она основала компанию Physiio. Вскоре ее новая компания объединилась с Empatica Sri, в результате чего образовалась Empatica, Inc.
На сегодняшний день Empatica продает две версии своего сенсора: Е4 для исследователей и Embrace для широкого потребления. Embrace предназначен, как и многие современные портативные устройства, для отслеживания и получения данных о разных аспектах жизни, включая уровень стресса, степень возбуждения, ритмы сна и физическую активность. Его можно использовать, чтобы распознавать эпилептические припадки и передавать сигнал тем, кто ухаживает за эпилептиком. В приборе Е4 есть функция беспроводной передачи первичных данных исследователям, которым необходимо отслеживать физиологические показатели.
Разумеется, Affectiva – далеко не единственная компания, ориентированная на эмоциональные технологии или анализ эмоций в выражении лица. Компания Emotient, главный офис которой находится в Сан-Диего, была основана до Affectiva, в 2008 году. Используя схожий подход к распознаванию лиц, Emotient вычисляет и анализирует едва уловимые выражения лица, присущие почти каждому человеку, когда он испытывает эмоции. Почему же стали появляться компании, работающие в этой сфере? Генеральный директор Emotient Кен Денман объясняет: «До сегодняшнего дня не существовало механизмов реализации. Технология камер была для нас недостаточно продвинутой, чтобы определять микровыражения лица, те бессознательные реакции, которые проявляются в виде движений лицевых мышц прежде, чем наше сознание сможет их остановить, поскольку они представляют собой импульс». Денман отмечает, что сейчас доступны вычислительные возможности для глубинного обучения нейросетей, благодаря чему развивается технология в целом.
Появляются десятки компаний, ориентированные не только на чтение лиц, но и на другие способы эмоционального взаимодействия. Компания Beyond Verbal с главным офисом в Тель-Авиве занимается анализом эмоций, распознавая интонации в человеческой речи. Их первое приложение применялось в кол-центрах и службах техподдержки и позволяло считывать эмоции и настроение клиента. На сегодняшний день Beyond Verbal расширяют рынок, особенно в области фитнеса и здоровья9. В течение двадцати одного года физики и нейрофизиологи компании проводили исследования и обучали свою систему: в их базе данных более 1,6 миллиона образцов голоса людей из 174 стран. Перед добавлением в учебную базу данных каждый образец анализировали трое психологов, решавших, какие эмоции он содержит. По словам сотрудников компании, приложение может не только распознавать основное и сопутствующее настроение звонящих, но и некоторые аспекты поведения и личности. Такие данные можно использовать для настройки автоматизированных систем и инструктажа обслуживающего персонала, чтобы повысить уровень удовлетворенности клиентов. Использование системы в кол-центрах позволяет эффективнее реагировать на разного рода ситуации. Например, стратегии работы с рассерженными клиентами, которым необходимо решить свою проблему, отличаются от стратегий работы с теми, кто хочет просто выплеснуть свое раздражение.
Компания Beyond Verbal использует методики глубинного обучения и распознавания образов, чтобы выделить из колебательных сигналов голоса эмоциональную составляющую. Сам по себе человеческий голос эволюционировал не для того, чтобы передавать эмоции, но именно психология человека определяет и задает интонацию в речи. Руководитель научного отдела компании доктор Йорам Леванон в беседе о том, как эмоции обретают голосовое выражение, отмечает, что соматические изменения, сопровождающие переживание эмоций, изменяют свойства речи. В какой-то мере это схоже с идеей Манфреда Клайнса о том, что эмоции можно обнаружить по колебательным сигналам от нажатия пальцев. По словам доктора Леванона, мы учимся определять эти эмоциональные характеристики голоса на ранних этапах своего развития, начиная с внутриутробного периода. Предположительно, во время раннего обучения происходит самоорганизация соответствующих нейронов, в результате которой мы обретаем способность распознавать эмоции в голосе людей10.
Beyond Verbal предлагает интерфейс программирования приложений (API) и набор средств разработки (SDK), позволяющие разработчикам встроить в собственные приложения функцию анализа эмоций по интонациям голоса. Они также запустили технологию Moodies, которая позиционируется как первое в мире приложение обработки и анализа данных для смартфонов. В Beyond Verbal утверждают, что оно может оценивать результат на основе более чем четырехсот эмоциональных вариантов, определяющих широкий спектр чувств и настроений. Генеральный директор компании Юваль Мор прогнозирует, что вскоре приложения для обработки и анализа голосовых данных станут частью каждого устройства или платформы с голосовой активацией.
Десятки компаний стремятся занять свою нишу в сфере технологий распознавания голоса. Одни разрабатывают собственные продукты с нуля, другие пользуются интерфейсами программирования и наборами средств для разработки приложений от сторонних производителей.
Кроме Affectiva и Emotient, в сфере распознавания выражений лица работают такие компании, как Eyeris, IMRSV, Noldus, RealEyes, Sightcorp, и Affective Computing Company (tACC).
Даже Microsoft запустила когнитивные сервисы, предложив API-интерфейс Emotion, предоставляющий естественные и контекстные интерактивные инструменты для улучшения взаимодействия с пользователем. Сейчас интерфейс ориентирован в основном на распознавание выражений лиц.
В других областях распознавания эмоций работает компания Emospeech, которая, как и Beyond Verbal, разрабатывает приложения для определения эмоций в речи. Nemesysco, еще одна израильская компания, занимается анализом уровня стресса говорящего с целью выявления мошенничества. Шведская компания Tobii's business ориентируется на контроль взгляда и движений глаз при изучении человеческого поведения. Анализ походки и поз также считается предметом исследования эмоционального программирования и находит применение в таких областях, как физиотерапия и эргономика. Однако пока еще сложно использовать согласованные признаки эмоциональных состояний для фиксирования той или иной эмоции. Возможно, когда технология геолокации достигнет определенного разрешения или с портативных камер можно будет получать обратную связь о передвижениях владельца, анализ общих признаков сможет продвинуться вперед.
Обратная сторона эмоционального программирования – синтез эмоций для программного обеспечения и роботизированных систем. Некоторые компании начали заполнять этот сегмент рынка и обучать машины создавать видимость эмоций. Например, компания Emoshape, с представительствами в Лондоне и Нью-Йорке производит эмоциональный процессор, который можно встраивать в устройства, создавая у пользователя впечатление, что устройство переживает эмоции11. Эмоциональный процессор позиционируется как первый эмоциональный чип для ИИ, роботов и электронных устройств широкого потребления. Он подключается к сенсорам, определяющим эмоции пользователя, а затем воспроизводит эту информацию в своем поведении. Отслеживая выражения лица, используемые слова и тона голоса пользователя, устройство может оценивать уровень его эмоций.
Другие компании неизменно последуют их примеру, либо создавая собственные специализированные эмоциональные процессоры, как Emoshape, либо разрабатывая и продавая собственные эмоциональные движки с API-интерфейсом, в которые можно встраивать другие приложения. С их помощью можно будет изменять поведение и действия роботов, программных приложений и персональных ИИ-помощников, подобных Мэнди (персональному цифровому помощнику из главы 1).
Во всей этой ситуации интересно одно – преобладающее количество стартапов, использующих технологии распознавания эмоций. По всей видимости, это объясняется двумя причинами. Во-первых, существующие технологии позволяют развивать именно это направление: веб-камеры, камеры смартфонов с достаточным разрешением и скоростью; доступные вычислительные мощности всех наших устройств – стационарных компьютеров, ноутбуков и, самое главное, смартфонов; высокая скорость передачи данных и возможность подключаться к серверам и службам проводным способом, по Wi-Fi или через мобильные устройства.
Вторая причина интереснее. Компьютерное распознавание образов и глубинное обучение – технологии, которые за последние годы достигли значительной сложности и больших возможностей. В некоторых ситуациях компьютеры способны распознавать то, что человек заметить не в состоянии, в то время как в других условиях они откровенно слабы. Когда имеются разумно структурированные универсальные признаки – скажем, четыре зубца у вилки, четыре колеса у автомобиля или начертание в алфавита, – система распознавания, основанная на нейронной сети, может обучаться очень хорошо даже в плохих условиях. Большинство систем распознавания выражений лиц основаны на структурированной таксономии, по большей части на карте движений лицевых мышц, составленной Экманом. Обучение возможно, потому что природа выражения эмоций на лицах людей универсальна. Четко определенная таксономия может быть одной из причин, по которой компании, разрабатывающие технологии анализа эмоций, специализируются в основном на чтении лиц. Со временем, когда удастся разработать и разобраться в техниках распознавания других эмоциональных каналов, ситуация может измениться.
Мы находимся на пороге странной новой эры, когда границы между людьми и технологиями становятся все более зыбкими. Нам станут доступны чудеса, которых мир прежде не видел.
Разумеется, в сфере эмоционального программирования будут происходить слияния компаний и приобретения одних компаний другими. Как упоминалось, Physiio объединилась с Empatica Sri, образовав Empatica, Inc. в апреле 2014 года. В 2015 году компания Kairos, производящая программное обеспечение для распознавания выражений лиц, купила IMRSV за 2,7 миллиона долларов. И предоставила своим клиентам услуги, на которые существовал спрос, но которые не входили в компетенцию Kairos. В январе 2016 года мировой гигант Apple купила Emotient за сумму, размер которой не разглашается. Хотя Apple не уточнила причину покупки Emotient на момент написания книги, было распространено мнение, что они могли разрабатывать усовершенствованную версию своего приложения личного помощника Siri. В пользу этого предположения говорят и некоторые другие приобретения Apple в тот же период времени. В их числе британская компания по производству программного обеспечения для анализа естественных языков VocallQ, компания Perceptio, занимающаяся глубинным обучением в распознавании образов, и недавно созданная компания Faceshift, специализирующаяся на распознании выражений лиц на видеоизображениях. Как уже говорилось, создание систем программного обеспечения, способных понимать нас и взаимодействовать с нами более естественным образом, постоянно способствует усовершенствованию множества поддерживающих технологий.
На расширение новой сферы влияют и другие факторы, например законодательство в области патентов и интеллектуальной собственности. Например, в мае 2015 года Emotient запатентовала свой метод сбора и категоризации до ста тысяч изображений лиц в день. За год до этого Apple подала патентную заявку на систему, которая оценивает настроение, основываясь на выражении лица. Защита интеллектуальной собственности – крайне важная движущая сила и мотивирующий фактор. В то же время новые технологии получают патенты, формулировки которых слишком общие или слишком очевидны с точки зрения существующего законодательства. К сожалению, недостаток осведомленности в новой отрасли науки часто ведет к перегибанию палки в виде некорректно работающей защиты. Патенты на гены рака груди, выданные в 1997 и 1998 годах компании Myriad Genetics, признанные недействительными в 2013 году, – яркий тому пример12.
Чрезмерно широко трактуемые патенты могут препятствовать инновациям и развитию. Оценка патентов, подобных патенту Emotient, не является целью этой книги, но уместно задать вопрос: правомерно ли защищать патентом нечто подобное проекту машинного обучения, данные для которого были получены от бескорыстных исполнителей. Время покажет. В действительности важно на ранних этапах развития новой отрасли науки то, чтобы мы не создавали ненужных препятствий. Просто представьте, что бы произошло, если бы кто-то получил в 1980-е или 1990-е годы патент, в общих чертах описывающий таксономию выражения лица человека. В то время этот процесс мог показаться новым и неочевидным, и общая формулировка патента могла затормозить развитие всей отрасли эмоционального программирования! Главным образом стоит понять: на столь ранних стадиях будет мудрым решением ввести дополнительную защиту от патентов, которые очевидно будут вредными для всех. Важно помнить, что, кроме выдачи патентов, основная миссия Ведомства США по патентам и торговым знакам– «способствовать индустриальному и технологическому прогрессу США и укреплять национальную экономику». В нашем быстро меняющемся мире необходимо установить продуманный баланс в том, кому служит патентная защита.
В условиях экономики свободного рынка заманчиво ориентироваться на выгоду как главный фактор мотивирования и движущую силу инноваций, но это лишь одна из ее составляющих и даже не самая важная. Огромное значение для долговременного успеха имеют поддержка инфраструктуры, достаточного количества мечтателей-единомышленников и общества, готового ухватиться за некоторые, если не за все, возможности новой технологии. Инновации не развиваются в вакууме, а являются результатом взаимного обогащения идей. Делая доступными некоторые аспекты развивающейся технологии, но при этом защищая действительно заслуживающую этого интеллектуальную собственность, технологическая экосистема получает возможность расти и процветать, что идет на пользу не только обществу, но и самим новаторам. Эль Калиуби, по всей видимости, поддерживает эту идею, говоря: «Наша самая большая проблема заключается в том, что существует так много прикладных способов использовать эту технологию, что мы с моей командой понимаем: нам будет не под силу создать их самим, поэтому мы сделали технологию доступной для других разработчиков, которые хотят создавать и творить»13.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?