Электронная библиотека » Рут Айлетт » » онлайн чтение - страница 4


  • Текст добавлен: 1 ноября 2022, 19:25


Автор книги: Рут Айлетт


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 4 (всего у книги 14 страниц) [доступный отрывок для чтения: 4 страниц]

Шрифт:
- 100% +

Исследователи активно работают над тем, как повысить энергоэффективность своих разработок. Они пытаются придумывать новые источники энергии с повышенной энергетической плотностью. Примером таких разработок является сахарная батарея, принцип действия которой основан на выработке энергии в клетках из глюкозы[50]50
  Работа по сахарным батареям: Sebastian Anthony, «Sugar-Powered Bio-battery Has 10 Times the Energy Storage of Lithium: Your Smartphone Might Soon Run on Enzymes,» ExtremeTech, January 21, 2014, https://www.extremetech.com/extreme/175137-sugar-powered-biobattery-has-10-times-the-energy-storage-of-lithium-your-smartphone-might-soon-run-on-enzymes (доступ от 20 ноября 2020).


[Закрыть]
. Одним из препятствий здесь является сложность химических процессов, протекающих в живом организме. Для их регуляции необходима цепочка энзимов. При перезарядке сахарной батареи они должны находиться в ней, когда сахар туда поступит. Она также нуждается в доставке воздуха, поскольку в процессе участвует кислород; батарею нельзя герметично запечатать, как литиево-ионную. Повышенная энергетическая плотность – не единственное достоинство сахарной батареи. Сахар куда доступнее лития, и он не такой токсичный. С ним не возникает проблемы переработки. Он обеспечивает стабильную подачу энергии, в то время как у литиевых батарей вольтаж падает по мере того, как они садятся, отчего у робота, который питается от такого источника энергии, могут возникать проблемы. Сахарная батарея вырабатывает воду и электричество. Если такой источник энергии поступит на широкий рынок, он может значительно расширить применение роботов в повседневной сфере.

Мы уже говорили, что в разработке ходячих роботов ученые много занимались принципами ходьбы у живых существ, хотя модели, получившиеся в результате, не идентичны своим прототипам. Применение биологии в инженерии известно как биомиметика, когда копируются идеи, а также как био-вдохновление, когда используются базовые принципы. Оба подхода применялись к различным вариантам движения роботов: полету, плаванию, прыжкам, карабканью и ползанью. Такие роботы не предназначены для жизни в нашем социальном пространстве. Они повторяют особенности и, соответственно, заимствуют способности птиц, рыб, ящериц, насекомых и змей.

Можно сказать, что в каком-то смысле самолет, летящий на автопилоте, и самонаводящаяся ракета тоже являются летающими роботами. Но по-настоящему популярными летающие роботы стали с появлением недорогих квадрокоптеров, в которых четыре пропеллера независимо подключены к одному мотору. Такие аппараты, доступные многим любителям и энтузиастам, обычно управляются с помощью дистанционного пульта.

Автономному летающему роботу требуется компьютер для управления, помимо батарей, камеры и коммуникационного оборудования, которые у него уже есть. Большая нагрузка приводит к увеличению мотора и росту потребления энергии. Квадрокоптер летает всего несколько минут, а не часов: примерно от 6 минут до получаса. Установка более мощных батарей, увеличивает массу аппарата и, соответственно, энергопотребление. Небольшой двигатель внутреннего сгорания мог бы решить проблему, но он стоит дороже и занимает больше места. Если пропеллеры остановятся, квадрокоптер тут же упадет на землю, как вертолет, поэтому он по определению более требователен к источнику энергии.

Летательный аппарат с неподвижным крылом более экономичен, потому что способен сберегать энергию при парении, но подъемная сила, которая держит его в воздухе, зависит от площади крыла в квадратных метрах, а также от разницы в давлении, возникающей при ускорении. Это означает, что подъемная сила будет уменьшаться по экспоненте с уменьшением размера крыла: вот почему большие аэробусы взлетают медленней, чем маленькие самолетики, и почему у самолетов, разработанных по принципу планера, крылья куда длиннее. Размер крыла – одна из причин, по которой испытатели, пытавшиеся крепить к себе крылья, разбивались: для подъема их веса крылья требовались куда больше, чем можно прицепить человеку на спину. Модели планеров, даже маленькие и легкие, все равно должны летать достаточно быстро, чтобы сохранять подъемную силу. Любители предпочитают квадрокоптеры, потому что те могут делать красивые фотографии, поднявшись над землей, в отличие от тех, что получаются с быстро движущихся аппаратов с фиксированными крыльями.

Тем не менее птицы потребляют меньше энергии и более маневренны, равно как летучие мыши и летающие насекомые. Они легко приспосабливаются к ветру, который сдувает летающих роботов. Исследователи хорошо изучили фауну, пытаясь разработать более удачные летающие модели[51]51
  О последних работах по летающим роботам, основанным на природных прототипах, см. Kate Baggaley, «Forget Props and Fixed Wings: New Bio-inspired Drones Mimic Birds, Bats and Bugs,» NBC News, July 30, 2019, https://www.nbcnews.com/mach/science/forget-props-fixed-wings-new-bio-inspired-drones-mimic-birds-ncna1033061 (доступ от 20 ноября 2020).


[Закрыть]
. Ученые из Германии в 2011 создали автономную птицу-робота, основываясь на примере чайки, а в наше время несколько исследовательских групп работают над роботами, прототипом которых стали колибри, которые летают особенно эффективно[52]52
  Обзор Smartbird в IEEE robot catalog: https://robots.ieee.org/robots/smartbird (доступ от 20 ноября 2020).


[Закрыть]
.

Как и человеческий скелет, биологические структуры у летающих животных слишком сложные, чтобы их могли воспроизвести современные инженеры. В крыле у летучей мыши сорок суставов, поэтому она может контролировать и угол разворота крыла, и жесткость мембраны, из которой оно состоит. Дилемма разработчиков заключается в том, насколько точно следовать за образцами: достаточно, чтобы получить схожие способности, но не слишком, чтобы готовую модель можно было контролировать. Летучая мышь – это пример мягкого робота: ее крылья выполнены из гибкого материала, напоминающего ткань, поэтому потенциально они безопасней для человека, чем металл и пропеллеры квадрокоптера.

Мы уже поняли, что в ближайшем будущем не приходится ожидать появления двуногих роботов, свободно ходящих среди нас. Точно так же рои пчел или других летающих роботов-насекомых – лишь плод фантазии сценаристов в кино и на телевидении. Строительство таких механизмов, контроль над ними и доставка энергии, а также необходимость сделать их максимально миниатюрными: это грандиозная инженерная задача. Однако ученые активно занимаются роботами-птицами и роботами-летучими мышами, и некоторые уже достигли стадии старт апов, хотя продукция их пока выходит лишь в небольшом количестве, как прототипы.

Как птицы и летучие мыши вдохновили разработчиков летающих роботов, так и рыбы подали немало идей насчет роботов плавающих. Рыбы очень подвижны и обладают куда большей маневренностью, чем рукотворные подводные суда. Большинство рыб могут разворачиваться очень быстро, а хищные еще и ускоряются лучше других. Они энергоэффективны благодаря тому, что теряют меньше энергии при прохождении сквозь воду по сравнению с судами на пропеллерах. Исследования показывают, что, когда рыба движением хвоста создает в воде воронку, она использует ее энергию для разворота в другую сторону. Но опять же, как и птицы, рыбы представляют большую проблему для инженеров. Они перемещаются, извиваясь, а для этого требуется гибкий робот, состоящий из множества сегментов, при этом защищенный от проникновения воды внутрь. Этого легко добиться у простых заводных рыбок, которых покупают детям, но куда труднее у электронных устройств. Обычно разработчики помещают электронику в защищенную голову и прикрепляют к ней подвижные сегменты, каждый из которых приводится в действие собственным мотором.

Первым роботом-рыбой стал Робот-Тунец, построенный в 1990-х в Массачусетском Технологическом Институте. С тех пор аналогичные механизмы создавали в Великобритании, Франции, Китае, Японии и других странах. Цель таких разработок – получить небольшую, эффективную и скоростную инспекционную модель, однако до сих пор они служат лишь для развлечения публики, когда их сажают в автоматизированные аквариумы[53]53
  О французской рыбке-роботе Jessiko, созданной с развлекательными целями, см. http://www.robotswim.com/?lang=English (доступ от 20 ноября 2020). Она маленькая (23 см. в длину) и якобы может плавать по девять часов между подзарядками, с помощью индукции. В нее встроен LED-светильник, меняющий цвета.


[Закрыть]
. По сути, это то же самое, что древние птички-автоматы в Византии.

Наземные роботы, состоящие из отдельных сегментов, имеют гораздо большее распространение. В качестве модели для них использованы змеи. Идея заключается в том, что эти роботы могут передвигаться в тесных пространствах: под полом или внутри труб, в разрушенных зданиях или даже в человеческом теле в рамках эндоскопической хирургии. Особая форма дает им преимущество, и благодаря большому количеству сегментов они могут двигаться, даже если один сегмент поврежден. Как железнодорожные составы (или земляные черви), они могут иметь контрольные механизмы на обоих концах, чтобы легко менять направление движения[54]54
  Видеосъемка робота-змеи, которая может и плавать, и ползать, хотя не совсем ясно, не управляют ли ей дистанционно: «Snake Bot,» IEEE Spectrum, video posted to YouTube, December 23, 2013, https://www.youtube.com/watch?v=vCrN47cOmHQ (доступ от 20 ноября 2020).


[Закрыть]
. У настоящих змей нет колес, но у роботизированных они встречаются. Иногда это пассивные колеса с различной степенью трения на разных поверхностях, обеспечивающие движение зигзагами, как у змеи. Некоторые разработчики ставят в каждый сегмент собственный мотор, приводящий колеса в движение. В некоторых моделях колеса заменяются гусеницами.

Разработка роботов-змей для хирургии (без колес) – это перспективное направление исследований, хотя на пациентах они пока не тестировались. В ходе эндоскопических операций в тело человека уже вводят кабели с камерой и миниатюрными хирургическими инструментами. Осталось научить их передвигаться независимо, хотя, конечно, в основном ими будет дистанционно управлять хирург.

Наконец, существуют роботы, образцом для которых послужили ящерицы – гекконы, умеющие карабкаться по стенам с помощью своих липких ног, и кузнечики, прыгающие на большие расстояния. Конечно, все эти роботы пока являются лишь прототипами, а не готовыми продуктами, но у них определенно есть большой потенциал.

Глава 4
Чувства: будут ли они знать о нашем присутствии?

В 2002 году маленький робот по имени Гаак сбежал из исследовательского центра Magna Science в Ротереме, Англия. Гаак был участником выставки «живых роботов» и участвовал в соревнованиях на «выживание сильнейших». Он выскользнул из своего отсека через небольшое отверстие, спустился по рампе, вышел за двери центра и был пойман в конце подъездной дороги, где один из посетителей едва не переехал его на машине.

Примерно так это событие описывали в прессе[55]55
  Чтобы узнать, как эта история освещалась в прессе в соответствующий период, см. Martin Wainwright, «Robot Fails to Find a Place in the Sun,» The Guardian, June 20, 2002, https://www.theguardian.com/uk/2002/jun/20/engineering.highereducation (доступ от 20 нояб ря 2020).


[Закрыть]
. На самом деле ситуация объяснялась работой его сенсоров. Гаака запрограммировали на поведение, которое называется таксис: оно не имеет ничего общего с автомобилями и произносится как тáксис. Идея заключается в том, что вы поворачиваетесь в сторону наиболее сильного сигнала, поступающего к вашим сенсорам, и движетесь в его направлении. Гаак выполнял фототаксис, то есть двигался к свету, потому что должен был действовать как «хищник» в поисках «добычи», роботов меньшего размера с прикрепленными к ним источниками света. Добравшись до такого робота, он подключался к нему и «ел» его электроэнергию. Но день выдался теплый и солнечный, Гаака забыли выключить, и он направился в сторону света, проникавшего в двери центра. В конце подъездной дорожки росло высокое дерево, ветви которого раскачивались на ветру, отчего внизу образовался подвижный узор из света и тени. Гаак застрял там, пытаясь следовать за световыми пятнами, и начал кружиться на месте.

Из этой истории следуют два любопытных вывода. Первый: роботам нужны сенсоры, чтобы реагировать на меняющийся мир. Второй: реагировать разумно – «делать нужные вещи» – не всегда просто, и связь действий робота с информацией от сенсоров может приводить к неожиданным результатам, особенно если робот движется не в той среде, для которой приспособлен.

Слово робот до сих пор используется для механизмов, не имеющих сенсоров, как многие поколения промышленных роботов. Однако в главе 2 мы уже упоминали: чтобы по праву называться роботом, механизм должен уметь реагировать на изменения в окружающей среде в реальном времени. Это означает, что ему нужны сенсоры. Как мы увидим в следующей главе, первое, что требуется роботу от сенсоров, – информация, которая позволяет ему избегать препятствий, не ударяясь о них, когда он перемещается. Понимание того, где он находится и как добраться туда, куда ему нужно, то есть локализация и навигация. И это следующее, чему он должен научиться.

Обычно мы представляем себе роботов в гуманоидной форме и потому считаем, что и сенсорная система у них такая же, как у нас. В конце концов, робот с камерой видит то же, что и мы, так ведь? Но, конечно, это не так. Мы не можем снабдить роботов чувствами, наподобие собственных. Зрение человека устроено сложнее любой камеры, и, как и остальной человеческий организм, до сих пор не понято до конца. У камеры стандартные световые рецепторы расположены равномерно. А в нашей сетчатке они разделяются на два типа. Палочки работают при низкой освещенности, не обрабатывают цвет, четкость у них ниже, и они более чувствительны к движению. Палочки располагаются ближе к краям сетчатки. Колбочки же сосредоточены в ее середине и обрабатывают цвет с большей четкостью. Разрешение сетчатки варьируется: максимально высокое в центре, где находятся только колбочки. Этот участок называется fovea.

Камера наводится на картинку, и программа обрабатывает то, что попадает в ее поле зрения, а глаза постоянно двигаются. Наши рецепторы отключаются, если на них постоянно падает один и тот же свет, поэтому, если бы глаза не двигались, мы ничего не видели бы. Быстрые движения глаз называются саккадами и позволяют перемещать fovea к «интересным» элементам картинки. Мозг редактирует поступающую информацию, а также стабилизирует визуальное поле, когда наше тело перемещается. Более того, сетчатка запечатлевает изображения вниз головой, и мозг переворачивает их обратно. Если вы наденете очки, которые переворачивают картинку перед вами, мозг адаптируется и станет переворачивать ее назад, пока вы не снимете очки, и тогда мозг повторит процесс адаптации[56]56
  Джордж Страттон, знаменитый американский психолог, проводил эксперименты с инвертирующими очками, еще будучи студентом в Лейпциге, Германия, в 1900-х. Его очки инвертировали изображение сверху вниз и слева направо. В статье 1897 года он заявлял, что спустя неделю снова начинал видеть мир нормально. Позднейшие работы, в Австрии в 1950-х, показывали, что люди, которые носили очки, видели мир перевернутым, но приспосабливали свое поведение так, словно сами перевернулись в реальном мире. Вы можете посмотреть классический фильм о его работе в Австрии на https://www.youtube.com/watch?v=jKUVpBJalNQ.


[Закрыть]
.

Глядя перед собой, мы видим предметы. Когда робот наводит камеру на какой-то предмет, он получает набор цифр, по одной для каждого пикселя или элемента картинки. Это больше похоже на разглядывание по отдельности каждой нарисованной на огромном щите точки, за тем исключением, что мы видим точку, причем в цвете, а не набор цифр, представляющих ее. Робот получает сырые цифровые данные, в то время как ему нужна информация о том, что находится вокруг. Количество цифр, которые робот получает, зависит от разрешения камеры: например, если оно равно 4 мегапикселям, то он получит более 4 млн цифр на картинку. Как же робот распознает предметы, которые мы видим на той же картинке? Первым делом он идентифицирует детали, группируя пиксели вместе. Стандартный подход – искать пиксели одного цвета равной интенсивности и формировать из них контуры, или линии. На этот процесс сильно влияет освещение. Представьте человека, который стоит перед роботом, и его наполовину заливает свет, падающий из окна. Пиксели на освещенном краю лица будут отличаться по цвету от стороны, находящейся в тени, и где-то посередине будет проходить линия, не имеющая к лицу никакого отношения: она разделяет освещенную и неосвещенную половины.

Есть один фактор, помогающий в обработке изображений, – это представление о том, как далеко расположен каждый пиксель. Если у человека, стоящего перед роботом, за спиной находятся еще люди, нельзя допустить, чтобы пиксели того же цвета, относящиеся к другому человеку, сливались с силуэтом главного объекта. Наше зрение бинокулярно, то есть мы получаем по два изображения каждой сцены, и разница между ними, возникающая из-за разделения между глазами, дает смещение, на основании которого мозг судит о расстоянии. При взгляде на близлежащий предмет глаза сходятся больше, чем если предмет далеко, и наше зрение фокусируется, так что мышечное напряжение также дает представление о том, на каком расстоянии находится предмет.

Мы можем отчасти повторить этот эффект, снабдив робота двумя камерами. Но проще будет использовать камеру с дальномером. Вместо того чтобы просто позволить свету проникать в камеру, мы можем сканировать поле обзора лазером и измерять отклик. От близлежащих предметов луч будет возвращаться быстрее, чем от удаленных, поэтому к каждому пикселю мы сможем добавить измерение дальности. Это не похоже на человеческий глаз, но так у робота появится дополнительная информация, помогающая объединять пиксели в контур.

Лазеры относительно дороги, но дают высокую точность, если только не попадают на сильно отражающую поверхность, например стекло. Их нельзя использовать для автономных подводных роботов (АПР), потому что вода рассеивает луч, укорачивая его. Еще одна проблема с подводными камерами заключается в том, что чем глубже вы погружаетесь, тем меньше там света. АПР используют ультразвук вместо дальномера, примерно так же, как дельфины. Минус в том, что ультразвук еще сильнее лазера рассеивается при прохождении среды, поэтому возвращается с большим количеством погрешностей.


4.1 Три графических отображения сенсорных данных: (а), сверху, Университет Стерлинга, данные с дрона: облако точек, в котором каждая представляет цифру, нуждающуюся в обработке; (б), внизу слева, снимок гостиной, сделанной с помощью сенсоров Microsoft Kinect; (в), внизу справа, дорога, машина, деревья на снимке с лазерного радара. На всех снимках можно различить некоторые предметы: это означает, что ваши глаза отлично справляются с задачей


Пока мы основываемся на предположении, что цифры, поступающие от сенсоров, точны. На самом деле в этой информации имеется элемент, который инженеры называют шумом. Изначально термин использовался для описания статики в радиосигнале, но впоследствии перешел на любые нежелательные электрические флюктуации. Шум вносит небольшие случайные изменения в получаемые данные, даже если робот не движется. Шум в изображениях дает небольшие искажения яркости и цвета на картинке от камеры. Эти искажения могут идти от разных источников: как внутренних, вызванных перемещениями электронов в самом сенсоре, так и наружных, поступающих из среды. Расположенные поблизости электрические устройства генерируют магнитные поля, которые могут распространять волны, и даже солнечная радиация приводит к электронному шуму.

Данные от сенсоров, таким образом, неизбежно отклоняются от достоверности и могут считаться точными лишь в определенных пределах. Движущийся робот должен уметь различать, вызваны подобные отклонения настоящими изменениями или просто шумом. Инженеры изобрели так называемые фильтры для снижения сенсорного шума и смягчения флюктуаций, поэтому данные, которыми пользуется робот при движении в среде, достаточно точные. Подробнее мы изучим этот вопрос в следующей главе.

Давайте вернемся к контурам, основываясь на предположении, что шум удалось успешно подавить. Контуры – лишь начало истории. Роботу надо понять, к каким объектам они относятся. Человек хорошо распознает предметы, потому что обладает достаточными знаниями об окружающем мире и предметах, которые в нем находятся. Дети, повинуясь инстинкту, ищут взглядом другие лица. Мы можем по контурам движущейся фигуры определить, например, ее пол. Ребенок много времени тратит на наблюдение за миром, и потому быстро усваивает его объективность. Это происходит в основном в процессе развития зрительной и тактильной координации, которая требуется, чтобы хватать вещи рукой или, к примеру, зачерпывать пищу ложкой. Но дать роботу набор контуров с картинки, а затем попросить его определить, что это за объект, если таковой вообще существует, – совсем другая задача.

Превратить набор контуров в предмет проще, если у программы уже есть ожидания насчет того, чем они могут оказаться, или она ищет нечто, вписывающееся в определенный паттерн или модель. Современные технологии обработки изображений значительно усовершенствовались в контексте видеонаблюдения, когда камера концентрируется на людях или их лицах. Программа может содержать примерную модель человеческого тела и примерять ее на все, что попадает в объектив. В случае успеха такая модель помогает предсказывать, что попадет в камеру дальше, а кроме того, помогает камере следовать за конкретным человеком, если тот проходит за спинами других или еще каким-то образом частично скрыт. Точно так же система может содержать паттерн относительно особой группы деталей. Лицо имеет овальные контуры, с глазами в верхней трети и ртом внизу. Программа распознавания лиц неплохо работает, опираясь на такую модель, если освещение не слишком отличается от запрограммированного эталона. Она будет сопоставлять особые приметы с изображения с теми же приметами в базе данных своих снимков. Форма глаз здесь помогает особенно, вот почему автоматический паспортный контроль срабатывает лучше, когда люди снимают очки.


4.2 Программа может распознавать черты лица, если у нее имеется модель, указывающая, на что обратить внимание


Мы уже заметили кое-какие важные расхождения между тем, что должен делать робот, и тем, что делает система наблюдения. Робот движется в среде, поэтому должен следить не только за лицами, особенно если ему предстоит взаимодействовать с конкретными предметами. Возможно, он должен налить чай в кружку и принести ее пользователю либо отыскать лежащие не на своем месте очки. Или этот робот собирает фрукты, и ему нужно снять с дерева спелые яблоки. Для каждого предмета у него должна быть модель или паттерн, применяемые при распознавании.

К счастью, роботу не нужно узнавать абсолютно все предметы вокруг себя. Препятствие есть препятствие, будь то стол, стена или прилавок. Главное – избегать их, каковы бы они ни были. Это еще одна причина давать роботу особенно подробную информацию о том, какие объекты он должен распознавать: в любой среде их будет совсем немного. Это также минимизирует усилия на расчеты в процессе распознавания.

Для обработки всего одного изображения роботу нужно более 4 млн цифр: в изменчивой среде, где еще и сам он движется, этого изображения все равно будет недостаточно. Именно поэтому камера должна делать минимум 20 снимков в секунду, а лучше Эти снимки содержат массу данных и требуют тщательной обработки и обширного хранилища для полученной информации. Естественно, здесь мы возвращаемся к вопросу энергии, которого касались в предыдущей главе, не говоря уже о выработке тепла и увеличении веса. Даже роботы с высокой степенью автономности зачастую передают данные с камеры на внешние обрабатывающие устройства. Отслеживание движущихся предметов, например мяча в футболе для роботов, обычно ограничивается 5 кадрами в секунду вместо 20 к моменту, когда обработка завершена.

Когда робот двигается, освещение меняется, что осложняет процесс распознавания деталей. Некоторые из них могут принадлежать независимо движущимся объектам, например людям, проходящим мимо. Но камера двигается тоже, вместе с роботом, и, как мы увидим в следующей главе, установление позиции робота после серии движений может вызывать проблемы, не говоря уже о тряске камеры, которая начинается со штатива и заканчивается колесами или, что еще хуже, ногами самого робота. Распознавание деталей в подвижном изображении редко проходит удачно. Но все не так уж плохо. Ведь среда, в которой находится робот, обычно меняется мало. Детали, присутствующие на одном изображении, скорее всего, появятся и на остальных, пусть даже они слегка сдвинутся и изменятся. Робот лучше контролирует изменения в картинке, чем обычная камера наблюдения, которая может только наезжать и отъезжать: у него есть возможность приближаться к любопытным деталям или следовать за теми, которые продолжают двигаться.

Другая хорошая новость заключается в том, что благодаря активным исследованиям в сфере видеонаблюдения в публичном доступе оказались библиотеки изображений, не нуждающиеся в дополнительной обработке. Они позволяют снабдить любого робота камерой с мощным программным обеспечением, которое не надо писать с нуля[57]57
  Широко используемая открытая библиотека по видеообработке называется OpenCV (Open Computer Vision), https://opencv.org. В ней можно найти все классические алгоритмы, а также базовые подходы к машинному обучению.


[Закрыть]
. Такие библиотеки ныне задействованы в самых современных методиках визуального распознавания, включая машинное обучение, описанное в главе Идея в том, что в программу загружается большое количество изображений целевого объекта, на основании которых она учится искать характерные детали, позволяющие его распознавать. Если этот объект появляется на входящем изображении, система считывает его без дополнительной работы по извлечению данных. Любой, кто проходит тест «я не робот», где вас просят распознать в реальном времени какой-нибудь предмет, например машину, участвует в процессе обучения подобных систем. Однако в современных условиях для этого требуются большие вычислительные мощности, чем есть у роботов, и поэтому в реальном времени система распознает лишь некоторые объекты, вроде мяча в футболе для роботов.

В целом, нынешняя ситуация с камерами на роботах очень похожа на таковую с мобильностью, описанную в предыдущей главе. В знакомой среде с ограниченным набором известных предметов распознавание может работать достаточно хорошо, чтобы исполнять конкретные задачи в ограниченный отрезок времени, хотя и в зависимости от освещения. Если роботу надо идентифицировать небольшое количество людей, его можно снабдить их снимками, а затем позволить передвигаться так, чтобы он видел их лица. Однако зрение роботов с применением камер довольно ненадежно и заторможено. И не идет ни в какое сравнение с человеческим зрительным восприятием.

Тем не менее в робототехнике не обязательно ограничиваться лишь способностями, присущими человеку. Как дальномером в камере, мы можем снабдить робота инфракрасным зрением. Это позволит ему видеть в темноте без специальных очков. Также у роботов есть и более простые сенсоры, помимо камер. Бампер с датчиком контакта сообщает роботу, что он наткнулся на препятствие. Сенсоры, выполняющие работу дальномеров (без попыток построения изображения), дают роботу информацию до того, как он врежется во что-нибудь. В них могут применяться лазеры, а также камеры, о которых мы уже говорили, но инфракрасные или ультразвуковые сенсоры стоят дешевле, а с задачей справляются не хуже. Сенсоры, позволяющие избегать столкновений, обычно располагаются в нижней части робота. Преимущество простых устройств в том, что они генерируют гораздо меньше сырых данных, и обрабатывать информацию от них проще. Сенсоры такого рода получают меньше информации из среды, но это значит, что они более надежные. У роботов на колесах зачастую есть сенсор под названием «детектор оптического потока». Он измеряет скорость, с которой движутся пиксели, не пытаясь построить изображение. Если знать, на какой высоте от пола расположен сенсор, это дает достаточно информации о том, как быстро и в каком направлении робот движется.

Простейшие сенсоры напоминают те, с помощью которых Гаак совершил побег. Они измеряют уровень определенного сигнала, например, светового, инфракрасного или звукового. Вы можете решить, что это слишком просто, чтобы спровоцировать у робота какие-то интересные действия. Но таксис, будь он позитивным (по направлению к сигналу) или негативным (от него), может на самом деле вызывать сложные интеракции между несколькими роботами, как мы еще увидим в главе Многие исследователи разрабатывали небольшие роботизированные экосистемы наподобие этой, в некоторых случаях включая и зарядную станцию с источником света, куда робот отправляется, если внутренний сенсор сообщает ему о недостатке заряда[58]58
  Экосистемы роботов изучаются уже долгое время; примером могут служить исследования, проведенные в Брюсселе более 20 лет назад. См. A. Birk, «Where to Watch» (1997), Semantic Scholar, https://pdfs. semanticscholar.org/50b4/51436a7e1608fc8c7278953 3e49c7a88a3ca. pdf (доступ от 20 ноября 2020).


[Закрыть]
.

А как же насчет слуха? Мы уже привыкли к бестелесным голосовым домашним системам вроде Siri, Alexa и Google Home и ожидаем, что робот будет слышать, как мы зовем его или разговариваем с ним. Позднее мы еще поговорим о вербальном взаимодействии, но, чтобы оно работало, у робота должно быть устройство, улавливающее звук. Однако как камера не повторяет человеческое зрение, так и микрофон или набор микрофонов – не похож на человеческий слух. Звук отличается от света в том смысле, что он гораздо менее направленный. Мы видим то, что попадает к нам на сетчатку, и поворачиваем голову, чтобы увидеть нечто другое. Звук может возникать где угодно вокруг нас, и мы все равно его услышим. Как и с глазами, наличие пары ушей дает нам указание на локацию, поскольку звук достигает одного уха чуть раньше, чем другого, если возникает сбоку от нас. Частота также является указанием на движущийся источник звука: вспомните, как меняется вой сирены скорой помощи, когда она приближается к нам и затем удаляется. Наконец, сложная форма нашего наружного уха не просто украшение: она действует как воронка для входящих звуков, помогая их локализовать.

Набор микрофонов дает роботу ту же возможность определять источник звука. Но тут остаются две больших проблемы. Первая: робот сам генерирует звук, особенно если у него работают моторы. Это снижает вероятность точного восприятия внешних звуковых сигналов. Вот почему в экспериментах по взаимодействию человека и робота люди обычно надевают микрофон. Для эксперимента такое, конечно, возможно, но вряд ли подойдет для взаимодействия в обычной среде. Вторая проблема более фундаментальна. Люди, как большинство других животных, обладают вниманием. Это означает, что мы фокусируемся не на всей информации, поступающей через органы чувств, а лишь на сигналах, которые нас интересуют. Структура глаза – его fovea с высоким разрешением – поддерживает этот процесс. Вспомним, например, как полицейские собирают свидетельские показания и пытаются узнать то, что свидетели видели, но не запомнили. Многочисленные эксперименты подтверждают, как много решает внимание: так люди могут не заметить, что один секретарь за стойкой в приемной нырнул под стол, а на его место вынырнул совсем другой. Да, и такое бывает.

Что касается слуха, то внимание здесь помогает нам отфильтровывать так называемый фоновый шум: все, что мы не хотим слышать. Во многих привычных для нас социальных ситуациях этот шум присутствует в большой степени. Хлопанье дверей, звуки от проезжающих автомобилей или работающей стиральной машины, музыка по радио. Но мы все равно можем разговаривать между собой и при условии, что фоновый шум не слишком громкий, не обращать на него внимания и сосредоточиваться на том, что говорит наш собеседник. Даже в крайне звучной среде, мы все равно слышим и реагируем, когда кто-то произносит наше имя. Для этого феномена даже имеется собственное название – эффект вечеринки. Во время такого рода собраний мы говорим внутри группы, к которой относимся, и отфильтровываем звуки других разговоров.

Как со многими сенсорными способностями, мы не понимаем, что именно для этого делаем, и потому нам очень трудно реализовать данные возможности у робота. В повседневной человеческой среде роботу трудно сосредоточиться на голосе, когда масса звуков попадает в его микрофон. Вообще, говоря о «голосе», мы уже намекаем на то, что это единый звуковой поток, на котором нужно сфокусироваться. Но в действительности роботу здесь требуется еще и распознавание речи. И снова, как в случае с движением в повседневной среде, где находятся люди, например в офисе, есть разница между распознаванием речи в шуме и распознаванием речи одного человека, говорящего в микрофон. Бестелесная голосовая система находится в помещении в одном конкретном месте.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации