Автор книги: Дэвид Иглмен
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 20 страниц) [доступный отрывок для чтения: 7 страниц]
Спрашивается, почему эти диковинные подходы оказались эффективными? Да просто потому, что поступающие в мозг данные – фотоны через глаза, колебания сжатого воздуха через уши или давление стерженьков на поверхность спины – преобразуются в знакомые, привычные мозгу электрические импульсы. Во всех случаях, когда они несут информацию о каких-то важных особенностях окружающей обстановки, мозг обязательно выучивается интерпретировать их. Обширным нейронным лесам в мозге неважно, какими маршрутами прибывают в них импульсы. Бах-и-Рита довольно образно описал это в интервью, данном в 2003 году общественному телеканалу PBS:
«Если я смотрю на вас, ваше изображение не проникает дальше моей сетчатки. От сетчатки и далее к мозгу, ко всем остальным его отделам, передаются только импульсы по нервным путям. Эти импульсы ничем не отличаются от тех, что проходят вдоль большого пальца ноги. Те тоже несут такую же информацию и тоже имеют частоту и паттерны. Если можно было бы натренировать мозг извлекать информацию такого рода, то глаза для того, чтобы видеть, уже не требовались бы».
Иными словами, кожа стала проводящим путем для поставки информации в мозг, лишившийся нормально функционирующих глаз. Но как такое могло произойти?
Трюк на все случаи жизни
Кора головного мозга выглядит примерно одинаково на всем протяжении своих холмов и долин. Но если применить нейровизуализацию или погрузить в желеобразную ткань мозга крохотные электроды, обнаруживается, что в разных областях коры таятся разные типы информации. Эти различия позволили нейробиологам классифицировать области мозга по их специализации. Так сказать, навесить на каждую свой ярлычок: эта область отведена под зрение, та – под слух, а вон тот участочек – под прикосновения к большому пальцу левой ноги. Но что, если эти области стали тем, чем стали, в силу лишь специфики входных сенсорных данных? Что, если «зрительная» кора только потому зрительная, что к ней поступает зрительная информация? Что, если специализация формируется особенностями входных информационных каналов, а не генетической заданностью кортикальных модулей? В рамках такой логики кора представляет собой универсальную машину обработки данных. Введите информацию, и кора не только ее обработает, но и вытащит из нее статистические закономерности[106]106
Гипотезу о том, что кора головного мозга везде фундаментально одинакова, но приобретает форму под действием входящих потоков информации, первоначально изучал нейрофизиолог Вернон Маунткасл; позже ученый и изобретатель Джефф Хокинс реанимировал гипотезу Маунткасла и подарил ей новую жизнь. См. Hawkins J, Blakeslee S (2005). On Intelligence (New York: Times Books).
[Закрыть]. Проще говоря, кора жаждет получать информацию, и в каком бы виде ни поступали данные, вычислительные кортикальные мощности применяют к ним одни и те же алгоритмы. В этом смысле ни одному участку коры изначально не предписано конкретное назначение, например служить зрительной корой, слуховой или какой-либо еще. Значит, независимо от того, желает ли организм воспринимать акустические волны или фотоны, от него требуется только одно: подключить к коре подающие входной сигнал пучки нервных волокон, а шестислойный вычислительный механизм коры запустит очень общий алгоритм и извлечет правильный тип информации. Специализацию участку коры назначает тип поступающих к ней данных.
Вот теперь понятно, почему неокортекс[107]107
Неокортекс (лат. neocortex) – верхний слой полушарий мозга. Эволюционно самые молодые области, которые у высших млекопитающих составляют основную часть коры. Неокортекс отвечает за высшие нервные функции – сенсорное восприятие, выполнение моторных команд, осознанное мышление, речь у людей. Состоит из шести слоев нейронов, которые объединяются в своеобразные вертикальные популяции, так называемые колонки кортекса. Прим. ред.
[Закрыть] на всем своем протяжении выглядит одинаково: неокортекс и есть везде одинаковый. Каждый клочок кортикальной территории обладает плюрипотентностью, это означает, что в нем заложены возможности дифференцироваться в разнообразные по назначению типы коры, а в какой конкретно тип он разовьется, зависит от того, что к нему подключено.
Следовательно, если в коре имеется отвечающий за слух участок, то это только потому, что определенное периферическое устройство (в данном случае уши) посылает входные сигналы по нервным путям, которые ведут именно в этот участок. Он функционально является слуховой зоной не в силу абстрактной необходимости, а лишь потому, что такую судьбу ему определили сигналы, поступающие по восходящим нервным путям от ушей. Представим, что в альтернативной вселенной к этому участку подключены нервные волокна, передающие зрительную информацию; тогда в наших учебниках эта зона коры будет обозначена как зрительная. Иными словами, кора выполняет стандартные операции с любой поступающей к ней информацией. По первому впечатлению, сенсорные поля в мозге заранее распределены, но на самом деле их определяют получаемые данные[108]108
Pascual-Leone A, Hamilton R (2001). The metamodal organization of the brain, in Vision: From Neurons to Cognition, ed. C Casanova and M Ptito (New York: Elsevier Science), 427–445.
[Закрыть].
В центральных штатах США рыбные рынки располагаются в городах, где процветает пескетарианство (отказ от употребления мяса теплокровных животных). Здесь на каждом углу встретишь суши-рестораны, где помимо прочего изобретают новые рецепты блюд из морепродуктов, – условно назовем эти города первичной рыбуальной корой.
Давайте поразмышляем, почему их география сложилась именно в такую конфигурацию, а не какую-либо иную? А потому, что здесь протекает много рек и в них много рыбы. Представим, что это не рыба, а биты информации, которые текут по информационным каналам (их роль в данном случае играют реки) в города, где само собой формируется распределение этих данных по функциональным полям – рыбным ресторанам. Заметьте, никакой законодательный орган не предписывал рыбным рынкам стянуться именно в эту часть страны, они сами собой гроздьями наросли здесь.
Из сказанного можно вывести гипотезу, что участок мозговой ткани (допустим, в слуховой коре) не представляет собой нечто особенное. Значит ли это, что можно отсечь у эмбриона кусочек слуховой коры и пересадить его в кору зрительную, где он будет функционировать, как полагается последней? Безусловно. Именно это продемонстрировали эксперименты на животных, проводившиеся в начале 1990-х годов: в кратчайшее время после операции пересаженная ткань уже выглядела и функционировала точно так же, как остальная зрительная кора[109]109
Sur M (2001). Cortical Development: Transplantation and rewiring studies, in International Encyclopedia of the Social and Behavioral Sciences, ed. N Smelser and P Baltes (New York: Elsevier).
[Закрыть].
Затем ученые еще на шаг продвинулись в демонстрации возможностей коры. В 2000 году исследователи из Массачусетского технологического института перенаправили восходящие нервные пути от глаз хорька в слуховую кору, в результате чего она стала получать зрительные данные. К чему это привело? Слуховая кора скорректировала свои нейронные связи так, что они стали похожи на связи, характерные для первичной зрительной коры[110]110
Sharma J, Angelucci A, Sur M (2000). Induction of visual orientation modules in auditory cortex, Nature 404: 841–847. Клетки в этой обновленной слуховой коре теперь реагируют, скажем, на различную пространственную ориентацию линий.
[Закрыть]. Животные с такими переподключенными нейронными связями воспринимали входящие в слуховую кору сигналы как нормальное зрение. Отсюда делаем вывод: судьбу коры определяют паттерны входных сигналов. Мозг гибко монтирует свою сеть, чтобы наилучшим образом представлять (и в конечном счете использовать как руководство) любые данные, какие ему доведется получить (рис. 4.10)[111]111
Хочу предупредить об одной тонкости (подробнее рассмотрим ее в следующих главах): мозг приходит в мир не как абсолютно чистый лист. И по этой причине у хорька реагирующая на визуальные данные слуховая кора несколько неряшливее в кодировании по сравнению с нормальной зрительной корой. Генетические настройки местного значения придают одним участкам коры чуть большую предрасположенность к определенному типу входящей сенсорной информации. Между жестко заданными планами построения (генетикой) и гибкостью в зависимости от вида активности (живая, динамически переменчивая нейронная связь), как между краями спектра, располагается непрерывный диапазон постепенно меняющихся значений. Почему так? Потому что в масштабах эволюционного времени устойчивые входные данные медленно переходят из разряда заученного на протяжении жизни в разряд генетически запрограммированного. А наша цель – сосредоточить внимание на колоссальной гибкости мозга, наблюдаемой в пределах продолжительности человеческой жизни.
[Закрыть].
Рис. 4.10. Зрительные нервные волокна в мозге хорька были перенаправлены в слуховую кору, после чего она начала обрабатывать зрительную информацию
Печатается с разрешения автора
Сотни исследований пересадки кортикальной ткани и переподключения входных сигналов подтверждают правоту модели, рассматривающей мозг как универсальное вычислительное устройство – машину, которая производит стандартные операции с притекающими данными, будь то вид резвящегося на лужайке кролика, звук телефонного звонка, вкус арахисового масла, запах салями или прикосновение шелка к щеке. Мозг анализирует поступившие данные и помещает в контекст «что я могу с этим сделать?». Вот почему незрячему могут быть полезны входные данные, даже когда они поступают от прикосновений к спине, от ушей или со лба.
* * *
В 1990-х годах Бах-и-Рита с коллегами задумали сконструировать устройство для незрячих габаритами поменьше, чем громоздкое стоматологическое кресло, и разработали совсем маленький прибор, который назвали BrainPort[112]112
Bach-y-Rita P et al. (2005). Late human brain plasticity: vestibular substitution with a tongue brainport human-machine interface, Intellectica 1 (40): 115–122; Nau AC et al. (2015). Acquisition of visual perception in blind adults using the brainport artificial vision device, Am J Occup Ther 69 (1): 1–8; Stronks HC et al. (2016). Visual task performance in the blind with the brainport V100 vision aid, Expert Rev Med Devices 13 (10): 919–931.
[Закрыть]. На лоб слепому человеку помещают видеокамеру, сигналы от которой в виде электрических импульсов передаются в помещаемую на язык плату с электродами размером чуть более 3 см2 – «наязычный дисплей» (Tongue Display Unit, TDU) (рис. 4.11).
Рис. 4.11. Зрение посредством языка
Javier Fadul, Kara Gray, and Culture Pilot
Электроды создают слабые разряды тока, коррелирующие с расположением пикселей, а язык ощущает покалывания, как от взрывной карамели-шипучки Pop Rocks (другая аналогия – пузырьки шампанского). Яркие пиксели кодируются в виде сильных покалываний в соответствующих точках на языке, пиксели побледнее – как покалывания умеренной силы, а черные не производят вообще никакого воздействия. BrainPort позволяет различать визуальные объекты с оптической резкостью примерно в 20/800 остроты зрения[113]113
Sampaio E, Maris S, Bach-y-Rita P (2001). Brain plasticity: “visual” acuity of blind persons via the tongue, Brain Res 908 (2): 204–207.
[Закрыть]. Пользователи говорят, что сначала воспринимают стимуляции как хаотичное смешение неузнаваемых краев и форм, но потом начинают распознавать их, что позволяет оценить расстояние между предметами, их форму, направление движения и размер[114]114
Levy B (2008). The blind climber who “sees” with his tongue, Discover, June 22, 2008.
[Закрыть].
Мы воспринимаем язык прежде всего как орган вкуса, но не будем забывать, что он усеян множеством тактильных рецепторов (это они позволяют вам воспринимать текстуру пищи) и потому может служить превосходным машинно-мозговым интерфейсом[115]115
Bach-y-Rita P et al. (1969). Vision substitution by tactile image projection, Nature 221: 963–964; Bach-y-Rita P (2004). Tactile Sensory Substitution Studies, Ann NY Acad Sci 1013: 83–91.
[Закрыть]. Электродная плата на языке, как и другие визуально-тактильные устройства, напоминает нам, что зрение возникает не в глазах, а в мозге. При визуализации мозга у натренированных индивидов (слепых или зрячих) изменения электротактильных разрядов на языке активируют зону мозга, которая в норме задействуется для восприятия видимого движения[116]116
Эту область обозначают как MT+. См. Matteau I et al. (2010). Beyond visual, aural, and haptic movement perception: hMT+ is activated by electrotactile motion stimulation of the tongue in sighted and in congenitally blind individuals, Brain Res Bull 82 (5–6): 264–270. См. также Amedi A et al. (2010). Cortical activity during tactile exploration of objects in blind and sighted humans, Restor Neurol Neurosci 28 (2): 143–156; Merabet L et al. (2009). Functional recruitment of visual cortex for sound encoded object identification in the blind, Neuroreport 20 (2): 132. У незрячих также активируются многие другие участки затылочной доли коры, именно этого нам и следует ожидать вследствие кортикальных захватов, которые мы рассматривали в главе 3.
[Закрыть].
Как и в случае с соленоидной решеткой на спине, незрячие пользователи BrainPort со временем начинают чувствовать, что визуальная картинка обладает открытостью и глубиной и что объекты располагаются снаружи. Иными словами, их ощущения выходят за рамки осмысления происходящего на поверхности языка и перерастают в непосредственный опыт восприятия. Оно не описывается в понятиях «я чувствую на языке схему электрических разрядов, в которых закодировано, что “мимо меня прошла моя жена”», а создает непосредственное впечатление, что жена проходит через гостиную. Если у вас нормальное зрение, примите к сведению, что ваши глаза работают точно так же: электрохимические сигналы на сетчатке воспринимаются вами как образ приятеля, который машет вам рукой, образ проносящейся мимо Ferrari или алого воздушного змея на фоне небесной синевы. Даже притом что все это происходит на поверхности ваших сенсорных детекторов, вы воспринимаете это как происходящее снаружи. И не имеет значения, выступают ли детектором глаза или язык. Вот как описывает опыт пользования прибором BrainPort незрячий участник испытаний Роджер Бэм:
«Первый раз я пришел сюда в прошлом году, и тогда мы проделывали разные упражнения за столом на кухне. Я немножко разнервничался, потому что на тот момент уже 33 года вообще не видел. И я смог протянуть руку точно в направлении шаров, которые лежали на столе, и видел, что они разного размера. То есть я зрительно воспринимал их. Я видел, куда протянуть руку, чтобы взять шары, – не шарить по столу или чувствовать, где они, а именно взять, и еще видел чашку: я поднял руку и опустил точно на нее»[117]117
WIRED Science video: “Mixed Feelings”.
[Закрыть].
Как вы уже догадываетесь, тактильную информацию можно подавать на кожу любого участка тела. Японские ученые разработали свой вариант тактильной платы – налобный, который называется Forehead Retina System (рис. 4.12). Изображение с миниатюрной видеокамеры преобразуется в электрические импульсы и передается в виде точечных раздражений тактильных рецепторов лба, рисуя на нем упрощенный контур изображения[118]118
Forehead Retina System – разработка японской корпорации EyePlusPlus Inc. и Tachi Laboratory Токийского университета. Для имитации сетчатки в приборе применяется выделение контуров (для повышения контрастности) и временная фильтрация полосы частот.
[Закрыть]. Почему вдруг лоб? А почему бы и нет? Поверхность лба вообще мало для чего используется, вот пусть и послужит.
Рис. 4.12. Технология Forehead Retina System
Javier Fadul, Kara Gray, and Culture Pilot
В другой версии этой технологии плата вибротактильного датчика (соленоида) помещается на живот; интенсивность сигнала отображает расстояние до ближайших поверхностей[119]119
Это хороший способ не позволять талии попусту бездельничать. См. Lobo L et al. (2018). Sensory substitution: using a vibrotactile device to orient and walk to targets, J Exp Psychol Appl 24 (1): 108. См. также Lobo L et al. (2017). Sensory substitution and walking toward targets: an experiment with blind participants. Исследования авторов показывают, что траектории движения незрячих не планируются заранее, а прокладываются прямо во время движения по мере поступления новой информации об окружающей обстановке.
[Закрыть].
Описанные технологии объединены тем, что мозг соображает, как придать смысл визуальным данным, поступающим через входные каналы, которые принято считать тактильными. Но, как выясняется, тактильные ощущения не единственная плодотворная стратегия для создания зрительной картинки у незрячих.
Видящие уши
Как-то, несколько лет назад, к нам в лабораторию зашел Дон Вон: глаза зажмурены, а в руках прямо перед собой он держит iPhone и начинает расхаживать туда-сюда, при этом ухитряясь не натыкаться на столы, шкафы и прочее, как будто все это видит. Как оказалось, в его уши через наушники-пуговки вливались потоки звуков и усердно преобразовывали визуальную картину окружающей обстановки в звуковой ландшафт. Дон учился видеть помещение ушами. Он плавно водил телефоном из стороны в сторону – словно это был третий глаз или миниатюрная тросточка вроде тех, с какими ходят незрячие, – поворачивал его то в одну сторону, то в другую, вытягивая из пространства нужную ему информацию о расположении предметов. Таким образом мы экспериментально выясняли, может ли незрячий индивид собирать зрительную информацию через уши. Не удивлюсь, если вы не слыхали об этой технологии, разработанной в помощь слепым, но ее идея не нова: исследования в данном направлении начались более чем полвека назад.
В 1966 году профессора Лесли Кея[120]120
Лесли Кей (1922–2020) – британско-новозеландский инженер-электрик, особенно известный разработкой ультразвуковых устройств для помощи слепым. Прим. ред.
[Закрыть] пленила красота механизма эхолокации у летучих мышей. Он знал, что некоторым людям тоже дано развить в себе необычный дар ориентироваться в пространстве по отраженным от разных поверхностей звуковым импульсам, однако дело это очень сложное. И Кей сконструировал очки, чтобы незрячие люди смогли воспользоваться преимуществами эхолокации (рис. 4.13)[121]121
Kay L (2000). Auditory perception of objects by blind persons, using a bioacoustic high resolution air sonar, J Acoust Soc Am 107 (6): 3266–3276. Акустические очки впервые были представлены публике в середине 1970-х годов и после дебюта прошли многие этапы дальнейшего усовершенствования. См. Binaural Sensory Aid Кея (стереофоническое сенсорное устройство для слепых) и представленную им позже более совершенную систему KASPA – Kay’s Advanced Spatial Perception Aid, которая отображает текстуру поверхностей через различия в тембре звука. Разрешение у подобных ультразвуковых устройств невысокое, особенно в вертикальной плоскости, и потому акустические очки наиболее полезны для обнаружения объектов, расположенных в узкой горизонтальной полосе пространства.
[Закрыть]. Правда, довольно громоздкие.
Рис. 4.13. Незрячий мужчина в акустических очках Кея, справа (на самом профессоре очки не акустические, а просто с очень толстыми стеклами)
Ted West / Hulton Archive / Getty Images
Очки излучали в пространство ультразвук. Благодаря очень малой длине волны ультразвук способен дать информацию о мелких объектах, отражаясь от их поверхностей. Электронная начинка очков улавливала отраженные от объектов волны и преобразовывала в звуковые сигналы воспринимаемой человеческим ухом частоты, причем высота звука указывала расстояние до объекта: высокие звуки обозначали объекты, расположенные в отдалении, низкие – находящиеся вблизи. Габариты объекта передавались через силу звука: громкий звук означал, что объект крупногабаритный, негромкий – что мал размерами. Для передачи характера поверхности использовалась чистота звучания: чистый звук означал гладкую поверхность объекта, а если она была грубой и шероховатой, к звукам примешивались шумы. Пользователи устройства научались очень неплохо обходить препятствия, однако ввиду низкого разрешения устройства Кей и его коллеги решили, что их изобретение следует считать скорее помощью, нежели заменой передвижения с собакой-поводырем или с тростью.
Хотя незрячим индивидам акустические очки Кея могли быть разве что умеренно полезны, открытым оставался вопрос, насколько хорошо могли бы обучиться интерпретировать их сигналы незрячие дети, если учесть поразительную пластичность детского мозга. Продуктивность этой идеи в 1974 году решил проверить психолог Томас Бауэр из Калифорнии, взявший для испытаний модифицированную версию очков Кея. В качестве испытуемого был выбран четырехмесячный младенец с врожденной слепотой[122]122
Bower TGR (1978). Perceptual development: object and space, in Handbook of Perception, vol. 8, Perceptual Coding, ed. EC Carterette and MP Friedman (New York: Academic Press). См. также Aitken S, Bower TGR (1982). Intersensory substitution in the blind, J Exp Child Psychol 33: 309–323.
[Закрыть]. В первый день Бауэр брал предмет и медленно водил им перед носом малыша. Когда он проводил предмет в четвертый раз, глаза ребенка сошлись к переносице, как бывает, если поднести что-то близко к глазам. Бауэр отвел предмет в сторону, и глазки малыша вернулись к нормальному положению. После нескольких циклов такого упражнения младенец при приближении объекта уже поднимал ручонки. Когда находившийся перед ним предмет перемещался вправо или влево, малыш поворачивал вслед за его движением головку и старался ударить по нему ручкой.
В отчете о результатах эксперимента Бауэр упоминает еще несколько форм поведения, отмеченных у маленького испытуемого:
«Младенец с надетым на него устройством лежал лицом к матери, пока та ворковала с ним. Он медленно поворачивал головку в сторону, чтобы удалить ее из звукового поля, затем так же медленно возвращал в прежнее положение, чтобы мать снова оказалась в его звуковом поле. Это действие повторялось несколько раз подряд и сопровождалось широкой, радостной улыбкой ребенка. У всех троих наблюдателей сложилось четкое впечатление, что малыш играет с матерью в своего рода прятки, что доставляет ему огромное удовольствие».
Далее Бауэр сообщает о примечательных результатах, достигнутых в следующие несколько месяцев:
«После этих первоначальных приключений малыш развивался более-менее на одном уровне со зрячими ровесниками. Руководствуясь акустическими подсказками, он, как представлялось, мог узнавать любимую игрушку, не прикасаясь к ней. В возрасте около шести месяцев малыш начал протягивать к предметам обе ручки. А к восьми месяцам уже мог найти предмет, спрятанный за другим предметом. Подобные формы поведения обычно и близко не наблюдаются у младенцев с врожденной слепотой».
Тут вам самое время удивиться, почему вы раньше не слышали, чтобы кто-то пользовался подобным акустическим устройством для слепых. Но, как мы уже видели, технологическое решение имело серьезные недостатки, в частности громоздкость и немалый вес (не такая это была вещь, чтобы, пользуясь ею, ребенок мог расти, не испытывая неудобств), а разрешающая способность оставалась низкой. Кроме того, результаты испытаний акустических очков у взрослых в целом свидетельствовали о меньшем успехе, чем у детей[123]123
Дело в том, что ввиду снижающейся с возрастом пластичности мозга сенсорное замещение требуется разрабатывать индивидуально – как под текущий возраст, так и с учетом возраста приобретения слепоты. См. Bubic, Striem-Amit, Amedi (2010).
[Закрыть] (к этой теме мы вернемся в главе 9). Таким образом, хотя сенсорное замещение и прижилось в науке, придется подождать, пока для его продуктивного использования сложится правильная комбинация факторов.
* * *
В начале 1980-х годов нидерландский физик Питер Мейер принял эстафету в разработке теории, рассматривающей ухо как средство трансляции мозгу зрительной информации. Эхолокация его не занимала, зато сильно интересовал вопрос, возможно ли преобразовать в звук входной поток видеоданных.
Мейер знал о работах Бах-и-Риты по преобразованию видеоданных в тактильные ощущения, однако небеспочвенно подозревал, что человеческое ухо наделено большей способностью вбирать и усваивать информацию. Его недостатком в данном контексте выступала меньшая интуитивность преобразования зрительных сигналов в слуховые. При использовании устройства на основе стоматологического кресла Бах-и-Риты формы окружности, лица или человеческой фигуры непосредственно прорисовывались на коже и потому были легко распознаваемы. А как преобразовать в звук сотни пикселей изображения?
Тем не менее к 1991 году Мейер разработал версию системы на персональном компьютере, а к 1999 году сконструировал комплект из встроенной в очки миниатюрной камеры и носимого на поясе компьютера. Свою систему он назвал vOICe: все буквы складывались в слово «голос» (англ.), а три средние служили аббревиатурой возгласа Oh, I see! – «О, я вижу!»[124]124
Meijer PB (1992). An experimental system for auditory image representations, IEEE Trans Biomed Eng 39 (2): 112–121.
[Закрыть]. Заложенный в систему алгоритм обрабатывал звук по трем измерениям: высоту объекта передавала частота, положение в горизонтальной плоскости передавалось панорамированием стереовхода (представьте, что звук перемещается из левого уха в правое, как если бы вы скользили взглядом, разглядывая картину или сценку), о яркости объекта давала представление сила звука. Система позволяла получить визуальное представление об объекте в градациях серого цвета с разрешением порядка 60 × 60 пикселей[125]125
Технические подробности см. на www.seeingwithsound.com, и там же можно послушать, как звучит работающий vOICe-алгоритм.
[Закрыть].
Попробуем представить опыт эксплуатации таких очков. Сначала мы слышим лишь какофонию звуков. Затем, двигаясь по помещению, – чуждые уху бессмысленные жужжания и завывания. Через некоторое время мы начинаем соображать, как руководствоваться этими звуками, чтобы перемещаться, не налетая на предметы. На данной стадии приходится выполнять когнитивное упражнение: мы с мучительным трудом учимся переводить хаос из разрозненных звуков в подсказки для успешного перемещения.
Важные перемены происходят чуть позже. По прошествии недель или месяцев незрячие пользователи vOICe осваиваются и начинают передвигаться вполне успешно[126]126
Arno P et al. (1999). Auditory coding of visual patterns for the blind, Perception 28 (8): 1013–1029; Arno P et al. (2001). Occipital activation by pattern recognition in the early blind using auditory substitution for vision, Neuroimage 13 (4): 632–645; Auvray M, Hanneton S, O’Regan JK (2007). Learning to perceive with a visuo-auditory substitution system: localisation and object recognition with “the vOICe”, Perception 36: 416–430; Proulx MJ et al. (2008). Seeing “where” through the ears: effects of learning-by-doing and long-term sensory deprivation on localization based on image-to-sound substitution, PLoS One 3 (3): e1840.
[Закрыть], но не потому, что запомнили значение того или иного звука, – напротив, теперь слепые могут в некотором смысле видеть. Они переживают зрительный опыт, используя прибор с необычно низкой разрешающей способностью[127]127
Cronly-Dillon J, Persaud K, Gregory RP (1999). The perception of visual images encoded in musical form: a study in cross-modality information transfer, Proc Biol Sci 266 (1436): 2427–2433; Cronly-Dillon J, Persaud KC, Blore R (2000). Blind subjects construct conscious mental images of visual scenes encoded in musical form, Proc Biol Sci 267 (1458): 2231–2238.
[Закрыть]. Женщина, потерявшая зрение в 20 лет, так описала свои впечатления от применения устройства:
«Недели за две-три у тебя развивается представление о звуковом ландшафте. Примерно месяца через три или около того ты начинаешь видеть нечто вроде вспышек в окружающей обстановке и уже можешь различать предметы, просто глядя на них… Это в общем-то зрение. Я знаю, что такое зрение. Я помню, каково это»[128]128
Отзыв Пэт Флетчер из статьи в журнале американского общества слепых ACB Braille Forum – цит. по Maidenbaum S et al. (2014). Sensory substitution: closing the gap between basic research and widespread practical visual rehabilitation, Neurosci Biobehav Rev 41: 3–15.
[Закрыть].
Решающее значение имеет непрерывная неукоснительная тренировка. Как и в случае с кохлеарными имплантатами, могут потребоваться многие месяцы, прежде чем мозг приспособится извлекать смысл из звуковых сигналов устройства. К этому моменту изменения в мозге уже измеримы методом нейровизуализации. Вполне определенный участок (латеральная затылочная кора) в норме реагирует на информацию о форме предметов, и неважно, определяется ли она зрением или осязанием. После нескольких дней ношения очков этот участок коры начинает реагировать на звуковой ландшафт[129]129
У Amedi et al (2007) конкретно продемонстрирована активность в латеральной затылочной тактильной визуальной области (LOtv). Как представляется, эта область кодирует информацию о форме – активируется ли она зрением, осязанием, заучиванием или, как зрительный ландшафт, транслируется в звуковой. См. Amedi et al (2007). Shape conveyed by visual-to-auditory sensory substitution activates the lateral occipital complex, Nat Neurosci 10: 687–689. Краткое обобщение опыта одного из пользователей см. в Piore A (2017). The Body Builders: Inside the Science of the Engineered Human (New York: Ecco).
[Закрыть]. Рост эффективности пользования устройством происходит параллельно с масштабами церебральной реорганизации[130]130
Collignon O et al. (2007). Functional cerebral reorganization for auditory spatial processing and auditory substitution of vision in early blind subjects, Cereb Cortex 17 (2): 457–465.
[Закрыть].
Иными словами, мозг придумывает, как извлечь информацию о форме предметов из входных сигналов, по каким бы проводящим путям – через зрение, осязание или слух – они ни поступали в его святая святых. Какой именно орган чувств посылает их – второстепенная подробность. Самое главное – поступающая в мозг информация.
В первые годы XXI века ряд исследовательских лабораторий начали использовать широкие возможности мобильных телефонов и принялись разрабатывать мобильные приложения, преобразующие входящие визуальные данные в исходящие аудиоданные. Незрячие люди направляют камеру телефона на пространство перед собой, а приложение преобразует зрительную картину в звуковую и транслирует им в наушники. Приложение vOICe, например, можно бесплатно скачать на мобильник в любой точке мира.
Отметим, что vOICe не единственная технология замещения визуальных сигналов звуковыми; в последние годы подобные технологии появляются в изобилии. Например, разработано приложение EyeMusic, которое использует музыкальные тоны для отображения положения объектов в вертикальной плоскости: чем выше располагается пиксель изображения, тем выше музыкальный тон. Для обозначения правого или левого положения пикселя используется временной интервал: ноты, зазвучавшие раньше, указывают, что объект слева; позже – справа. Система даже умеет передавать цвета через звук разных музыкальных инструментов: белый – звучит вокал, синий – труба, красный – орган, зеленый – дудочка, желтый – скрипка[131]131
Abboud S et al. (2014). EyeMusic: Introducing a “visual” colorful experience for the blind using auditory sensory substitution, Restor Neurol Neurosci 32 (2): 247–257. Технология EyeMusic опирается на более раннюю технологию SmartSight: Cronly-Dillon et al. (1999, 2000).
[Закрыть]. Применяются также имитирующие эхолокацию технологии, модуляция громкости в зависимости от расстояния до объектов и многие другие идеи[132]132
Massiceti D, Hicks SL, van Rheede JJ (2018). Stereosonic vision: Exploring visual-to-auditory sensory substitution mappings in an immersive virtual reality navigation paradigm, PLoS One 13 (7): e0199389; Tapu R, Mocanu B, Zaharia T (2018). Wearable assistive devices for visually impaired: A state of the art survey, Pattern Recognit Lett; Kubanek M, Bobulski J (2018). Device for acoustic support of orientation in the surroundings for blind people, Sensors 18 (12): 4309. См. также Hoffmann R et al. (2018). Evaluation of an audio-haptic sensory substitution device for enhancing spatial awareness for the visually impaired, Optom Vis Sci 95 (9): 757.
[Закрыть].
Повсеместное распространение смартфонов позволило человечеству отойти от громоздких компьютеров и приобрести колоссальную вычислительную мощь в кармане. Смартфоны дают не только выигрыш в эффективности и скорости, но и шанс в глобальном масштабе улучшить ситуацию с помощью устройств сенсорного замещения, в особенности с учетом того, что 87 % людей с нарушениями зрения проживают в развивающихся странах[133]133
В развивающемся мире самая распространенная причина слепоты – трахома (инфекционная болезнь, которую вызывают хламидии), по вине которой зрения лишились почти 2 млн человек. Второй по распространенности причиной выступает эндемическое для тридцати африканских стран заболевание онхоцеркоз. Многие ученые считают, что сенсорно-заместительное программное обеспечение поможет заново научить видеть тех, кто лишился зрения, в сочетании с другими видами терапии (например, хирургией роговицы).
[Закрыть]. Недорогие мобильные приложения для сенсорного замещения можно распространить по всему миру, поскольку это не требует постоянных издержек на производство, физическое распространение или пополнение запасов, как и не вызывает неблагоприятных побочных эффектов. В этом смысле вдохновленный нейробиологией подход можно считать малозатратным, быстро развертываемым и применимым для решения глобальных проблем здоровья человека.
* * *
Если вас удивляет, что незрячие люди могут «прозреть» за счет языка или звуков в наушниках смартфона, вспомните, как они учатся читать шрифт Брайля. Поначалу под кончиками пальцев не чувствуется ничего, кроме странных, хаотически рассыпанных бугорков. Но вскоре хаос перерастает в нечто намного большее: мозг перестает обращать внимание на необычность средства доставки сигналов (осязание выпуклых точек кончиками пальцев) и сосредоточивается на смысле образуемых ими символов. Опыт чтения брайлевского текста аналогичен вашему, когда вы ведете глазами по этим строчкам: хотя буквы имеют произвольную форму, вы обходите стороной частные подробности данного средства передачи информации (форма букв) и напрямую усваиваете смысл нарисованного ими узора.
Новичку, в первый раз применяющему наязычный дисплей или наушники с системой замещения видеоданных звуковыми, требуется переводить входные сигналы в что-то осмысленное: звуки, генерируемые визуальной картинкой (скажем, собакой, входящей в гостиную с косточкой в зубах), мало что говорят о происходящем вокруг. Это аналогично тому, как если бы ваши нервные волокна вдруг начали транслировать мозгу послания на иностранном языке. Но при достаточной практике мозг способен обучиться переводить звуки в зрительные образы. И как только он этому научится, создаваемая звуками визуальная картинка станет вам понятна и очевидна.
Эти благословенные вибрации
Принимая во внимание, что примерно 5 % населения Земли из-за тяжелой формы тугоухости обречены на инвалидность, ученые несколько лет назад начали плотно изучать генетические корни заболевания[134]134
Koffler T et al. (2015). Genetics of hearing loss, Otolaryngol Clin North Am 48 (6): 1041–1061.
[Закрыть]. К сожалению, на настоящий момент наука выявила более 220 генов, так или иначе связанных с глухотой. Это большое разочарование для тех, кто надеется на простые способы излечения, хотя удивляться по большому счету нечему. В конце концов, слуховая система подобна симфоническому оркестру, каждый инструмент которого тонко настроен на гармоничное взаимодействие с остальными. А всякая сложная система подвержена сотням различного рода сбоев. Малейшая неполадка в работе хотя бы одного элемента нарушает функционирование всей системы, из-за чего развивается тугоухость. Многие ученые посвящают себя поиску способов «починки» отдельных элементов слуховой системы. А мы с вами подойдем к проблеме с позиций живой нейронной сети мозга: чем принципы сенсорного замещения могли бы помочь восстановлению способности слышать?
Движимые этой идеей, мы с моим бывшим аспирантом Скоттом Новичем решили придумать устройство для сенсорного замещения слуха. И нацелились сконструировать устройство совершенно незаметное – настолько, чтобы посторонние даже не заподозрили, что оно у вас есть. В этих целях мы использовали ряд достижений из области высокопроизводительных вычислений и получили носимое под одеждой устройство, позволяющее воспринимать звук посредством осязания. Наш сенсорный жилет – Neosensory Vest – улавливает звуки внешней среды и конвертирует их в вибрации, которые передаются на кожу встроенными в жилет моторчиками (рис. 4.14). Это позволяет человеку кожей ощущать звуковую картину окружающей реальности.
Рис. 4.14. Сенсорный жилет Neosensory Vest. Звук передается коже и воспринимается как различимые паттерны вибраций
Syed Rahman
Если вы не верите, что такой способ может возыметь эффект, напомню, что ровно то же самое проделывает ваше внутреннее ухо: раскладывает звук на частоты (от низких до высоких) и в таком виде сгружает данные мозгу для интерпретации. В сущности, мы всего лишь переместили внутреннее ухо на кожу.
Уму непостижимо, какими изощренными вычислительными возможностями обладает человеческая кожа, однако в современной жизни они мало используются. Если бы какой-нибудь стартап в Кремниевой долине синтезировал подобный материал, за него отвалили бы огромные деньги, хотя он в натуральном виде имеется под одеждой у каждого из нас. Правда, почти все время простаивает без дела. Конечно, задействовать столь чувствительный орган было бы неплохо, но сразу возникает вопрос: достаточно ли широка у него полоса пропускания[135]135
Полоса пропускания (прозрачности) – диапазон частот, в пределах которого амплитудно-частотная характеристика (АЧХ) акустического, радиотехнического, оптического или механического устройства достаточно равномерна для того, чтобы обеспечить передачу сигнала без существенного искажения его формы. Прим. ред.
[Закрыть], чтобы передавать звуковую картину во всей полноте. Напомню, что ушная улитка – в высшей степени специализированная структура, ее изысканно-прихотливая форма идеальна для приема и кодирования звука. Кожа, в отличие от улитки, предназначена для восприятия воздействий совсем иного рода, а ее пространственное разрешение оставляет желать лучшего. Для передачи на кожу всей полноты информации, которую играючи улавливает внутреннее ухо, потребовалось бы несколько сотен вибротактильных моторчиков – слишком много, чтобы навесить их на человека. Но за счет сжатия речевой информации можно обойтись менее чем тремя десятками моторчиков. Как это может быть? Суть сжатия речевых сигналов заключается в извлечении максимума смысла из информации любого объема. Возьмем, например, разговор по сотовому телефону: вы что-то говорите, а ваш голос слышит собеседник. Но на самом деле то, что он слышит, совсем не ваш напрямую передаваемый ему голос. Сотовый телефон производит цифровое семплирование, или дискретизацию, вашей речи (через равные промежутки времени берет отсчеты – семплы – аналогового, то есть непрерывного сигнала) 8 тысяч раз за секунду. Затем алгоритмы выделяют из этих тысяч отсчетов важную информацию, и этот сжатый сигнал передается на вышку сотовой связи. Посредством техники сжатия сигнала Neosensory-жилет улавливает звуки и «проигрывает» эту звуковую картину на коже за счет вибрации десятков моторчиков[136]136
Novich SD, Eagleman DM (2015). Using space and time to encode vibrotactile information: Toward an estimate of the skin’s achievable throughput, Exp Brain Res 233 (10): 2777–2788. См. также Neosensory.com. Можно ли было выбрать что-либо другое помимо вибрации? На самом деле кожа наделена рецепторами нескольких типов, и их тоже можно использовать для передачи информации – помимо вибраций через температуру, почесывание, болевые ощущения и растяжения. Но мы решили сосредоточиться на вибрациях, так как этот способ самый быстрый. Температура воспринимается медленнее, к тому же не имеет выраженной локализации. Тензорецепторы многообещающи в плане пространственных и временных свойств, но в долгосрочной перспективе постоянные растягивания кожи создавали бы пользователям дискомфорт. От необходимости рассуждать о болевых рецепторах меня, надо думать, избавляют общегуманные соображения.
[Закрыть].
Первым участником испытаний Neosensory-жилета стал 37-летний Джонатан с врожденной полной глухотой. На протяжении четырех дней мы просили его надевать жилет и по два часа тренироваться в распознавании набора из тридцати слов. На пятый день Скотт, прикрыв ладонью рот (чтобы нельзя было прочитать по губам), произнес слово «трогать». Джонатан ощутил на коже под жилетом сложный паттерн из вибраций и написал это слово на маркерной доске. Тогда Скотт произнес слово из другой части речи («где»), и Джонатан снова написал его правильно. Итак, он оказался способен раскодировать сложносочиненный паттерн вибраций и понять, какое слово произнесено, причем не в результате сознательного умственного усилия (паттерны вибраций слишком сложны для этого), мозг сам производит раскодирование. Затем мы переключились на изучение следующего набора слов, и Джонатан по-прежнему хорошо справлялся с заданиями, это свидетельствует о том, что он не просто запоминал отдельные конфигурации вибраций, а обучался слышать. Иными словами, если у вас со слухом все в порядке, я мог бы произнести незнакомое вам слово schmegegge (шмеджэдж, то есть полная несуразица), и вы прекрасно различили бы его – не потому, что когда-то слышали и запомнили, а потому, что умеете пользоваться слухом.
Мы разработали наше заместительное устройство в нескольких формах, в том числе как нагрудный пояс для детей (рис. 4.15). Его действие было испытано на группе глухих детей в возрасте от двух до восьми лет. На протяжении всего испытательного периода родители чуть ли не каждый день слали мне видеоролики, демонстрирующие прогресс их малышей. На первых порах было неясно, происходит ли хоть что-нибудь, а потом мы стали замечать, что дети останавливаются и сосредоточиваются, когда кто-то из родных нажимает на клавишу пианино.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?