Читать книгу "Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов"

Текст добавлен: 19 июля 2018, 11:00

Автор книги: Рэй Курцвейл

Жанр: Прочая образовательная литература, Наука и Образование

Возрастные ограничения: 12+

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 3 (всего у книги 20 страниц) [доступный отрывок для чтения: 5 страниц]

Скачать книгу

Шрифт:

- 100% +

Таким образом, наш осознанный опыт восприятия изменяется в зависимости от интерпретации.

Подумайте, мы ведь видим то, что ожидаем…

Я уверен, что вы смогли закончить предложение.

Если бы я дописал последнее слово, вам бы понадобилось лишь скользнуть по нему взглядом, чтобы подтвердить, что вы именно этого и ожидали.

Таким образом, мы постоянно предсказываем будущее и составляем гипотезы о том, что произойдет. Это ожидание влияет на наше восприятие. На самом деле главная причина, почему у нас вообще есть мозг, состоит в необходимости предсказывать будущее.

Рассмотрим каждому из нас хорошо знакомый пример: время от времени по непонятной причине у нас в голове возникают воспоминания многолетней давности.

Часто это воспоминание о каком-то человеке или событии, о котором вы не думали уже долгое время. Очевидно, что-то стало импульсом, вызвавшим это воспоминание. Иногда ход ваших мыслей можно объяснить. Иногда вы можете восстановить последовательность мыслей, вызвавших это воспоминание, но не способны ее выразить. Часто импульс быстро пропадает, и вам кажется, что мысль пришла «ниоткуда». Ко мне такие случайные воспоминания часто приходят, когда я занят какими-то рутинными делами, например чищу зубы. Иногда мне удается найти связь: свалившаяся со щетки паста напоминает мне о краске, капавшей с кисточки на уроке рисования в школе. Иногда у меня бывает лишь смутное ощущение, что связь есть, а иногда я не нахожу никакого объяснения. Близкое по сути явление, которое также знакомо каждому, состоит в попытках вспомнить имя или слово. В таких случаях мы сами пытаемся подобрать те импульсы, которые могли бы вызвать в памяти необходимую информацию. Например: Кто играл королеву Падме в «Звездных войнах»? Дайте подумать, кажется, недавно она же снималась в какой-то драме о балерине… А, это был «Черный лебедь». Ну конечно, Натали Портман! Иногда мы прибегаем к специфической мнемонике. Например: Она скорее худая, чем толстая, ну да, Портман, Натали Портман![30]30
Английское слово portly (тучный, толстый) созвучно фамилии Портман.

[Закрыть] Некоторые из наших воспоминаний достаточно прочны, так что мы можем непосредственно от вопроса (например, кто играл королеву Падме?) перейти к ответу, но иногда приходится перебрать серию импульсов, пока мы не найдем тот, который сработает. Это в значительной степени напоминает поиск нужной ссылки в Интернете. Воспоминания на самом деле могут оказаться утерянными, как странички Интернета, к которым не ведут никакие ссылки (или мы не можем их найти).

Когда выполняете какое-нибудь привычное действие (натягиваете рубашку) – проследите за собой и подумайте, в какой степени вы каждый раз следуете одной и той же схеме. Мои личные наблюдения (как я уже говорил, я постоянно наблюдаю за самим собой) свидетельствуют, что человек обычно выполняет привычные действия в одном и том же порядке, хотя иногда требуется подключение дополнительных модулей. Например, почти все мои рубашки без запонок, но, когда попадается рубашка с запонками, приходится выполнять дополнительную серию движений.

Стадии всех процессов записаны в моей голове в иерархическом порядке. Прежде чем идти спать, я выполняю стандартную серию процедур. Сначала чищу зубы. Однако этот процесс, в свою очередь, тоже состоит из нескольких этапов, первый из которых заключается в том, чтобы выдавить пасту на щетку. Этот этап тоже подразумевает несколько организованных действий: найти пасту, отвернуть колпачок и т. д. Стадия поиска пасты тоже состоит из более мелких стадий – в первую очередь нужно открыть дверь в ванную комнату. Эта вложенность действий продолжается до мельчайших деталей, так что наш вечерний туалет состоит буквально из сотен маленьких движений. И, хотя мне трудно вспомнить подробности прогулки, состоявшейся всего несколько часов назад, для меня не составляет никакой проблемы назвать все многочисленные этапы подготовки ко сну, которых так много, что, пока я их выполняю, я могу думать совершенно о других вещах. Важно отметить, что в нашей голове этот план не хранится в виде одного длинного списка из сотен движений, но каждая рутинная процедура записана как сложная иерархическая цепь вложенных действий.

Тот же иерархический механизм задействован в нашей способности распознавать объекты и ситуации. Мы узнаём лица знакомых людей, а также узнаём на этих лицах глаза, нос, рот и т. д. – это иерархия образов, которую мы применяем как для восприятия, так и для действий. Иерархия позволяет нам использовать одни и те же образы. Например, нам не нужно заново изучать, что такое нос или рот, каждый раз, когда мы видим новое лицо.

В следующей главе мы соберем результаты наших мысленных экспериментов в единую теорию, описывающую механизмы работы новой коры. Я покажу, что эти эксперименты отражают важнейшие и общие принципы мышления, одинаковые для поиска зубной пасты и сочинения стихов.

Глава третья
Модель новой коры; теория мысленного распознавания образов

Головной мозг – это ткань. Сложно сплетенная ткань, не похожая ни на что другое во Вселенной, но так же состоящая из клеток, как любая другая ткань. Это, безусловно, высокоспециализированные клетки, но функционируют они по тем же законам, что и любые другие клетки. Можно определить, зарегистрировать и интерпретировать их электрические и химические сигналы, идентифицировать химические молекулы и составить карту нервных сплетений. Короче говоря, мозг можно изучать так же, как изучают почку.

Д. Х. Хьюбел[31]31
Дэвид Хантер Хьюбел (1926–2013) – канадско-американский нейрофизиолог, лауреат Нобелевской премии по физиологии и медицине за 1981 г. «За открытия, касающиеся принципов переработки информации в нейронных структурах».

[Закрыть]

Предположим, что есть машина, производящая мысли, чувства и ощущения; вообразим, что эта машина увеличилась, но сохранила те же пропорции, так что вы можете войти в нее, как на мельницу. Вы можете осмотреть ее изнутри, но что вы там увидите? Только детали, которые толкают и двигают друг друга, и ничего другого, что могло бы объяснить восприятие.

Готфрид Вильгельм Лейбниц, 1714

Иерархия образов

Я повторял описанные выше простые эксперименты и наблюдения тысячи раз в самых разных ситуациях. Выводы из этих наблюдений неизбежно ограничивают мое представление о том, как должен работать мозг – точно так же, как простые эксперименты XIX в. по анализу времени, пространства и массы сдерживали размышления молодого Эйнштейна об устройстве Вселенной. Далее я остановлюсь на некоторых наблюдениях из нейробиологии, стараясь избегать многих пока еще неизвестных подробностей.

Прежде всего, позвольте мне объяснить, почему в этом разделе я считаю нужным поговорить о неокортексе (что в переводе с латыни буквально означает «новая кора»). Мы знаем, что именно новая кора отвечает за нашу способность обрабатывать информацию и что функционирует она по иерархическому принципу. Животные, не имеющие новой коры (в основном не млекопитающие), в большинстве своем не способны понимать иерархические построения[32]32
Считается, что некоторые не относящиеся к млекопитающим животные, такие как вороны, попугаи и осьминоги, тоже в определенной степени способны размышлять, однако эта их способность неразвита и недостаточна для того, чтобы создавать орудия. У этих животных произошла адаптация других отделов мозга, осуществляющих некоторые этапы иерархического мышления, но для неограниченного иерархического мышления, на какое способен человек, нужна новая кора.

[Закрыть]. Понимание и использование иерархической природы реальности являются исключительной способностью млекопитающих и объясняются наличием у них этой новой в эволюционном плане структуры головного мозга. Новая кора отвечает за чувственное восприятие, распознавание видимых объектов и абстрактных понятий, контроль движений, размышления (от пространственной ориентации до рационального мышления) и речь, то есть за все то, что мы называем «разумом».

Новая кора человеческого мозга, его самый внешний слой, представляет собой тонкую, практически двумерную структуру (ее толщина составляет около 2,5 мм). У грызунов она гладкая и имеет толщину почтовой марки. Эволюционной инновацией у приматов стала сложная складчатость этой структуры, образующей на поверхности остального мозга глубокие морщины, складки и бороздки, увеличивающие площадь ее поверхности. Благодаря этой сложной складчатости новая кора составляет основную часть человеческого мозга – около 80 % по массе. Высокий лоб Homo sapiens позволяет дополнительно увеличить размер новой коры. В частности, лобная доля мозга отвечает за обработку абстрактной информации и формирование сложных понятий.

Эта тонкая структура мозга состоит из шести основных слоев – от слоя I (внешний) до слоя VI. Аксоны (выходные контакты), отходящие от нервных клеток на уровне слоев II и III, проецируются в другие участки новой коры. Аксоны, отходящие от слоев V и VI, вне новой коры связываются с таламусом, стволом мозга и спинным мозгом. Нейроны слоя IV принимают синаптические (входные) сигналы от нейронов, находящихся вне новой коры, особенно в таламусе. В разных отделах мозга число слоев коры может незначительно изменяться. В моторной коре слой IV очень тонкий, поскольку в этой зоне он практически не принимает сигналов от таламуса, ствола мозга или спинного мозга. Напротив, в затылочной доле (зоне новой коры, ответственной за зрение) слой IV имеет три дополнительных подслоя, поскольку в эту область приходит множество сигналов, в том числе от таламуса.

Важнейшая особенность новой коры – удивительная однородность ее основных структур. Впервые это заметил американский нейробиолог Вернон Маунткасл (1918–2015). В 1957 г. он открыл колончатую структуру новой коры. В 1978 г. он обнаружил закономерность, которая была так же важна для нейробиологии, как эксперименты Майкельсона и Морли в 1831 г. для физики. Он описал удивительно однородную организацию новой коры и высказал гипотезу, в соответствии с которой кора построена по единому принципу, воспроизводимому множество раз[33]33
Mountcastle, V. B. (1978), An Organizing Principle for Cerebral Function: The Unit Model and the Distributed System, in Gerald M. Edelman and Vernon B. Mountcastle, The Mindful Brain, MIT Press, 1982.

[Закрыть], а в качестве основного модуля этой структуры Маунткасл назвал кортикальную колонку. Изменение высоты некоторых слоев в различных отделах мозга объясняется лишь разным числом связей этих отделов с другими структурами.

Маунткасл предположил, что колонки состоят из мини-колонок, но эта гипотеза не получила поддержки, поскольку не было найдено никаких видимых границ подобных структур. Однако активные экспериментальные исследования показали, что, действительно, в нейронной ткани каждой колонки имеются повторяющиеся единицы. Я считаю, что основной структурной единицей новой коры являются распознающие модули. В отличие от мини-колонок Маунткасла, эти модули не разделены никакими физическими границами, поскольку расположены очень близко друг к другу и связаны между собой, так что кортикальная колонка – это просто агрегат большого числа таких модулей. Со временем распознающие модули могут скручиваться друг с другом, так что сложное соединение модулей, которое мы наблюдаем в новой коре, не определяется генетическим кодом, а формируется постепенно в зависимости от тех образов, которые нам приходится распознавать. Я подробнее остановлюсь на этом позднее; важно, чтобы вы поняли, как организована новая кора.

Прежде чем мы продолжим исследовать структуру новой коры, хочу заметить, что чрезвычайно важно осуществлять моделирование поведения сложных систем на правильно выбранном уровне. Хотя химия теоретически основана на физике и может быть выведена из законов физики, на практике сделать это невозможно, поэтому химия создала собственные законы и модели. Аналогичным образом из законов физики можно вывести законы термодинамики, но, если у нас имеется достаточное количество частиц, чтобы мы могли назвать их скопление газом, решение физических уравнений для взаимодействий всех частиц становится безнадежным делом, а вот законы термодинамики отлично работают. Точно так же биология создала свои собственные законы и модели. Единственная клетка поджелудочной железы чрезвычайно сложна, особенно если мы рассматриваем ее поведение на уровне молекул; значительно проще осуществить моделирование функций клеток поджелудочной железы в регуляции уровня инсулина и пищеварительных ферментов.

Тот же принцип применим к моделированию и изучению функций мозга. Безусловно, важной и необходимой задачей для проектирования мозга является создание моделей взаимодействий на межмолекулярном уровне, однако цель всего процесса главным образом заключается в уточнении модели, которая описывает, каким образом мозг перерабатывает информацию, превращая ее в знания.

Американский ученый Герберт А. Саймон (1916–2001), которого считают одним из отцов теории искусственного интеллекта, очень красочно выразился по поводу того, насколько важно выбрать правильный уровень абстракции для анализа сложных систем. В 1973 г. по поводу созданной им программы искусственного интеллекта EPAM (elementary perceiver and memorizer) Саймон писал следующее: «Представьте себе, что вы хотите понять имеющуюся у меня загадочную программу EPAM. Я могу дать вам две версии этой программы. Первая версия – это та, в которой программа была исходно написана, – со всеми составляющими ее компонентами и подпрограммами… Вторая – полностью трансформированная версия EPAM, переведенная на машинный язык… Я думаю, не стоит долго объяснять, какая версия представляет более краткое, значимое и понятное описание… Третью я вам предлагать не стану, поскольку это окажется даже не программа, а электромагнитные уравнения и граничные условия, которым компьютер как физическая система должен подчиняться. И это будет кульминация сокращения и непостижимости»[34]34
Herbert A. Simon, The Organization of Complex Systems. Hierarchy Theory, The Challenge of Complex Systems, Edited by Howard H. Pattee, George Braziller, Inc., New York, 1973; http://blog.santafe.edu/wp-content/uploads/2009/03/simon1973.pdf.

[Закрыть].

В новой коре человека содержится около полумиллиона кортикальных колонок, каждая из которых составляет около 2 мм в высоту и 0,5 мм в ширину и содержит около 60 тыс. нейронов (таким образом, в сумме в новой коре содержится около 30 млрд нейронов). В общем, каждый распознающий модуль кортикальной колонки содержит около 100 нейронов, а всего в новой коре имеется порядка 300 млн распознающих модулей.

Теперь мы обратимся к рассмотрению механизмов работы распознающих модулей, однако должен заметить, что, честно говоря, совершенно непонятно, с чего же следует начинать. В новой коре все происходит одновременно, так что в этих процессах нет ни начала, ни конца. Мне часто придется упоминать явления, которые я еще не объяснил, а только собираюсь объяснить, так что прошу вас запастись терпением.

Человек лишь в небольшой степени способен к логическим размышлениям, зато прекрасно умеет распознавать образы. Для логического мышления нам приходится использовать новую кору, которая и является большим распознающим модулем. Это далеко не идеальный механизм для осуществления логических преобразований, но другого у нас нет. Сравним, к примеру, как играют в шахматы человек и специальная компьютерная программа. В 1997 г. компьютер DeepBlue, обыгравший чемпиона мира среди людей Гарри Каспарова, был способен за секунду логически анализировать последствия 200 млн комбинаций на доске (то есть последовательностей ходов и ответных ходов). Сейчас на такое способны некоторые персональные компьютеры. Каспаров в ответ на вопрос, сколько комбинаций он может анализировать за секунду, ответил, что менее одной. Как же в таком случае он вообще мог сражаться против DeepBlue? Ответ заключается в исключительной способности человека распознавать образы. Однако эту способность нужно тренировать – вот почему не каждый из нас мастерски играет в шахматы.

Каспаров знал примерно 100 тыс. шахматных комбинаций. Это реальное число – по нашим расчетам, специалист в какой-либо сфере деятельности должен уметь оперировать примерно 100 тыс. «элементами» знаний. В пьесах Шекспира использовано около 100 тыс. предложений (в которых задействовано около 29 тыс. слов, но большинство из них использовано разными способами). Анализ медицинской экспертной системы, созданной для воспроизведения знаний обычного врача, показал, что врач оперирует примерно 100 тыс. понятий в своей области. Распознавание «элемента» знаний из такого хранилища информации является далеко не простой задачей, поскольку все элементы слегка изменяются при каждом новом обращении к ним.

Вооруженный этими знаниями, Каспаров смотрит на шахматную доску и сравнивает каждую конкретную комбинацию со всеми знакомыми ему 100 тыс. комбинаций, причем все 100 тыс. сравнений он производит одновременно. В этом вопросе наблюдается полный консенсус: все наши нейроны одновременно участвуют в обработке изображения. Это не означает, что все они одновременно возбуждаются (в такой ситуации мы, возможно, не могли бы удержаться на ногах), но выполнение их функции подразумевает возможность возбуждения.

Сколько образов может хранить новая кора? Здесь необходимо учесть явление избыточности. Например, лицо любимого человека хранится не в виде единого образа, а записано тысячи раз. Некоторые из этих повторов представляют собой изображения практически одного и того же лица, тогда как другие показывают его в разных ракурсах, при разном освещении, с разным выражением и т. д. Никакие из этих повторяющихся образов не хранятся в виде истинных рисунков (то есть в виде двумерного набора пикселов). Скорее, они хранятся в виде списков признаков, в которых составные элементы образа сами являются образами. Чуть позже мы подробнее поговорим о том, как устроена эта иерархия признаков.

Если принять, что база знаний специалиста в какой-либо области состоит из 100 тыс. «единиц» знания (то есть образов) при избыточности примерно 100:1, получается, что мозг хранит около 10 млн образов. Эти специфические знания основаны на более общих знаниях и дополняются более глубокими и узкоспециальными знаниями, так что общее число образов повышается до 30 или 50 млн. Однако наши «бытовые» знания, которые мы используем в каждодневной жизни, еще шире; знание «законов улицы» требует от нашей новой коры значительно больше, чем «книжное знание». Если учесть эти бытовые знания и упомянутый выше фактор избыточности, мы получим, что общее число образов, хранящихся в нашей новой коре, превышает 100 млн. Отметим, что фактор избыточности не постоянная величина – часто используемые образы могут повторяться тысячи раз, а новые явления имеют фактор избыточности менее десяти.

Как я расскажу позднее, наши действия и навыки также составляют образы и тоже хранятся в отделах коры, так что, по моим оценкам, общий объем информации в человеческой новой коре составляет несколько сотен миллионов образов. Эта приблизительная оценка вполне соответствует числу распознающих элементов коры, которое, как мы уже определили, составляет около 300 млн. Поэтому вполне резонно предположить, что функция каждого распознающего элемента новой коры состоит в обработке одной итерации образа (то есть одной копии среди множества повторяющихся копий образов). Наши оценки числа образов, которые может обрабатывать человеческий мозг (с учетом необходимой избыточности), и числа физических распознающих элементов привели нас к величинам одного порядка. Замечу, что, когда я говорю об «обработке» образа, я имею в виду все процессы, которые мы можем с ним (и его частями) проделать: изучить, предсказать, узнать и использовать (либо путем дальнейшего осмысления, либо путем применения образа физического перемещения).

Процессор, обрабатывающий 300 млн образов, кажется весьма серьезным аппаратом; и действительно, он позволил Homo sapiens создать устную и письменную речь, все наши многочисленные инструменты и творения. Одни изобретения вызывали к жизни другие, что привело к экспоненциальному росту информационного содержания технологий, который я описываю с помощью закона ускорения отдачи. Никакие другие существа не способны на такое. Как я уже говорил, ряд животных, включая шимпанзе, по-видимому, обладают рудиментарными способностями понимать и произносить слова, а также использовать примитивные орудия. У них, вообще говоря, тоже есть новая кора, однако их способности ограничиваются небольшим размером коры, особенно лобных долей. Размер нашей новой коры позволил нам создавать еще более мощные инструменты, включая те, которые теперь помогают нам изучать собственный разум. Когда-нибудь наш мозг вместе с созданными нами технологиями позволит сотворить искусственную новую кору, в которой будет не 300 млн процессоров, а значительно больше. Может быть, миллиард? Или триллион?

Структура образа

Теория мысленного распознавания образов, которую я хочу вам представить, основана на распознавании образов распознающими модулями новой коры. Эти образы (и модули) организованы иерархическим путем. Ниже я расскажу о том, как возникла эта идея, в том числе поведаю о собственных экспериментах 1980–1990-х гг. и о модели коры Джефа Хокинса и Дайлипа Джорджа, созданной в начале 2000-х гг.

Каждый образ (распознаваемый одним из примерно 300 млн распознающих модулей новой коры) состоит из трех элементов. Первый – это входной сигнал из образов низшего порядка, формирующих основной образ. Нет необходимости в повторении описания каждого из этих образов низшего порядка для каждого образа более высокого порядка, в котором они содержатся. Например, многие образы слов содержат букву «А». Нет нужды повторять описание буквы «А» во всех этих образах слов – они используют одно и то же описание. Это можно сравнить со страничкой в Интернете: в Интернете есть одна страница с описанием буквы «А» (один образ), и все страницы для слов (образы слов), содержащих букву «А», связаны с этой страницей (с образом буквы «А»). Вместо ссылок новая кора использует реальные нервные связи. Аксон от модуля, распознающего букву «А», связан с множеством дендритов – по одному для каждого слова с буквой «А». Но не забывайте и об избыточности коры: для распознавания буквы «А» существует несколько модулей. Любой из них может посылать сигнал модулям, распознающим слова с буквой «А».

Второй элемент каждого образа – его имя. Если речь идет о звуковых образах, этот образ более высокого порядка – просто слово, например «яблоко» (apple). Хотя мы напрямую применяем новую кору для понимания и использования речи, большинство образов в коре не являются языковыми образами. «Имя» образа в новой коре – это просто аксон, выходящий из каждого модуля; возбуждение аксона означает распознавание соответствующего образа. Возбуждение аксона означает, что распознающий модуль «называет имя» образа: «Эй, ребята, я увидел слово “яблоко”!»

Три повторяющихся (но слегка отличных друг от друга) образа «А» включаются в образы более высокого порядка, содержащие букву «А».

Третий и последний элемент образа – это набор образов более высокого порядка, в состав которых он входит. Для буквы «А» это все слова с буквой «А». Здесь вновь уместно сравнение с веб-страницей. Каждый распознанный образ более низкого порядка запускает распознавание образа более высокого порядка, содержащего первый образ. В новой коре эти связи осуществляются дендритами, соединяющимися с нейронами в каждом распознающем модуле коры. Помним, что каждый нейрон может получать сигналы от множества дендритов, но выдает единственный сигнал на аксон. Этот аксон, однако, может, в свою очередь, передавать сигнал множеству дендритов.

В качестве примера рассмотрим набор знаков, использующихся для изображения печатных букв. Здесь каждый уровень – это образ. Формы – это образы, буквы – образы, слова – тоже образы. Каждый образ характеризуется серией входных сигналов, процессом распознавания образа в модуле и выходным сигналом, поступающим к распознающему модулю более высокого порядка.

Из нижней левой точки к центру верхней линии:

Из нижней правой точки к центру верхней линии:

Горизонтальная перекладина:

Левая вертикаль:

Дуга в нижней области:

Нижняя горизонталь:

Верхняя горизонталь:

Средняя горизонталь:

Петля в верхней левой области:

Перечисленные образы составляют образ более высокого порядка, относящийся к категории печатных букв (в новой коре, конечно, таких формальных категорий не существует).

Буква А:

Два разных образа, составляющих букву «А» и два разных образа более высокого порядка (APPLE и PEAR), в состав которых входит «А».

Буква P:

Образы, из которых складывается образ более высокого порядка – буква «P».

Буква L:

Образы, из которых складывается образ более высокого порядка – буква «L».

Буква E:

Образы, из которых складывается образ более высокого порядка – буква «E».

Эти образы букв соединяются в образ еще более высокого порядка, относящийся к категории слов (в нашем с вами языке – для новой коры это лишь образ определенного порядка): APPLE.

В другой части коры имеет место аналогичная иерархия распознающих модулей, участвующих в обработке образов реальных объектов (а не печатных букв). Если вы смотрите на настоящее яблоко, модули низшего уровня находят округлые формы и образы цвета кожицы, в результате чего происходит возбуждение соответствующего аксона и подается знак: «Эй, ребята, я увидел настоящее яблоко!» Возбуждение аксонов распознающих модулей в слуховой коре, участвующих в определении частоты звуковых сигналов, в ответ на произнесенное кем-то слово «яблоко» даст знак: «Только что прозвучало слово “яблоко”!»

Опять же, помним об избыточности модулей – мы имеем не по одному распознающему модулю для каждого вида яблока (увиденного или услышанного слова «яблоко» и реального яблока). Скорее всего, происходит возбуждение сотен таких модулей, если не больше. Избыточность не только повышает вероятность успешного узнавания всех форм яблока, но и помогает распознавать варианты настоящих яблок. Существуют распознающие модули для узнавания самых разных видов яблок – всех сортов, цветов и форм.

Кроме того, не забываем о том, что описанная выше иерархия является иерархией понятий. Распознающие элементы на самом деле не выстраиваются каким-либо иерархическим образом относительно друг друга; новая кора тонкая и по высоте равна лишь одному распознающему элементу. Концептуальная иерархия создается за счет взаимодействий между отдельными распознающими элементами.

Важным элементом теории мысленного распознавания образов является описание процесса распознавания в каждом распознающем модуле. В модель заложен параметр «веса» входного сигнала каждого дендрита; этот параметр определяет важность данного сигнала для распознавания. Модули характеризуются пороговым значением возбуждения (преодоление этого значения говорит о том, что сигнал успешно узнается соответствующим распознающим модулем). Для возбуждения распознающего модуля не обязательно нужны все входные сигналы. Модуль может возбуждаться, например, при отсутствии входного сигнала с малым весом, но при отсутствии важного сигнала возбуждение вряд ли возможно. Возбуждение распознающего модуля обычно означает следующее: «Образ, за узнавание которого я отвечаю, скорее всего, присутствует».

Однако успешное распознавание модулем соответствующего образа заключается не только в подсчете входных сигналов (и в учете параметра их значимости). Важна также величина сигнала. Каждый входной сигнал, кроме того, описывается параметром, указывающим ожидаемую величину сигнала, и параметром, учитывающим вариабельность этой величины. В качестве примера рассмотрим распознающий модуль, ответственный за узнавание в речи слова steep (произносится «стиип» – «крутой», «высокий»). Слово состоит из четырех звуков: [s], [t] [E] и [p]. Звук [t] относится к так называемым зубным согласным; это означает, что звук производится воздухом, нарушающим контакт между языком и верхними зубами. Звук [t] практически невозможно произносить медленно. Глухой звук [p] относится к «взрывным согласным»; он образуется при открытии блокированного голосового тракта (перекрытого губами в случае [p]). Это тоже быстрый звук. Гласный звук [E] образуется за счет резонанса голосовых связок при открытом рте. Он относится к долгим гласным звукам, то есть длится гораздо дольше, чем согласные [t] и [p], однако его длительность может изменяться в широких пределах. Звук [s] относится к свистящим согласным; он возникает при прохождении воздуха через щель между сжатыми зубами. Его длительность обычно меньше, чем у долгих гласных звуков, таких как [E], но тоже может изменяться (звук [s] можно произнести быстро, а можно протянуть).

В нашей работе по распознаванию речи мы установили, что для распознавания звуковых образов этот тип информации должен быть закодирован. Например, слова steep и step (произносится «стэп» – «шаг», «этап») достаточно похожи. Хотя звуки [e] в слове step и [E] в слове steep звучат немного по-разному (имеют разные резонансные частоты), нельзя достоверно различить эти два слова лишь на этом основании. Гораздо надежнее основываться на длительности звучания гласных в этих двух словах: [e] в слове step звучит короче, чем [E] в слове steep.

Эту информацию можно закодировать с помощью двух параметров – ожидаемой величины (в данном случае длительности) и степени ее вариабельности. В нашем примере звуки [t] и [p] в слове steep характеризуются очень малой ожидаемой длительностью и малой вариабельностью (это означает, что мы не ожидаем услышать долгих звуков [t] и [p]). Звук [s] характеризуется малой ожидаемой длительностью, но большей вариабельностью, поскольку этот звук можно протянуть. Наконец, звук [E] имеет большую ожидаемую длительность и высокую степень вариабельности.

В этом примере величина – это длительность, но длительность – лишь одна из нескольких возможных характеристик величины сигнала. В нашей работе по распознаванию знаков мы обнаружили, что для распознавания печатных букв важна соответствующая пространственная информация (например, ожидается, что точка над i будет значительно меньше палочки). На более высоком понятийном уровне новая кора имеет дело с самыми разными совокупностями информации, такими как уровень притягательности, иронии, удовольствия, расстройства, и множеством других. Мы можем найти сходство между еще более различающимися совокупностями, чем Дарвин, который связал размер геологических разломов с различиями между видами организмов.

Источником данных параметров для головного мозга является собственный опыт мозга. Когда мы родились, мы ничего не знали о фонемах (звуковых единицах языка), кроме того, разные языки очень сильно различаются по фонетическим характеристикам. Это означает, что многочисленные примеры образа записываются в виде параметров для каждого распознающего модуля (поскольку ожидаемое распределение величин входных сигналов определяется в результате множества экспозиций). В некоторых программах искусственного интеллекта такие параметры кодируются экспертами (например, лингвисты могут назвать ожидаемую длительность различных фонем). В ходе наших исследований мы поняли, что лучше заставить программу самостоятельно определить параметры на основе тренировочных данных (примерно так, как это делает мозг). Иногда мы использовали смешанный подход, то есть снабжали систему человеческой интуицией (для начальных установок параметров), а затем заставляли ее уточнить эти оценки путем обучения на реальных речевых примерах.

Страницы книги >> Предыдущая | 1 2 3 4 5 | Следующая

Скачать книгу "Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов"