Читать книгу "Как мы учимся. Почему мозг учится лучше, чем любая машина… пока"

Текст добавлен: 21 декабря 2020, 01:00

Автор книги: Станислас Деан+

Жанр: Прочая образовательная литература, Наука и Образование

Возрастные ограничения: 16+

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 5 (всего у книги 29 страниц) [доступный отрывок для чтения: 7 страниц]

Скачать книгу

Шрифт:

- 100% +

Учиться – значит логически выводить основы

Одной из характерных особенностей человека является неустанный поиск абстрактных правил, выводов высокого уровня, которые мы извлекаем из конкретной ситуации и впоследствии проверяем на новых наблюдениях. Попытки сформулировать такие абстрактные законы могут служить чрезвычайно мощной стратегией научения, поскольку самые абстрактные законы – это законы, которые применимы к наибольшему числу наблюдений. Поиск подходящего логического правила, учитывающего все доступные данные, – наиболее действенный способ существенно ускорить научение, и человеческий мозг умеет играть в эту игру очень хорошо.

Рассмотрим пример. Представьте, что я показываю вам десять непрозрачных ящиков с разноцветными шарами внутри. Я наугад выбираю ящик, из которого раньше ничего не доставал, запускаю в него руку и достаю зеленый шар. Можете ли вы сделать какие-нибудь выводы о содержимом ящика? Какого цвета будет следующий шар?

Вероятно, первый ответ, который придет вам на ум, прозвучит примерно так: «Я понятия не имею – вы не дали мне практически никакой информации; откуда мне знать, какого цвета будет следующий шар?» Да, но… Представьте, что некоторое время назад я вытащил несколько шаров из других ящиков, и вы отметили следующую закономерность: шары в каждом ящике всегда одного цвета. Выходит, все просто? Как только я покажу новый ящик, вам нужно всего-навсего увидеть один зеленый шар, чтобы сделать вывод, что все остальные шары тоже зеленые. Благодаря этому общему правилу научение происходит с одной попытки.

Данный пример наглядно иллюстрирует, как знания более высокого порядка, сформулированные на так называемом «метауровне», управляют наблюдениями более низкого уровня. Стоит нам усвоить некое абстрактное метаправило – например, «шары в каждом ящике одного цвета», – как процесс научения значительно ускоряется. Конечно, это правило может оказаться и ложным. Вы будете сильно удивлены (или «метаудивлены»), если в десятом ящике окажутся шары всех цветов. В этом случае вам придется пересмотреть свою ментальную модель и поставить под вопрос допущение о том, что все ящики одинаковые. Возможно, вы предложите гипотезу еще более высокого уровня, «метаметагипотезу». Скажем, что ящики бывают двух видов: в одних лежат шары одного цвета, в других – разных цветов. Если так, то вам потребуется по меньшей мере два шара из каждого ящика, чтобы сделать какие-либо выводы. В любом случае формулирование иерархии абстрактных правил существенно сократит драгоценное время научения.

В этом смысле научение предполагает управление внутренней иерархией правил и попытки как можно скорее вывести из них наиболее общие, подытоживающие целую серию наблюдений. Человеческий мозг, по-видимому, применяет этот иерархический принцип с детства. Возьмем двух– или трехлетнего ребенка, который гуляет в саду и узнает от родителей новое слово – допустим, слово «бабочка». Зачастую ребенку достаточно услышать слово один или два раза, и вуаля! – его значение зафиксировано в памяти. Невероятная скорость! Ни одна из известных на сегодняшний день систем искусственного интеллекта не способна учиться так быстро. Почему это так трудно? Потому что любой случай употребления слова не полностью ограничивает его значение. Обычно ребенок слышит слово «бабочка», находясь в окружении цветов, деревьев, игрушек и людей; все это – потенциальные значения нового слова, не говоря даже о менее очевидных значениях: каждое мгновение нашей жизни полно не только звуков, запахов, движений, действий, но и абстрактных свойств. «Бабочка» вполне может означать цвет, небо, движение или симметрию. Существование абстрактных слов только усложняет задачу. Как дети узнают смысл слов «думать», «верить», «нет», «свобода» и «смерть», если то, что они обозначают, не поддается чувственному восприятию? Как они понимают, что значит «я», если каждый раз, когда они слышат это местоимение, говорящие имеют в виду… самих себя?!

Быстрое усвоение абстрактных слов так же несовместимо с наивными взглядами на формирование словарного запаса, как павловское обусловливание или скиннеровские ассоциации. Искусственным нейронным сетям, которые просто пытаются соотнести входные данные с выходными и образы со словами, обычно требуются тысячи попыток, прежде чем они начнут понимать, что слово «бабочка» относится к вон тому разноцветному насекомому в углу изображения. Разумеется, такое поверхностное соотнесение слов с картинками никогда не позволит установить смысл слов без фиксированного денотата, например, местоимения «мы», наречия «всегда» или существительного «запах».

Усвоение новых слов представляет огромную проблему для когнитивной науки. Тем не менее сегодня мы знаем, что часть решения кроется в способности ребенка формулировать нелингвистические, абстрактные, логические репрезентации. Еще до того, как малыши овладевают первыми словами, они активно пользуются своеобразным языком мышления, на котором могут формулировать и проверять абстрактные гипотезы. Их мозг – не «чистый лист»; врожденные знания, которые они проецируют на внешний мир, существенно ограничивают абстрактное пространство, в котором происходит научение. Более того, дети быстро схватывают значения новых слов потому, что в выборе подходящих гипотез руководствуются целым арсеналом правил высокого уровня. Такие метаправила значительно ускоряют процесс научения – точь-в-точь как в задаче с разноцветными шарами в разных ящиках.

Одно из правил, облегчающих усвоение лексики, заключается в том, чтобы всегда отдавать предпочтение простейшему предположению (наименьшему множеству), совместимому с данными. Например, когда ребенок слышит, как его мать говорит: «Посмотри на собаку», теоретически ничто не мешает слову «собака» относиться к этой конкретной собаке (Снупи) или, наоборот, к любому млекопитающему, четвероногому существу, животному или вообще всему живому. Как же ребенок узнает истинное значение слова – например, что слово «собака» применимо ко всем собакам, но только к собакам? Эксперименты показывают, что дети рассуждают логически: они проверяют все гипотезы, но оставляют только самую простую модель, которая согласуется с данными. Когда малыш слышит слово «Снупи», это всегда контекстуально связано с конкретным существом, а самое маленькое множество, совместимое с этими наблюдениями, ограничивается данной конкретной собакой. Впервые услышав слово «собака» в определенном контексте, многие дети полагают, что это слово относится только к конкретному животному, но, услышав его дважды, в двух разных контекстах, делают вывод, что слово относится ко всему виду. Согласно прогнозу математической модели, достаточно трех или четырех примеров, чтобы установить верное значение²⁷. Такие логические выводы дети делают быстрее, чем любая искусственная нейросеть, существующая на сегодняшний день.

Овладеть речью в рекордные сроки (по сравнению с современными системами искусственного интеллекта) детям позволяют и другие хитрости. Одно из таких метаправил всем известно: обычно говорящий смотрит на то, о чем говорит. Это правило позволяет детям значительно ограничить абстрактное пространство, в котором они ищут значение нового слова: ребенку не нужно соотносить каждое незнакомое слово со всеми объектами в своем поле зрения, как поступил бы компьютер. Последний будет делать это до тех пор, пока не соберет достаточно данных и не убедится, что каждый раз, когда он слышит о бабочке, где-то есть маленькое разноцветное насекомое. Чтобы понять, о чем говорит мама, ребенку достаточно проследить за ее взглядом или направлением пальца. Это называется «совместным вниманием» и является фундаментальным принципом овладения речью.

Вот изящный эксперимент: покажите двух– или трехлетнему ребенку новую игрушку, посмотрите на нее и скажите: «Пупс!» Ребенок с первого раза поймет, что «пупс» – это название предмета. Теперь воспроизведите ситуацию, но на этот раз молчите – пусть слово «пупс» малыш услышит из динамика. В этом случае он ничему не научится, потому что не сможет расшифровать намерение говорящего²⁸. Маленькие дети усваивают значение нового слова только в том случае, если понимают намерение человека, который его произнес. Эта же способность позволяет им сформировать обширный запас абстрактных слов: чтобы понять, к какой мысли или слову апеллирует говорящий, они должны поставить себя на его место.

Дети используют множество метаправил для заучивания слов. Например, они опираются на грамматический контекст. Возьмем английский язык. Когда ребенку говорят: Look at the butterfly («Посмотри на эту бабочку»), наличие детерминатива the подсказывает ему, что следующее слово должно быть существительным. Это метаправило, несомненно, приобретено – дети явно не появляются на свет с врожденным знанием всех артиклей на всех языках. Тем не менее исследования показывают, что данный тип научения происходит очень быстро: к году младенцам уже известны самые распространенные детерминативы и другие служебные слова, облегчающие дальнейшее научение²⁹.

Это происходит потому, что некоторые грамматические слова употребляются очень часто и почти всегда стоят перед существительным. Может показаться, что подобные рассуждения создают замкнутый круг, но это не так. Примерно в шесть месяцев малыши начинают овладевать существительными: первыми в списке идут самые знакомые, например, bottle («бутылочка») и chair («стул»). Через некоторое время дети замечают, что этим словам часто предшествует другое слово – артикль the. Вывод: все эти слова, вероятно, принадлежат к одной категории (существительным) и обычно обозначают вещи. Руководствуясь данным метаправилом, ребенок, который услышал новое высказывание, например the butterfly («бабочка»), прежде всего ищет возможное значение среди окружающих его объектов, а не расценивает слово как глагол или прилагательное. Каждый последующий эпизод подкрепляет это правило, а оно, в свою очередь, облегчает и ускоряет последующее научение. Специалисты по психологии развития утверждают, что ребенок полагается на синтаксический бутстрэппинг: детский алгоритм овладения языком развертывается постепенно, сам по себе, основываясь на последовательности небольших, но систематических шагов вывода.

Учиться – значит выбирать простейшую модель, которая согласуется с данными. Предположим, я покажу вам картинку, которая приведена выше, и скажу, что три объекта, обведенные в квадрат, – это «туфы». Располагая столь скудными данными, как вы найдете другие туфы? Ваш мозг вычисляет принципы, по которым были обведены именно эти изображения, строит иерархическое дерево их основных свойств, а затем выбирает самую маленькую ветвь, которая совместима со всеми данными.

Существует еще одно метаправило, которое дети часто используют для ускорения усвоения новых слов. Оно называется «допущением взаимного исключения» и вкратце может быть сформулировано следующим образом: одна вещь – одно название. Проще говоря, закон гласит, что два разных слова едва ли будут относиться к одному и тому же понятию – во всяком случае, это маловероятно. Следовательно, незнакомое слово скорее всего обозначает новый предмет или новую концепцию. Благодаря этому правилу ребенок, услышавший новое слово, может ограничить поиски его значения вещами, названия которых он пока не знает. Начиная с 16 месяцев дети мастерски пользуются этим трюком³⁰. Проведем эксперимент: возьмите две мисочки – пусть одна будет синяя, а другая, скажем, оливково-зеленая – и скажите ребенку: «Дай мне оливновую миску». Ребенок даст вам ту миску, которая не синяя (слово, которое он уже знает). Очевидно, он полагает, что если бы вы говорили о синей миске, то вы бы употребили слово «синяя» – значит, вы имеете в виду другую. Одного-единственного раза достаточно, чтобы через несколько недель малыш вспомнил, что этот странный цвет называется «оливновый».

Здесь мы снова видим, что владение метаправилом значительно ускоряет процесс научения. Вполне вероятно, что само это метаправило тоже приобретено. И действительно, некоторые эксперименты показывают, что малыши из двуязычных семей применяют его гораздо реже, чем дети с одним родным языком³¹. Билингвальный опыт подсказывает им, что родители могут использовать разные слова, чтобы сказать одно и то же. Одноязычные дети, напротив, часто полагаются на правило исключительности. Со временем они приходят к выводу, что всякий раз, когда вы произносите новое слово, вы хотите познакомить их с новым предметом или концепцией. Услышав фразу «дай мне глакс» в комнате, полной знакомых предметов, ребенок будет повсюду искать эту таинственную штуку: ему и в голову не придет, что вы можете иметь в виду одну из уже известных ему вещей.

Все эти метаправила иллюстрируют так называемый «дар абстракции»: самые абстрактные метаправила усвоить легче всего – хотя бы потому, что их подтверждает каждое слово, которое слышит ребенок. Таким образом, грамматическое правило «перед существительным обычно идет артикль the» вполне может быть усвоено на ранней стадии и впоследствии облегчить приобретение обширного репертуара существительных. Благодаря абстракции примерно в два-три года дети вступают в благословенный период, по праву называемый «лексическим взрывом». В это время они без усилий выучивают от десяти до двадцати новых слов в день, полагаясь на подсказки, которые до сих пор ставят в тупик лучшие алгоритмы на планете.

Способность использовать метаправила, по-видимому, требует достаточно развитого интеллекта. Если так, значит, она присуща только человеку? Не совсем. В определенной степени делать абстрактные умозаключения способны и другие животные. Возьмем случай с Рико – бордер-колли, которого научили приносить самые разные предметы³². Все, что вам нужно, – это сказать: «Рико, принеси динозавра». Животное убегает в комнату с игрушками и через несколько секунд возвращается с плюшевым динозавром в пасти. Этологи, которые проверяли Рико, установили, что он знает около двухсот слов. Но это еще не самое удивительное. Оказывается, чтобы выучить новые слова, пес применял принцип взаимной исключительности! Если бы вы сказали: «Рико, принеси сикирид» (новое слово), он бы вернулся с предметом, названия которого не знал. Иными словами, Рико использовал метаправила, в том числе правило «одна вещь – одно название».

Математики и специалисты в области вычислительной техники уже приступили к разработке алгоритмов, которые позволят машинам усваивать подобную иерархию правил, метаправил и метаметаправил. В этих иерархических алгоритмах каждый эпизод обучения ограничивает не только параметры низкого уровня, но и знания самого высокого уровня, абстрактные гиперпараметры, которые, в свою очередь, управляют последующим обучением. Хотя таким системам еще далеко до экстраординарной эффективности, присущей человеческому мозгу при овладении речью, они показывают неплохие результаты. Например, на цветной иллюстрации 4 представлен новейший алгоритм, который, подобно искусственному ученому, ищет лучшую модель внешнего мира³³. Данная система обладает набором абстрактных примитивов, а также грамматикой, позволяющей генерировать бесконечное число структур более высокого уровня посредством рекомбинации этих элементарных правил. Например, она может определить линейную цепочку как последовательность тесно связанных точек, описываемую правилом «с каждой точкой соседствуют две другие точки – одна слева, другая справа», и совершенно самостоятельно обнаружить, что такая цепочка является наилучшим способом представления множества целых чисел (от нуля до бесконечности) или политических взглядов (от ультралевых до ультраправых). Вариант той же грамматики дает двоичное дерево, где каждый узел имеет одного родителя и двух потомков. Такая древовидная структура выбирается автоматически, когда систему просят представить живые существа; машина, подобно искусственному Дарвину, заново открывает древо жизни!

Другие комбинации правил порождают плоскости, цилиндры и сферы, и алгоритм определяет, как такие структуры приближенно выражают географию нашей планеты. Более сложные версии того же алгоритма могут выразить еще более абстрактные идеи. Например, американские специалисты в сфере вычислительной техники Ной Гудман и Джош Тененбаум разработали систему, способную открыть принцип причинности³⁴, согласно которому одни события вызывают другие. Его формулировка носит весьма абстрактный и математический характер: «В направленном ациклическом графе, связывающем различные переменные, существует подмножество переменных, от которых зависят все остальные». Хотя это определение почти невозможно понять, оно прекрасно иллюстрирует тип абстрактных внутренних формул, которые эта ментальная грамматика способна выразить и проверить. Система тестирует тысячи таких формул, но сохраняет только те из них, которые согласуются с входящими данными. В результате она быстро выводит принцип причинности (если, конечно, некоторые из получаемых ею сенсорных сигналов являются причинами, а другие – следствиями). Это еще одно доказательство в пользу дара абстракции: принятие такой высокоуровневой гипотезы значительно ускоряет процесс обучения, ибо радикально сужает объем правдоподобных гипотез, среди которых осуществляется поиск. Вот почему из поколения в поколение дети неустанно спрашивают «почему?» и ищут объяснений, тем самым подпитывая бесконечную погоню нашего вида за научными знаниями.

Согласно данной точке зрения, научение состоит в анализе обширного набора утверждений, выраженных на языке мышления, и выборе того, которое наилучшим образом согласуется с данными. Как мы увидим далее, эта модель отлично описывает все, что происходит в мозге любого ребенка. Подобно начинающим ученым, дети формулируют теории и сравнивают их с внешним миром. Отсюда следует, что ментальные представления детей гораздо более структурированы, нежели представления современных искусственных нейросетей. С самого рождения мозг ребенка уже должен обладать двумя ключевыми составляющими: всеми механизмами, позволяющими генерировать множество абстрактных формул (комбинаторным языком мышления), и способностью выбирать из этих формул наиболее правдоподобные.

Таково наше новое видение мозга³⁵: мозг – это огромная генеративная модель, в значительной степени структурированная и способная формулировать бесчисленное множество гипотетических правил и структур, но постепенно ограничивающаяся теми, которые максимально точно описывают реальность.

Учиться – значит рассуждать как ученый

Как мозг выбирает наиболее подходящую гипотезу? По каким критериям он принимает или отвергает модель внешнего мира? Оказывается, для этого существует идеальная стратегия. Она лежит в основе одной из самых современных и продуктивных теорий научения – гипотезы о том, что мозг ведет себя как ученый. Согласно данной теории, учиться – значит рассуждать как хороший специалист по статистике, выбирающий из нескольких альтернативных теорий ту, у которой больше всего шансов оказаться верной. А какая теория вероятнее станет таковой? Разумеется, та, которая наилучшим образом объясняет имеющиеся данные.

Как же работает научное мышление? Когда ученые формулируют теорию, они не просто записывают математические формулы – они делают прогнозы. О силе теории судят по богатству исходных прогнозов, которые из нее вытекают. Последующее подтверждение или опровержение этих предсказаний ведет к подтверждению или крушению теории. Исследователи применяют простую логику: они формулируют несколько теорий, распутывают паутину вытекающих из них прогнозов и исключают теории, прогнозы которых опровергает опыт или наблюдения. Конечно, одного эксперимента редко бывает достаточно: зачастую, чтобы отделить истинное от ложного, приходится повторять эксперимент несколько раз, в разных лабораториях. И все же, перефразируя философа науки Карла Поппера (1902–1994), невежество постепенно отступает, ибо благодаря серии догадок и опровержений мы можем шаг за шагом уточнить теорию.

В этом плане наука сродни человеческому научению. По мере того как мозг успешно формулирует все более и более точные теории внешнего мира на основе наблюдений, невежество каждого из нас постепенно отступает. Но разве это не просто туманная метафора? Нет. По сути, это довольно точное описание вычислений, которые, судя по всему, производит мозг. За последние тридцать лет гипотеза «ребенка как ученого» привела к ряду крупных открытий относительно того, как дети рассуждают и учатся.

Математики и ученые в области вычислительной техники уже давно сформулировали лучший способ рассуждения в условиях неопределенности. Эту теорию называют байесовской, в честь ее создателя, преподобного Томаса Байеса (1702–1761), английского пресвитерианского пастора и математика, ставшего членом Королевского общества. Возможно, правда, нам следовало бы назвать ее теорией Лапласа, поскольку именно Пьер-Симон, маркиз де Лаплас (1749–1827) – великий французский математик – придал ей окончательную форму. Как бы то ни было, несмотря на свой почтенный «возраст», в когнитивистике и машинном обучении она получила известность лишь в последние лет двадцать. К счастью, сегодня все больше исследователей осознают, что только байесовский подход, основанный на теории вероятностей, позволяет извлекать максимум информации из каждой единицы данных. Учиться – значит делать как можно больше выводов из каждого наблюдения, даже самого неопределенного. Правило Байеса это гарантирует.

Что же обнаружили Байес и Лаплас? В двух словах – как правильно делать выводы, то есть рассуждать на базе вероятностей с тем, чтобы проследить каждое наблюдение до его наиболее вероятной причины. Вернемся к основам логики. С древнейших времен человечество умело рассуждать на базе истинностных значений: истинно или ложно. Аристотель сформулировал правила дедукции, которые мы называем силлогизмами и применяем более или менее интуитивно. Например, правило под названием modus tollens (букв. «метод отрицания») гласит, что если P подразумевает Q и оказывается, что Q ложно, то и P тоже ложно. Именно это правило Шерлок Холмс применяет в знаменитом рассказе «Серебряный»[14]14
Конан Дойль, А. Серебряный. / А. Конан Дойль. Собрание сочинений. В 8 т. – М.: Издательство «Правда», 1966. – Т. 2. (Прим. перев.)

[Закрыть]:

Инспектор Грегори: Есть еще какие-то моменты, на которые вы советовали бы мне обратить внимание?

Холмс: На странное поведение собаки в ночь преступления.

Инспектор Грегори: Собаки? Но она никак себя не вела!

Холмс: Это-то и странно.

Шерлок рассудил, что если бы собака учуяла незнакомца, то непременно бы залаяла. Поскольку она этого не сделала, преступник, очевидно, не был посторонним человеком… Подобные рассуждения позволили знаменитому сыщику сузить круг подозреваемых и в конечном итоге разоблачить убийцу.

«Какое это имеет отношение к научению?» – наверняка спросите вы. Что ж, учиться – значит рассуждать как детектив: по сути, научение всегда сводится к анализу скрытых причин явлений и построению наиболее правдоподобной модели, которая ими управляет. Но в реальном мире наблюдения редко бывают истинными или ложными: они носят неопределенный и вероятностный характер. Вот тут-то в игру и вступают фундаментальные работы преподобного Байеса и маркиза де Лапласа: байесовская теория говорит нам, как мыслить вероятностями, то есть какие виды силлогизмов мы должны применять, когда данные не идеальные (истинные или ложные), а вероятностные.

Probability Theory: The Logic of Science («Теория вероятностей: Логика науки») – название увлекательной книги по байесовской теории, написанной статистиком Э.Т. Джейнсом (1922–1998)³⁶. Оказывается, то, что мы называем вероятностью, есть не что иное, как выражение нашей неуверенности. Теория с математической точностью описывает законы, по которым должна развиваться неуверенность с каждым новым наблюдением. Фактически это идеальное расширение логики в туманную область вероятностей и неопределенностей.

Рассмотрим пример, схожий по духу с тем, на котором преподобный Байес основал свою теорию в XVIII веке. Предположим, я вижу, как кто-то подбрасывает монетку. Если монетка правильная (симметричная), вероятность выпадения орла и решки одинаковая: пятьдесят на пятьдесят. Исходя из этой предпосылки, классическая теория вероятностей подсказывает нам, как вычислить вероятность того или иного исхода (например, вероятность выпадения пяти решек подряд). Байесовская теория позволяет двигаться в противоположном направлении – от наблюдений к причинам. Она дает нам возможность ответить на вопросы вроде «после того как я подброшу монету несколько раз, должен ли я изменить свои представления о ней?». По умолчанию предполагается, что монета симметрична. Но если решка выпадет двадцать раз подряд, я поступлю разумно, если пересмотрю свои изначальные допущения: с этой монетой явно что-то не так. Очевидно, моя первоначальная гипотеза стала неправдоподобной, но насколько? Как именно мне обновлять мои убеждения после каждого наблюдения? В рамках теории каждому допущению присваивается номер, соответствующий степени правдоподобия или уровню доверия. С каждым последующим наблюдением это число изменяется на величину, пропорциональную степени невероятности наблюдаемого исхода. Как и в науке, чем невероятнее экспериментальное наблюдение, тем сильнее оно нарушает прогнозы первоначальной теории и с тем большей уверенностью мы можем отвергнуть эту теорию и искать альтернативные интерпретации.

Байесовская теория невероятно эффективна. Во время Второй мировой войны британский математик Алан Тьюринг (1912–1954) использовал ее для расшифровки кода «Энигмы». Как известно, немецкие военные сообщения шифровались с помощью машины под названием «Энигма» – хитроумного устройства из шестеренок, роторов и электрических кабелей. После каждой буквы конфигурации, количество которых превышало один миллиард, менялись. Каждое утро шифровальщик задавал машине особые настройки, которые были запланированы на этот день. Затем он набирал текст, и «Энигма» выдавала на первый взгляд случайную последовательность букв, которую мог расшифровать только обладатель шифровального ключа. Всем остальным текст казался полностью лишенным какого-либо порядка. Однако гениальный Тьюринг обнаружил, что если две машины были настроены одним и тем же образом, то это приводило к небольшой погрешности в распределении букв, в результате чего возрастала вероятность того, что два сообщения будут похожи. Эта погрешность была настолько мала, что одной буквы было недостаточно, чтобы сделать какой-то точный вывод. Тем не менее, анализируя букву за буквой, Тьюринг смог доказать, что одна и та же конфигурация действительно использовалась дважды. С помощью устройства, которое назвали «бомбой» (большой тикающей электромеханической машины, которая стала прототипом наших компьютеров), он и его команда регулярно взламывали код «Энигмы».

Но какое отношение это имеет к живому мозгу? Что ж, похоже, точно так же рассуждает и наша кора больших полушарий³⁷. Согласно этой теории, каждая область мозга формулирует одну или несколько гипотез и посылает соответствующие прогнозы в другие отделы. Таким образом, каждый модуль ограничивает предположения следующего, обмениваясь вероятностными предсказаниями о внешнем мире. Эти сигналы называются «нисходящими»: они зарождаются в областях высокого уровня – например, в лобных долях – и спускаются в сенсорные области более низкого уровня, такие как первичная зрительная кора. Теория предполагает, что эти сигналы выражают набор гипотез, которые наш мозг считает правдоподобными и хочет проверить.

В сенсорных областях нисходящие допущения вступают в контакт с «восходящей» информацией из внешнего мира – например, из сетчатки. Теория гласит: как только модель соприкасается с реальностью, мозг вычисляет сигнал ошибки – расхождение между тем, что предсказывала модель, и тем, что наблюдалось фактически. Байесовский алгоритм определяет, как использовать этот сигнал ошибки для изменения внутренней модели мира. Если ошибки нет, значит, модель правильная. В противном случае сигнал ошибки движется вверх по цепочке мозговых центров и по пути корректирует соответствующие параметры. В результате алгоритм относительно быстро приходит к ментальной модели, которая согласуется с внешним миром.

Согласно данному представлению о мозге, наши взрослые суждения объединяют два уровня: врожденные знания, присущие нам как виду (то, что сторонники байесовского подхода называют априорной вероятностью – наборы правдоподобных гипотез, унаследованных в ходе эволюции), и наш личный опыт (апостериорная вероятность – пересмотр этих гипотез на основе всех выводов, которые мы смогли сделать на протяжении жизни). Такое разделение труда ставит точку в классической дискуссии об относительной роли наследственности и окружающей среды: организация нашего мозга обеспечивает нас как мощным стартовым снаряжением, так и не менее мощной самообучающейся машиной. Очевидно, все знания должны быть основаны на этих двух компонентах: во-первых, на наборе априорных допущений, предшествующих любому взаимодействию с окружающей средой, а во-вторых, на способности сортировать эти допущения в соответствии с их апостериорной правдоподобностью после соприкосновения с реальными данными.

На сегодняшний день мы можем математически доказать, что байесовский подход – это лучший способ учиться. Это единственный способ выделить саму суть учебного эпизода и извлечь из него максимум. Для научения достаточно всего нескольких битов информации вроде подозрительных совпадений, которые Тьюринг обнаружил в коде «Энигмы». Как только система их обработает, она получит достаточно данных, чтобы опровергнуть одни теории и подтвердить другие.

Значит, вот как работает мозг? Неужели он с рождения может генерировать массы гипотез, из которых затем выбирает те, которые наилучшим образом согласуются с наблюдаемыми данными? Получается, младенцы с самого рождения действуют как умные и терпеливые ученые-статистики? Способны ли они извлечь максимум информации из каждого учебного опыта? Давайте посмотрим, что удалось выяснить о мозге маленьких детей в ходе экспериментальных исследований.