Читать книгу "Краткая история интеллекта. Макс Беннетт. Саммари"

Текст добавлен: 25 мая 2026, 11:44

Автор книги: М. Иванов

Жанр: Биология, Наука и Образование

Возрастные ограничения: 16+

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 1 (всего у книги 2 страниц) [доступный отрывок для чтения: 1 страниц]

Скачать книгу

Шрифт:

- 100% +

Smart Reading
Краткая история интеллекта. Макс Беннетт. Саммари

Оригинальное название:

A Brief History of Intelligence

Автор:

Max Bennett

www.smartreading.ru

Две истории

На протяжении веков человечество черпало вдохновение для инноваций у природы: птицы научили нас летать, идея липучки пришла Жоржу де Местралю при виде репейника, а исследования электричества начались с наблюдений за молниями. Однако когда дело доходит до разработки искусственного интеллекта, оказывается, что человеческий мозг – не самая лучшая модель. Несмотря на столетия исследований, у нас по-прежнему нет ответов на многие вопросы касательно его работы – мы сами не до конца понимаем вещь, которую пытаемся воспроизвести.

«Ключ к разгадке тайн человеческого интеллекта – а значит, и к переходу на новую ступень развития искусственного интеллекта – лежит за пределами человеческого мозга», – считает Макс Беннетт, предприниматель и исследователь в области ИИ. Ответ, по его мнению, сокрыт не в настоящем, но в остатках давно ушедшего времени: в древних червях, рыбах, первых млекопитающих и первых приматах.

Как примитивное поведение доисторических червей заложило основы нашего собственного интеллекта? Как древние млекопитающие научились воображать? Как у первых приматов развилась способность планировать будущее и размышлять о прошлом? Как получилось, что у первых людей появился язык, а у всех остальных животных – нет? И как это все поможет нам в будущем?

«Краткая история интеллекта» рассказывает две захватывающие истории: одна – эволюция нашего мозга, охватывающая 4 млрд лет, а другая – непрекращающиеся попытки человечества разработать все более разумные компьютерные системы, а также то, как эти истории пересекаются. С каждым новым прорывом читатель приобретает все более глубокое понимание не только собственного пути, но и стремительно развивающегося мира искусственного интеллекта. Настало время заглянуть в первую главу.

Жизнь до мозга

Жизнь существовала на Земле более 3 млрд лет до появления первого мозга. Около 4 млрд лет назад самовоспроизводящиеся молекулы, подобные ДНК, и защитные липидные пузырьки положили начало клеточной жизни. Эти древние клетки имели примитивную версию интеллекта, реализованную не в нейронах, но в сложной сети химических каскадов и белков.

Появились первые бактерии, а затем цианобактерии, способные к фотосинтезу. Из этого симбиоза – фотосинтетической жизни, преобразующей воду и углекислый газ в сахар и кислород, и дыхательной жизни, преобразующей сахар и кислород обратно в углекислый газ, – возникло огромное разнообразие организмов.

Со временем возникли первые многоклеточные животные, и у некоторых из них появилось то, что в корне отличало их от всей другой жизни того времени, – нейроны.

Нервная система всех современных животных состоит из нейронов. Более того, они все по большей части идентичны – нейроны в человеческом мозге работают так же, как нейроны в медузе. Это яркий пример того, как предшествующие инновации становятся основой для будущих – фундаментальные строительные блоки мозга остаются, по сути, неизменными на протяжении более 600 млн лет.

У первых животных не было мозга. Их нервная система представляла собой то, что ученые называют нервной сетью – распределенной сетью независимых нейронных цепей, которых вполне хватало, чтобы реализовывать несложные рефлексы.

С появлением нейронов остальные прорывы в истории интеллекта стали лишь вопросом времени.

Прорыв первый: билатеральная симметрия и навигация

Наши предки примерно 550 млн лет назад перешли от радиальной симметрии, как у морской звезды или медузы, к двусторонней, как у червей, напоминающих современных нематод. В процессе этого перехода произошло множество физических и неврологических изменений.

• Двусторонний план тела свел навигационный выбор к двум простым вариантам: двигаться вперед или повернуть.

Сегодня, несмотря на огромное разнообразие животной жизни, подавляющее большинство имеет билатеральное строение тела, что Беннетт связывает с его большей эффективностью.

• Появились «валентные нейроны», влияющие на этот выбор.

Нейроны с положительной валентностью активируются стимулами, которые нематоды считают хорошими (например, запах пищи): нематода плывет к стимулу. Нейроны с отрицательной валентностью активируются стимулами, которые нематоды считают плохими (например, экстремальные температуры, запах хищников, яркий свет): нематода разворачивается.

• Появился первый централизованный протомозг для принятия решений.

Даже простейший мозг из тысячи нейронов, в отличие от распределенной сети нейронов, может эффективно обрабатывать противоречивую сенсорную информацию и принимать единственное решение на основе накопления «голосов» от нейронов с положительной и отрицательной валентностями.

• Валентные реакции модулировались внутренним состоянием.

Нейроны с положительной валентностью к запаху пищи у C. elegans становятся более восприимчивыми при наличии сигналов голода и менее восприимчивыми при наличии сигналов сытости.

• Появились нейромодуляторы – дофамин, серотонин, адреналин[1]1
Читайте саммари книги Лоретты Бройнинг «Гормоны счастья. Как приучить мозг вырабатывать серотонин, дофамин, эндорфин и окситоцин».

[Закрыть], – которые вызывают аффективные состояния.

Аффективные состояния – это примитивные эмоции: удовольствие, боль, насыщение и стресс. В отличие от других реакций, они сохраняются долгое время даже после того, как стимул, который их вызвал, исчезнет. Это меняет состояние животного для более эффективного ответа на внешние стимулы.

Эффективнее настойчиво обыскивать окрестности после встречи с едой, а не реагировать на запахи еды только в моменте. Аналогично, почувствовав запах хищника, лучше продолжать уплывать даже после того, как запах исчезнет.

Аффективные состояния регулируются нейромодуляторами. Дофамин высвобождается при предвкушении вознаграждения (еды), вызывая повышенную возбудимость; серотонин высвобождается при потреблении еды, вызывая пониженную возбудимость. Норадреналин, октопамин и адреналин вызывают аффективное состояние «бей или беги».

• У билатерий появилась способность к ассоциативному обучению для принятия решений на основе предыдущего опыта.

Если представить нематоде запах определенной пищи и запах вредного химического вещества вместе, она впоследствии будет избегать эту пищу даже без запаха вредного вещества. Если кормить нематоду при определенной температуре, она со временем станет предпочитать эту температуру.

Роботехник Родни Брукс выступал за постепенный подход к созданию интеллектуальных систем, увеличивая их сложность подобно процессу эволюции, вместо того чтобы сразу создавать сложные машины на основе человеческого интеллекта. Так появился простой робот-пылесос Roomba, на удивление схожий с первыми билатериями. Оба перемещаются движением вперед и поворотом. Оба используют приемы, которые позволяют ориентироваться в сложном мире, фактически не понимая и не моделируя этот мир: реагируя на хорошие и плохие стимулы (еда – мусор, хищник – стена) с помощью простых рецепторов и простых датчиков, основываясь на внутренних состояниях (голод – низкий заряд батареи).

Прорыв второй: первые позвоночные и обучение с подкреплением

Следующая веха в эволюции мозга произошла в кембрийский период – от 540 до 485 млн лет назад, – когда наши предки перешли от простых червеобразных билатерий к рыбообразным позвоночным. Простой протомозг ранних билатерий превратился в настоящую машину с новыми структурами, слоями и системами, которые участвовали в обучении с подкреплением (способность учиться сложному поведению путем проб и ошибок).

• Появились базальные ганглии – центр обучения с подкреплением, основанного на прогнозируемом вознаграждении.

Если бы мозг обучался только на вознаграждениях постфактум, животные столкнулись бы с трудностями при освоении сложных задач, включающих много действий, например охоты. Мозгу было бы трудно связать вознаграждение с конкретными действиями, которые к нему привели.

Базальные ганглии – это система, которая учится повторять поведение, ранее приведшее к положительному результату, а также предсказывать, какие действия приведут к получению награды. Как это работает?

Они получают сигналы из других областей мозга (то есть сигналы о состоянии животного и окружающей среды) и дофаминовых нейронов; от них сигналы идут к двигательным центрам, а также обратно к дофаминовым нейронам. Работа базальных ганглий способствует выполнению действий, которые максимизируют высвобождение дофамина.

Со временем в системе обратной связи с дофаминовыми нейронами базальные ганглии учатся делать прогнозы по предсказательным сигналам, которые предшествуют награде. В зависимости от того, сбывается прогноз или нет, базальные ганглии совершенствуют свои предсказания. Так, выброс дофамина постепенно смещается с реальных вознаграждений на прогнозируемые, позволяя животному эффективнее адаптироваться к новым условиям.

В искусственном интеллекте такая система обучения называется «актер-критик». Она включает в себя два компонента, актера и критика, работающие вместе для улучшения принятия решений во время игры. Критик оценивает вероятность победы, в то время как актер выбирает действия на основе обратной связи критика. Одновременное обучение актера и критика приводит к синергетическому эффекту, где постоянное взаимодействие и обучение на своих ошибках приводят к более совершенной системе. Эта стратегия была использована для обучения ИИ игре в нарды – так система впервые победила человека, что ранее было невозможно. Теперь это применяется для обучения многих систем ИИ, от игр до беспилотных автомобилей.

• У позвоночных возникло любопытство.

Для эффективного обучения с подкреплением животное должно исследовать новое поведение – то есть быть любопытным. Чем больше новых вещей испытывает животное, тем больше вероятность того, что оно научится правильным связям между своими действиями и соответствующими результатами. Это работает, потому что обучение и эффект неожиданности сами по себе вызывают выброс дофамина, даже если нет реальной награды.

Лучший способ заставить крысу навязчиво нажимать на рычаг для получения еды – заставлять рычаг выпускать еду не при каждом нажатии, но случайным образом. Рыбы также демонстрируют этот эффект. Социальные сети тоже используют это. С каждой прокруткой ленты появляется новый случайный пост. Даже если вы не хотите продолжать листать ленту, поведение подсознательно подкрепляется желанием узнать, что появится при следующей прокрутке. Внедрение любопытства в систему ИИ помогло ей пройти первый уровень «Мести Монтесумы» – игры-лабиринта. Она смогла пройти первый уровень только тогда, когда была запрограммирована на целенаправленное исследование новых путей.

• Появился кортекс – для распознавания паттернов.

Сенсорное восприятие запахов, визуальной информации или звуков, по сути, всего лишь процесс идентификации уникальных последовательностей активированных нейронов.

Способность первых билатерий распознавать мир была ограничена отдельными нейронами. Мозг ранних позвоночных стал обрабатывать целые последовательности нейронов, что позволяло животным интерпретировать более широкий спектр сенсорной информации.

• У позвоночных возникло восприятие трехмерного пространства и времени.

Это позволило им распознавать, где они находятся, и запоминать расположение вещей в пространстве, а также положило начало уникальной способности мозга отделять себя от мира и строить внутреннюю модель окружающей среды. Чтобы отслеживать свое местоположение в пространстве, животному нужно уметь различать «что-то плывет ко мне» и «я плыву к чему-то».[2]2
Читайте саммари книги Джеффа Хокинса «Мозг, умноженный на 1000. Новая теория интеллекта».

[Закрыть] А восприятие точного времени позволило им знать не только что делать, но и когда это делать.

Прорыв третий: млекопитающие и моделирование

В девонский, каменноугольный и пермский периоды (420–250 млн лет назад) наземные растения и животные вышли на сушу. Это привело к появлению терапсид, или ранних млекопитающих, – наших первых теплокровных предков.

Основной новой структурой мозга, которая появилась у ранних млекопитающих, был неокортекс – ядро, из которого возник человеческий интеллект. Его появление ознаменовало значительный скачок в когнитивных способностях, представив концепцию моделирования – способности внутренне воспроизводить симуляцию реальности. Ранние млекопитающие теперь обучались не только посредством действий, как ранние позвоночные, но и посредством воображения. Как это работает?

• Сенсорный неокортекс создает внутреннюю модель внешнего мира.

Он постоянно воспроизводит симуляцию вашей среды, сравнивая фактические сенсорные данные с данными, предсказанными симуляцией.[3]3
Читайте саммари книги Анила Сета «Быть собой. Новая теория сознания».

[Закрыть]

Так вы можете немедленно распознать что-то неправильное в окружении. Пока вы идете, неокортекс воспроизводит симуляцию ходьбы; если симуляция согласуется с сенсорными данными, вы ничего не замечаете, но если вы ставите ногу и в определенный момент не чувствуете земли, то немедленно смотрите вниз, чтобы увидеть, нет ли под ногами выбоины. Таким же образом мозг заполняет пробелы. Основываясь на полученных сенсорных данных и внутренней симуляции, мозг дополняет неполную картину.

• Внутренняя модель позволяет млекопитающим учиться посредством «косвенных проб и ошибок» – моделировать ситуации и делать выбор на основе воображаемых результатов, не совершая физических действий.

В 1930-х годах психолог Эдвард Толман заметил, что крысы останавливались и оценивали варианты пути на развилках лабиринтов, где выбор не был очевиден. Они мысленно моделировали потенциальные пути перед тем, как действовать, что было подкреплено исследованиями мозговой активности.

• Неокортекс хранит и воспроизводит эпизодические воспоминания. Это позволяет млекопитающим вспоминать прошлые события и использовать эти воспоминания для корректировки своего поведения.

• Внутренняя модель позволяет млекопитающим использовать «контрафактное обучение» и испытывать сожаление. Симулируя альтернативное прошлое, они решают, какие действия могли бы быть наиболее полезны.

Крысы сожалели, когда делали неправильный выбор в лабиринте. Когда они проходили мимо еды, которую не могли получить, они останавливались и оглядывались, сожалея о неверном выборе пути. Нейроны во вкусовой зоне неокортекса активировались, показывая, что крысы буквально представляли себе мир, в котором они сделали другой выбор и могли съесть еду.

Всякий раз, когда обезьяны проигрывали в «Камень, ножницы, бумага», их следующий ход всегда был смещен в сторону хода, который бы привел к победе в предыдущей игре.

• Возникла агранулярная префронтальная кора (aПФК).

АПФК генерирует намерение совершить действие и позволяет планировать. Похоже, что у ранних млекопитающих сами симуляции воспроизводились в сенсорном неокортексе, а их воспроизведение контролировалось в аПФК. Повреждение aПФК лишает животных намерений.

Жертва инсульта с повреждением аПФК была физически дееспособна, но у нее отсутствовала мотивация, речь или интерес к чему-либо. Во время восстановления пациентка описала свои предыдущие шесть месяцев как переживание «пустого» ума без желания участвовать в разговорах, поскольку у нее не было намерения и мотивации совершать действия.[4]4
Читайте саммари книги Джилл Тейлор «Удар прозрения. Частное путешествие исследователя мозга».

[Закрыть]

• У более поздних млекопитающих развилась моторная кора, что позволило им планировать и выполнять точные движения.

Таким образом, наши предки-млекопитающие 100 млн лет назад использовали воображение для выживания – неокортекс внутренне воспроизводил симуляцию реальности, позволяя животным переосмысливать прошлые события и планировать будущее.

Подобную систему задействовали и в нейросетях. В 2017 году DeepMind от Google представил AlphaZero – искусственный интеллект, который впервые превзошел человека в го – более сложной игре, чем шахматы, победив чемпиона мира Ли Седоля. В отличие от более ранних моделей, AlphaZero использовала моделирование тысяч будущих игровых сценариев для определения оптимальных ходов. Этот метод аналогичен тому, как млекопитающие моделируют возможные исходы при принятии решений.

Однако Беннетт и многие другие исследователи считают, что до внутренней симуляции животных нейросетям еще далеко. Неокортекс – это машина для прогнозирования целого мира, воспроизводящая все трехмерное пространство вокруг животного и обрабатывающая множество сигналов различного типа. В то же время современные модели ИИ способны работать только в узком наборе параметров, для которых они были специально обучены.

Прорыв четвертый: приматы и ментализация

Наши прямые предки нашли убежище на высоких деревьях Африки семь миллионов лет назад – это были первые приматы. Их эволюция разделилась на два пути: по первому пошли предки современных шимпанзе, по второму – предки людей.

Мозг ранних приматов увеличился в размерах более чем в 100 раз, и у этого есть несколько причин.

• Первые приматы перешли на питание фруктами.

Ранние приматы питались фруктами прямо на верхушках деревьев. Это давало изобилие калорий, которые можно было тратить на развитие более крупного мозга. Кроме того, из-за отсутствия хищников у приматов было достаточно времени для приобретения сложных социальных навыков.

• Они жили в уникальных социальных группах.

У сообществ приматов уникальная социальная иерархия, которая основана не только на физической силе, но и на политических союзах. Они отслеживают не только поведение отдельных лиц, но и конкретные отношения между ними. Они формируют союзы с оказанием поддержки в конфликтах, и эта дружба имеет решающее значение для определения социального ранга. В социальных группах приматов также, как правило, существует иерархия целых семей.

• Развилась новая область неокортекса – гПФК для моделирования собственного разума и разума других.

Гранулярная префронтальная кора (гПФК) играет ключевую роль в способности проецировать себя – свои намерения, чувства, мысли, личность и знания, «самомодель» – во внутренние симуляции, будь то прошлое или воображаемое будущее. Беннетт называет это ментализацией.

Люди с повреждением гПФК могут представлять сложные детальные сцены, но им трудно представить в них себя. Некоторые люди с повреждением гПФК не узнают себя в зеркале.

ГПФК, по-видимому, играет ключевую роль как в моделировании собственного разума, так и в способности моделировать разум других. Это помогло первым приматам развить три ключевые способности – теорию разума, имитационное обучение и предвосхищение будущих потребностей.

• Теория разума: понять намерения и знания других.

Приматы могут догадываться о том, о чем думают другие и каков их опыт.

Тест Салли – Энн, или тест на ложные убеждения, оценивает способность человека понимать, что у других людей могут быть другие убеждения и знания. Участники наблюдают за сценарием, в котором Салли не знает о действиях Энн, – например, Энн прячет вещь Салли, пока Салли находится в другой комнате. Чтобы правильно ответить на вопрос «Где Салли будет искать эту вещь?», нужно осознать, что Салли обладает иными знаниями, чем вы. Люди с поврежденной гПФК испытывают трудности с такими тестами.

Теория разума могла позволить нашим предкам активно обучать – обучение требует понимания того, чего не знает другой разум. Она также помогала учащимся не терять мотивацию, поскольку она позволяет им определять цель сложного навыка, и различать намеренные и непреднамеренные действия учителя.

В 2009 году исследователи Росс и Дрю Багнелл разработали нейросеть для управления машиной в виртуальной игре. Вместо того чтобы обучать ИИ имитировать предварительно записанное вождение человека, они использовали активный метод обучения, при котором Росс и система ИИ поочередно управляли автомобилем. ИИ учился на вождении Росса и быстро исправлял ошибки под его руководством. Этот подход, похожий на то, как мать-шимпанзе исправляет действия своего детеныша, оказался весьма эффективным в обучении нейросети практически идеальному вождению за короткое время.

В 2010 году исследователи успешно обучили систему ИИ выполнять сложные фигуры высшего пилотажа дистанционно управляемым вертолетом. Вместо того чтобы просто повторять действия людей, система ИИ была запрограммирована определять, почему они совершали те или иные действия. Этот метод отфильтровал ошибки людей и позволил ИИ исправлять свои собственные ошибки, успешно обучив нейросеть автономно выполнять воздушные акробатические трюки. Это подтверждает идею о том, что теория разума, с помощью которой приматы понимают намерения своих собратьев, необходима для обучения и передачи навыков.

• Имитационное обучение: приобретение новых навыков посредством наблюдения.

«Зеркальные нейроны» в моторной коре обезьяны активируются не только когда обезьяна сама выполняет определенные действия, но и когда она наблюдает, как их выполняют другие. Моторная кора отражает действия, которые она наблюдает.

Обучение посредством наблюдения существует и у других млекопитающих, и даже у позвоночных. Однако приматы могут приобретать совершенно новый двигательный навык посредством наблюдения, например использовать инструменты, которые они никогда раньше не видели.

• Предвосхищение будущих желаний. Предпринять действие сейчас, чтобы удовлетворить потребность в будущем.

Беличьи обезьяны способны противостоять искушению съесть сладкое лакомство сразу, если у них нет источника воды, потому что они знают, что будут испытывать жажду. Напротив, крысы совершенно неспособны отказаться от сладостей ради воды, поскольку не хотят пить в моменте.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!