Электронная библиотека » Даниэль Канеман » » онлайн чтение - страница 11


  • Текст добавлен: 10 января 2022, 15:07


Автор книги: Даниэль Канеман


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 11 (всего у книги 39 страниц) [доступный отрывок для чтения: 11 страниц]

Шрифт:
- 100% +
Еще больше простоты: простые правила

Еще один способ упрощения – использование экономных моделей, или простых правил. Экономные модели в реальности выглядят как упрощенные до смешного расчеты на клочке бумаги. Однако в некоторых случаях они могут выдавать поразительно точные результаты.

Эти модели построены на одной особенности множественной регрессии, которая удивляет большинство людей. Допустим, вы используете два прогностических фактора, от которых в значительной степени зависит итоговый прогноз, – их корреляция с конечным результатом составляет 0,60 (ПС=71 %) и 0,55 (ПС=69 %). Предположим также, что эти два прогностических фактора коррелируют друг с другом (коэффициент 0,50). Попробуйте угадать, каков будет ваш прогноз, если два фактора будут в оптимальном соотношении? Ответ вас разочарует: корреляция 0,67 (ПС=73 %). Выше, однако совсем ненамного.

Пример иллюстрирует общее правило: сочетание двух и более коррелирующих между собой прогностических факторов дает лишь немногим более удачный результат, чем лучший из них сам по себе. Именно потому что в реальной жизни факторы почти всегда коррелируют между собой, этот статистический факт способствует применению на практике экономных методов с малым числом предикторов. Простые правила, которые требуют небольшого числа расчетов или обходятся вообще без них, давали в некоторых случаях впечатляюще точные прогнозы, сравнимые с моделями на основе большего количества предикторов.

В 2020 году команда исследователей121 подвела итоги масштабных усилий по применению экономных методов к различным задачам; например, когда судьи встают перед выбором – освободить обвиняемых под залог до вынесения приговора или нет. Их решение, по сути, является прогнозированием поведения обвиняемого. Если судья неоправданно откажет в залоге и обвиняемого отправят за решетку без необходимости, то конкретный человек и общество понесут значительные издержки. Если же под залог отпустят не того, он может скрыться или даже совершить другое преступление.

Модель, построенная исследователями, использует всего две переменных, от которых наиболее сильно зависит вероятность, что обвиняемый скроется от суда: его возраст (чем старше человек, тем меньше риск побега) и количество прошлых неявок в суд (те, кто нарушал условия освобождения ранее, склонны к рецидивам). Модель переводила эти переменные в баллы, на основании которых и рассчитывался фактор риска. Для этого не требовался компьютер и даже калькулятор.

Протестированная на реальном массиве данных, экономная модель выполнила свою задачу так же хорошо, как статистические модели с использованием значительно большего числа переменных. Она прогнозировала риски лучше, чем это делали практически все судьи.

Те же самые экономичные методы, использующие до пяти параметров с целочисленными весами (от -3 до +3), были применены к разнообразным задачам, таким как оценка степени опасности новообразований по результатам маммографии, диагностике сердечно-сосудистых заболеваний, прогнозированию кредитных рисков. Во всех этих задачах экономные правила показали себя так же хорошо, как более сложные регрессивные модели (хотя в большинстве случаев не так хорошо, как модели на основе методов машинного обучения).

В качестве другой демонстрации возможностей простых правил отдельная команда исследователей121а изучала сходную, хотя и более специфическую судебную задачу: прогноз рецидивизма. Используя всего две переменных122, простые правила оказались способны поспорить с надежностью существующих инструментов, которые использовали 137 переменных, чтобы оценить риски для каждого подсудимого. Неудивительно: эти две переменных (возраст и количество ранее совершенных преступлений) близки к двум факторам в примере с освобождением под залог, и их связь с преступным поведением широко документирована123.

Привлекательность экономных методов состоит в том, что они прозрачны и просты в исполнении. Более того, они имеют преимущество перед более сложными моделями вследствие относительно малых затрат.

Больше сложности: методы машинного обучения

Во второй части нашего обзора мы двинемся в противоположном направлении диапазона – к большей сложности. Что если мы сумеем взять еще больше прогностических факторов, собрать еще больше данных о каждом, выявить взаимосвязи, которые человеку обнаружить не под силу, и создать на их основе модель, которая добьется лучших прогнозов? В сущности, это нам и обещает ИИ.

Продвинутые модели отличает умение работать с очень большими массивами данных124, и растущая возможность доступа к таким наборам данных – одна из основных причин стремительного прогресса ИИ в последние годы. Например, благодаря таким массивам появилась возможность механической обработки даже там, где требуется применить правило сломанной ноги. Это несколько загадочное выражение обязано своим появлением воображаемой ситуации, придуманной Милом. Допустим, некая модель разработана, чтобы прогнозировать вероятность посещения кинотеатра сегодня вечером. Если вы случайно узнали, что конкретный человек сломал ногу, то лучше модели представляете, как он проведет вечер – независимо от степени вашего доверия модели.

При использовании простых моделей принцип сломанной ноги дает важный урок тем, кто принимает решения: он сообщает им, когда стоит отвергнуть модель, а когда нет. Если у вас есть не вызывающая сомнений информация, которую модель не примет во внимание, это и есть та самая «сломанная нога», и вам лучше не учитывать рекомендации модели. С другой стороны, порой может случиться так, что вы не согласитесь с моделью даже при отсутствии конфиденциальной информации. В таких случаях соблазн не послушаться модели отражает ваш личный шаблон, который вы применяете к аналогичным предикторам. Когда же этот личный шаблон с высокой степенью вероятности неприменим, следует прислушаться к модели; ваше вмешательство, скорее всего, снизит точность прогноза.

Одна из причин успешной работы моделей на основе методов машинного обучения в сложных задачах – то, что они способны распознавать «сломанные ноги», причем намного лучше, чем кажется людям. Обработав огромный массив данных, включающий очень большое количество случаев, модель может отследить поведение завсегдатаев кинотеатров и в самом деле усвоить, например, что люди, посетившие больницы в те дни, когда они обычно ходят в кино, вероятнее всего, пропустят сегодня вечерний сеанс. Таким образом, усовершенствованные прогнозы редких событий сокращают необходимость человеческого контроля.

В том, что делает ИИ, нет ни магии, ни подлинного интеллекта – главное, найти больше различных сценариев. Как бы мы ни восхищались мощью умной машины, не следует забывать, что искусственному интеллекту потребуется еще некоторое время, чтобы понять, почему сломавший ногу человек не сможет пойти в кино.

Освобождение под залог: оптимальные решения

В то же самое время, когда вышеупомянутая команда исследователей применила к проблеме освобождения под залог простые правила, другая команда125 под руководством Сендила Муллайнатана натаскивала на выполнение той же задачи продвинутую модель на основе ИИ. Группа имела доступ к более обширному массиву данных – 758 027 ранее принятых решений. В каждом случае исследователям была доступна та же информация, что и судьям: текущее преступление, имеющиеся судимости, предыдущие неявки в суд. Никакой демографической информации, кроме возраста, для тренировки алгоритма не использовалось. Исследователям также было известно в каждом конкретном случае, отпустили ли обвиняемого под залог; и если да, то явился ли он впоследствии в суд или был арестован повторно. (Из всех обвиняемых были освобождены 74 %; 15 % из них не явились в суд, и 26 % арестованы повторно.) С этими данными исследователи тренировали алгоритм126 и оценивали его возможности. Поскольку модель построили на основе методов машинного обучения, она не ограничивалась линейными комбинациями. Обнаруживая более сложную закономерность в данных, модель использовала этот сценарий для усовершенствования своих прогнозов.

Модель была ориентирована на прогнозирование побега обвиняемого и оценивала риск в баллах; перед ней не ставился вопрос, освобождать обвиняемого под залог или нет. Такой подход признает, что максимально допустимый порог риска (то есть уровень риска, при превышении которого обвиняемому откажут в выпуске под залог) требует оценочных суждений, которые не под силу модели. Тем не менее исследователи вычислили: независимо от принятого порога риска, использование модели повысит эффективность судебных решений. Команда Сендила Муллайнатана рассчитала: если порог риска установлен так, что количество человек, которым отказано в освобождении под залог, остается таким же, как по решению судей, то уровень преступности может сократиться на 24 %, потому что за решетку попадут преступники, наиболее склонные к рецидиву. И наоборот, если порог риска установлен так, чтобы максимально сократить количество человек, которым отказано в освобождении под залог, причем без риска роста преступности, то количество взятых под стражу может уменьшиться на 42 %. Другими словами, модель на основе методов машинного обучения намного лучше судей справляется с задачей по прогнозированию и подсказывает, каких обвиняемых рискованно отпускать.

Модель, построенная обученной машиной, оказалась также более успешной, чем линейные модели, использующие ту же информацию. Причина звучит интригующе: «Алгоритмы на основе методов машинного обучения вылавливают127 в комбинации переменных значимые совпадения, которые в иных случаях могли быть упущены». Способность алгоритмов легко находить сценарии, упущенные другими методами, особенно резко выражена в случае обвиняемых, которым алгоритм присвоил самую высокую степень риска. Другими словами, некоторые сценарии в массиве данных, пусть даже редкие, прогнозируют высокий риск. Это открытие – когда алгоритмы выхватывают редкие, но решающие факторы – возвращает нас к концепции сломанной ноги.

Исследователи также использовали алгоритм для построения модели каждого судьи, аналогичной описанной в главе 9 (однако не ограниченной простыми линейными комбинациями). Применение этих моделей ко всему массиву данных позволило команде симулировать решения судей, которые они вынесли бы при рассмотрении тех же самых дел, и сравнить с реальными. Результаты выявили существенный системный шум в решениях об освобождении под залог. Отчасти это межэкспертный шум: если судей отсортировать по степени их благосклонности, наиболее снисходительный квинтиль[10]10
  Квинтиль – пятая часть.


[Закрыть]
(20 % судей, которые отпускают под залог чаще всего) освобождал 83 % обвиняемых, в то время как наименее снисходительный квинтиль – всего 61 %. Кроме того, оценивая риск побега заключенных, судьи будто судили их по разным шаблонам. Одному судье конкретный подсудимый не показался склонным к побегу, в то время как другой, в целом совсем не строгий, определил его в группу высокого риска. Эти результаты свидетельствуют о явном присутствии внутриэкспертного шума. Более детальный анализ выявил, что различия между прецедентами составили 67 % от всех расхождений, а системный шум – 33 %. Некоторую долю системного шума составлял128 межэкспертный шум, например, обусловленный неодинаковой строгостью судей, однако большей частью (79 %) это был внутриэкспертный шум.

Наконец – и к счастью – бóльшая точность программ на основе методов машинного обучения достигается не за счет других поддающихся учету целей, которых могут добиваться судьи, в особенности расовой справедливости. Теоретически, хотя в алгоритм не заложены данные о расе обвиняемых, программа может непреднамеренно усугублять расовое неравенство. Оно может возникнуть, если модель использует прогностические факторы, в сильной степени коррелирующие с расой (например, почтовый индекс), или необъективен источник данных, на котором обучался алгоритм. Если, к примеру, прогностический фактор – количество предыдущих арестов, а эти аресты производились на почве расовой дискриминации, то и алгоритм в результате получится дискриминационным.

Несмотря на то что риск дискриминации в принципе присутствует, решения на основе алгоритма во многих важных аспектах содержат как раз меньше расовых предубеждений, чем судейские решения. Например, если порог риска установлен так, чтобы получить такой же уровень преступности, каким он был бы при судейских решениях, алгоритм отправит за решетку на 41 % меньше цветных. Похожие результаты обнаружены и в других сценариях: выигрыш в точности не влечет за собой обострения расовой дискриминации – и, как показали исследователи, алгоритм можно легко запрограммировать на ее сокращение.

Еще одно исследование в другой области иллюстрирует, как алгоритмы могут одновременно повышать точность и сокращать дискриминацию. Бо Каугилл, профессор Колумбийской школы бизнеса, изучал набор инженеров-программистов129 в крупной технологической компании. Вместо того чтобы поручить человеку на основе резюме отобрать кандидатов на собеседование, Каугилл разработал алгоритм сортировки резюме и обучил его на более чем трехстах тысячах заявлениях, которые компания получила и приняла к рассмотрению ранее. Кандидатов, которым по результатам собеседования предложили работу, среди отобранных алгоритмом оказалось на 14 % больше, чем среди отобранных специалистами кадровой службы. А когда им предложили работу, из первой группы приняли на 18 % больше человек, чем из второй. Алгоритму также предложили более пеструю группу кандидатов, различающихся по расе, полу и другим показателям; тут была бóльшая вероятность выбрать «нетрадиционных» соискателей – тех, кто не окончил элитную школу, не имел опыта работы, не предоставил рекомендаций. Люди больше отдавали предпочтение резюме, авторы которых поставили галочки напротив всех типовых для инженера-программиста пунктов анкеты, однако алгоритм присвоил каждому существенному фактору должный вес.

Конечно, данные примеры еще не доказывают, что алгоритмы всегда честны, беспристрастны и свободны от дискриминации. Мы рассмотрели на хорошем примере алгоритм, призванный прогнозировать успех кандидатов, однако в действительности он обучен на выборке прошлых кадровых решений и, само собой, будет повторять все человеческие предпочтения.

К тому же представляется возможным, причем довольно легко, построить алгоритм, который увековечивает расовое или гендерное неравенство; прецедентов создания именно таких алгоритмов немало. Очевидность подобных случаев объясняет растущее беспокойство по поводу искажений в принятии решений на основе формул. Тем не менее, прежде чем делать общие выводы, следует помнить, что иной алгоритм не только точнее человека, но еще и честнее.

Почему мы не так часто используем правила?

Подводя итог короткому туру, посвященному механическим методам принятия решений, мы снова назовем две причины превосходства всех видов правил над экспертными оценками. Во-первых, как описано в главе 9, все механические методы прогнозирования – а не только самые современные и продвинутые – способны одержать победу над любым экспертом. Комбинация личных предубеждений и ситуативного шума настолько сильно воздействует на качество экспертных оценок, что простота и «бесшумность» становятся немалым преимуществом. Простые и к тому же удобные правила обычно справляются лучше людей.

Во-вторых, обширного массива данных для продвинутого ИИ порой достаточно, чтобы распознать эффективные сценарии и намного превысить мощность простой модели. Когда ИИ успешно осваивает такие методы, преимущества моделей над экспертами состоят уже не только в отсутствии шума, но и в способности обработать намного больше информации.

Учитывая эти преимущества, подкрепленные огромным количеством фактов, стоит задаться вопросом: почему алгоритмы не используются более широко в различных видах профессиональных оценок, которые мы обсуждаем в данной книге? Наперекор всем оживленным дискуссиям об алгоритмах и методах машинного обучения их применение остается ограниченным, несмотря на наличие важных исключений в специфических сферах деятельности. Многие эксперты не берут в расчет дебаты клиницистов с приверженцами механических моделей, предпочитая свои суждения. Они доверяют своей интуиции и сомневаются в превосходстве машин, воспринимая саму идею принятия решений на основе алгоритмов как бездушный механический процесс и как способ снять с себя ответственность.

В частности, применение алгоритмов в постановке диагнозов до сих пор не стало общепринятой практикой, несмотря на впечатляющие успехи. Немногие организации используют алгоритмы при найме сотрудников и их продвижении по службе. Руководители киностудий в Голливуде дают зеленый свет фильмам на основе своих предпочтений и опыта, а не каких-то формул; с книгоиздателями та же история. И даже если легенда о помешанной на статистике бейсбольной команде «Окленд атлетикс», которую поведал Майкл Льюис в своем бестселлере «Moneyball», произвела сильный эффект, то лишь потому, что отбор кандидатов в команду на основе строгих математических расчетов длительное время считался исключением, а не правилом. Даже сегодня тренеры, менеджеры и те, кто с ними сотрудничает, чаще доверяют только своей интуиции, утверждая, что статистический анализ не сможет прийти на смену здравому смыслу.

В одной из статей 1996 года130 Мил и его соавтор перечислили (и опровергли) не менее семнадцати типов возражений в отношении механических методов со стороны психиатров, врачей, судей и других профессионалов. Авторы статьи пришли к выводу, что сопротивление клиницистов можно объяснить сочетанием социопсихологических факторов, включая «страх перед технологической безработицей», «недостаточную образованность» и «обычную неприязнь к компьютерам».

С тех пор исследователи распознали дополнительные факторы, которые способствовали этому сопротивлению. Мы не ставим цель предложить вам здесь полный их обзор. Цель этой книги – дать предложения по улучшению оценочных суждений, которые делают люди, а не выступать «за замену людей машинами», как выразился бы судья Франкел.

Однако некоторые выводы относительно того, что побуждает людей сопротивляться механическому прогнозированию, существенны для нашей дискуссии. В ходе недавних исследований всплыла одна ключевая догадка: люди не всегда относятся к алгоритмам с подозрением. Например, если есть выбор, у кого спросить совета – у человека или алгоритма, – они часто предпочитают алгоритм131. Неприятие, или антипатия к алгоритмам, не всегда проявляет себя как тотальный отказ от использования новейших инструментов в процессе принятия решений. Люди чаще выражают готовность дать шанс алгоритму, однако прекращают доверять ему, как только обнаруживают, что он делает ошибки132.

С одной стороны, подобная реакция кажется здравой: к чему связываться с алгоритмом, которому не доверяешь? Как и все люди, мы прекрасно сознаем, что делаем ошибки, однако делиться этой привилегией не готовы. Мы ожидаем от машин совершенства. А если наши ожидания не оправдались?133 Значит, долой машины!

Однако из-за своих интуитивных ожиданий люди, как правило, не доверяют алгоритмам и продолжают использовать свои оценочные суждения, даже когда подобный выбор приносит явно худшие результаты. Такая позиция глубоко укоренилась и едва ли изменится, пока точность прогнозов не станет практически идеальной.

К счастью, большинство методов, которые делают правила и алгоритмы более совершенными, могут взять на вооружение и люди. Мы не надеемся пользоваться информацией так же эффективно, как модели на основе ИИ, однако можем стремиться копировать простоту и «бесшумность» простых моделей. Когда мы усвоим методы сокращения системного шума, то сами увидим, что качество наших прогнозов улучшается. Это станет основной темой части V.

К разговору о правилах и алгоритмах

«На больших массивах данных алгоритмы на основе методов машинного обучения работают лучше людей и лучше простых моделей. Однако даже самые простейшие правила и алгоритмы имеют большое преимущество над людьми: они свободны от шума и не стараются прибегать к запутанным и в большинстве случаев непродуктивным домыслам в отношении прогностических факторов».

«Поскольку у нас недостаточно данных о конечном результате, который должны спрогнозировать, почему бы не использовать равновесную модель? Она почти не уступает «правильной» модели и в отдельных случаях уверенно справится с задачей лучше человека».

«Вы не соглашаетесь с прогнозом модели. Я вас понимаю. Однако что у нас по факту – «сломанная нога» или вам просто не нравится сам прогноз?»

«Конечно, алгоритм порой ошибается. Но ведь еще больше ошибок делают люди. Кому же следует доверять?»

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации