Автор книги: Эрик Тополь
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 5 (всего у книги 27 страниц) [доступный отрывок для чтения: 9 страниц]
Он наблюдал женщину в возрасте за тридцать со скованностью и болью в суставах кистей рук. Врач был не вполне уверен в диагнозе ревматоидного артрита и отправил в HumanDx сообщение: «Женщина 35 лет с болью и скованностью в суставах кистей обеих рук; болеет в течение 6 месяцев. Подозрение на ревматоидный артрит». К сообщению врач приложил фотографию кистей рук пациентки. В течение нескольких часов на это сообщение откликнулись многие ревматологи, подтвердившие диагноз. К 2022 г. HumanDx планирует заполучить в свои ряды по меньшей мере 100 тыс. врачей, а также расширить использование алгоритмов обработки естественного языка для направления важнейших данных соответствующим специалистам, сочетая инструментарий ИИ с врачебным краудсорсингом.
Альтернативная модель краудсорсинга, призванная улучшить качество диагностики, предусматривает так называемую «гражданскую науку» – участие общественности в научных исследованиях. Платформа, разработанная компанией CrowdMed, запускает финансово стимулируемую конкуренцию между врачами и любителями по «раскалыванию» трудных диагностических случаев. Привлечение к диагностике лиц, не имеющих отношения к клинической медицине, является абсолютным новшеством и уже привело к неожиданным результатам: как рассказал мне основатель и генеральный директор компании Джаред Хейман, любители ставят верные диагнозы чаще, чем врачи-специалисты. У нашей исследовательской группы не было возможности проверить эти данные или подтвердить точность окончательных диагнозов. Но если эти данные верны и обоснованны, то у этого преимущества может быть свое объяснение: у любителей больше времени для углубленного изучения каждого случая, что лишь подчеркивает, как важно не спешить и тщательно работать для получения правильного ответа на трудный вопрос.
Единственная компания, открыто заявившая о своих амбициозных планах по улучшению качества медицинской диагностики и результатов лечения, – IBM, которая готова делать это с помощью своего суперкомпьютера Watson и искусственного интеллекта (см. рис. 3.3). В 2013 г. IBM начала работать совместно с ведущими медицинскими центрами, потратила миллиарды долларов на покупку необходимых компаний и загрузила в Watson данные пациентов, медицинские изображения, миллионы анамнезов, биомедицинскую литературу, а также платежные документы[68]68
. “Doctor Evidence Brings Valuable Health Data to IBM Watson Ecosystem,” IBM Press Release. 2015.
[Закрыть]. К 2015 г. IBM объявила, что Watson обработал 15 млн страниц медицинского контента, более 200 учебников по медицине и 300 медицинских журналов. Огромное количество публикаций, появляющихся ежедневно, представляет собой базу знаний, которые медицинское профессиональное сообщество, разумеется, не способно переработать полностью, но которые тем не менее могут быть полезны. В 2016 г. IBM даже приобрела компанию Truven Health Analytics за $2,6 млрд для того, чтобы можно было ввести в ненасытную память Watson данные о 100 млн пациентов, которыми располагала компания[69]69
Ross, C., and I. Swetlitz, “IBM Pitched Its Watson Supercomputer as a Revolution in Cancer Care: It’s Nowhere Close,” Stat News. 2017.
[Закрыть].
Когда несколько лет назад сотрудники команды, обслуживающей Watson, посетили наш Научно-исследовательский институт Скриппса, нам было продемонстрировано, как ввод симптомов в компьютер выдает дифференциальный диагноз, в котором конкурирующие диагнозы ранжированы по вероятности. Однако если бы мы захотели использовать Watson для нашей программы геномного секвенирования пациента с неизвестной болезнью, то нам пришлось бы выложить за это более $1 млн. Этого мы себе позволить не могли. Но другие центры это не испугало, и они, разумеется, поделились результатами.
Самые впечатляющие результаты, полученные в Комплексном онкологическом центре Линебергера при Университете Северной Каролины (UNC), были продемонстрированы в телешоу CBS «60 минут» в 2016 г. Директор этого центра Норман Шарплесс – теперь он директор Национального института рака (NCI) – рассказал, что изначально скептически относился к перспективе использования искусственного интеллекта для улучшения результатов лечения онкологических заболеваний. Из всех методов, использованных специалистами UNC для лечения 1 тыс. пациентов, 30 % были определены с помощью Watson на основании компьютерного анализа рецензированной литературы по вопросам онкологии[70]70
Patel, N. M., et al., “Enhancing Next-Generation Sequencing-Guided Cancer Care Through Cognitive Computing.” The Oncologist, 2018. 23 (2): pp. 179–185.
[Закрыть]. Надо помнить, что лечение – это не то же самое, что улучшение диагностики, но способность Watson «проглотить» и обработать более 160 тыс. исследований по онкологии, которые ежегодно публикуются по этой теме, может стать отличным подспорьем в деле помощи некоторым пациентам. Первая публикация (в рецензируемом издании) результатов исследования с привлечением материалов по 1 тыс. пациентов клиники Университета Северной Каролины выявила 300 случаев, когда адекватное лечение предложил Watson, а не онкологи[71]71
Patel, et al., “Enhancing Next-Generation Sequencing-Guided Cancer Care Through Cognitive Computing.”
[Закрыть].
Однако сотрудничество Watson с Онкологическим центром М. Д. Андерсона, одним из ведущих противораковых центров США, обернулось фиаско, отмеченным многими просчетами. Одной из самых фундаментальных ошибок стало утверждение, будто поглощение миллионов страниц медицинской информации – это то же самое, что ее осмысление и разумное использование. Глава проекта Центра Андерсона по тестированию Watson доктор Линда Чин сформулировала это так: «Научить машину читать медицинскую карту труднее, чем кажется»[72]72
Mukherjee, S., “A. I. Versus M. D.: What Happens When Diagnosis Is Automated?” The New Yorker. 2017.
[Закрыть]. Оказалось, что не так легко научить машину упорядочивать неструктурированные данные, распознавать сокращения, обрывки фраз и различные стили изложения, а также учитывать человеческие ошибки. Такой же пессимизм сквозит в словах Марка Криса из мемориального онкологического центра имени Слоуна—Кеттеринга, который участвовал в начальном обучении системы Watson for Oncology: «Таким способом мы не сможем изменить систему когнитивной компьютерной обработки ни на дюйм. В машину надо вложить литературу, надо вложить в нее отдельные клинические случаи»[73]73
Ross and Swetlitz, “IBM Pitched Its Watson Supercomputer as a Revolution in Cancer Care.”
[Закрыть]. Фрагментарность клинических данных и недостаток доказательных данных из медицинской литературы лишило проект предполагавшейся ценности. В конечном счете проект, обошедшийся в $62 млн, закончился провалом. Ни одна из поставленных целей не была достигнута; исследователи по ходу работы меняли направление от одного вида рака к другому, а также планировали пилотные проекты, ни один из которых так и не был запущен[74]74
Herper, M., “MD Anderson Benches IBM Watson in Setback for Artificial Intelligence in Medicine,” Forbes. 2017.
[Закрыть]. Поэтому неудивительно, что бывший менеджер IBM Питер Гройлих, рассуждая о проекте, заключил: «IBM стоит отказаться от попыток излечить рак. Маркетинговая машина работала вхолостую, нисколько не помогая создавать реальный эффективный продукт»[75]75
Ross and Swetlitz, “IBM Pitched Its Watson Supercomputer as a Revolution in Cancer Care.”
[Закрыть]. Стоит отметить позицию Исаака Когана, который возглавляет отделение биомедицинской информации медицинского факультета Гарвардского университета: «Особенно громко рекламировалось, что Центр Андерсона якобы создал платформу для диагностики лейкозов – более 150 потенциальных протоколов, платформа разработана при помощи Watson и все такое. Но на самом деле никто ее не использовал – ее просто не существовало»[76]76
Muoio, D., “IBM Watson Manager, Academics Describe Challenges, Potential of Health Care AI,” MobiHealthNews. 2017.
[Закрыть].
Рис. 3.3. Реклама суперкомпьютера Watson компании IBM
Проблемы, с которыми столкнулся компьютер IBM Watson в онкологии, типичны для всех попыток его использования в медицине для улучшения качества диагностики. Оптимистичный прогноз будущего Watson высказал в книге «Homo Deus»[77]77
Харари Ю. Н. Homo Deus. Краткая история будущего. – М.: Синдбад, 2018.
[Закрыть] Юваль Ной Харари: «Увы, даже самый внимательный врач не может помнить обо всех моих прошлых недомоганиях и обследованиях и не может одинаково разбираться во всех болезнях и лекарствах или быть в курсе всех свежих статей во всех медицинских журналах. Вдобавок к этому иногда врач переутомлен, или голоден, или даже нездоров, что сказывается на его концентрации. Неудивительно, что доктора иногда ошибаются в диагнозах или назначают не слишком действенное лечение»[78]78
Harari, Y. N., Homo Deus. 2016. New York: HarperCollins, p. 448.
[Закрыть]. Конечно, у компьютеров есть определенный потенциал, и ситуация может быть значительно улучшена, но пока обещания остаются лишь обещаниями. Трудности в сборе и объединении данных были недооценены, причем не только создателями суперкомпьютера Watson, но и всеми технологическими компаниями, которые решили заняться проблемами здравоохранения.
Мы не разделяем идей Харари, но машины необходимы нам как помощники в диагностике. В связи с тем, что перед нами стоит труднейшая проблема нарастающего потока данных и информации по каждому индивиду, а также не менее стремительного роста числа медицинских публикаций, для нас очень важно превратить искусство диагноза в цифровую науку, основанную на объективных данных. Пока, однако, в нашем распоряжении лишь ограниченное количество перспективных клинических испытаний, которые внушают надежду, что это когда-нибудь станет принципиально возможным.
Быстро и узко
До этого момента нас интересовала общая диагностика пациента и мы не касались таких более узких аспектов диагностики, как интерпретация медицинских изображений, электрокардиограмм, голоса или речи. Но именно в интерпретации этих данных в последние годы машины сделали большой прогресс.
Позвольте мне представить краткую выборку достижений искусственного интеллекта в некоторых узких областях диагностики. В том, что касается головного мозга, мы можем констатировать, что машины лучше интерпретируют снимки больных с острыми нарушениями мозгового кровообращения или с малозаметными изменениями, которые надежно указывают на возможное развитие в дальнейшем болезни Альцгеймера. Если говорить об исследованиях сердца, машины способны к качественной интерпретации электрокардиографических признаков нарушений сердечного ритма и анализу эхокардиограмм. В онкологии машины успешно анализируют картины поражений кожи, а также морфологию опухолей в микроскопических препаратах. Большая работа была проделана по усовершенствованию автоматической диагностики в офтальмологии на основании фотографий сетчатки. Обработка и анализ звуков – голоса и речи – помогли в диагностике посттравматического стрессового расстройства и травматических поражений головного мозга. Даже анализ формы звуковой волны кашля использовали для облегчения диагностики бронхиальной астмы, туберкулеза легких, пневмонии и других легочных заболеваний.
Стоит упомянуть также и приложение Face2Gene от FDNA, так как оно может помочь в диагностике более 4 тыс. генетических нарушений, многие из которых очень трудно выявить и диагностировать. Примером может служить ребенок с редким синдромом Коффина—Сириса. Приложение выполняет диагностику, распознавая характерное строение лица, в течение нескольких секунд, в то время как в некоторых семьях на выявление этого заболевания у «живых» врачей ушло до 16 лет напряженного труда, дорогостоящих обследований и кропотливой работы с пациентами. Создатели приложения добились такого успеха, использовав методы глубокого обучения для анализа внешности больных и выявив редкое, но характерное сочетание черт лица, которое позволяет безошибочно диагностировать синдром. Этим приложением уже пользуются 60 % специалистов по медицинской генетике. Это хороший признак, потому что столь широкое применение неуклонно расширяет объем знаний, необходимых для точной диагностики редких заболеваний, которые в последние годы начинают встречаться все чаще и чаще. В этом случае мы вновь наблюдаем поразительный успех инструментов искусственного интеллекта в узких областях диагностики. Но дело не только в узкой специализации диагностических инструментов искусственного интеллекта. Машинная обработка данных – очень быстрая и дешевая. Было подсчитано, что машина может проанализировать 250 млн снимков за 24 часа, и обойдется это в $1 тыс.[79]79
Beam, A. L., and I. S. Kohane, “Translating Artificial Intelligence into Clinical Care.” JAMA, 2016. 316 (22): pp. 2368–2369.
[Закрыть]
Все это выглядит весьма многообещающе – но и довольно легковесно. Для того, чтобы по-настоящему оценить перспективы и нащупать подводные камни, нам необходимо глубже заглянуть в суть технологии ИИ. Например, в этой главе я много писал о человеческих когнитивных искажениях. Но те же искажения – как часть человеческой культуры – могут быть внедрены и в инструментарий искусственного интеллекта. Так как прогресс внедрения искусственного интеллекта в медицину отстает от других сфер (самоуправляющиеся автомобили, распознавание лиц и компьютерные игры), мы можем учиться на этом опыте, чтобы избежать повторения тех же ошибок в медицине. В следующих двух главах я опишу плюсы применения искусственного интеллекта, а затем перейду к минусам. Вы вместе со мной увидите, как трудно искусственному интеллекту преобразить медицину и насколько неизбежно это преображение. Однако и врачам, и пациентам будет полезно, если они смогут заглянуть за кулисы, а не слепо принимать новую эру алгоритмической медицины. Вы должны быть во всеоружии, придя на прием к доктору Алгоритму.
Глава 4
Что такое глубокое обучение
ИИ, вероятно, самое важное из всего, над чем когда-либо работало человечество. ИИ по значимости превосходит электричество или огонь.
Сундар Пичаи
В феврале 2016 г. небольшой стартап под названием AliveCor пригласил на работу двух сотрудников Google, Фрэнка Петтерсона и Саймона Пракаша, имевших опыт работы с ИИ, чтобы усовершенствовать новый продукт компании – приложение-кардиограф для смартфона. Компания переживала трудные времена. Ее сотрудники разработали приложение для смартфона, способное регистрировать ЭКГ в одном отведении, а к 2015 г. смогли вывести кривую ЭКГ на умные часы – Apple Watch. Это приложение было весьма интересным, но едва ли имело какую-то практическую ценность. Возникла угроза самому существованию компании, несмотря на то, что ее довольно щедро финансировали такие инвесторы, как Khosla Ventures и не только.
Однако у Петтерсона, Пракаша и их команды – еще троих талантливых разработчиков ИИ – была амбициозная двойная миссия. Одной из их целей было создание алгоритма, который мог бы улавливать нарушения сердечного ритма, а второй – определение концентрации ионов калия в крови: всего лишь по рисунку ЭКГ, регистрируемой часами. Эта идея вовсе не выглядела безумной, если учесть, кто именно работал в компании AliveCor. Вице-президент компании Петтерсон – высокий, голубоглазый мужчина с залысинами; интроверт, как и большинство инженеров. В Google он возглавлял отделы YouTube Live и игр, а также занимался проектированием Hangouts. За плечами у него были заслуженный «Оскар» и работа над девятью художественными фильмами, включая «Трансформеры», «Звездный путь», несколько серий «Гарри Поттера» и «Аватар». Пракаш, заместитель директора по производству и дизайну, не обласкан Киноакадемией, но зато отличается красотой; темноволосый и темноглазый, он похож на голливудского актера. Эта юношеская внешность не вполне вяжется с двадцатилетним опытом организации производства: помимо прочего, он возглавлял разработку очков Google Glass. Кроме того, он девять лет проработал в Apple, участвовал в разработке первого iPhone и iPad. В этом послужном списке можно при желании усмотреть некоторую иронию.
Тем временем команда из 20 инженеров и ИТ-специалистов Apple, работавшая всего в десятке километров от AliveCor, приступила к созданию встроенного в наручные часы устройства, способного распознавать мерцательную аритмию. Эта группа пользовалась практически неисчерпаемыми ресурсами Apple и мощной корпоративной поддержкой: руководитель производственного отдела компании Джефф Уильямс, ответственный за разработку и выпуск часов Apple, говорил о новом продукте как о медицинском приборе будущего. Когда мне выпала возможность посетить Apple в качестве консультанта и воочию увидеть прогресс в этой работе, у меня не возникло никаких сомнений относительно важности и приоритетности этого проекта. Казалось, еще немного, и цель будет достигнута.
На первый взгляд цель компании Apple казалась более достижимой. И действительно: определение уровня калия в крови с помощью часов – это не совсем то, чего мы ждем от подобного устройства. Но эпоха глубокого обучения, как мы увидим, опрокинула множество ожиданий и прогнозов.
Идея родилась не в AliveCor. В клинике Мэйо Пол Фридман и его коллеги занимались изучением части кривой ЭКГ, называемой зубцом Т, и в частности корреляцией его формы с уровнем содержания калия в крови. Мы, врачи, давно знали, что высокий и заостренный зубец Т говорит о повышении концентрации калия в крови, а увеличение концентрации свыше 5,0 мэкв/л может представлять опасность для жизни. Риск увеличения концентрации калия в крови особенно высок у людей с почечными заболеваниями. Чем больше уровень калия превышает 5,0 мэкв/л, тем выше вероятность внезапной смерти от опасных нарушений сердечного ритма, особенно при тяжелых почечных заболеваниях или у пациентов, находящихся на гемодиализе. Данные Фридмана были основаны на корреляции формы кривой ЭКГ и уровней концентрации калия всего у 12 пациентов до, во время и после сеансов гемодиализа. Свои находки группа опубликовала в малоизвестном журнале по электрофизиологии в статье с подзаголовком «Обоснование концепции нового “бескровного” метода анализа крови»[81]81
Dillon, J. J., et al., “Noninvasive Potassium Determination Using a Mathematically Processed ECG: Proof of Concept for a Novel ‘Blood-Less,’ Blood Test.” Journal of Electrocardiology, 2015. 48 (1): pp. 12–18.
[Закрыть].
Фридман и его группа горели желанием превратить свою идею в новый способ регистрации ЭКГ с помощью смартфонов или электронных часов со встроенными инструментами искусственного интеллекта. Вместо того, чтобы обратиться в такие крупные компании, как Medtronic или Apple, они в феврале 2016 г. пообщались с генеральным директором AliveCor Виком Гундотрой – незадолго до того, как к руководству компанией присоединились Петтерсон и Пракаш. Гундотра – это еще один бывший инженер Google: по его словам, он решил перейти в AliveCor, поверив, что на ЭКГ можно обнаружить много весьма важных признаков[82]82
Vic Gundotra, Frank Petterson, and Simon Prakash interview with Eric Topol, AliveCor. November 2017.
[Закрыть]. И в итоге на исходе 2016 г. клиника Мэйо и AliveCor подписали соглашение о сотрудничестве.
Клиника Мэйо располагала архивом из 1,3 млн электрокардиограмм, выполненных в 12 отведениях за более чем 20 лет, и к каждой электрокардиограмме прилагался анализ с данными о содержании в крови калия у соответствующих пациентов. Анализы брались в течение от одного до трех часов после регистрации ЭКГ. Это была превосходная обучающая база для специалистов AliveCor и великолепная основа для создания алгоритма. Но когда эти данные были проанализированы, разработчики поняли, что попали в тупик (см. рис. 4.1).
Рис. 4.1. График данных клиники Мэйо, предсказывающих концентрацию K+ по форме зубцов ЭКГ, в сравнении с истинными показателями, определенными в лаборатории. Источник: данные AliveCor.
Здесь «истинные» значения концентрации ионов калия, определенные в лаборатории, отложены по оси X, а предсказанные алгоритмом значения концентрации – по оси Y. Никакого соответствия мы не видим. При истинном значении концентрации 7,0 алгоритм предсказывает 4,5: диапазон отклонений оказался неприемлемым. В течение всей зимы сотрудники AliveCor не раз посещали клинику Мэйо в Рочестере и в конце концов, по выражению Гундорты, попали в долину отчаяния на целых три месяца, пытаясь выяснить, что пошло не так.
Петтерсон и Пракаш заново проанализировали все данные. Поначалу им казалось, что они занимаются своего рода патологоанатомическим вскрытием, но вдруг поняли, что «пациента» можно и реанимировать. Клиника Мэйо отфильтровала ЭКГ, попавшие в архив, ограничив их только кардиограммами амбулаторных пациентов, что изменило выборку в сторону более здоровых людей: неудивительно, поскольку люди со смертельной концентрацией калия в крови едва ли спокойно разгуливают по улицам. А что, если анализы брали у всех пациентов, которые были госпитализированы? Это повысило бы в базе данных не только долю людей с высоким уровнем калия в крови, но и долю тех, у кого анализ крови был взят через короткий промежуток времени после регистрации ЭКГ.
Рис. 4.2. Кривые рабочей характеристики приемника (ROC-кривые) соотношения истинно положительных и ложноположительных результатов с примерами отличного, хорошего и бесполезного результатов. Источник: с изменениями из: “Receiver Operating Characteristic,” Wikipedia (2018): http://en.wikipedia.org/wiki/Receiver_Operating_Characteristic.
Кроме того, они допустили: возможно, ключевая информация содержится не только в зубце Т, как предполагали Фридман и его сотрудники. Так почему бы не проанализировать и весь ЭКГ-сигнал целиком, перестав (очень естественно, по-человечески) цепляться за предыдущее убеждение, будто по-настоящему информативен только зубец Т? Они попросили клинику Мэйо предоставить более широкую базу данных. Клиника согласилась. Теперь проверке с помощью алгоритма были подвергнуты 2,8 млн электрокардиограмм с полной кривой, и эти данные были сопоставлены с результатами 4,28 млн анализов крови на содержание калия. И что же произошло в результате?
Эврика! Частота ошибок снизилась до 1 %, а ROC-кривая, мера предсказательной точности, где величина 1,0 является идеальной, выросла от 0,63 (случайного рассеяния, как на рис. 4.1) до 0,86. Мы будем часто в дальнейшем упоминать ROC-кривые, так как они являются одним из наилучших способов показать (подчеркиваем: одним, так как этот метод сильно критикуют, а попытки разработать более адекватные критерии не прекращаются) и количественно оценить точность, отложив по одной оси число истинно положительных, а по другой – число ложноположительных результатов (см. рис. 4.2). Число, обозначающее степень точности, равно площади под кривой, причем 1,0 является идеальной величиной, а площадь под диагональю считается бесполезной, так как это все равно что подбрасывать монетку. Изначально полученное специалистами AliveCor значение 0,63 представляется плохим. Хорошим считается показатель 0,80–0,90, а 0,70–0,80 – достаточным. Затем они оценили валидность алгоритма, применив его на 40 пациентах, проходящих сеансы гемодиализа, у которых одновременно брали анализы крови на калий и снимали ЭКГ. Теперь у компании были и данные, и сам алгоритм для предъявления в Управление по контролю за лекарствами и пищевыми продуктами (FDA) для получения разрешения выпустить его на рынок как метод определения уровня калия в крови с помощью наручных смарт-часов.
Этот опыт AliveCor должен стать уроком для всех, кто хочет применить технологии ИИ в медицине искусственный интеллект. Когда я спросил Петтерсона, чему научила его эта история, он ответил: «Не спешить отбрасывать данные… Я работал в Google. Вик работал в Google. Саймон работал в Google. Мы уже тогда выучили это правило, но порой приходится усваивать один и тот же урок несколько раз. Машинное обучение лучше всего работает, если вы представляете машине достаточно сырых необработанных данных. Если у вас достаточно данных, она сама отфильтрует шум»[83]83
Gundotra, Petterson, and Prakash interview with Topol.
[Закрыть].
Петтерсон считает: «В медицине никогда не бывает достаточно данных. Тут нет поисковых запросов. Миллиард запросов в минуту – такого у нас быть не может… Если в медицине у вас есть массив из 1 млн записей, то это уже гигантский массив. Величины, с которыми работает Google, не в тысячу, а в миллионы раз больше». Фильтровать данные настолько, чтобы с ними можно было работать вручную, – это ужасная идея. Как правило, при попытках применения искусственного интеллекта в медицине это не учитывается, но Петтерсон глубоко убежден: «В этой отрасли необходим, скажем так, сейсмический сдвиг»[84]84
Там же.
[Закрыть].
Уже сейчас мы видим основания для дальнейшего развития и разработки алгоритмов с помощью глубокого обучения. Критически важное условие – правильное наименование или базовое определение истинных показателей: алгоритм на входе должен получить корректные данные, чтобы на выходе от него была польза. Если бы анализы на калий брали через большие промежутки времени после регистрации ЭКГ, то предсказательная сила алгоритма была бы существенно меньше. Ограничение данных только показателями амбулаторных пациентов (так как поначалу казалось, что это наилучшая выборка для анализа) едва не погубило весь проект, так же как и чисто человеческое желание положиться на предыдущее допущение (ценность имеет только ввод данных о зубце Т, а не обо всем комплексе зубцов и интервалов).
Глубокое обучение искусственного интеллекта базируется на корректном вводе и выводе данных. Как говорит Эндрю Ын, настоящая рок-звезда в мире искусственного интеллекта, «планирование ввода-вывода – это современная суперсила». Алгоритмы любят поглощать данные – чем больше, тем лучше, но данные должны включать в себя адекватный диапазон значений, чтобы ввод был своего рода линзой для правильного фокусирования вывода. Это напоминает мне лечение пациента в отделении интенсивной терапии: один из ключевых критериев количественной оценки – сколько жидкости больной получил и сколько мочи выделил. Без точного знания о том, что на «входе», и о том, что на «выходе», мы можем неверно лечить больного, перегружая его жидкостью или, наоборот, вводя ненужные диуретики. В обоих случаях несоответствие между входом и выходом может убить больного.
Параллельно с проектом по определению уровня калия в крови AliveCor занималась выявлением мерцательной аритмии. Для каждого человека в течение жизни риск развития фибрилляции предсердий (раньше это нарушение ритма называли мерцанием предсердий) равен приблизительно 30 %, а риск развития инсульта у больного с фибрилляцией предсердий составляет около 3 % в год. Таким образом, очень важно выявить пароксизм фибрилляции предсердий при ее бессимптомном течении, поскольку он свидетельствует, что пациенту, возможно, следует назначить антиагреганты или антикоагулянты, то есть лекарства, «разжижающие» кровь. Еще в 2015 г. Дэвид Альберт, кардиолог, учредивший AliveCor, представил эту идею на научной конференции. Подход к глубокому обучению заключался в следующем: надо было дать машине представление об ожидаемой частоте сердечных сокращений у данного пациента в покое и на фоне физической активности. Скажем, ваша ЧСС, когда вы спокойно сидите, равна 60 в минуту, но внезапно она взлетает до 90 – без смены активности. Если акселерометр часов показывает, что вы по-прежнему сидите, то алгоритм зафиксирует аномалию и посоветует носителю часов зарегистрировать ЭКГ, что можно сделать, приложив подушечку большого пальца к браслету часов.
Пракаш, Петтерсон и трое других членов команды AliveCor с глубокого обучения разработали алгоритм, названный ими Smart Rhythm: нейронную сеть, которая анализирует активность человека в течение пяти предшествующих минут. По практическим соображениям этот алгоритм должен быть интегрирован со смарт-часами или другим устройством, способным круглосуточно и непрерывно осуществлять мониторинг частоты сердечных сокращений. Когда Apple в 2015 г. выпустил свои первые часы, они могли регистрировать ритм сердца всего лишь в течение пяти часов. Но вторая и третья версии часов уже могли отслеживать пульс непрерывно в течение суток, используя для этого оптические плетизмографические датчики – те самые, что мигают зеленым светом на задней крышке корпуса часов: эти датчики применяют многие производители (например, Fitbit). Увеличение срока работы аккумуляторов в версии 3 позволяет регистрировать сердечный ритм непрерывно на протяжении 24 часов – именно то, что было нужно AliveCor, чтобы алгоритм Smart Rhythm мог «оседлать» устройство. По крайней мере, впервые появилась возможность зарегистрировать кардиограмму в случае бессимптомного пароксизма фибрилляции предсердий в часы бодрствования пациента и уменьшить риск инсульта.
30 ноября 2017 г., меньше чем через полтора года после прихода Петтерсона и Пракаша в компанию AliveCor, FDA одобрила применение разработанного компанией устройства KardiaBand, которое может заменить устройство Apple Watch и помочь выявлять ФП, предупреждая пользователей о «возможной ФП». Впервые в истории FDA одобрила к применению алгоритм искусственного интеллекта, способный помогать пользователям устанавливать себе диагноз самостоятельно.
Между тем Apple, зная, когда AliveCor собирается анонсировать устройство KardiaBand, в тот же день объявил о начале большого клинического испытания в сотрудничестве со Стэнфордским университетом. Целью исследования было испытание датчика для выявления фибрилляции предсердий[85]85
Comstock, J., “Apple, Stanford Launch Apple Heart Study to Improve Atrial Fibrillation Detection,” MobiHealthNews. 2017; Loftus, P., and T. Mickle, “Apple Delves Deeper into Health,” The Wall Street Journal. 2017, p. B5.
[Закрыть]. В случае Apple выявление выполняется на основании нарушения регулярности сердечного ритма, после чего пациент может попасть на дистанционный прием к врачам телемедицинской онлайн-платформы American Well. После консультации пациентам назначают ношение специального пояса, который непрерывно регистрирует ЭКГ в течение по меньшей мере недели. Это более долгий и неудобный путь диагностики ФП по сравнению с прикладыванием большого пальца к часам. Словом, маленькая компания AliveCor выбила «яблочко»… вернее, Apple.
Триумф продолжался около девяти месяцев. В сентябре 2018 г. Apple с большой помпой объявил на ежегодном собрании, что FDA одобрила продажу часов Apple серии 4, которые станут «первым аппаратом ЭКГ в свободной продаже», и обещала пользователям: Apple Watch 4 – «надежный страж вашего здоровья». Оба утверждения, впрочем, не вполне точны[86]86
Gonzalez, R., “The New ECG Apple Watch Could Do More Harm Than Good,” Wired. 2018. https://www.wired.com/story/ecg-apple-watch/; Dormehl, L., “Why We Should Be Wary of Apple Watch ‘Ultimate’ Health Guardian Claims,” Cult of Mac, 2018. https://www.cultofmac.com/577489/why-we-shouldbe-wary-of-apple-watch-ultimate-health-guardian-claims/; Victory, J., “What Did Journalists Overlook About the Apple Watch ‘Heart Monitor’ Feature?” HealthNewsReview, 2018. https://www.healthnewsreview.org/2018/09/ what-did-journalists-overlook-about-the-apple-watch-heart-monitor-feature/.
[Закрыть].
Два проекта AliveCor – для определения содержания калия в крови и для выявления фибрилляции предсердий – демонстрируют многие характерные возможности искусственного интеллекта: например, выявление того, что не способен выявить человек, преодоление человеческих заблуждений и по-настоящему персонализированный мониторинг. Эти устройства для определения уровня калия и для слежения за ритмом сердца могут показаться скромными успехами, но они дают представление о том, чего может достичь ИИ, и переводят теоретические достижения в практическую плоскость. В конце концов, часы Apple носят 35 млн человек. Однако в долгосрочной перспективе, в эпоху ИИ в медицине, может случиться так, что Давид все-таки побьет Голиафа.
В этой главе я хочу обсудить некоторые нюансы того, как именно работают эти достижения (а также другие; их примеры я приведу далее). Я не собираюсь вдаваться в подробности глубокого обучения – в ту технологию, которая лежит в основе множества других технологий. Для этого есть прекрасный учебник «Глубокое обучение»[87]87
Бенджио И., Курвилль А., Гудфеллоу Я. Глубокое обучение. – М.: ДМК-Пресс, 2018.
[Закрыть], написанный Яном Гудфеллоу, блестящим молодым ученым из Google Brain, и группой его коллег[88]88
Goodfellow, I., Y. Bengio, and A. Courville, Deep Learning, ed. T. Dietterich. 2016. Cambridge, MA: MIT Press.
[Закрыть]. Мой план заключается в отказе от излишней детализации – лучше я постараюсь охватить именно то, что наиболее существенно для медицины, в технологиях, о которых мы сейчас говорим. Тем не менее нам все равно придется рассмотреть некоторые немедицинские концепции, и это очень важный момент, потому что ИИ получил куда большее распространение вне мира медицины, чем внутри него. Если бы не самоотверженные первопроходцы, мы никогда не сумели бы начать использование искусственного интеллекта в нашей отрасли. По этой причине я для начала изложу основные прецеденты, а также поясню некоторые термины и расскажу о хронологии.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?