Текст книги "Доказательная медицина. Что, когда и зачем принимать"
Автор книги: Кирилл Галанкин
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 13 (всего у книги 19 страниц)
Визуально-аналоговая шкала для измерения интенсивности боли
А теперь давайте повторим фразу, с которой начиналась эта глава.
Чем больше людей принимает участие в клиническом исследовании, тем точнее будут его результаты.
Как по-вашему, возможно ли полноценное клиническое исследование, а не какое-нибудь фейково-юмористическое, с участием 1 человека? Да – одного-единственного. Будет ли, по-вашему, от подобного «микроисследования» польза и в каких случаях его можно проводить (дайте волю фантазии и придумайте случаи)?
Большинство непосвященных в тонкости клинических исследований сейчас ответило «Нет!», а посвященные понимающе улыбнулись, потому что им известна истина. Среди великого множества клинических исследований существует и такая разновидность, как исследования с одним участником, которые обозначаются как n-of-1 (n-количество из 1).
Те, кто читает эту книгу внимательно, могут решить, что подобные исследования бессмысленны, поскольку не имеют контрольной группы. А без контрольной группы никак нельзя обойтись, так что самая минималистичная формула клинического исследования должна выглядеть как n-of-2.
Да – контроль в исследовании необходим, иначе это будет не исследование, а его имитация. Но кто сказал, что контроль не может осуществляться при одном участнике? Что если он в течение 3 или 6 месяцев станет получать изучаемый препарат, а затем на такое же время препарат будет заменен плацебо? У нас получится контролируемый эксперимент. При одном-единственном участнике!
Такой максимально персонализированный эксперимент имеет несколько преимуществ. Во-первых, исследователь имеет возможность исследовать действие экспериментального фактора конкретно на ту узкую группу, к которой принадлежит пациент. Данные, полученные в нескольких одиночных исследованиях, могут послужить ценным дополнением к данным масштабного исследования, к среднему результату, полученному на большой выборке. Во-вторых, исследование n-of-1 может проводиться в интересах конкретного пациента и дать личностный результат. От масштабного исследования такого ценного подарка получить невозможно.
Первое исследование n-of-1 произвел в середине восьмидесятых годов прошлого века в канадском городе Онтарио врач Гордон Гайатт, один из пионеров доказательной медицины. На мысль о подобном исследовании Гайатта навели знакомые психотерапевты, которые широко практиковали индивидуальные эксперименты, помогающие определить эффективность проводимой терапии.
Для первого исследования Гайатт выбрал шестидесятипятилетнего пациента с бронхиальной астмой, давно страдающего этим заболеванием, но пребывающего в стабильном состоянии. Стабильное состояние участника имеет очень большое значение в исследованиях n-of-1, потому что для контроля приходится принимать плацебо, иначе говоря – на некоторое время оставаться без изучаемого препарата. При нестабильном состоянии замена действующего препарата «пустышкой» опасна, а вот при стабильном на это можно пойти при условии постоянного наблюдения.
Гайатт изучал действие теофиллина – препарата, расширяющего просвет бронхов[82]82
Приступы бронхиальной астмы возникают в результате сужения бронхов.
[Закрыть]. Теофиллин действует быстро и дает заметный эффект, что весьма удобно для исследования. Пациент в течение 10 дней принимал лекарство, а затем в течение такого же срока принимал плацебо. Этот цикл повторился дважды. Плацебо и теофиллин давались пациенту в одинаковых капсулах, он не мог знать, что именно сейчас принял. Выяснилось, что теофиллин не улучшал, а ухудшал состояние пациента. При приеме плацебо приступы бронхиальной астмы купировались быстрее и самочувствие было лучше (разумеется, теофиллин был не единственным препаратом, применявшимся для купирования приступов в процессе исследования, иначе это было бы не клиническое исследование, а садистский эксперимент, представляющий опасность для жизни).
В 1986 году Гайатт опубликовал отчет об этом исследовании и призвал коллег следовать его примеру в тех случаях, когда возникает необходимость в оценке действия какого-то лекарственного препарата на конкретного пациента. Предложенный Гайаттом метод отличался от практики отмены препарата или же замены одного препарата на другой. Простая отмена или замена не может дать полного и исчерпывающего представления о действии этого препарата на этого пациента, а вот чередование курсов приема препарата и плацебо такое представление дает.
Гайатт не ограничился одной лишь публикацией отчета. С помощью коллег, разделявших его взгляды, он создал Центр n-of-1 в канадском университете Макмастера (провинция Онтарио). К 1990 году врачи, прошедшие обучение новому методу исследования в Центре, провели 57 испытаний n-of-1. У 15 пациентов исследования привели к существенному изменению схемы лечения.
С юридической точки зрения исследования n-of-1 считаются расширением стандартной медицинской помощи, а не клиническим исследованием, проведение которых регулируется множеством правил (иногда эти правила просто мешают работать). Благодаря этому исследования n-of-1 являются более гибкими и динамичными, что позволяет им лучше удовлетворять потребности отдельных пациентов. Но давайте повторим, что речь идет не только об этих отдельных потребностях. Исследования n-of-1 могут служить дополнением к масштабным клиническим исследованиям. Сам Гайатт сравнивал метод n-of-1 со скальпелем, предназначенным для удаления катаракты – тонким хирургическим инструментом, позволяющим проводить филигранные операции.
Казалось бы, что такому простому, недорогому и удобному методу исследования, как n-of-1, уготована широкая популярность. Однако же большого распространения этот метод не получил. Три его основных достоинства уравновешиваются тремя основными недостатками.
Недостаток первый – частые отказы участников от продолжения исследования. Перед началом исследования оговаривается, что оно будет продолжаться столько, сколько сочтет нужным врач (иногда требуются не два и не три, а пять-шесть циклов «препарат – плацебо»). Но у пациента есть право в любой момент выйти из эксперимента. Многие пациенты, почувствовав улучшение от приема исследуемого препарата, желают принимать его постоянно, без замен на плацебо[83]83
Участники исследования не знают о том, что именно они принимают в данный момент, но до начала исследования им предоставляется информация о нем, в том числе и описание сути метода, так что все знают, что им придется попеременно принимать препарат и «пустышку».
[Закрыть].
Недостаток второй – в подавляющем большинстве случаев исследования n-of-1 производятся лечащими врачами, которые далеко не всегда склонны этим заниматься из-за наличия множества других дел. Кроме того, в случае выраженного ухудшения состояния пациента, вызванного заменой действующего препарата на плацебо (а такое может произойти и при стабильном течении заболевания, пути неисповедимы), пациент может подать судебный иск против врача или клиники. Риск судебного преследования – весомый сдерживающий фактор.
Недостаток третий – многие препараты сохраняются в организме в активной форме на протяжении длительного времени. Когда такой препарат заменяют на плацебо, то в начальном периоде приема плацебо организм находится под воздействием принятого ранее препарата. Это сказывается на результатах – увидев, что плацебо оказывает на пациента такое же действие, что и исследуемый препарат, врач может счесть этот препарат неэффективным, хотя на самом деле это не так. Проблему могут решить перерывы между приемами препарата и плацебо, но такие перерывы будут удлинять и без того довольно продолжительный эксперимент.
Есть и четвертый «недостаток» (кавычки неслучайны) – противники доказательной медицины пытаются представить метод n-of-1 в качестве более предпочтительной альтернативы масштабным клиническим исследованиям. Нередко дело доходит до полного отрицания пользы клинических исследований с большим числом участников. Такую точку зрения обществу пытаются навязывать различные шарлатаны, продвигающие неэффективные и ненаучные методы лечения, которые не могут выдержать серьезной проверки. А раз так, то нужно объявить несостоятельными сами проверки, нужно вещать о том, что на смену устаревшей доказательной медицине приходит новая медицина – персонализированная. На самом же деле такая постановка вопроса является в корне неверной, потому что персонализация не отвергает доказательности. Кто сказал, что во время подбора лечения для конкретного пациента не нужно выбирать препараты с доказанной эффективностью? Опять же, говоря о том, что любое лечение проводится индивидуально, нельзя забывать о тех преимуществах, которыми обладают масштабные клинические исследования. Короче говоря, не надо дружить с демагогией, такая дружба ни до чего хорошего не доведет.
Что же касается персонализации современной медицины, то вместо этого понятия лучше употреблять другое, более широкое, понятие прецизионной медицины, образованного от английского слова «precision» – «точность». Прецизионная медицина не персонализированная, а «узкопрофильная», приспособленная не к нуждам всей популяции в целом, а к потребностям небольших групп населения, имеющих какие-то характерные отличия от других групп. Частью прецизионной медицины является фармакогеномика – наука, изучающая роль генов отдельного человека в формировании ответа на воздействие того или иного лекарственного средства. Однако при всех достоинствах прецизионной медицины и при всех перспективах фармакогеномики нужно понимать, что большинство лекарственных препаратов воздействует на нас вне зависимости от нашего личного набора генов и что далеко не всегда клинические исследования должны быть «узкопрофильными». Персонализированный подход не догматическая установка, а инструмент, помогающий решать проблемы в отдельных случаях. Скальпель, предназначенный для удаления катаракты, нельзя использовать при операциях брюшной полости или при ампутациях конечностей, вы с этим согласны? Цена вопроса тоже имеет значение. Одно дело, когда в результате прецизионного подхода создается лекарственный препарат, который действует на представителей какой-то небольшой группы гораздо лучше, чем его аналоги «широкого спектра», и совсем другое, когда эффективность «узкопрофильного» препарата чуть выше, чем у аналогов. Во втором случае сразу же возникает вопрос – стоило ли городить огород, то есть тратить дополнительные средства на разработку того же самого «велосипеда»[84]84
В 2012 году в США вызвало бурную дискуссию внедрение в клиническую практику препарата «Ивакафтор», предназначенного для лечения муковисцидоза. Муковисцидоз – это системное наследственное заболевание, обусловленное генетической мутацией (изменением генетического кода) и характеризующееся поражением желез внешней секреции в сочетании с выраженными нарушениями функций органов дыхания. «Ивакафтор» улучшал дыхательную функцию не у всех пациентов с муковисцидозом, а только в тех случаях, когда мутация гена регулятора трансмембранной проводимости была представлена заменой глицина в 155-м положении на аспарагиновую кислоту (в эти нюансы можно не вникать, важно знать, что подобный тип мутации наблюдается только у 5 % лиц, страдающих муковисцидозом). Сторонники прецизионного подхода расценили появление «Ивакафтора» как большое достижение, а их оппоненты утверждали, что достижение это весьма сомнительное. Во-первых, на разработку «Ивакафтора» было потрачено около двух десятков лет. Во-вторых, «Ивакафтор» получился очень дорогим, стоимость годового лечения в ценах 2012 года составляла 300 000 долларов США. В-третьих, этот препарат не подходил для лечения 95 % пациентов с муковисцидозом (см. Interlandi J. The Paradox of Precision Medicine // Sci Am. 2016. Vol. 314 (4). P. 24–25).
[Закрыть].
Короче говоря, уклон в любую сторону является неверным. Пренебрегать персонализацией нельзя, но и возводить ее в абсолют, отрицая при этом значимость масштабных клинических исследований, тоже не стоит. В конце концов персонализация дает ответ на вопрос: «Работает ли это у данного конкретного человека?». А ответ на вопрос: «Работает ли это вообще?» в 99,99 % случаев можно получить только в исследовании с большим количеством участников. Вдобавок не надо забывать и о том, что между данными исследований и пациентом находится лечащий врач, который учился не менее восьми лет[85]85
6 лет основного обучения плюс 2 года клинической ординатуры.
[Закрыть] именно для того, чтобы уметь превращать общее в частно-конкретное.
Но в целом, конечно же, то, что современная медицина, образно говоря, «поворачивается лицом к пациенту», не может не радовать. И то, что доказательность с каждым годом все сильнее укрепляет свои позиции, тоже радует.
Очень показательные результаты получены в Канаде, где применение принципов фармакогеномики всего для шести классов лекарственных препаратов (то есть точное назначение препаратов с учетом генетического кода пациента) дало годовую экономию бюджета в размере 2,1–2,3 миллиардов долларов США[86]86
Cullis P., Drohan J., Fraser R. Roadmap for Bringing Personalized Medicine to British Columbians // Summit Partners.
[Закрыть]. Расшифровка генома (генетического материала) человека завершилась еще в 2003 году. Образно говоря, карта у нас давно есть, нужно только научиться правильно ею пользоваться. Питать надежды не возбраняется, но при этом нужно понимать, что в первую очередь медицинские генетики занимаются распределением пациентов по группам в соответствии с генетическими рисками и заложенной в генах чувствительностью к препаратам. Индивидуальная разработка генозависимых схем лечения – дело отдаленного будущего.
ПОСТСКРИПТУМ. Среди противников доказательной медицины есть особо одаренные личности, которые на полном серьезе утверждают, что при современном развитии науки и при том багаже знаний, который медицина успела накопить, клинические исследования не нужны. Ко всему тому, что устанавливается в ходе масштабных, длительных и дорогостоящих экспериментов, можно прийти логическим путем, это проще, удобнее и дешевле. Такая постановка вопроса выставляет ученых, которые занимаются исследованиями, полными невеждами, пытающимися компенсировать недостаток знаний при помощи экспериментов. Заодно открывается очень удобная лазейка для шарлатанов, у которых всегда есть якобы научное и весьма убедительное на первый взгляд объяснение, но никогда не может быть достоверных подтверждений эффективности.
Но мы-то с вами не вчера родились, многое знаем и можем представить, в какие схоластические дебри может завести подобный подход. Чего доброго, возродится теория четырех жизненных соков. Опыт без теории, что руки без головы, а теория без опыта, что голова без рук.
Глава пятнадцатая
Диагностические методы в зеркале доказательной медицины
Профессор Триша Гринхол, автор одного из самых известных руководств по доказательной медицине, сравнивает диагностические методы с судьей, не всегда выносящим справедливые приговоры. Но, наверное, в качестве наглядного примера лучше взять старую арабскую притчу о справедливом халифе и шести заговорщиках.
Некоему халифу, известному своей справедливостью, стало известно, что шестеро из двенадцати его визирей устроили заговор, но имена заговорщиков остались тайной (то ли шпион, подслушавший их беседу, не смог разглядеть лица, то ли еще что). Халиф не знал, что ему делать. Самым простым выходом была бы казнь всех двенадцати визирей, но тогда бы пострадали невиновные. С другой стороны, нельзя было позволить, чтобы заговорщики избежали кары. Выход из создавшегося положения подсказала любимая жена халифа. «Если моему повелителю больше не на кого положиться, то следует положиться на судьбу, – сказала она. – Пусть все визири встанут в круг, а палач отрубит голову каждому второму, начав счет с кого пожелает». Халиф так и сделал. В результате было казнено четверо заговорщиков и двое невиновных. На оставшихся в живых двух заговорщиков казнь произвела такое устрашающее впечатление, что они покаялись и были прощены. Притча заканчивается похвалами в адрес мудрой жены халифа, которая дала возможность своему супругу «сохранить лицо», то есть отреагировать надлежащим образом на сообщение о заговоре среди высшего руководства, а с другой избавила его от греха несправедливости, потому что тех, кого следовало казнить, выбирал палач. Интересно, что бы было, если бы казнили шестерых невиновных, а все заговорщики остались бы в живых? Но такой вариант развития событий в притче не рассматривался.
Что сделал халиф с медицинской точки зрения? Ладно, не сам халиф, а его палач, если вам так больше нравится. Он диагностировал заболевание – выделил шестерых заговорщиков среди двенадцати визирей.
Можно ли считать всю эту затею с казнью каждого второго аналогом диагностического метода? Определенно – можно! Тем более, что и характеристики совпадают.
Палач казнил четырех заговорщиков из шести, то есть 2/3 от общего количества. 2/3 – это вероятность того, что в результате «кругового метода» будет наказан виновный. Точность попадания в цель называется чувствительностью диагностического метода. Чувствительность метода отражает долю положительных результатов, которые правильно идентифицированы как положительные.
Палач казнил двоих визирей из шести, не принимавших участия в заговоре, а четверо, или 2/3 от общего количества невиновных, осталось в живых. 2/3 – это вероятность того, что в результате «кругового метода» невиновный избежит наказания. Показатель, отражающий долю отрицательных результатов, которые правильно идентифицированы как отрицательные, называется специфичностью метода.
Чувствительность и специфичность отражают способность диагностического метода давать правильный ответ.
Казалось бы, что на этом с характеристиками можно заканчивать. Что нам еще нужно знать о диагностических методах, кроме их способности давать правильные ответы?
Но кровь невинно убиенных визирей вопиет если не об отмщении, то хотя бы о необходимости проявить внимание к напрасным жертвам. Из шести невиновных в живых осталось четверо. Получается, что «круговой метод» оставляет в живых 2/3 невиновных людей, иначе говоря, этот метод справедлив к 2/3 невиновных. Доля правильных отрицательных результатов диагностического теста называется прогностической (предсказательной) ценностью отрицательного результата.
Соответственно, доля правильных положительных результатов теста будет называться прогностической ценностью положительного результата. Сколько заговорщиков казнено? Четверо из шести? Снова получаем наш любимый показатель 2/3 (простим автору притчи любовь к этой дроби, но он, скорее всего, не предполагал, что в далеком будущем его историю подвергнут беспристрастному статистическому анализу).
Но хотелось бы выразить точность метода в одном показателе, не так ли? Вот чтобы взглянуть на цифру и сразу понять – годится нам такой метод или нет. Какова доля правильных ответов у кругового метода, считая, как определение виновных, так и определение невиновных? Всего визирей дюжина. Палач казнил четырех заговорщиков и четверо невиновных визирей оставил в живых. 8 из 12, это… снова 2/3, или примерно 67 %. Таков индекс точности «кругового метода».
А теперь давайте повторим все сказанное другими словами – сформулируем вопросы, на которые отвечают характеристики диагностического метода.
Чувствительность отвечает на вопрос: «Насколько хорош этот метод для выявления пациентов, имеющих данное заболевание?»
Специфичность – насколько хорош этот метод для исключения пациентов, не имеющих данного заболевания?
Прогностическая ценность положительного результата – какова вероятность того, что человек с положительным результатом действительно болен?
Прогностическая ценность отрицательного результата теста – какова вероятность того, что человека с отрицательным результатом действительно нет данного заболевания?
Индекс точности – какая часть всех тестов дала правильные результаты?
Чувствительность и специфичность определяют глобальную ценность теста, его значение для всей популяции (для общества) в целом. Этими характеристиками преимущественно оперируют управленцы и эпидемиологи. На уровне «врач – пациент» большее значение имеют прогностические ценности результатов, потому что пациента и его лечащего врача сильнее всего интересует наличие или отсутствие заболевания, выявляемого тестом. Надо понимать, что высокая чувствительность метода еще не гарантирует его высокой положительной прогностической ценности (то же самое можно сказать и о специфичности). Практикующие врачи зачастую не придают значения прогностической ценности, считая ее априори равной 100 % или близкой к этому значению. Иными словами, практикующие врачи принимают результаты диагностических тестов как абсолютную истину, что в корне неверно. И если уж на то пошло, то тест, обладающий определенной чувствительностью и определенной специфичностью, будет иметь различную положительную и отрицательную прогностическую ценность, если применять его в группах с различной распространенностью заболевания[87]87
Распространенностью заболевания называется процентное отношение количества людей, страдающих данным заболеванием, ко всему количеству обследованных пациентов.
[Закрыть]. В группах, где распространенность составляет 10 % и 90 % прогностическая ценность результатов будет абсолютно разной. А вот чувствительность и специфичность диагностического теста от распространенности заболевания не зависят, но они зависят от состава групп пациентов, участвовавших в исследованиях, по результатам которых были определены (стандартизированы) эти характеристики. Врач, применяющий диагностический тест на практике, ориентируется на характеристики без учета того, что они могли быть определены с участием совершенно иной популяции. Доказательная медицина требует от врачей осмысленной оценки характеристик диагностических тестов. Грубо говоря, всегда надо учитывать то, что реальная достоверность теста может оказаться меньше заявленной.
В последнее время в практику входит еще одна характеристика – отношение правдоподобия. Отношение правдоподобия для положительного результата – это отношение вероятности получения положительного результата диагностического теста у пациента с наличием заболевания к вероятности такого же результата у пациента без заболевания. Оно рассчитывается по формуле:
Этот показатель отвечает на вопрос: «Насколько более вероятно то, что тест будет положительным у человека с заболеванием по сравнению со здоровым?»
Отношение правдоподобия для отрицательного результата – это отношение вероятности получения отрицательного результата диагностического теста у пациента без заболевания к вероятности такого же результата у пациента с наличием заболевания. Формула расчета такова:
Вопрос в данном случае такой: «Насколько более вероятно то, что тест будет отрицательным у здорового человека с заболеванием по сравнению с больным?»
У каждого диагностического метода есть своего рода лекало, которому данный метод должен как можно лучше соответствовать. Это лекало называется «критериальным стандартом». Его еще называют «золотым стандартом», но в наше время такое название считается неверным. Слишком уж многое в области медицины стали называть этим термином, заимствованным у финансистов. В результате произошла девальвация – при словах «золотой стандарт» врачи морщатся и думают: «Ах, еще один!» Справедливости ради нужно отметить, что прилагательное «золотой» звучит лучше, чем царапающее слух слово «критериальный», но зато «критериальный» правильно отражает суть стандарта, являющегося набором диагностических критериев, позволяющих установить наличие заболевания.
У «кругового метода» из притчи индекс точности равнялся 67 %. Как, по-вашему, хороший это индекс или нет? Можно ли внедрять в практику диагностический метод, который позволяет ставить точный диагноз в 67 случаях из 100? (разумеется, речь идет не о казни по счету, а о нормальном, реальном диагностическом методе). Давайте представим, что вы – высокопоставленный сотрудник Министерства здравоохранения, которому предоставили информацию, касающуюся нового диагностического метода, для принятия решения о его практическом использовании. От вас зависит, получит отечественное здравоохранение новый метод диагностики с индексом точности 67 % или нет.
Не спешите отказываться от принятия решения, ссылаясь на незнание тонкостей. Это вопрос на сообразительность, уточняющий ваше личное отношение к цифре 67.
Правильный ответ будет таким: индекс точности сам по себе ничего не определяет. Более важное значение для медицинского менеджера высшего звена имеют такие качества, как чувствительность и специфичность. У идеального теста эти характеристики приближаются к 100 %. Менеджеру важнее знать, насколько хорош этот метод для выявления пациентов, имеющих данное заболевание, и для исключения пациентов, не имеющих заболевания. Какая часть всех тестов дала правильные результаты – это вопрос второго порядка.
И вот здесь, на границе соприкосновения чувствительности и специфичности, начинается самое интересное. Высокая чувствительность исключает высокую специфичность и наоборот. Высокая чувствительность проявляется в гипердиагностике – ошибочном заключении о наличии заболевания, а гипердиагностика снижает специфичность. В свою очередь высокая специфичность подразумевает, что диагноз должен выставляться только тем, кто болен вне всякого сомнения, на все 100 %. Такое условие снижает чувствительность. Приходится определять приоритеты, решать, чего больше хочется, условно говоря – приобрести капитал или же сохранить невинность.
Вам нужно максимальное выявление заболевания, такое, чтобы ни один больной не проскочил бы мимо (это очень важно при опасных инфекционных заболеваниях)? Тогда делайте ставку на чувствительность диагностического теста, а с издержками гипердиагностики будете бороться позже, в рабочем порядке. Ну а если же вам нужно отделить наверняка здоровых от больных и возможно больных, то ставку придется делать на специфичность. В одну телегу впрячь коня и трепетную лань, а в одном тесте совместить исключительную чувствительность с исключительной специфичностью невозможно. Понять и принять это поможет графическое изображение, получившее название ROC-кривой (от английского «receiver operating characteristic» – рабочая характеристика приемника), также известной как «кривая ошибок». ROC-кривые позволяют наглядно сопоставлять эффективность различных характеристик одного и того диагностического метода.
Графическое изображение взаимной противоречивости чувствительности и специфичности
Если сказать проще, то ROC-кривые показывают зависимость количества верно определенных положительных результатов от количества неверно определенных отрицательных результатов. Изменяемый параметр называется порогом отсечения. Для каждого значения порога отсечения, которое меняется от 0 до 1 с определенным шагом, рассчитываются значения чувствительности и специфичности, и строится график зависимости – по оси Y откладывается чувствительность, а по оси X – 100 % минус специфичность (а не просто специфичность, как можно подумать). В результате получается ROC-кривая. Также на графике вычерчивается диагональная прямая линия, которая соответствует полному совпадению значений х и у (y = x). Чем ближе ROC-кривая к верхнему левому углу, тем выше эффективность (предсказательная способность) модели, а чем ближе она расположена к диагональной прямой, тем эффективность меньше. Для идеальной в плане чувствительности модели ROC-кривая будет проходить через верхний левый угол, в котором доля истинно положительных случаев составляет 100 % (это идеальная чувствительность), а доля ложноположительных результатов равна 0.
Если вам не хочется вникать во всю эту графическо-математическую премудрость, то вы можете совершенно спокойно ее пропустить и продолжить чтение со слов «Пожалуй, довольно с нас математики».
«Точка баланса» между чувствительностью и специфичностью
Выше было сказано об идеально чувствительной модели. Но как будет выглядеть ROC-кривая в случае с идеальной моделью, обладающей и 100 % чувствительностью, и 100 % специфичностью? Взгляд невольно упирается в правый верхний угол, куда протягивается диагональная линия полного совпадения значений и нулевой эффективности. Невозможно одновременно повышать чувствительность и специфичность, сохраняя при этом эффективность модели (диагностического метода). Можно говорить только о нахождении «точки баланса» – оптимального порога отсечения, при котором чувствительность и специфичность будут иметь максимально возможные значения.
На практике обычно оперируют требованием минимальной величины чувствительности или специфичности диагностического метода, а значение второй характеристики подгоняется к основному требованию.
Пожалуй, довольно с нас математики. Общее впечатление о характеристиках диагностических методов вы получили и понимаете, что не все так просто и не все однозначно. Метод методу рознь, разные характеристики свидетельствуют о разных качествах, и в каждом конкретном случае на первый план выступают те характеристики или свойства, которые соответствуют основным требованиям. Разумеется, доказательная медицина настоятельно требует использовать методы с подтвержденной эффективностью. На основании осмотра мочи в наше время диагнозы не ставятся[88]88
Это не шутка, а упоминание о реальном историческом факте. В средневековой европейской медицине исследование мочи пациентов было основным диагностическим методом, а нередко и единственным. Врач мог вообще не встречаться пациентом, выставляя диагноз на основании осмотра мочи, которую ему принесли. Считалось, что моча может «рассказать» не только о том, чем болен человек, но и о его возрасте, поле, темпераменте и прочих индивидуальных особенностях, причем рассказать очень подробно. Налитая в сосуд моча условно делилась на три слоя, верхний слой «рассказывал» о заболеваниях головы, средний – о заболеваниях грудных органов, а нижний – об органах брюшной полости. Средневековые врачи различали более 30 разновидностей мочи по цвету и еще больше по запаху. Оценивался не только естественный запах мочи, но и то, как он изменяется при нагревании. Это была целая «наука», довольно сложная.
[Закрыть].
К слову – о тесте, позволяющем определить содержание глюкозы в моче. Это очень яркий пример того, что диагностический метод с чувствительностью примерно в 23 % (всего-навсего!) может получить широкое распространение, причем полностью заслуженное.
Но давайте по порядку. В норме в моче глюкозы быть не должно. Глюкоза – это ценный продукт, источник энергии, и природа сделала все возможное для того, чтобы сохранить ее в организме. Но при сахарном диабете, когда уровень содержания глюкозы в крови резко возрастает, организму приходится выводить ее излишки с мочой. Тест-полоски, позволяющие быстро и просто определить содержание глюкозы в моче, используются для выявления больных сахарным диабетом, которые не знают о своей болезни. Опустили в мочу полоску – оценили изменение цвета – сделали вывод. Метод крайне простой и довольно-таки дешевый. Альтернативой ему, а если точнее, то не альтернативой, а диагностическим методом более высокого порядка, служит глюкозотолерантный тест, определяющий, насколько хорошо организм усваивает глюкозу. Суть этого метода заключается в следующем. Сначала у пациента натощак измеряют уровень содержания глюкозы в крови. Затем ему дают выпить стакан воды, в котором растворено большое количество глюкозы (75 граммов для взрослого человека). Затем – каждые полчаса в течение двух часов или же просто через два часа – повторяют определение уровня содержания глюкозы в крови. Если диагноз сахарного диабета неочевиден, то есть кроме повышенного содержания глюкозы в крови нет никаких иных симптомов, глюкозотолерантный тест повторяют дважды. Но если и во второй раз глюкозы в крови определилось больше нормы, то факт наличия сахарного диабета сомнений уже не вызывает. Чувствительность у этого метода практически 100 %-ная. По сути дела, это не просто диагностический метод, а критериальный стандарт сахарного диабета.
С тест-полосками дело обстоит совсем иначе. Количество глюкозы, переходящей из крови в мочу, зависит от почек конкретного человека. Существует такое понятие, как «почечный порог» – уровень содержания глюкозы в крови, при котором начинается ее переход в мочу. У каждого человека свой почечный порог. Глюкоза может не определяться в моче при наличии сахарного диабета, если почечный порог высокий, и может иногда (редко, но все же) присутствовать в моче при отсутствии этого заболевания.
Так почему же при чувствительности примерно в 23 %, при высокой вероятности ложноотрицательного результата, вызванного отсутствием глюкозы в моче при сахарном диабете вследствие высокого почечного порога, тест-полоски используются повсеместно?
Что это – результат мирового заговора, организованного компаниями-производителями или же циничное пренебрежение высокими принципами доказательной медицины? (Выберите тот вариант, который вам больше по душе и немного поразмышляйте на эту тему, возможно в вашем воображении родится хороший сюжет для романа или сценария.)
Нет, ни то, ни другое. Все упирается в две характеристики, которые мы с вами еще не рассматривали, поскольку они не имеют узкоспециального отношения к диагностическим методам. Это цена и удобство использования.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.