Электронная библиотека » Алия Сарманова » » онлайн чтение - страница 27


  • Текст добавлен: 2 декабря 2024, 08:21


Автор книги: Алия Сарманова


Жанр: Здоровье, Дом и Семья


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 27 (всего у книги 43 страниц)

Шрифт:
- 100% +
2.4 Не все то золото, что блестит: Значимость в научных исследованиях

Когда вы читаете результаты клинических испытаний, в глаза часто бросается слово «значимый» – значимый результат, значимый положительный ответ, значимое улучшение. Многие из нас приравнивают «значимость» к буквальному значению «важности», то есть «значимые результаты» равно «важные результаты». Однако в клинических исследованиях значимость бывает двух видов: «статистическая значимость» и «клиническая значимость». И то и другое – значимость, но это не одно и то же.

Статистическая значимость отвечает на вопрос: «Возможно ли, что результаты могут быть случайными?» Клиническая значимость отвечает на вопрос: «Будут ли результаты иметь значение для пациентов?»

Статистически значимая разница означает, что статистический тест показал различия между группами, которые не были вызваны исключительно случайностью. Тогда как клинически значимая разница означает нечто большее и более важное – статистически значимая разница достаточно существенна, чтобы повлиять на решения врача или изменить жизнь пациента. Определить клиническую значимость сложнее, ведь в ней есть как объективный компонент – результат статистического теста, так и субъективный – суждение врачей и пациентов о важности этих различий.

Давайте посмотрим, как эти две значимости выглядят на примере.

В одном исследовании ученые анализировали выживаемость 569 пациентов с распространенным раком поджелудочной железы [9]. Пациенты были рандомизированы в две группы: первая получала новый препарат эрлотиниб в сочетании со стандартным гемцитабином, вторая – только гемцитабин. Результаты показали: в группе эрлотиниба в сочетании с гемцитабином риск смерти пациентов был «значительно» ниже. Под значимостью здесь подразумевается статистическая значимость, которую определили с помощью «значения р».

Р-значение (пи) отражает, насколько вероятно, что полученный в исследовании результат (и даже предположительно больший результат) может быть следствием случайности. Например, насколько случайна разница между группами лечения. P = 0,01 означает, что с вероятностью 1 из 100 эффект от лечения мог произойти случайным образом, то есть на самом деле лечение неэффективно. Обычно ученые сообщают о значимых результатах, когда р-значение теста меньше 0,05 (1 из 20). Если статистическая значимость больше, чем 0,05, любое значение эффективности лечения будет под большим вопросом, так как невозможно исключить возможность случайных ошибок.

В нашем примере значение р равнялось 0,038, то есть существует лишь 3,8 %-ная вероятность, что наблюдаемая разница между группами возникла случайно. А значит, есть 96,2 %-ная вероятность не наблюдать положительный эффект нового препарата на выживаемость пациентов с распространенным раком поджелудочной железы случайно.

Для нас важно, насколько выражен этот положительный эффект, – так мы можем понять, есть ли реальная польза от нового лечения. Поэтому, помимо значения р, мы обязательно обращаем внимание на количественную разницу между значениями – размер эффекта. В данном примере эффект измерялся в продолжительности жизни на фоне лечения. Анализ выживаемости показал: комбинированная терапия увеличивает выживаемость пациентов на 18 %. Это относительные показатели. А в абсолютных значениях медиана выживаемости (срока дожития) была 6,24 и 5,91 месяца, то есть разница между группами – всего 10 дней. Конечно, ее можно с уверенностью считать клинически несущественным «улучшением», особенно с учетом дополнительной токсичности и затрат, связанных с комбинацией лекарств. Поэтому следует быть осторожными с любыми выводами, основанными только на том, что получен статистически значимый или незначимый результат, и значение p без оценки количественных показателей и важности этих показателей для врача и пациента. Говоря о клинической значимости и размере эффекта, я бы хотела упомянуть еще один термин – «минимальная клинически значимая разница» (с англ. minimal clinically important difference (MCID)). Как следует из названия, этот показатель отражает нижнюю границу разницы в результатах, которая будет клинически значимой для пациента.

Когда мы оцениваем клиническую значимость, важны оба показателя: статистическая значимость и размер эффекта. Например, сравните «показатели боли в суставах до и после лечения значительно отличаются (р < 0,001)» с «на фоне лечения снижение боли в суставах составило от 1 до 2 баллов по 10-балльной шкале с вероятностью случайности наблюдаемого эффекта менее 0,1 %». Оба утверждения следуют из статистического теста, но второе также предполагает, что боль, вероятно, уменьшится на 1–2 балла, учитывая, что в исследования обычно набирают пациентов с уровнем боли >6, такое улучшение, вероятно, будет незначительно в жизни для большинства участников.

Еще один пример: исследование эффективности витамина D и рыбьего жира в профилактике смертности от сердечно-сосудистых заболеваний под аббревиатурой VITAL показало, что смертность при приеме рыбьего жира была на 4 % меньше [41]. Однако эта разница не была статистически значимой (95 %-ный доверительный интервал 0,76–1,21), а значит, полученный эффект вполне мог оказаться случайным.

Клинически значимые результаты всегда должны быть статистически значимыми, но статистически значимые результаты не всегда являются клинически значимыми.

Рисунок 26. Статистическая и клиническая значимость

2.5 Доктор, а мне точно поможет?

Показатели, которые мы разобрали в этой главе, говорили об эффективности как таковой и о том, насколько важны результаты для практики. Но чтобы понять вероятность, поможет то или иное вмешательство конкретному пациенту, есть еще одна статистика, которую вы можете встретить в исследованиях и клинических протоколах, – это число больных, кого необходимо пролечить, чтобы достичь определенного благоприятного исхода или предотвратить один неблагоприятный исход, в сравнении с контрольной группой (англ. number needed to treat, или NNT). Дальше я буду использовать английскую аббревиатуру NNT, так как более вероятно, что вы столкнетесь именно с ней, нежели с русскоязычной аббревиатурой ЧБНЛ.

Идеальный показатель NNT равен 1, когда все больные выздоравливают от лечения, а в контрольной группе никто не выздоравливает. Чем больше NNT, тем больше людей требуется пролечить, чтобы один из них выздоровел, то есть лечение менее эффективно.

Например, исследование ASCOT-LLA оценивало эффект от приема 10 мг аторвастина (понижает уровень холестерина) у пациентов с гипертензией, но без сердечно-сосудистых осложнений (первичная профилактика). За 3,3 года наблюдения риск осложнений снизился на 36 % (относительное снижение риска). Снижение риска в абсолютных значениях было значительно меньше, поскольку исследуемая группа имела невысокую частоту развития осложнений сердечно-сосудистых заболеваний за время исследования: 2,67 % в контрольной группе против 1,65 % в группе пролеченных больных. Прием аторвастатина в течение 3,3 лет в итоге приводил к снижению абсолютных рисков всего на 1,02 % (2,67 % минус 1,65 %). Число больных, которых необходимо лечить, чтобы предотвратить одно осложнение сердечно-сосудистых заболеваний, равнялось 99,7 за 3,3 года.

NNT находится в обратной зависимости от разницы показателей между группами. Например, если она равняется 1, то NNT = 2. Чем разница ближе к 0, тем больше людей надо пролечить, чтобы получить эффект.

Возможно, вас напугали эти цифры – как минимум 100 человек должны получать статины, чтобы предотвратить одно осложнение в течение 3 лет, или нужно провакцинировать от 80 до 120 пациентов, чтобы предотвратить один случай COVID‐19. Только не забывайте: это относится к профилактике. Показатели NNT для лечения гораздо более оптимистичные. NNT для лучевой терапии рака молочной железы равен 8, для бета-блокаторов при хронической сердечной недостаточности – 24.

Практические рекомендации

Наиболее полный онлайн-каталог NNT при различных видах лечения собран на сайте https://thennt.com/home-nnt/.

Ни одно исследование не является идеальным. Будь то рандомизированное испытание или наблюдательное исследование, никогда нельзя быть абсолютно уверенным, что результаты верны и применимы к вам. Однако, зная эффективность лечения, вы сможете задать вопросы о лечении, не демонстрирующем эффективность в исследованиях, и с осторожностью отнестись к его назначению, а также обсудить с врачом сравнительную эффективность предложенных вариантов лечения.

§ 3. Интерпретация результатов исследований эффективности

В заключительном параграфе главы про эффективность предлагаю вам взглянуть на клинические испытания с еще нескольких ракурсов, что, надеюсь, поможет закрепить различные термины на реальных примерах.

3.1 Фазы клинических испытаний

В 1917 году педиатр из Нью-Йорка Сидни Хаас нашел еще одно чудесное лечение. Много лет он боролся с проблемами пищеварения, болями в животе, плохим усвоением питательных веществ и задержкой роста, вызванных целиакией, которая приводила к смерти маленьких пациентов. Решение оказалось простым – бананы. На диете с большим количеством бананов симптомы болезни быстро исчезали, и дети набирали вес. Результаты до и после лечения с фотографиями, подтверждающими чудесную трансформацию, Хаас опубликовал в научной статье The value of the banana in the treatment of celiac disease (в то время такой дизайн исследования без использования контрольной группы вопросов не вызвал).

Сидни Хаас предполагал, что бананы являются суперфудом, то есть продуктом, богатым ценными веществами, оказывающими целительное или оздоровительное действие, о которых мы часто сегодня слышим. В 5‐й главе мы говорили, что иногда даже без понимания причины можно найти эффективное решение. Во всяком случае, на время, пока не придет понимание. Так и в этой истории целительное действие бананов при целиакии, как оказалось, было обусловлено не веществами, содержащимися в бананах, а тем, что, потребляя огромное количество этих фруктов, дети переставали есть или значительно уменьшали количество хлеба в рационе. Хлеб и содержащийся в нем глютен приводит ко многим нежелательным последствиям у людей с целиакией, вызывает разрушение ворсинок в кишечнике и затрудняет усвоение питательных веществ. Бананы эффективно справлялись с симптомами болезни, но интерпретация их эффекта была неправильной. Чудо оказалось не в бананах, а в сокращении глютена.

Из этой истории следует один важный вывод: научные исследования отвечают только на конкретно поставленный вопрос. Ни одно научное исследование не может ответить на все вопросы сразу. Это относится ко всем, не только к РКИ или клиническим испытаниям эффективности.

Результаты научного исследования подтверждают определенный факт, в определенной популяции, в определенных условиях, и этот факт не всегда распространяется на остальные группы пациентов или другие популяции.

Научные исследования, несомненно, могут ошибаться, но в реальности большинство ошибочных выводов следует из ошибочных интерпретаций.

Дети, которые едят большое количество бананов, избавляются от симптомов целиакии – это показало исследование Хааса – факт. Бананы – чудесный суперфуд, исцеляющий от целиакии, – это уже интерпретация. То, что мы добавляем, кажется вполне разумным для объяснения факта, но это также нужно доказать. Хлорка эффективно боролась с родильной горячкой, вызванной грязными руками акушеров, – факт, однако он не подтверждал мнения, что горячку вызывает трупный яд. В определенной степени это снова про разделение экспертных мнений от фактов и про то, что исследования доказывали эффективность вмешательства без объяснения биологического эффекта. Важны и эффект, и эффективность.

Сегодня, прежде чем какое-либо вмешательство будет одобрено к использованию пациентами, ученые и производители должны доказать как механизм эффекта, так и его эффективность. Для этого требуется серия исследований, которые проводятся последовательно, согласно так называемым фазам клинического испытания от экспериментальных работ в лаборатории (доклинические исследования) до исследований безопасности и эффективности сначала в небольшом эксперименте, а затем и в реальной клинической практике. У каждой фазы есть цель в отношении эффекта и эффективности, хотя безопасность оценивается на каждом этапе.

Рассмотрим фазы и цели исследований на примере клинических испытаний вакцин:

Фаза 1 – тестирование на маленькой группе здоровых волонтеров (около 10 человек). Главный фокус на безопасность, но также изучается эффект вакцины на иммунитет.

Фаза 2 – тестирование на большей группе здоровых волонтеров (сотни человек). Цель: оценить безопасность и иммуногенность вакцины – способность генерировать иммунный ответ против вируса. Она измеряется с помощью анализа крови, где оценивают, сколько антител и других иммунных клеток выработалось в организме после введения вакцины. По дизайну исследования могут быть сериями случаев или РКИ экспериментальной эффективности. На этом этапе никто не считает, сколько человек, получивших вакцину, в итоге заразились COVID‐19, главное – вакцина способна вызывать желаемый и объяснимый эффект.

Фаза 3 – тестирование на большой выборке (тысячи человек). Цель: оценить эффективность, то есть способность вакцины защитить от вируса в реальных условиях, когда испытуемые живут обычной жизнью. На этом этапе все исследования уже РКИ, изучается как экспериментальная, так и клиническая эффективность. Исследуют не здоровых волонтеров, а обычных людей, максимально похожих на тех, кто будет получать вакцину в будущем, включая пожилых и людей из групп риска.

В США и Европе официальное одобрение вакцин происходит только после успешного завершения 3‐й фазы, так как известно достаточно случаев, когда именно на ней препарат оказывался неэффективным или небезопасным.

Фаза 4 – постмаркетинговые исследования – дополнительные исследования безопасности, побочных эффектов и отдаленной эффективности после того, как вакцина поступит на рынок. По дизайну это могут быть как РКИ, так и когортные исследования и исследования «случай – контроль», так исследования в реальной клинической практике.

Фазы клинических испытаний лекарств аналогичны. Если в практике врача уже есть эффективные лекарства, проводят сравнительный анализ эффективности (с англ. comparative effectiveness research), чтобы оценить, насколько новое лекарство эффективно и безопасно по сравнению со старым. Однако не каждое новое лечение позволяет получить большую разницу в эффективности в сравнении со старым по твердым (или жестким) конечным точкам: снизить смертность, уменьшить количество инсультов или сердечных приступов, улучшить качество жизни.

В последние десятилетия все чаще мы сталкиваемся с особой категорией клинических испытаний, цель которых – оценить так называемую неменьшую эффективность (с англ. noninferiority trials). То есть новые методы лечения должны доказать, что они при схожей общей эффективности также имеют дополнительные преимущества: уменьшение побочных эффектов, повышение удобства или снижение стоимости. Например, новые антикоагулянты ввели не потому, что они уменьшают количество инсультов или других тромботических событий, а потому, что их не нужно так часто контролировать и у них меньше лекарственных взаимодействий в сравнении с варфарином.

3.2 Клиническая и экспериментальная эффективность

Возможно, вы обратили внимание, что РКИ проводятся на разных фазах исследования, и, даже если цель исследования – изучить эффективность вмешательства, речь может идти о разных видах эффективности. А именно об экспериментальной эффективности, которая дает ответ на вопрос «Действительно ли вмешательство способно произвести определенный эффект в идеальных контролируемых условиях?», либо о клинической эффективности, оценивающей действие лекарственного средства или методики лечения в условиях реальной клинической практики.

В английском языке разница между этими двумя понятиями очевиднее: «экспериментальная эффективность» переводится как efficacy, что ближе к действенности, тогда как «клиническая эффективность» переводится как effectiveness, что в прямом переводе ближе к результативности. А вот в русском языке оба понятия переводятся как эффективность, что может создавать дополнительную сложность в интерпретации результатов исследования.

Если экспериментальная эффективность относится к эффекту как таковому (биологическому, физиологическому, социальному) и, как правило, изучается в исследованиях 2‐й фазы, то клиническая эффективность учитывает не только эффект, но и то, насколько реально его применение в условиях определенной системы здравоохранения, включая экономическую целесообразность, и чаще встречается в исследованиях 3‐й и 4‐й фаз.

Конечно, лишь малая часть исследований в чистом виде относится к экспериментальной либо клинической эффективности, большинство находится где-то посередине. Для нас с вами важно не то, как называется исследование, а характеристики, присущие каждому типу, такие как: кто выбран для участия в исследовании, как осуществляется вмешательство, как обращаются с выбывшими и получающими «неправильное» лечение, как результаты анализируются. От перечисленных характеристик зависит интерпретация результатов: достаточно ли они убедительны, чтобы изменить врачебную тактику уже сегодня, или следует еще подождать. Давайте подробнее остановимся на некоторых моментах.

Если провести сравнение с путешествием в новый неизведанный город, то в какой-то мере РКИ похоже на экскурсию с гидом. Заранее продуманы места посещения, прописаны временные рамки и правила поведения в группе. Плюсы в том, что вы можете быть уверены, что успеете везде побывать, вовремя закончить и точно будете знать, где оказались. Но для этого нужно прийти вовремя, придерживаться маршрута и не отставать от группы. И от цели экскурсии зависит, насколько строги правила.

Испытания экспериментальной эффективности похожи на очень организованную и строгую экскурсию, где нужны наилучшие условия и идеально подходящие пациенты. Для этого больных отбирают по полу, возрасту и сопутствующей патологии на основании четких критериев. Например, исследование может включать только новые случаи (не больше месяца с постановки диагноза). Или только тех, кого хроническая боль в суставах беспокоит «в большинство дней месяца, в течение не менее трех месяцев». Или пациентов «с симптомами шизофрении в течение 6 месяцев». Остальных пациентов (с сопутствующими заболеваниями, старшего возраста, с нетипичными симптомами) часто не берут. Еще в исследованиях экспериментальной эффективности обычно врачи и медперсонал должны следовать строгому протоколу. Например, пройти обучение, запомнить, что можно и чего нельзя говорить пациенту, как описывать лечение. Количество визитов к врачу, дозы и алгоритмы лечения и даже даты напоминаний, которые медсестра посылает пациентам, заранее прописываются протоколами. Если тестируются новые лекарства, их уровень в крови регулярно проверяют, чтобы убедиться, что значения находятся в пределах, способных оказывать лечебный эффект (так называемая терапевтическая концентрация), но не доходят до токсических уровней.

Все это делается, чтобы оказываемая помощь и оценка исходов были идентичны для всех пациентов, а сами пациенты представляют собой небольшую группу населения, отвечающую строгим критериям, – которые с наибольшей вероятностью получат пользу от лечения.

Если лечение не работает в идеальных условиях, маловероятно, что оно будет эффективным на практике.

Недостаток подхода в том, что участники эксперимента становятся все менее и менее похожими на пациентов, которых врачи встречают на приеме. Помните, в прошлой главе мы говорили о репрезентативности в научных исследованиях и о том, почему так важно, чтобы выборка включала людей, похожих на нас с вами? Так же и здесь. Хотя в РКИ две группы статистически идентичны друг другу – за исключением полученного лечения, – это еще не означает, что какая-либо группа идентична вам.

Если в испытании участвуют люди аналогичного вашим возраста, дохода, условий жизни и так далее, его результаты более вероятно применимы и к вам. Тогда как результаты исследования, участники которого – бедные 30‐летние крестьяне из сельских районов Китая, может быть неприменимо к пожилым жителям Нью-Йорка из среднего класса, и наоборот. Например, в Великобритании из многих испытаний исключают пациентов, не говорящих на английском языке или без образования. Однако такие результаты сложно применить в практике, если вы доктор в населенном пункте, где таких жителей – большинство. Результаты исследований новых препаратов на здоровых студентах-добровольцах сложно применить к женщинам пожилого возраста. Результаты клинического испытания с участием пациентов с умеренными и тяжелыми формами заболевания, например сердечной недостаточностью, могут быть неприменимыми для лечения легких форм сердечной недостаточности. Это важно, особенно когда хотите применить результаты исследований, проведенных на пациентах в больнице, для лечения амбулаторных больных, у кого тяжесть заболевания, как правило, меньше. Многие, особенно более ранние, испытания не включали женщин, людей определенного социального класса или этнической принадлежности. Поэтому мы знаем о влиянии лекарств на группы пациентов, которые не изучались, гораздо меньше, чем хотелось.

И как раз в этом помогают исследования клинической эффективности, которые больше похожи на лечение в том виде, в каком оно фактически проводится. Это все еще организованная экскурсия, только уже менее строгая. Например, подобные исследования включают пациентов разного возраста, с разными сопутствующими заболеваниями и разной медицинской историей, налагают меньше ограничений на то, как проводится лечение, и меньше контролируют соблюдение пациентом режима лечения. Для этого, вероятно, потребуется бóльшая выборка, но результаты будут применимы к ситуациям, с которыми врачи сталкиваются на практике. Ведь к врачу обращаются разные пациенты. И врач не может кому-то из них сказать: «Я не буду вас лечить, так как вашим симптомам не 6, а всего 4 месяца». Или – «боль в коленных суставах беспокоит вас часто, но не большинство дней в месяце». В клинических испытаниях пациенты обязуются пройти полный курс лечения и прийти на контроль в назначенный срок, но в реальной практике многие пациенты не могут этого пообещать. Однако, даже несмотря на сомнения, врач все равно должен назначить лечение. Также в реальности не всегда есть дополнительный персонал и доступны дополнительные обследования, не все специалисты имеют необходимый опыт и уверенность в тех или иных методах диагностики и лечения. Из-за этого терапия в реальной жизни редко оказывается столь же однородной, как в контролируемых испытаниях эффективности.

Подагра – единственное заболевание в практике врача-ревматолога, от которого есть доступное и эффективное лечение. Тем не менее только 40 % пациентов его получают, и то зачастую в недостаточных дозах. А все потому, что у врачей нет времени титровать дозы, нет времени объяснять, что в первые месяцы возможны обострения, но уже через полгода они полностью прекратятся, а также что лечения придется придерживаться очень долго, возможно всю жизнь, и что дело совсем не в артрите, оно нужно, чтобы кристаллы мочевой кислоты не разрушили почки, которые совсем не болят, но в один день могут привести к серьезным последствиям для здоровья.

Практические рекомендации

Когда вы читаете результаты клинических испытаний эффективности, обратите внимание на критерии, по которым пациентов включали в исследование. Обычно эту информацию указывают в разделе «методы».

Основные критерии, по которым участники клинических испытаний могут отличаться от пациентов в практике врача:

• возраст;

• степень тяжести заболевания;

• этническая принадлежность;

• образ жизни и наличие вредных привычек;

• сколько внимания участники получали во время исследования. Если больше, чем то, которое врач может уделить своим пациентам, – например, если в исследовании пациенты получали часовую консультацию, а врач может уделить только 15 минут, за которые нужно успеть впечатать все данные в компьютер, – эффект лечения может быть меньше. Последующие звонки медперсонала с целью узнать самочувствие пациента и звонки-напоминания о последующих приемах тоже повышают приверженность терапии, и даже сами по себе могут оказывать некоторый терапевтический эффект;

• сопутствующие заболевания и прием медикаментов, включая оральные контрацептивы.

Однозначно, практикующие врачи и пациенты наибольшую пользу извлекают из исследований клинической эффективности. С этой точки зрения было бы разумно начать с ее испытания, потому что благодаря ему мы можем быть уверены: вмешательство сработает в реальной жизни. Однако с организационной и финансовой точки зрения это весьма неразумно. Клинические испытания 3‐й фазы могут занять несколько лет и стоить сотни миллионов долларов. Более того, 90 % разрабатываемых лекарств терпят неудачу и не доходят до регистрации и свободной продажи. Поэтому исследования проводят последовательно с увеличением количества участников и времени наблюдения. К тому же есть риск, что даже эффективное лечение не сработает из-за ошибок в критериях отбора пациентов или в обучении терапевтов, из-за несоблюдения режима, побочных эффектов или других неучтенных факторов. В таком случае вывод об отсутствии значительного эффекта, когда он на самом деле есть, способен преждевременно прервать дальнейшие исследования в этой области. Поэтому исследования экспериментальной эффективности – это важный и необходимый шаг в разработке эффективного лечения. Но их результаты следует интерпретировать, помня о недостатках, которые мы ранее разобрали: размер и репрезентативность выборки, протокол обследования и лечения, дополнительное внимание и обучение медперсонала и т. д.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 | Следующая
  • 0 Оценок: 0

Правообладателям!

Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.


Популярные книги за неделю


Рекомендации