Текст книги "Доказательная медицина. Что, когда и зачем принимать"
Автор книги: Кирилл Галанкин
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 14 (всего у книги 19 страниц)
Полоски гораздо удобнее исследования плазмы крови на содержание глюкозы. В детали углубляться нет необходимости, можно просто сказать, что разница здесь примерно такая же, как между катанием на самокате и вождением большегрузного автомобиля. Для того чтобы опустить полоску в мочу и посмотреть, как изменится цвет, не нужно быть врачом-лаборантом, это можно сделать и без медицинского образования[89]89
Но инструкцию, прилагаемую к тест-полоскам, все же придется прочесть, чтобы сделать тест правильно. Исследования тест-полосок, предназначенных для определения беременности, показали, что несоблюдение правил может снижать чувствительность теста на 20–25 %.
[Закрыть]. Лаборатория с реактивами для этого тоже не нужна… Да, есть еще и глюкометры – приборы для моментального определения содержания глюкозы в крови. Они бывают фотометрическими, электрохимическими, лазерными, бесконтактными, но глюкометры значительно дороже тест-полосок и не так надежны, как лабораторные методы.
Полоски гораздо дешевле лабораторного анализа крови.
А еще полоски имеют очень высокую специфичность, могущую доходить до 99 % и примерно такую же прогностическую ценность отрицательного результата! Именно на специфичность здесь и сделана ставка. При помощи простого и недорогого метода исключаем тех, у кого явно нет сахарного диабета, а остальных обследуем по полной программе. При специфичности в 99 % может быть пропущен 1 человек из 100 обследуемых при помощи данного теста. Это очень хороший показатель. Ошибок, вызванных высоким почечным порогом глюкозы, можно избежать, если следовать одному простому правилу – помимо результатов теста надо обращать внимание на жалобы и состояние пациента. Если пациент с отрицательным результатом предъявляет жалобы, характерные для сахарного диабета (сильная жажда, частое мочеиспускание, потеря веса), то такого пациента нужно обследовать дополнительно.
Теперь вы можете самостоятельно оценивать диагностические методы на основании их характеристик. Если хотите, то можете в рамках домашнего задания оценить парочку методов. Когда станете читать научные статьи по этой теме или систематические обзоры с метаанализами, то непременно обращайте внимание на то, проводилось ли параллельно каждому участнику исследования полное обследование по критериальному (или «золотому») стандарту. Лишь на основании сравнения с этим стандартом можно давать правильную оценку исследуемому диагностическому методу. А еще надо помнить о том, что в правильном клиническом исследовании основная и контрольная группы должны включать здоровых людей, людей с легкими и тяжелыми формами заболевания, с наличием сопутствующих заболеваний, людей, регулярно получающих лечение и не леченных, людей разных возрастов. Только такой «разброс» может обеспечить получение правильного «доказательного» результата. Обратите внимание – «может обеспечить», но не гарантирует.
Если же вы захотите сравнить разные варианты тестов при одном и том же заболевании, то в первую очередь сравнивайте такую характеристику, как отношение правдоподобия. Это наиболее информативный показатель в плане сравнения.
ПОСТСКРИПТУМ. Оценивая диагностический метод нужно хорошо представлять, для каких именно целей он используется, иначе оценка рискует получиться неверной.
Глава шестнадцатая
Наблюдательные клинические исследования
Представьте такую ситуацию. Вы – врач-исследователь, и вам нужно исследовать связь между курением и раком легкого. Или между систематическим употреблением спиртных напитков и циррозом печени. Или между ожирением и артериальной гипертензией… Короче говоря, между систематическим действием на организм какого-то вредного фактора и определенным заболеванием.
Что вы станете делать?
Создадите две группы участников, основную и контрольную. Тех, кто окажется в основной группе, заставите выкуривать по пачке сигарет в день… Ой, как бы не пришлось отвечать в суде за организацию такого, с позволения сказать, исследования. Нельзя намеренно наносить вред чьему-то здоровью, это неэтично и преступно. Научный интерес не может служить оправданием. К месту можно вспомнить, что в рамках Нюрнбергского трибунала был выделен отдельный процесс над врачами, которые ставили эксперименты над людьми в нацистских концлагерях.
Вредить ближнему своему нельзя. Но если ближний сам вредит себе, то почему бы не понаблюдать за этим? Всегда можно найти людей, которые добровольно и сознательно подвергают себя действию какого-либо вредного фактора. Из этих людей можно сформировать основную группу, а из тех, кто ведет здоровый образ жизни – аналог контрольной, и наблюдать за ними. Вы не будете оказывать никакого воздействия на участников вашего исследования, вы просто будете наблюдать и сравнивать результаты наблюдения в разных группах. Такое «пассивное» клиническое исследование называется наблюдательным, или в латинизированном варианте – обсервационным.
Наблюдательные исследования проводятся не только по этическим причинам, но и в тех случаях, когда невозможно или очень сложно провести экспериментальное (рандомизированное) клиническое исследование. Например, вам нужно исследовать, каким образом влияет на здоровье работа в определенных условиях. Вы же не можете взять тысячу молодых людей и распределить их по разным специальностям – эта сотня отправляется в шахты, эти будут летчиками, а вот эти – офисными клерками… Более того, вы даже не сможете замотивировать энное количество выбранных наугад молодых людей регулярно заниматься плаванием в течение 20 лет, если вам будет нужно исследовать, как регулярные занятия плаванием связаны с возрастными изменениями позвоночника. Придется вместо рандомизированного экспериментального исследования проводить наблюдательное – формировать основную группу из числа тех, кто смолоду регулярно занимается плаванием.
Обратите внимание вот на что. Наблюдательное клиническое исследование отличается от экспериментального не только тем, что исследователи просто наблюдают за участниками, не оказывая на них никакого воздействия, но и тем, что в этих исследованиях отсутствует формирование групп по принципу рандомизации, в случайном порядке. В процессе подготовки к рандомизированному экспериментальному исследованию сначала в случайном порядке формируются основные и контрольные группы, а затем основную группу подвергают какому-то воздействию. При наблюдательном исследовании приходится «выбирать из того, что есть» – из курящих, из пловцов, из шахтеров. Управление воздействием изучаемого фактора остается за рамками исследования. Поэтому в зарубежной литературе наблюдательным клиническим исследованиям противопоставляются не экспериментальные исследования, а рандомизированные (Randomized trial или Randomized controlled trial). Говорим «рандомизация» – подразумеваем «эксперимент», как-то так.
Хочешь, чтобы было правильно – сделай сам. Этот древний принцип справедлив и для клинических исследований. Если исследователь хочет получить абсолютно идентичные основную и контрольную группы (или близкие к абсолютной идентичности), то ему нужно самостоятельно производить отбор. Главное преимущество экспериментального рандомизированного клинического исследования перед наблюдательным заключается в отсутствии ошибок отбора, а также в низком влиянии так называемых вмешивающихся факторов – каких-то независимых признаков, влияющих на исследуемый признак и исход исследования.
Вот пример, грубый, но яркий. Исследователь, желающий изучить влияние регулярных занятий плаванием на состояние позвоночника, отбирает две группы участников – основную, в которую входят люди, занимающиеся плаванием, и контрольную, члены которой видят бассейны только в кино. Исследователь думает, что он выбирает между «пловцами» и «непловцами», а на самом деле он выбирает между обеспеченными и малообеспеченными людьми, потому что бассейны в основном посещают люди обеспеченные. Результаты, которые будут получены в процессе наблюдения за двумя группами, будут лишь в небольшой степени обусловлены занятием плаванием. Основным определяющим фактором будет достаток. В некоторых случаях можно получить и парадоксальные результаты. Например, исследователь может упустить из внимания тот факт, что многие следящие за своим здоровьем пловцы придерживаются некоей модной диеты, которая отрицательно сказывается на состоянии костей, потому что не дает организму кальция. В результате выяснится, что у тех, кто не занимается плаванием, состояние позвоночника лучше, чем у «пловцов» (как уже было сказано, это грубый пример, на деле различия бывают тоньше, но нам сейчас важны не детали, а суть вопроса).
В статистике есть такое понятие, как спутывающая переменная. Это переменная, которая является причиной двух других переменных и способствует их взаимосвязанному появлению, иначе говоря – спутывает, связывает их между собой. В наблюдательном исследовании довольно легко можно упустить из виду наличие спутывающей переменной. Как ни продумывай эксперимент, как ни старайся все предусмотреть, что-то всегда останется «за рамками». В результате исследование взаимосвязи между явлениями А и Б на самом деле будет представлять собой исследование взаимосвязи между явлениями А и В, где В – спутывающая переменная, опосредованно связывающая А с В.
На наблюдательные исследования очень любят ссылаться производители неэффективных шарлатанских лечебных препаратов. «Наблюдения за 200 пациентами, принимавшими наш гибельвирусин[90]90
Название вымышленное.
[Закрыть], установили, что они в три раза реже болеют простудными заболеваниями, чем те, кто гибельвирусина не принимал». И знаете, что самое интересное? То, что такой результат можно спокойно получить на деле, если в основную группу отобрать людей в возрасте 20–30 лет, а в контрольную взять тех, кто уже перешагнул шестидесятилетний рубеж. Впрочем, подобные «шалости» и в экспериментальных исследованиях можно совершать, было бы желание.
У наблюдательных клинических исследований есть четыре преимущества перед экспериментальными.
Преимущество первое – наблюдательные исследования можно проводить в тех случаях, когда проведение экспериментальных исследований невозможно по этическим или каким-то иным соображениям.
Преимущество второе – наблюдательные исследования обходятся дешевле экспериментальных.
Преимущество третье – длительность наблюдательных исследований ограничивается только желанием исследователей. Отдаленные последствия приема препаратов часто устанавливаются именно в наблюдательных исследованиях.
Преимущество четвертое – наблюдательные исследования предоставляют широкую возможность изучения взаимодействия лекарственных препаратов друг с другом. Врачей же интересует не только то, как действуют препараты, но и как они сочетаются друг с другом. Взаимодействие может быть совершенно разным, от полной взаимной инактивации до выраженного усиления эффекта. Частично эти вопросы изучаются в ходе первичных исследований, которые проводятся до запуска препаратов в производство, но этой информации бывает недостаточно. В экспериментальных исследованиях сопутствующую терапию, то есть те препараты, которые пациенты принимают вместе с исследуемым, стараются максимально ограничить. Это делается для того, чтобы иметь возможность правильно и точно оценить действие исследуемого препарата, чтобы его эффект не искажался действием других лекарств.
Но в целом экспериментальные рандомизированные клинические исследования считаются более предпочтительными, чем наблюдательные. «Экспериментальньный» результат достовернее «наблюдательного» – это аксиома. Поэтому проведение наблюдательных исследований принято обосновывать, принято объяснять (если это не ясно априори), почему в данном случае было решено провести именно наблюдательное исследование.
Основными типами наблюдательных исследований являются когортные исследования и исследования «случай-контроль».
Древнеримское слово «когорта»[91]91
Буквально «когорта» переводится как «огороженное место».
[Закрыть], обозначающее тактическое воинское подразделение, перекочевало в медицину из демографии, где им называют совокупность людей, у которых в один и тот же период времени произошло определенное демографическое событие (например, рождение или вступление в брак). В эпидемиологии «когортой» называют группу людей, имеющих какие-то общие характеристики. Собственно, когортное исследование можно было бы назвать «групповым», так было бы яснее. Суть когортного исследования заключается в наблюдении за основными и контрольными группами.
Когортное исследование может быть проспективным или ретроспективным.
В проспективном когортном исследовании сначала составляется план исследования, определяется порядок сбора и обработки данных, а затем формируются когорты, проводится наблюдение и анализируются полученные данные. Проспективные когортные исследования длятся определенное время, необходимое для сбора данных. А вот ретроспективные когортные исследования являются одномоментными, потому что наблюдения в них не проводят. Эти исследования обращены назад, в прошлое. Сведения об участниках добываются из архивной документации. Ретроспективные исследования менее информативны, чем проспективные, потому что непосредственное наблюдение за участниками дает больше сведений, чем изучение документации. Но зато ретроспективные исследования проводятся быстро и стоят недорого. Да и не всегда можно произвести проспективное исследование. Ретроспективное исследование не предполагает обязательных встреч исследователей с участниками, оно может ограничиться только исследованием документации. Иногда в исследованиях участвуют те, кто давно уже умер. Врачи обычно недовольны тем, что по работе им приходится много писать, описывая и обосновывая каждое свое действие, но зато исследователям есть, что исследовать.
Большую известность получило «Исследование британских докторов» (British Doctors Study) – проспективное когортное исследование, проведенное в Великобритании во второй половине XX века. В ходе этого исследования изучалась весьма актуальная проблема – вред здоровью, наносимый курением. Если в наше время вред курения не вызывает сомнений ни у кого, кроме тех, кто принципиально отказывается его признавать, то еще совсем недавно – в первой половине ХХ века – вредным для здоровья считалось только неумеренное курение, например по три пачки сигарет в день. А умеренное, не превышающее 20 сигарет, даже считалось полезным. Курение успокаивает, курение «прочищает мозги», курение помогает избежать переедания, курение стимулирует активность… Ну и так далее. Реклама сигарет публиковалась в медицинских журналах, а в 1946 году табачная корпорация R. J. Reynolds Tobacco, производящая сигареты марки «Кэмел», запустила мощнейшую рекламную кампанию под слоганом «More doctors smoke Camels than any other cigarette» – «Большинство врачей курит “Кэмел”, а не другие сигареты». Возьмите голливудские фильмы сороковых-пятидесятых годов прошлого века и обратите внимание на то, как много там курят герои.
Только в 1950 году впервые были опубликованы результаты двух научных исследований, установивших связь между курением сигарет и раком легкого (чуть позже мы к этим исследованиям вернемся, потому что они были наблюдательными). Однако «первые ласточки» редко обращают на себя внимание общественности. Бо́льшая часть врачей проигнорировала эти сообщения, а некоторые ученые попытались опровергнуть их. Надо сказать, что опровержения выглядели весьма убедительными, поскольку исходили от двух известных ученых, корифеев медицинской статистики. Первым был американец Джозеф Берксон, в то время руководивший отделом биометрии и медицинской статистики клиники Мэйо (Рочестер, штат Миннесота, США)[92]92
Клиника Мэйо (Mayo Clinic) является одним из крупнейших частных медицинских и исследовательских центров мира.
[Закрыть]. Вторым – британец Рональд Фишер, профессор генетики Кембриджского университета, один из основателей математической статистики и математической популяционной генетики.
Берксон заявил, что до тех пор, пока из табачного дыма не будет выделено канцерогенное вещество, способствующее развитию рака легкого, нельзя говорить о связи между курением и этой группой заболеваний[93]93
Рак легкого, как и вообще рак, – это не одно заболевание, а много разных, имеющих единую причину – неконтролируемое деление клеток.
[Закрыть]. Когда предъявите канцероген, тогда и поговорим, а пока извольте не морочить людям головы вашими цифрами. Справедливости ради нужно сказать, что по большому статистическому счету Берксон был прав. Мало ли что могло повлиять на результат исследования. Возможно, имелась какая-то спутывающая переменная или был некий канцерогенный фактор, который исследователи не учли.
Возражения Фишера, которому вообще не нравились наблюдательные исследования как научный метод, звучали несколько иначе, но по сути были схожи с тем, что говорил Берксон. Фишер требовал подтвердить причинно-следственную связь между курением и раком легкого, что можно было сделать только при помощи рандомизированного эксперимента, проведение которого в данном случае исключалось. Будучи генетиком, Фишер предположил существование гена, вызывающего одновременно предрасположенность к раку легкого и склонность к курению. Гениальный ученый (а Фишер вне всякого сомнения был гением) отличается от простого труженика науки тем, что может выдвинуть убедительную гипотезу по любому вопросу.
Исследование британских докторов включало около 40 000 врачей-мужчин (2/3 от общего количества врачей-мужчин Великобритании), которые были разделены на 4 группы – некурящие, мало курящие, умеренно курящие и много курящие. Исходами в данном исследовании являлась смертность, как общая (то есть смерть от любой причины), так и смертность в результате определенных заболеваний. Исследование проводилось Группой статистических исследований при Британском совете по медицинским исследованиям. Участникам исследования регулярно высылались анкеты, велся учет смертности. Началось исследование в 1951 году, а закончилось – в 2001-м. На фоне этого грандиозного исследования проводилось много исследований более мелкого характера.
Промежуточные результаты Исследования британских докторов, опубликованные в 1964 году[94]94
Doll R., Hill A. B. Risk Factors in Cancer Pulmonary // Br. Med. J. 1964. Vol. 1. P. 1399–1410.
[Закрыть], подтверждали то, о чем было сказано 14 годами раньше. Общая смертности среди курильщиков была существенное выше, чем в контрольной группе, смертность от рака легкого наблюдалась среди курильщиков гораздо чаще, чем у некурящих, и смертность была прямо пропорциональна количеству сигарет, выкуриваемых за день.
Другой тип наблюдательных исследований – это исследования «случай-контроль», основанные на сравнении людей, имеющих определенное заболевание, с людьми из этой же популяции, которые такого заболевания не имеют. Собирая информацию об участниках, исследователи пытаются установить факторы риска – причины, вызывающие данное заболевание. Те два исследования, результаты которых были опубликованы в 1950 году и вызвали критику со стороны корифеев, относились к типу «случай-контроль». Одно из них, включавшее в себя 605 случаев рака легкого, было проведено в США. Другое, более масштабное (1465 случаев), провели в Великобритании эпидемиологи Ричард Долл и Остин Брэдфорд Хилл[95]95
Doll R., Hill О. Smoking and Carcinoma of the Lung // British Medical Journal. 1950. Sep. 30. P. 739–748.
[Закрыть]. Впоследствии они же проводили Исследование британских врачей и за свою деятельность на этой ниве удостоились посвящения в рыцари.
Критика Рональда Фишера, касавшаяся причинно-следственной связи между курением и раком легкого, побудила Хилла разработать критерии причинности, также известные как критерии Брэдфорда Хилла. Из девяти критериев, позволяющих устанавливать причинно-следственные связи в наблюдательных исследованиях, сегодня используются восемь. Альтернативой критериям причинности Хилла может служить только рандомизированный эксперимент, иначе говоря, очень часто у них попросту нет альтернативы.
Давайте познакомимся с этими критериями.
Первый критерий – устойчивость или воспроизводимость. Результат исследования должен быть устойчивым, то есть должен воспроизводиться при повторных исследованиях, проводимых в других условиях и другими методами.
Второй критерий – сила или выраженность эффекта. Слабый эффект не отрицает наличия причинно-следственной связи, но чем сильнее он выражен, тем выше вероятность существования причинно-следственной связи.
Третий критерий – биологический градиент или зависимость «доза – эффект» (зависимость эффекта от дозы воздействия). Увеличение силы или продолжительности воздействия фактора риска повышает вероятность развития заболевания.
Четвертый критерий – временная зависимость. Воздействие фактора риска всегда предшествует исходу – развитию заболевания.
Пятый критерий – биологическая правдоподобность. Нужно иметь убедительное объяснение того, как именно воздействие данного фактора вызывает развитие заболевания. Однако к месту можно вспомнить Шерлока Холмса, который говорил: «Отбросьте все невозможное, то, что останется, и будет ответом, каким бы невероятным он ни казался»[96]96
Цит. по: Дойл А.К. Знак четырех // Этюд в багровых томах. Знак четырех. Записки о Шерлоке Холмсе. Москва: Издательство АСТ, 2019. – С. 218.
[Закрыть]. Да и сам Хилл, выдвигая этот критерий, оговорил, что научные объяснения ограничиваются уровнем знания.
Шестой критерий – биологическая когерентность – тесно связан с предыдущим. Когерентностью называется степень соответствия предполагаемой причинной связи существующим теориям и знаниям. Проще говоря, объяснение механизма действия исследуемого фактора должно укладываться в рамки существующих научных представлений.
Седьмой критерий – экспериментальное подтверждение. Разумеется, эксперимент служит лучшим доказательством, но он не всегда возможен.
Восьмой критерий – аналогичность. Если воздействие, схожее с исследуемым фактором, вызывает похожее заболевание, то это служит косвенным подтверждением причинно-следственной связи. Применительно к связи между курением сигарет и раком легких подтверждающей аналогией является связь между курением трубки и высокой заболеваемостью раком ротовой полости.
Девятым критерием, который можно применять только к инфекционным заболеваниям, Хилл считал специфичность – конкретное заболевание может вызываться только одним фактором, который, соответственно, может вызывать только одно это заболевание. На словах вроде бы звучит логично, но на деле все не совсем так, поэтому девятый критерий впоследствии исключили (впервые критерии Хилла были опубликованы в 1965 году).
Противники наблюдательных исследований, считающие, что единственно верными могут быть рандомизированные экспериментальные исследования, отвергают критерии причинности Хилла, но, если дать себе труд вдуматься, то эти критерии выглядят логичными и заслуживающими внимания. Что же касается преимуществ (бесспорных преимуществ) рандомизированных клинических исследований перед наблюдательными, то здесь уместно будет вспомнить такие народные мудрости, как «на безрыбье и рак рыба» и «лучше синица в руках, чем журавль в небе». При отсутствии иных возможностей лучше провести наблюдательное исследование, чем сидеть сложа руки и рассуждать о преимуществах одних исследований над другими.
ПОСТСКРИПТУМ. Во время наблюдательного исследования тоже можно нарушить этические принципы. Доказательством может служить Исследование Таскиги – наблюдение за больными сифилисом афроамериканцами, которое проводилось с 1932 по 1972 год в американском городе Таскиги (штат Алабама). Исследование, проводившееся под эгидой Службы общественного здравоохранения США (United States Public Health Service, сокращенно USPHS), имело целью исследование всех стадий заболевания сифилисом. В нем участвовало 600 человек, 399 – в основной группе и 201 – в контрольной.
Во время Великой депрессии малообеспеченным афроамериканцам, не имевшим медицинской страховки, предложили участвовать в проекте, который давал им некоторые льготы медицинского характера (бесплатный проезд до больницы, бесплатное питание во время пребывания там и пр.). Доктор Рэймонд Уонделер, долгое время бывший директором этой исследовательской программы, написал в одном из служебных писем, что в его намерения «не входит раскрывать главную цель этого исследования, которая заключается в том, чтобы довести участников до посмертного вскрытия». На деле участники исследования не получали никакой существенной медицинской помощи. Более того, когда для лечения сифилиса начали повсеместно использовать пенициллин, от участников исследования скрыли этот факт, чтобы они продолжали думать, будто сифилис неизлечим. Исследование было завершено лишь в 1972 году, причем вынужденно, а не по этическим соображениям. Один из сотрудников Службы общественного здравоохранения, потеряв надежду прекратить это бесчеловечное исследование в рабочем порядке (высокопоставленные медицинские чиновники попросту не обращали на него внимания), передал информацию журналистам. Скандал в прессе повлек за собой слушания в Конгрессе США, и только после этого в деле была поставлена точка. За 40 лет умерло 128 участников исследования – 28 непосредственно от сифилиса, а 100 от различных осложнений, вызванных этим заболеванием. В 1997 году президент США Билл Клинтон принес официальные извинения от имени правительства США участникам Исследования Таскиги и их близким. В президентской речи исследование было названо «несомненно, расистским».
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.