Текст книги "Как не ошибаться. Сила математического мышления"

Текст добавлен: 29 марта 2017, 15:10

Автор книги: Джордан Элленберг

Жанр: Математика, Наука и Образование

Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 10 (всего у книги 38 страниц) [доступный отрывок для чтения: 12 страниц]

Скачать книгу

Шрифт:

- 100% +

Опровержение нулевой гипотезы

Все это время мы пытаемся найти ответ на фундаментальный вопрос: в какой степени мне следует удивляться тому, что я вижу в этом мире? Моя книга посвящена математике, а значит, вы догадываетесь, что существует численный способ ответить на этот вопрос. Такой способ действительно существует, но он таит в себе опасность. Пришло время поговорить о p-значениях.

Однако сначала нам нужно обсудить тему маловероятности, в отношении которой наши представления были до сих пор неприемлемо расплывчатыми. У этого есть своя причина. Существуют области математики (такие как геометрия и арифметика), которым мы учим детей и которым дети в какой-то мере учатся сами. Эти области математики наиболее отвечают нашей врожденной интуиции. Мы рождаемся, почти зная о том, как считать и разделять объекты на категории по таким признакам, как место и форма. Формальное математические толкование подобных концепций не так сильно отличается от того, с чего мы начинаем.

Совсем другое дело – вероятность. Безусловно, мы размышляем о неопределенных вещах, опираясь на внутреннее интуитивное восприятие, но сформулировать все это гораздо труднее. Есть причина, почему математическая теория вероятностей возникла на столь позднем этапе истории математики и почему она так поздно появляется в учебном плане по математике. Если вы попытаетесь задуматься, что означает вероятность, у вас голова пойдет кругом. Когда мы говорим: «Подброшенная монета упадет лицевой стороной вверх с вероятностью 1/2», – мы ссылаемся на закон больших чисел (из главы четвертой), который гласит, что, если вы будете подбрасывать монету много раз, доля аверсов непременно приблизится к 1/2, как будто заключенная в сужающийся канал. Такой подход обозначается термином «частотный подход к вероятности».

Но что мы имеем в виду, когда говорим: «Вероятность того, что завтра будет дождь, составляет 20 %»? Завтра наступает только один раз, значит, это не эксперимент, который мы вольны повторять снова и снова, как в случае подбрасывания монеты. Приложив определенные усилия, мы можем втиснуть прогноз погоды в частотную модель, подразумевая при этом, что в большой совокупности дней с соответствующими условиями на следующий день будет дождь с вероятностью 20 %. Но, пытаясь ответить на вопрос: «Какова вероятность, что через следующих тысячу лет род человеческий вымрет?» – вы снова оказываетесь в тупике. Это по своей сути такой эксперимент, который вы никак не сможете повторить. Мы используем вероятность даже тогда, когда говорим о событиях, которые вообще невозможно отнести на волю случая. Какова вероятность того, что потребление оливкового масла предотвращает рак? Какова вероятность того, что Шекспир был автором пьес Шекспира? Какова вероятность того, что Бог написал Библию и сотворил Землю? Трудно признать право на описание таких событий на том же языке, который мы используем для оценки подбрасывания монет и бросания костей. Тем не менее мы все-таки отвечаем на эти вопросы фразами: «Пожалуй, это маловероятно» или: «Кажется, это вполне вероятно». Но если мы так делаем, то сможем ли мы удержаться от соблазна спросить: «Насколько это вероятно?»

Одно дело – задать вопрос, и совсем другое – ответить на него. Я не могу представить себе эксперимент, который позволил бы определить вероятность того, что Всевышний действительно находится там, выше всех (или что Он – это действительно «он», если уж на то пошло). Следовательно, мы должны использовать следующий лучший вариант – во всяком случае лучший с точки зрения традиционной статистической практики. (Как мы увидим позже, по этому вопросу существуют разногласия.)

Мы уже говорили о низкой вероятности того, что имена средневековых раввинов скрыты в тексте Торы. Но действительно ли это так? Многие религиозные евреи придерживаются мнения, что все существующее знание так или иначе содержится в тексте Торы. Если это действительно так, присутствие в Торе имен и дат рождения раввинов совсем не маловероятно; по существу, это почти неизбежно.

То же самое можно сказать о розыгрыше лотереи в штате Северная Каролина. На первый взгляд кажется маловероятным, чтобы один и тот же набор выигрышных чисел выпал дважды за одну неделю. И это верно, если вы согласны с предположением, что шарики с числами выпадают из барабана в совершенно случайном порядке. Но, может быть, вы так не считаете? Возможно, вы думаете, что система случайного распределения работает неправильно, поэтому числа 4, 21, 23, 34, 39 могут выпадать с большей вероятностью, чем другие. Или вы полагаете, что нечистый на руку чиновник, занимающийся организацией лотереи, выбирает выигрышные числа так, чтобы они совпали с числами в его билете. При любой из этих гипотез удивительное совпадение совсем не маловероятно. Невероятность в таком понимании – понятие относительное, а не абсолютное. Когда мы говорим, что результат невероятен, тем самым мы в явной или неявной форме утверждаем, что он маловероятен при определенной совокупности предположений относительно базовых принципов устройства этого мира.

Многие научные вопросы, типа «происходит что-то или нет?», можно свести к простому ответу «да» или «нет». Новый лекарственный препарат действительно помогает вылечить болезнь или не оказывает никакого воздействия? Психологическая интервенция действительно делает вас более счастливыми (бодрыми, сексуальными) или не оказывает никакого воздействия? Сценарий «не оказывает никакого воздействия» называют нулевой гипотезой. Нулевая гипотеза – это предположение о том, что изучаемое вами воздействие не имеет никаких последствий. Если вы исследователь, разработавший новый лекарственный препарат, нулевая гипотеза – это то, что не дает вам спать по ночам. Пока вы не сможете ее опровергнуть, вы не поймете, стоите ли вы на пороге медицинского прорыва или выбрали не тот метаболический путь.

Каким образом следует доказывать несостоятельность нулевой гипотезы? Стандартную модель под названием «проверка значимости нулевой гипотезы» в наиболее распространенном виде разработал в начале ХХ столетия Рональд Эйлмер Фишер, основатель современной статистической практики[182]182
Вы можете не согласиться с утверждением, что методы Фишера относятся к области статистики, а не математики. Оба моих родителя занимаются статистикой, поэтому мне известно о существовании границы между этими двумя дисциплинами. Однако для своих целей мне довольно рассматривать статистическое мышление как разновидность математического, а также приводить убедительные доводы в пользу каждого из них.

[Закрыть].

Вот как это делается. Сначала необходимо провести эксперимент. Вы можете начать с сотни испытуемых, а затем в произвольном порядке выбрать половину участников эксперимента для приема вашего чудо-лекарства, а оставшимся давать плацебо. Безусловно, вы рассчитываете на то, что среди пациентов, принимающих ваш лекарственный препарат, вероятность смертности будет ниже, чем среди пациентов, принимающих таблетки-пустышки.

После этого дальнейшие действия могут показаться довольно простыми: если вы фиксируете меньше случаев смерти среди пациентов, принимавших лекарства, по сравнению с теми, кто принимал плацебо, можно объявлять о победе и подавать в Управление по контролю за пищевыми продуктами и медикаментами заявку на регистрацию нового лекарственного препарата. Но это неправильный путь. Недостаточно одного соответствия полученных данных вашей теории; эти данные должны быть несовместимы с отрицанием вашей теории, ужасной нулевой гипотезой. Я, например, объявлю, будто обладаю такими мощными способностями к телекинезу, что могу вытащить солнце из-за горизонта. Вам нужны доказательства? Тогда потрудитесь выйти на улицу около пяти утра, и увидите результаты моей работы! Но такое заявление в принципе нельзя считать доказательством, поскольку согласно нулевой гипотезе, если у меня нет экстрасенсорных способностей, солнце все равно взойдет.

Интерпретация результатов клинических испытаний требует такого же подхода. Давайте сформулируем эту задачу в числовом виде. Предположим, мы имеем ситуацию, в которой истиной является нулевая гипотеза: вероятность смерти одна и та же (скажем, 10 %) как среди пятидесяти пациентов, принимавших новый лекарственный препарат, так и среди пятидесяти пациентов, принимавших плацебо. Однако это не означает, что умрут пять пациентов, принимавших лекарство, и пять пациентов, которых лечили плацебо. В действительности вероятность того, что умрут в точности пять пациентов первой группы, составляет 18,5 % – не очень высокая, как и в случае выпадания точно одинакового количества аверсов и реверсов в длинной серии подбрасываний монеты. Точно так же маловероятно и то, что за время проведения испытаний из жизни уйдет столько же пациентов, лечившихся лекарственным препаратом, сколько и пациентов, получавших плацебо. Я сделал следующие расчеты.

Вероятность того, что количество летальных исходов среди пациентов, принимавших лекарство, и пациентов, получавших плацебо, окажется абсолютно одинаковым, составляет 13,3 %.

Вероятность того, что количество летальных исходов среди пациентов, получавших плацебо, окажется меньше количества случаев смерти среди пациентов, принимавших лекарственный препарат, составляет 43,3 %.

Вероятность того, что количество летальных исходов среди пациентов, получавших лекарственный препарат, окажется меньше количества случаев смерти среди пациентов, получавших плацебо, составляет 43,3 %.

Тот факт, что в группе пациентов, принимавших лекарственный препарат, результаты лучше, чем среди пациентов, получавших плацебо, мало что значит, поскольку даже согласно нулевой гипотезе нельзя исключать вероятность, что ваш лекарственный препарат не оказывает никакого воздействия.

Однако все выглядит совсем иначе, если в группе пациентов, принимавших лекарство, результаты гораздо лучше. Предположим, за время проведения испытаний в группе плацебо умирает пять пациентов, а в группе лекарственного препарата – ни одного. Если нулевая гипотеза верна, каждый пациент обеих групп имеет шанс остаться в живых, равный 90 %. Однако в таком случае весьма низка вероятность того, что выживут все пятьдесят пациентов, принимавших лекарство. Первый пациент из этой группы имеет шанс на выживание 90 %; вероятность того, что в живых останется не только первый, но и второй пациент, составляет 90 % от этих 90 %, или 81 %. Вероятность того, что в живых останется и третий пациент, составляет всего 90 % от 81 %, или 72,9 %. Каждый очередной пациент, выживание которого вы ставите в качестве условия, немного уменьшает вероятность, и к концу процесса, когда вы задаете вопрос о вероятности выживания всех пятидесяти пациентов, остается совсем небольшая доля вероятности:

(0,9) × (0,9) × (0,9) ×… всего пятьдесят раз! … × (0,9) × (0,9) = 0,00515…

В случае нулевой гипотезы существует только один шанс из двухсот получить настолько хороший результат. Это звучит гораздо более убедительно. Если я заявлю, что могу силой мысли заставить солнце взойти, власть моих способностей не должна производить на вас впечатление. Однако, если я скажу, что могу сделать так, чтобы солнце не взошло, и оно действительно не взойдет, тем самым я продемонстрирую весьма маловероятный результат с точки зрения нулевой гипотезы, и вам лучше обратить на это внимание.

Таким образом, в формальном виде процедуру опровержения нулевой гипотезы можно представить так.

1. Провести эксперимент.

2. Выдвинуть предположение, что нулевая гипотеза истинна, и обозначить символом p вероятность (согласно данной гипотезе) получения результатов со столь же крайними значениями, что были получены в результате наблюдений.

3. Число p обозначается термином «p-значение». Если это очень маленькое значение, радуйтесь – вы можете заявить, что ваши результаты статистически значимы. Если это число имеет большое значение, признайте тот факт, что нулевая гипотеза не была опровергнута.

Но насколько маленьким должно быть это «очень маленькое» значение? Нет принципиального способа провести четкое разграничение между тем, что является значимым, а что нет, но по традиции, которая началась еще со времен Фишера и которой принято придерживаться в настоящее время, в качестве пороговой величины используется значение p = 0,05, или 1/20.

Проверка значимости нулевой гипотезы получила широкое распространение, поскольку она соответствует нашим интуитивным представлениям о неопределенности. Почему библейские коды кажутся нам убедительными, по крайней мере на первый взгляд? Потому что коды, подобные тем, которые обнаружил Витцум, весьма маловероятны с точки зрения нулевой гипотезы, гласившей, что в Торе не заложено знание будущего. Значение числа p (вероятность обнаружения такого большого количества эквидистантных последовательностей букв, столь точно отображающих демографические данные о выдающихся раввинах) весьма близко к нулю.

Различные варианты этой аргументации в пользу божественного творения появились задолго до формального определения Фишера. Если в качестве нулевой гипотезы принять отсутствие первичного разработчика-организатора, сумевшего собрать все сущее воедино, тогда было бы крайне маловероятным существование нашего мира, столь великолепно спланированного и идеально упорядоченного.

Первым, кто попытался поставить такую аргументацию на математическую основу, был Джон Арбетнот – королевский физик и сатирик, друживший с Александром Поупом и среди прочего занимавшийся математикой[183]183
Материалы об Арбетноте взяты из работ: Ian Hacking. The Emergence of Probability. New York: Cambridge University Press, 1975, ch. 18;Stephen M. Stigler. The History of Statistics. Cambridge, MA: Harvard University Press/Belknap Press, 1986, ch. 6.

[Закрыть]. Арбетнот изучил записи о детях, родившихся в Лондоне за период с 1629 по 1710 год, и обнаружил в них удивительную закономерность: на протяжении каждого из этих восьмидесяти двух лет рождалось больше мальчиков, чем девочек. Арбетнот поставил вопрос так: какова вероятность такого совпадения, если нулевая гипотеза гласит, что Бога нет и все происходит по воле случая? Если исходить из такой гипотезы, вероятность того, что в любой год в Лондоне появится больше мальчиков, чем девочек, составляет 1/2, а p-значение (вероятность того, что мальчиков будет рождаться больше каждый год на протяжении восьмидесяти двух лет подряд) равно:

(1/2) × (1/2) × (1/2) ×… всего 82 раза … × (1/2)

или немногим меньше одного случая на 4 септильона – другими словами, почти ноль. Арбетнот опубликовал свои выводы в сочинении, названном An Argument for Divine Providence, Taken from the Constant Regularity Observed in the Births of Both Sexes («Аргумент в пользу Промысла Божьего, выведенный на основании устойчивой закономерности в рождении детей обоих полов»).

Аргументация Арбетнота получила высокую оценку авторитетных духовных лиц, но другие математики сразу обратили внимание на некоторые изъяны в его рассуждениях. Одним из основных недостатков была чрезмерная специфичность его нулевой гипотезы. Безусловно, данные Арбетнота опираются на предположение о том, что пол детей определяется произвольно: каждый ребенок имеет равные шансы появиться на свет как мальчиком, так и девочкой. Но почему эти шансы должны быть равными? Николай Бернулли предложил другую нулевую гипотезу: пол ребенка определяется случайно с вероятностью 18/35 того, что это будет мальчик, и 17/35 – что это будет девочка. Нулевая гипотеза Бернулли такая же атеистическая, как и гипотеза Арбетнота, и прекрасно согласуется с фактическими данными. Если вы подбросите монету 82 раза и она 82 раза выпадет лицевой стороной вверх, вам следует подумать: «Что-то не так с этой монетой», а не «Бог благоволит к аверсам»[184]184
Арбетнот рассматривал сам факт избыточного количества мальчиков в качестве аргумента в пользу промысла Божьего: кто-то или скорее Некто должен был бы заботиться, чтобы рождалось больше мальчиков – в качестве возмещения потерь от гибели взрослых мужчин в войнах и катастрофах.

[Закрыть].

Аргументация Арбетнота не была широко принята, однако дух ее жив. Арбетнот – интеллектуальный отец не только искателей библейских кодов, но и ученых-креационистов, которые даже в наше время утверждают, что мир без Бога вряд ли выглядел бы так, как тот мир, в котором мы живем[185]185
Мы проанализируем этот аргумент более подробно в главе 9.

[Закрыть][186]186
Подробный анализ множества различных вариантов, как классических, так и современных, этого «аргумента в пользу разумного замысла» содержится в кн.:Elliot Sober. Evidence and Evolution: The Logic Behind the Science. New York: Cambridge University Press, 2008.

[Закрыть].

Однако проверка статистической значимости не ограничивается теологической апологетикой. В каком-то смысле Дарвин – грубый безбожник в понимании ученых-креационистов – в своем основном труде предложил почти такие же аргументы:

Невозможно допустить, чтобы ложная теория объяснила столь удовлетворительно, как это делает теория естественного отбора, различные обширные группы фактов, которые были только что перечислены. Недавно было сделано возражение, что подобный способ аргументации ненадежен, но это метод, постоянно применяемый при суждении об обычных явлениях жизни и часто применявшийся величайшими естествоиспытателями[187]187
Пер. К. А. Тимирязева при участии М. А. Мензбира, А. П. Павлова и А. И. Петровского, 1896 год (по 6-му англ. изд.); Ч. Дарвин. Происхождение видов путем естественного отбора. М.: Просвещение, 1987. С. 355. Прим. ред.

[Закрыть][188]188
Charles Darwin. The Origin of Species. London. 6th ed., 1872, p. 421.

[Закрыть].

Другими словами, если закон естественного отбора считать ошибочным, представьте себе, насколько маловероятным было бы существование биологического мира, который настолько согласуется с его прогнозами!

Вклад Фишера состоит в том, что он формализовал процесс проверки значимости нулевой гипотезы, создав систему, в которой значимость (или отсутствие значимости) результатов эксперимента расценивается как объективный факт. Проверка значимости нулевой гипотезы в том виде, в котором ее описал Фишер, использовалась в качестве стандартного метода оценки результатов научных исследований почти на протяжении столетия. В учебниках этот метод называют «основой психологических исследований»[189]189
Richard J. Gerrig,Philip George Zimbardo. Psychology and Life. Boston: Allyn & Bacon, 2002 [Р. Герриг,Ф. Зимбардо. Психология и жизнь. СПб.: Питер, 2004. –Прим. М. Г.].

[Закрыть]. Это стандарт, по которому мы разделяем эксперименты на успешные и неудачные. Каждый раз, когда вы изучаете материалы медицинских, психологических или экономических исследований, скорее всего, вы читаете о том, что было проверено с помощью теста на оценку статистической значимости.

Тем не менее беспокойство по поводу этого «ненадежного способа аргументации», на которое обратил внимание еще Дарвин, так и не было отброшено полностью. Все то время, когда этот метод применялся как стандартный, находились люди, которые объявляли его огромной ошибкой. Психолог Дэвид Бакан писал в 1966 году о «кризисе психологии», который, по его мнению, был «кризисом статистической теории»:

Проверка значимости не обеспечивает получение информации относительно психологических феноменов, которые обычно относят на ее счет… Применение [этого метода] связано с большими неприятностями. …Заявить об этом «во всеуслышание» равносильно тому, чтобы взять на себя роль ребенка, заметившего в простоте, что король-то голый[190]190
David Bakan. The Test of Significance in Psychological Research // Psychological Bulletin, 1966, 66, no. 6, p. 423–437.

[Закрыть].

И сегодня, почти пятьдесят лет спустя, король по-прежнему у власти и все так же щеголяет в чем мать родила, несмотря на то что все больше шумных детей разносят весть о его наготе.

Незначительность значимости

Что не так со значимостью? Прежде всего само слово. У математической науки вообще забавные отношения с языком. Статьи о математических исследованиях, порой к большому удивлению людей непосвященных, состоят далеко не из одних только чисел и символов; математические выкладки состоят из слов. Однако объекты, на которые мы ссылаемся, зачастую представляют собой сущности, о которых ничего не сказано в словаре Merriam – Webster[191]191
  Американский толковый словарь английского языка; аналог словаря Брокгауза – Ефрона. Прим. М. Г.

[Закрыть]. Описание нового требует новой лексики. Существует два способа создать такой словарь. Можно придумать совершенно новые слова, как мы обычно поступаем, когда говорим о когомологиях, сизигиях, монодромии и так далее, однако это делает нашу работу непривлекательной и недоступной для понимания. Гораздо чаще мы приспосабливаем существующие слова для собственных целей[192]192
  Побочным результатом становятся такие перлы математического фольклора, как теорема «не ищи в полях идеалов». Кольцо – множество, на котором определены две операции: сложение (коммутативно, ассоциативно, с нолем и обратным элементом) и умножение (ассоциативно); сложение и умножение дистрибутивны. Кольцо называется полем, если умножение коммутативно, ассоциативно, с единицей и обратным элементом. Идеалом называется подкольцо, замкнутое относительно умножения на элементы из кольца. Теорема состоит в том, что у поля не может быть нетривиальных идеалов. Прим. М. Г.

[Закрыть], опираясь на определенное сходство между математическим объектом, который необходимо описать, и тем или иным элементом так называемого реального мира. Таким образом, для математика слово группа действительно означает группу объектов, но это группа особого типа, например группа целых чисел или группа симметрий геометрической фигуры. Под такой группой мы подразумеваем не просто произвольную совокупность объектов, как в случае ОПЕК или Abba[193]193
  OPEC (The Organization of the Petroleum Exporting Countries) – Организация стран – эскспортеров нефти. Abba – шведский эстрадный вокальный квартет 1970-х, назван по первым буквам имен исполнителей: Агнета Фельтског, Бьорн Ульвеус, Бенни Андерссон, Анни-Фрид Лингстад. Прим. М. Г.

[Закрыть], а совокупность объектов, обладающих таким свойством, что любую пару объектов данной группы можно скомбинировать, получив третий объект, как в случае, когда пару чисел можно сложить или пару симметрий выполнить одну за другой[194]194
  На самом деле, математическое определение «группа» содержит и другие компоненты – но, к сожалению, и эту замечательную историю придется оставить недорассказанной.

[Закрыть]. То же самое касается схем, расслоений, колец и пакетов – математических объектов, которые имеют лишь поверхностное отношение к тем вещам, которые обозначают эти слова в обычной жизни. Иногда слова, которые мы выбираем, имеют пасторальный оттенок: современная алгебраическая геометрия, например, имеет дело с полями, пучками, ядрами и слоями[195]195
  Устоявшийся перевод двух последних терминов kernel и stalk (англ.). Прим. М. Г.

[Закрыть]. Порой терминология носит более агрессивный характер: нередко говорят, что оператор что-то разрушает или, если использовать еще более сильное выражение, уничтожает. Однажды в аэропорту у меня сложилась довольно неловкая ситуация из-за коллеги, сделавшего совершенно безобидное в математическом смысле замечание: мол, нужно было бы в какой-то момент взорвать плоскость[196]196
  Оригинальная фраза blow up the plane означает как «раздуть плоскость», так и «взорвать самолет». Прим. М. Г.

[Закрыть].

Итак, поговорим о значимости. В обыденном языке это слово означает нечто важное или имеющее большое значение. Однако тест на оценку значимости, который используют ученые, не измеряет степень важности. Когда мы оцениваем воздействие нового лекарственного препарата, нулевая гипотеза гласит, что такого воздействия вообще нет; следовательно, доказать несостоятельность нулевой гипотезы – значит просто прийти к выводу, что воздействие лекарственного препарата отлично от нуля. Однако это воздействие все-таки может быть очень маленьким – настолько маленьким, что препарат не является эффективным в любом смысле, который обычный человек, не имеющий отношения к математике, назвал бы значимым.

Такая лексическая двойственность термина «значимость» не только делает математические работы трудными для чтения, но и влечет за собой другие последствия. Британский комитет по безопасности лекарственных средств (Committee on Safety of Medicines; далее по тексту – CSM) 18 октября 1995 года разослал по всей Великобритании – 200 тысячам врачей и медицинских работников – информационное письмо с тревожным предупреждением относительно некоторых марок оральных контрацептивов «третьего поколения». В этом письме было сказано следующее: «Получены новые доказательства, что в случае приема некоторых лекарственных препаратов вероятность закупорки вен возрастает примерно в два раза по сравнению с другими»[197]197
Цит. по статье: Ann Furedi. Social Consequences: The Public Health Implications of the 1995 «Pill Scare» // Human Reproduction Update, 1999, 5, no. 6, p. 621–626.

[Закрыть]. С венозным тромбозом шутки плохи. Во-первых, образуется тромб, препятствующий циркуляции крови по венам; во-вторых, когда тромб отрывается, кровоток может перенести его в легочную артерию; в-третьих, возникает угроза легочной эмболии, которая в итоге может вас убить.

Авторы письма поспешили заверить читателей, что противозачаточные средства безопасны для большинства женщин, а также что никому не следует прекращать прием соответствующих препаратов без совета врача. Однако такие детали легко теряются из виду, если главная мысль состоит в том, что «таблетки убивают». Уже 19 октября информационное агентство Associated Press опубликовало сообщение: «В четверг правительство предупредило, что новый оральный контрацептив, который принимают 1,5 миллиона британских женщин, может привести к образованию тромбов. …Рассматривалась возможность изъятия данного лекарственного препарата из обращения, но было принято решение не делать этого, отчасти потому, что некоторые женщины не могут принимать другие препараты»[198]198
Edith M. Lederer. Government Warns Some Birth Control Pills May Cause Blood Clots // Associated Press, 1995, Oct. 19.

[Закрыть].

Ясное дело, женщины почувствовали себя ошарашенными. По данным одного терапевта, 12 % ее пациенток, как только услышали о докладе правительства, прекратили принимать контрацептивы[199]199
Sally Hope. Third Generation Oral Contraceptives: 12 % of Women Stopped Taking Their Pill Immediately They Heard CSM’s Warning // British Medical Journal, 1996, 312, no. 7030, p. 576.

[Закрыть]. По всей вероятности, многие перешли на другие типы противозачаточных средств, не имеющих побочного действия в виде тромбоза. Однако любой перерыв в приеме контрацептивов снижает их эффективность, а менее эффективные противозачаточные меры приводят к увеличению случаев беременности. (Вряд ли вы сейчас подумали, что я сообщу о волне воздержания.) До этого инцидента уровень зачатий в Соединенном Королевстве снижался на протяжении нескольких лет подряд, но в следующем году он повысился на несколько процентных пунктов. В Англии и Уэльсе в 1996 году было зачато на 26 тысяч младенцев больше, чем за год до этого. Поскольку во многих случаях беременность оказалась незапланированной, это привело к увеличению случаев прерывания беременности: в 1996 году было сделано на 13 600 абортов больше, чем в 1995-м[200]200
Цит. по: Ann Furedi. Social Consequences…, p. 623.

[Закрыть].

На первый взгляд можно предположить, что такое развитие ситуации не слишком большая плата за возможность избежать страшной угрозы, когда по вашей кровеносной системе носятся сгустки крови, способные привести к летальному исходу. Подумайте обо всех женщинах, которых предупреждение CSM спасло от смерти!

Но о каком именно количестве женщин идет речь? Наверняка мы не знаем, однако, по данным одного ученого, поддержавшего решение CSM о публикации предупреждения, общее количество предотвращенных случаев смерти от эмболии составляло «возможно, один случай»[201]201
Klim McPherson. Third Generation Oral Contraception and Venous Thromboembolism // British Medical Journal, 1996, 312, no. 7023, p. 68.

[Закрыть]. Дополнительный риск в случае приема оральных контрацептивов третьего поколения был значимым в статистическом смысле по Фишеру, но не был значимым с точки зрения здравоохранения.

Способ, каким была подана эта история, только усилил замешательство. В письме CSM был приведен коэффициент риска: препараты третьего поколения в два раза увеличивают риск тромбоза у женщин. Звучит довольно мрачно, если только вы не вспомните, что тромбоз – крайне редкое заболевание. Среди женщин детородного возраста прием оральных контрацептивов первого и второго поколения мог привести к одному случаю тромбоза на семь тысяч женщин; у женщин, принимавших препараты нового поколения, этот риск был в два раза выше, то есть два случая тромбоза на семь тысяч женщин. Однако это все равно очень низкий уровень риска, если учесть простой математический факт: в два раза большее крохотное число остается крохотным числом. Хорошо это или плохо – увеличить нечто в два раза, зависит от того, насколько велико это нечто! Если во время игры в Scrabble удается сделать ход, в два раза увеличивающий ценность длинного сложного слова – это победа, но поставить на призовую клетку букву из такого слова, как «нос», – значит сделать бесполезный ход.

Мозг воспринимает коэффициент риска гораздо легче, чем крохотную долю вероятности, такую как единичный случай на семь тысяч. Однако применение этого показателя к малым значениям вероятности может ввести в заблуждение. Социологи Городского университета Нью-Йорка провели исследование, по результатам которого было установлено, что среди детей, за которыми присматривают няни или сотрудники центров по уходу за детьми на дому, смертность от несчастных случаев в семь раз выше, чем среди детей, посещающих детские садики[202]202
  Julia Wrigley,Joanna Dreby. Fatalities and the Organization of Child Care in the United States, 1985–2003 // American Sociological Review, 2005, 70, no. 5, p. 729–757.

[Закрыть]. Но прежде чем увольнять няню-иностранку, задумайтесь на минутку о том, что в наше время маленькие дети почти не умирают, а если даже это происходит, то не потому, что няня укачала ребенка до смерти. Годовой уровень несчастных случаев со смертельным исходом в случае ухода за детьми на дому составил 1,6 на 100 тысяч детей: действительно намного более высокий уровень, чем 0,23 на 100 тысяч детей в детских садиках[203]203
  В исследовании не рассматривается любопытный вопрос: каков уровень смертности среди детей, находящихся под присмотром родителей.

[Закрыть]. Однако оба показателя очень близки к нулю. По данным исследования, проведенного социологами Городского университета Нью-Йорка, от несчастных случаев погибло около десятка детей, за которыми обеспечивался уход на дому, – крохотная доля от 1110 американских детей, погибших в результате несчастных случаев в 2010 году (в основном в результате удушения постельным бельем), или от 2063 детей, умерших от синдрома внезапной детской смерти[204]204
  Вся информация о детской смертности дается по материалам Национального центра медицинской статистики (National Center for Health Statistics), размещенным на сайте Центра по контролю и профилактике заболеваний (Centers for Disease Control):Sherry L. Murphy,Jiaguan Xu,Kenneth D. Kochanek. Deaths: Final Data for 2010 // National Vital Statistics Reports, 2013, May 8. Vol. 61, no 4 (www.cdc.gov/nchs/data/nvsr/nvsr61/nvsr61_04.pdf).

[Закрыть]. При прочих равных условиях результатов этого исследования было бы достаточно для того, чтобы отдать предпочтение детским садам перед домашним воспитанием и уходом, однако на самом деле прочие условия не являются равными, причем некоторые аспекты такого неравенства имеют большее значение, чем другие. Что если детский сад, сияющий чистотой и имеющий сертификат городских властей, находится в два раза дальше от вашего дома, чем вызывающий небольшие сомнения детский сад семейного типа? Например, в автомобильных авариях в 2010 году погибло 79 детей; если ваш ребенок будет проводить на 20 % больше времени в год на дороге из-за большего расстояния до детского сада, вы можете потерять преимущество в плане безопасности, которое получили, выбрав более продвинутый садик.

Проверка значимости – это научный инструмент, и, подобно любому другому инструменту, он имеет определенный уровень точности. Если вы сделаете такую проверку более точной (например, увеличив размер изучаемой совокупности), это позволит вам зафиксировать еще более слабое воздействие. В этом не только сила данного метода, но и его опасность. По правде говоря, нулевая гипотеза (если воспринимать ее буквально) почти всегда бывает ложной. Когда вы вводите сильный лекарственный препарат в кровь пациента, трудно поверить, что такое вмешательство оказывает в точности нулевое воздействие на вероятность того, что у этого пациента возникнет рак пищевода, или тромбоз, или неприятный запах изо рта. Каждая часть тела взаимодействует со всеми остальными частями в рамках сложного цикла обратной связи, которая сводится к воздействию и контролю. Все, что вы делаете, либо способствует развитию злокачественной опухоли, либо предотвращает его. Теоретически, если провести эффективное исследование, можно определить влияние каждого фактора. Однако это влияние в большинстве случаев настолько крохотное, что его можно смело исключить из рассмотрения. Тот факт, что мы можем зафиксировать влияние различных факторов, не означает, что все они имеют значение.

Если можно было бы вернуться во времена формирования статистической терминологии и объявить результат, прошедший проверку Фишера с p-значением меньше 0,05, «статистически заметным» или «статистически определимым», вместо того чтобы называть его «статистически значимым»! Эти термины были бы более близкими к сути данного метода, который просто говорит нам о существовании воздействия, но не позволяет определить размер или важность этого воздействия. Но уже слишком поздно. И мы имеем то, что имеем[205]205
Безусловно, в разных языках используются разные термины. Китайские статистики обозначают статистическую значимость словом xianzhu, смысл которого ближе к слову «примечательный», но мои китайскоязычные друзья утверждают, что у этого слова есть и оттенок значения «важность», как у английского significance. В русском языке используется термин «значимость», хотя английское слово significant чаще переводится на русский как «значительный».

[Закрыть].

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 | Следующая

Скачать книгу "Как не ошибаться. Сила математического мышления"

- 92
- 1
- 2
- 3
- 4
- 5
4.6 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?

Текст книги "Как не ошибаться. Сила математического мышления"

Автор книги: Джордан Элленберг

Жанр: Математика, Наука и Образование

Популярные книги за неделю

Жанры библиотеки

Популярные серии книг

По году издания

Рекомендации