Электронная библиотека » Чарльз Уилан » » онлайн чтение - страница 5


  • Текст добавлен: 2 марта 2016, 17:20


Автор книги: Чарльз Уилан


Жанр: О бизнесе популярно, Бизнес-Книги


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 5 (всего у книги 25 страниц) [доступный отрывок для чтения: 7 страниц]

Шрифт:
- 100% +
Приложение к главе 2
Данные для графического отображения дефектов принтера

Формула для дисперсии и среднеквадратического отклонения

Дисперсия и среднеквадратическое отклонение – самые распространенные статистические механизмы для измерения и описания разброса того или иного распределения. Дисперсия, которая часто обозначается символом σ2, вычисляется путем определения, насколько далеко от среднего значения расположены наблюдения в рамках того или иного распределения. Однако фишка в данном случае состоит в том, что расстояние (разница) между каждым наблюдением и средним значением возводится в квадрат; сумма таких составляющих, возведенных в квадрат, затем делится на количество наблюдений.

А именно:

Для любой совокупности из n наблюдений x1, x2, x3 xn со средним значением μ
Дисперсия = σ² = [(x1 –μ)² + (x2 – μ)² + (x3 – μ)² + … (xn – μ)²] / n

Поскольку разница между каждым членом и средним значением возводится в квадрат, формула для вычисления дисперсии присваивает определенный вес наблюдениям, которые расположены вдали от среднего значения (то есть «отщепенцам»), как показано в приведенной ниже таблице роста учащихся.



* Абсолютное значение – это расстояние между двумя числами, независимо от знака разности между ними, то есть это значение всегда положительное. В данном случае оно представляет собой разницу в дюймах между ростом конкретного человека и средним значением.


Средний рост обеих групп учащихся составляет 70 дюймов. Суммы абсолютных отклонений от среднего значения в обеих группах также одинаковы – 14 дюймов. По этому показателю разброса указанные два распределения идентичны. Однако дисперсия для группы 2 оказалась выше из-за веса, присвоенного в формуле дисперсии значениям, которые расположены особенно далеко от среднего значения (в нашем случае эти значения относятся к Сахар и Нарцисо).

Дисперсия сама по себе редко используется в качестве описательной статистики. В наибольшей степени она полезна как один из шагов в направлении вычисления среднеквадратического (стандартного) отклонения интересующего нас распределения, которое, как описательная статистика, является более интуитивно понятным инструментом.

Среднеквадратическое отклонение для совокупности наблюдений представляет собой корень квадратный из дисперсии:

Для любой совокупности из n наблюдений x1, x2, x3 xn со средним значением µ среднеквадратическое отклонение = σ = корню квадратному из этой величины = √([(x1 –μ)² + (x2 – μ)² + (x3 – μ)² + … (xn – μ)²] / n)

3. Дезориентирующее описание
«Он – выдающаяся личность!» и другие истинные, но вводящие в заблуждение утверждения

Каждого, кому когда-либо приходилось выбирать себе спутника жизни, фраза «Он – выдающаяся личность!» обычно заставляет насторожиться – и вовсе не потому, что такое описание не соответствует действительности, а потому, что за подобным заявлением человек может что-то скрывать, например факт отсидки в тюрьме или «не до конца» оформленный развод с бывшей женой. Мы не сомневаемся, что этот парень и впрямь выдающаяся личность, но беспокоимся о том, чтобы справедливое в принципе утверждение не использовалось в качестве ширмы с целью замаскировать информацию, выставляющую лицо, о котором идет речь, в неприглядном свете, и тем самым не вводило нас в заблуждение (предполагается, что большинство женщин предпочло бы не встречаться с бывшими уголовниками и брачными аферистами). Утверждение «Он – выдающаяся личность!» само по себе не является ложью (то есть это не повод обвинить в лжесвидетельстве), тем не менее оно может быть настолько неточным, что в конечном счете не будет соответствовать действительности.

То же самое касается и статистики. Несмотря на то что статистика как область знаний коренится в математике, а математика, как известно, относится к числу точных наук, использование статистики для описания сложных явлений не может быть точным. Это оставляет немалый простор для манипуляций и искажения реального положения вещей. Марк Твен сказал однажды фразу, ставшую впоследствии знаменитой: «Есть три вида лжи: ложь, наглая ложь и статистика»[14]14
  Марк Твен приписывал эти слова британскому премьер-министру Бенджамину Дизраэли; впрочем, каких-либо документальных свидетельств, подтверждающих авторство Дизраэли, не обнаружено.


[Закрыть]
. Как объясняется в предыдущей главе, большинство явлений можно описать множеством разных способов. Если существуют разные способы описания одного и того же явления (например, «он – выдающаяся личность» или «он был осужден за мошенничество с ценными бумагами»), то описательные статистики, которые мы используем (или не используем) при этом, будут оказывать огромное влияние на итоговое впечатление. Кто-то из гнусных побуждений может обыграть даже самые невинные факты и численные показатели ради весьма сомнительных выводов, не имеющих ничего общего с реальной ситуацией.

Для начала давайте определим разницу между такими понятиями, как «точность» и «достоверность». Они не взаимозаменяемы. Словом «точность» мы обозначаем математическую точность того или иного явления. В описании протяженности вашего маршрута от дома до работы значение 41,6 мили будет более точным, чем «примерно 40 миль», которое, в свою очередь, намного точнее словосочетания «этот чертовски долгий путь на работу». Если вы спросите меня, как далеко до ближайшей автозаправки, я отвечу, что до нее 1,265 мили на восток. Это будет точный ответ. Но есть один нюанс: он может оказаться совершенно неточным, если вы ошибетесь в определении направления движения и поедете не строго на восток, а слегка отклонитесь. С другой стороны, если я скажу вам: «Едьте примерно десять минут, пока не увидите закусочную, а еще через пару сотен ярдов справа будет АЗС. Но если на вашем пути встретится ресторанчик Hooters, значит, вы уже проскочили автозаправку», то мой ответ окажется менее точным, чем «1,265 мили на восток», но более содержательным и полезным, поскольку я указал вам путь именно в направлении АЗС. Достоверность – это показатель того, соответствует ли истине рассматриваемое численное значение. Отсюда опасность путаницы между точностью и достоверностью. Если какой-либо ответ достоверный (правильный), то чем больше точность, тем, как правило, лучше. Однако даже самая высокая точность не в состоянии компенсировать недостоверности ответа.

На самом деле точность может маскировать – случайно или вполне намеренно – недостоверность, вызывая у нас ложное ощущение определенности. Паранойя, охватившая Джозефа Маккарти, сенатора от штата Висконсин и ярого антикоммуниста, достигла своего апогея в 1950 году, когда он не только утверждал, что в Госдепартамент США внедрились коммунисты, но и доказывал, что располагает поименным списком этих людей. Во время своего выступления в г. Уиллинг Маккарти потрясал в воздухе листком бумаги, заявляя: «Я держу в руке список из 205 фамилий членов Коммунистической партии. Они известны госсекретарю. Тем не менее эти люди продолжают работать в Госдепе, более того, они формируют внешнюю политику страны!»{12}12
  Robert Griffith, The Politics of Fear: Joseph R. McCarthy and the Senate, 2nd ed. (Amherst: University of Massachusetts Press, 1987), p. 49.


[Закрыть]
Впоследствии выяснилось, что Маккарти держал в руке чистый листок бумаги, однако указание точного числа (205) придало словам сенатора большую достоверность, несмотря на столь наглую ложь.

Я уяснил важное различие между точностью и достоверностью в менее негативном контексте. Однажды жена подарила мне на Рождество лазерный дальномер, чтобы я мог определять на поле для гольфа расстояния от мяча до лунки. Расстояние измеряется посредством лазерного луча: я становлюсь рядом с мячом на гладком поле (или неровной площадке) и навожу устройство на флажок, установленный на лужайке; при этом дальномер вычисляет расстояние, на которое мне предстоит отправить мяч. Это считается более удобным способом, чем стандартные маркеры, обозначающие расстояния в ярдах и только до центра лужайки (таким образом, маркеры позволяют получить правильный, но менее точный результат). С помощью дальномера я мог, например, узнать, что нахожусь в 147,2 ярда от лунки. Я рассчитывал, что точность, обеспечиваемая этой продвинутой технологией, улучшит мои результаты во время игры в гольф. Однако в действительности они заметно ухудшились.

У меня возникли две проблемы. Во-первых, я пользовался этим глупым устройством три месяца, прежде чем до меня дошло, что оно измеряет расстояния не в ярдах, а в метрах; таким образом, каждое точное вычисление (147,2) было неправильным. Во-вторых, иногда я непреднамеренно наводил лазерный луч на деревья позади лужайки, а не на флажок, отмечающий лунку, в результате чего мой «идеальный» удар преодолевал именно то расстояние, которое и должен был преодолеть: мяч пролетал над лужайкой и оказывался в лесу. Урок, который я извлек, касается всего статистического анализа и заключается в том, что даже самые точные измерения или вычисления не должны противоречить здравому смыслу.

Рассмотрим пример ситуации с более серьезными последствиями. Многие из моделей управления рисками, использовавшиеся на Уолл-стрит до финансового кризиса 2008 года, были довольно точными. Концепция «рисковой стоимости» (VaR) позволяла компаниям точно вычислить величину своего капитала, которая может быть потеряна в случае реализации тех или иных сценариев. Проблема состояла в том, что такие сверхсложные модели были эквивалентны настройке моего дальномера в метрах, а не в ярдах. Используемая в этом случае математическая модель была сложной и запутанной. Ответы, которые можно было получить с ее помощью, казались обнадеживающе точными. Однако предположения относительно того, что может случиться с глобальными рынками, встроенными в эти модели, были изначально неверными, в результате чего выводы, полученные с помощью этих моделей, были совершенно неправильными, что привело к дестабилизации не только Уолл-стрит, но и всей мировой экономики.

Даже самые точные описательные статистики могут стать жертвой более фундаментальной проблемы: недостаточной ясности того, что именно мы пытаемся определить, описать или объяснить. У статистических рассуждений и доказательств очень много общего с неудачными браками: участники дискуссии просто не понимают друг друга. Рассмотрим важный экономический вопрос: насколько успешны американские производственные отрасли? Нередко приходится слышать, что количество рабочих мест в них резко сокращается в результате появления новых рабочих мест в Китае, Индии и других странах с низким уровнем заработной платы. Также нередко приходится слышать, что в Соединенных Штатах высокотехнологичное производство по-прежнему процветает и Америка остается одним из ведущих мировых экспортеров товаров промышленного производства. Что же происходит на самом деле? Похоже, это тот случай, когда скрупулезный анализ надежных исходных данных мог бы примирить между собой эти противоречащие друг другу утверждения. Остаются ли американские производственные отрасли прибыльными и конкурентоспособными в глобальном масштабе или проигрывают в борьбе с сильными зарубежными конкурентами?

Верно и то и другое. Британскому журналу экономических новостей The Economist удалось примирить эти две полярные точки зрения на ситуацию в американских производственных отраслях с помощью приведенного ниже графика.



Кажущееся противоречие обусловлено разной трактовкой «благополучия» в американских производственных отраслях. По объему выпускаемой продукции – то есть общему количеству произведенных и проданных товаров – производственный сектор США демонстрировал неуклонный рост в начале 2000-х годов, затем испытал серьезный удар во время Великой рецессии, а теперь уверенно компенсирует потери. Это согласуется с данными, приведенными в справочнике-альманахе ЦРУ The World Factbook («Всемирная книга фактов»), которые показывают, что Соединенные Штаты являются третьим по величине экспортером продукции промышленного производства в мире (после Китая и Германии), то есть по-прежнему остаются одним из мировых локомотивов производства.

Но на графике, приведенном в журнале The Economist, есть еще одна линия, отражающая уровень занятости в производстве. Количество рабочих мест в производственной сфере США неуклонно сокращалось: за последнее десятилетие примерно на шесть миллионов. Указанные две тенденции – рост объема выпускаемой продукции и сокращение занятости – в совокупности объясняют реальную ситуацию в американских производственных отраслях. В производственной сфере Соединенных Штатов наблюдается стойкий рост производительности труда, а это означает, что заводы выпускают все больший объем продукции силами все меньшего числа работников. Это хорошо с точки зрения глобальной конкуренции, поскольку делает американскую продукцию более конкурентоспособной по сравнению с товарами, выпускаемыми в странах с низким уровнем заработной платы. (Одним из способов успешно конкурировать с компанией, выплачивающей работникам 2 доллара в час, является создание эффективного производственного процесса, где один работник, зарабатывающий 40 долларов в час, может делать в двадцать раз больше.) Однако это сопровождается сокращением рабочих мест в производственной сфере, что становится настоящим ударом для тех, кого уволили.

Поскольку моя книга посвящена статистике, а не проблемам в производственной сфере Соединенных Штатов, вернемся все же к главному вопросу: почему «благополучие» в американских производственных отраслях – показатель, который на первый взгляд не так уж сложно вычислить, – зависит от того, чем именно мы его определяем: объемом выпускаемой продукции или уровнем занятости? В данном случае (и во многих других) необходимо одновременно учитывать оба показателя, как и поступил The Economist, построив свой график.

Даже когда мы определяем единый показатель успеха (например результаты экзаменов в учебном заведении), все равно остается большой простор для статистических колебаний. Проверьте, можете ли вы примирить между собой два приведенных ниже гипотетических утверждения, причем оба вполне могут быть правильными.

Политик А (оппозиционер, критикующий существующее положение вещей): «Наша система школьного образования деградирует! Шестьдесят процентов наших школ продемонстрировали в этом году более низкие результаты экзаменов, чем в прошлом».

Политик B (должностное лицо, оправдывающее существующее положение вещей): «Наша система образования успешно развивается! Восемьдесят процентов наших учащихся продемонстрировали во время экзаменов в этом году более высокие результаты, чем в прошлом».

Подсказка: в разных школах обучается разное количество детей. Если взглянуть на эти утверждения, которые на первый взгляд кажутся взаимоисключающими, по-другому, то вы сразу заметите, что один политик использует в качестве единицы анализа школы («Шестьдесят процентов наших школ…»), а другой – учащихся («Восемьдесят процентов наших учащихся…»). Единица анализа – это объект, сравниваемый или описываемый посредством статистики; один из политиков говорит о деятельности школ, а другой – об успеваемости учащихся. Нет ничего нелогичного в том, что большинство учеников улучшают свои результаты, а большинство школ, напротив, ухудшают. Это присходит в случае, когда ученики, улучшающие свои результаты, обучаются в очень больших школах. Чтобы сделать этот пример более интуитивно понятным, выполним такое же по смыслу упражнение применительно к экономике американских штатов.

Политик А (популист): «Наша экономика катится в пропасть! В прошлом году уровень доходов в тридцати штатах сократился».

Политик B (противник популизма): «Наша экономика демонстрирует заметный рост: в прошлом году доходы семидесяти процентов американцев выросли».

Из этих утверждений напрашивается вывод, что самой благополучной можно считать экономику крупнейших штатов: Нью-Йорка, Калифорнии, Техаса, Иллинойса и т. п. Тридцатью штатами со снижающимся средним доходом, по-видимому, будут те, которые гораздо меньше по площади: Вермонт, Северная Дакота, Род-Айленд и т. п. Учитывая диспропорцию в величине штатов, вполне возможно, что экономическая ситуация во многих из них ухудшилась, тогда как доходы большинства американцев выросли. Главное – обратить внимание на единицу анализа. Кого именно (или что именно) мы пытаемся описать, и отличается ли этот «кто-то» (или это «что-то») от того, что пытается описать кто-то другой?

Хотя приведенные выше примеры относятся к категории гипотетических, ключевым здесь является отнюдь не гипотетический статистический вопрос: как влияет глобализация на неравенство доходов в мире в целом – в лучшую или в худшую сторону? По одной теории, глобализация лишь усугубляет существующее неравенство доходов: более богатые страны (если богатство измерять величиной ВВП [валовой внутренний продукт] на душу населения) демонстрировали более высокие темпы роста в период с 1980 по 2000 год, чем более бедные страны{13}13
  Catching Up, Economist, August 23, 2003.


[Закрыть]
. Богатые страны становились еще богаче; из этого следовало, что торговля, аутсорсинг, зарубежные инвестиции и прочие компоненты глобализации – не что иное как инструменты, с помощью которых развитые страны укрепляют свою экономическую гегемонию. Короче говоря, долой глобализацию!

Но не будем торопиться с выводами. Те же данные можно (и нужно) интерпретировать совершенно по-другому, если изменить единицу анализа. Нас интересуют не бедные страны, а бедные люди. А самый высокий процент бедных людей в мире приходится на Китай и Индию. Китай и Индия – огромные страны (население каждой из них превышает миллиард человек); и обе были относительно бедными в 1980 году. В течение нескольких последних десятилетий они развивались ускоренными темпами, что в немалой степени обусловливалось их возрастающей экономической интеграцией с остальным миром. The Economist описывает их как «быстрых глобализаторов». С учетом того, что наша цель – искоренить человеческую бедность, при анализе влияния глобализации на бедность нет смысла присваивать Китаю (с населением 1,3 миллиарда человек) такой же вес, как Маврикию (с населением 1,3 миллиона человек).

Единицей анализа должны быть люди, а не страны. На самом деле то, что произошло в период с 1980 по 2000 год, во многом похоже на приведенный мною выше гипотетический пример со школами. Большая часть бедного населения планеты проживает в двух гигантских странах, которые в настоящее время бурно развиваются, все больше и больше интегрируясь в мировую экономику. Надлежащим образом выполненный анализ приводит нас к совершенно другому выводу относительно последствий глобализации для людей со скромными достатками. Как указывают авторы статьи в журнале The Economist, «если анализировать положение людей, а не стран, то глобальное неравенство стремительно сокращается».

Телекоммуникационные компании AT&T и Verizon недавно развязали «рекламную войну», в которой используется рассматриваемая нами двусмысленность в отношении того, что именно описывается. Обе компании предоставляют услуги сотовой связи. Одной из главных проблем для большинства пользователей мобильных телефонов является качество связи. Таким образом, кажется вполне логичным, чтобы в своих рекламных кампаниях оба мобильных оператора сравнивали масштаб и качество своих сетей связи. В то время как потребители просто заинтересованы в достойном качественном сервисе, AT&T и Verizon применяют разные показатели для оценивания этого несколько расплывчатого желания. Verizon запустила агрессивную рекламную кампанию, расхваливающую географическое покрытие, обеспечиваемое ее сетью связи: возможно, вы вспомнили географические карты Соединенных Штатов, показывающие, какую часть страны охватывает сеть связи этого оператора по сравнению с относительно скромным географическим покрытием, обеспечиваемым AT&T. Единицей анализа, выбранной Verizon, является площадь охватываемой ею территории, поскольку Verizon весьма преуспела именно в этом отношении.

AT&T ответила запуском рекламной кампании с другой единицей анализа. Билборды AT&T гласят, что «AT&T предоставляет услуги 97 % американцев». Обратите внимание на использование слова «американцы», а не «Америка». AT&T сосредоточила внимание на том обстоятельстве, что большинство людей не проживает в сельскохозяйственном штате Монтана или в пустыне Аризоны. Поскольку население неравномерно распределено по территории США, ключом к предоставлению качественных услуг сотовой связи (как подразумевалось в данной рекламной кампании) является ее наличие в местах, где фактически проживают и работают потенциальные пользователи, а вовсе не обязательно там, где они могут проводить пару недель во время отпуска. Однако как человек, часто бывающий в сельскохозяйственном штате Нью-Гэмпшир, я отдаю свои симпатии компании Verizon.

Наши старые знакомые, среднее значение и медиана, также могут использоваться для всевозможных неблаговидных целей. Как вы, наверное, помните из материала предыдущей главы, среднее значение и медиана – это показатели «середины» того или иного распределения, или его «центральная тенденция». Среднее значение – это просто арифметическое среднее: сумма наблюдений, поделенная на их количество (среднее значение чисел 3, 4, 5, 6 и 102 равняется 24). Медиана представляет собой среднюю точку распределения: половина наблюдений расположена над ней, а другая половина – под ней (медиана чисел 3, 4, 5, 6 и 102 составляет 5). Итак, умный читатель, наверное, обратил внимание на существенную разницу между 24 и 5. Если бы по какой-то причине я захотел описать эту группу чисел так, чтобы она показалась более внушительной, то отдал бы предпочтение среднему значению. Если же мне захотелось бы, чтобы она выглядела меньшей, то воспользовался бы медианой.

А теперь давайте посмотрим, как эти манипуляции осуществляются на практике. Рассмотрим снижение налогов, рекламируемое администрацией экс-президента Джорджа Буша как благо для большинства американских семей. Продвигая этот план, администрация Буша указывала, что для 92 миллионов американцев налоги в среднем уменьшатся на 1000 долларов (если быть более точным, то на 1083 доллара). Но является ли такая величина точной? Согласно The New York Times, «Эти данные не лгут, просто кое о чем умалчивают».

Снизилось бы налоговое бремя для 92 миллионов американцев? Да.

Уменьшились бы налоги для большинства из них примерно на 1000 долларов? Нет. Снижение налога, подсчитанное как медиана, оказалось бы меньше 100 долларов.

Сокращение налогов для относительно малого числа очень богатых людей оказалось бы очень существенным; именно эти большие числа искажают среднее значение, создавая иллюзию значительного снижения налогового бремени. В действительности величина такого снижения для большинства американцев оказалась бы гораздо меньшей. Медиана нечувствительна к наблюдениям-«отщепенцам» и в данном случае стала бы более точным описанием того, как планируемые налоговые послабления сказались бы на типичной американской семье.

Разумеется, медиана также способна вводить в заблуждение – именно потому, что нечувствительна к наблюдениям-«отщепенцам». Допустим, у вас обнаружили смертельную болезнь. Утешением для вас служит тот факт, что недавно появилось новое лекарство, излечивающее это заболевание. Плохо лишь то, что оно чрезвычайно дорогое и, кроме того, имеет множество опасных побочных эффектов. «Но поможет ли мне это лекарство?» – спрашиваете вы у врача. И он сообщает вам, что оно повышает медианную ожидаемую продолжительность жизни на… две недели. Подобная новость вряд ли добавит вам оптимизма (учитывая расходы на покупку лекарства и возможные побочные эффекты). К тому же ваша страховая компания отказывается оплачивать лечение по причине очень незначительного повышения медианной ожидаемой продолжительности жизни людей, страдающих вашим заболеванием.

Однако медиана вполне может оказаться весьма обманчивой статистикой в данном случае. Допустим, новое лекарство не помогает многим пациентам, однако немалое их число, скажем 30 или 40 %, излечивается полностью. Этот процент успеха никак не сказывается на медиане (хотя средняя ожидаемая продолжительность жизни людей, принимающих новое лекарство, выглядела бы весьма впечатляюще). В этом случае наблюдения-«отщепенцы» – те, кому помогло новое лекарство, – должны сыграть важную роль в принятии вами окончательного решения. И это не просто некая гипотетическая ситуация. У Стефена Гоулда – ученого-биолога, занимающегося проблемами эволюции – была диагностирована форма рака, при которой медианная ожидаемая продолжительность жизни составляла восемь месяцев; спустя двадцать лет он умер от другого вида ракового заболевания, никак не связанного с предыдущим{14}14
  Carl Bialik, When the Median Doesn’t Mean What It Seems, Wall Street Journal, May 21–22, 2011.


[Закрыть]
. Гоулд впоследствии написал знаменитую статью под названием The Median Isn’t the Message («Медиана – это не приговор»), в которой утверждал, что именно его научные познания в области статистики уберегли его от ошибочного заключения, будто он непременно умрет через восемь месяцев. Определение медианы говорит нам, что половина пациентов проживет по меньшей мере восемь месяцев – и, возможно, гораздо дольше этого срока. Распределение смертности «скошено вправо», а это – нечто гораздо большее, чем просто техническая подробность, когда речь идет о смертельной болезни{15}15
  Stephen Jay Gould, The Median Isn’t the Message, с предисловием и заключением Стива Данна (Steve Dunn), http://cancerguide.org/median_not_msg.html.


[Закрыть]
.

В данном примере определяющая характеристика медианы – то есть то, что она не присваивает наблюдениям весовые коэффициенты исходя из того, насколько они отдалены от средней точки, а лишь оценивает их в зависимости от того, где (выше или ниже) они расположены, – оказывается ее слабым местом. В отличие от медианы среднее значение зависит от разброса наблюдений. С точки зрения точности, ответ на вопрос «медиана или среднее значение» будет обусловлен тем, какое влияние оказывают наблюдения-«отщепенцы» в рассматриваемом нами распределении на описываемое явление: искажают его или, напротив, играют важную роль в уяснении нами его сути. (И снова здравое суждение берет верх над «голой» математикой.) Разумеется, ничто не скажет вам наверняка, чему именно следует отдать предпочтение – медиане или среднему значению. В любом комплексном статистическом анализе, скорее всего, будут задействованы оба показателя. Когда вы встречаете ссылку лишь на медиану или среднее значение, это наверняка было сделано из соображений краткости, хотя может указывать и на то, что кому-то очень хочется с помощью статистики «убедить» вас в чем-то.

Те из вас, кто достиг определенного возраста, возможно, помнят приведенный ниже обмен репликами между персонажами фильма Caddyshack, в роли которых выступают Чеви Чейз и Тед Найт. Эти двое встречаются в раздевалке после игры в гольф.

Тед Найт: Сколько очков ты выбил?

Чеви Чейз: Я не подсчитывал.

Тед Найт: Как же ты в таком случае сравниваешь себя с другими гольфистами?

Чеви Чейз: По росту.

Я не буду объяснять, почему это должно быть смешно. Скажу лишь, что множество статистических манипуляций являются следствием сравнения «яблок и апельсинов». Допустим, вы пытаетесь сравнить цену гостиничного номера в Лондоне с ценой гостиничного номера в Париже и просите своего шестилетнего сынишку выполнить небольшое исследование в интернете, поскольку у него это получается гораздо быстрее, чем у вас. Спустя какое-то время сын докладывает, что гостиничные номера в Париже стоят дороже, примерно 180 за одну ночь; аналогичный номер в Лондоне обойдется приблизительно в 150 за одну ночь.

Скорее всего, вы объясните ребенку разницу между фунтами стерлингов и евро, а затем усадите его обратно за компьютер, чтобы выяснить обменные курсы этих валют и выполнить корректное сравнение цен. (Этот пример навеян моим собственным опытом: после того как я заплатил в Индии 100 рупий за чашку чая, моя дочь поинтересовалась, почему в Индии все настолько дорого.) Очевидно, сравнивать цены в разных странах, выраженные в соответствующих национальных валютах, бессмысленно, если не конвертировать их в сопоставимые денежные единицы. Каков обменный курс между фунтом стерлингов и евро или, в случае Индии, между долларом и рупией?

На первый взгляд это кажется совершенно очевидным, между тем попытки сопоставлять несопоставимое встречаются сплошь и рядом. Особенно это любят делать политики и студии Голливуда. Эти люди, конечно же, понимают разницу между фунтами стерлингов и евро, однако игнорируют менее очевидный пример «яблок и апельсинов» – инфляцию. Нынешний доллар и доллар, каким он был шестьдесят лет назад, – это далеко не одно и то же: покупательная способность нынешнего доллара гораздо ниже. Вследствие инфляции товар, который стоил 1 доллар в 1950 году, стоил бы 9,37доллара в 2011-м. В результате любые монетарные сравнения ситуации в 1950 году и в 2011 году без учета поправки на изменение стоимости доллара оказались бы даже менее точными, чем сравнение цен в фунтах стерлингов и евро, поскольку фунты стерлингов и евро по своей стоимости сейчас гораздо ближе друг к другу, чем доллар 1950 и 2011 годов.

Это настолько важное явление, что экономисты придумали специальные термины, указывающие, была ли внесена поправка на инфляцию или нет. Номинальные величины не скорректированы с учетом поправки на инфляцию. Сравнивая номинальную стоимость какой-либо государственной программы в 1970 году с номинальной стоимостью такой же государственной программы в 2011 году, мы просто сопоставляем величины чеков, выписанных Казначейством США в эти два года – без учета того обстоятельства, что покупательная способность доллара в 1970 году была выше, чем в 2011-м. Если в 1970 году мы потратили 10 миллионов долларов на некую программу оказания помощи ветеранам войны, а в 2011-м на такую же программу израсходовано 40 миллионов долларов, то в действительности это означает, что федеральное правительство снизило выплаты по этой программе. Да, суммы помощи повысились в номинальном выражении, однако это не отражает изменения стоимости долларов, затрачиваемых на ее оказание. Один доллар в 1970 году эквивалентен 5,83 доллара в 2011-м. В 2011 году правительству нужно было бы потратить на реализацию программы помощи ветеранам войны 58,3 миллиона долларов, чтобы обеспечить им поддержку, сопоставимую с 1970 годом.

Реальные величины, в отличие от номинальных, учитывают поправку на инфляцию. Чаще величины приводят к какой-то одной единице, например долларам 2011 года, после чего становится возможным сравнение «яблок и апельсинов». На многих сайтах, включая сайт Бюро статистики труда (Министерства труда США), есть простые калькуляторы инфляции, которые позволяют сравнивать стоимость доллара в разные временные периоды[15]15
  См. на сайте http://www.bls.gov/data/inflation_calculator.htm.


[Закрыть]
. Чтобы получить реальное представление о том, насколько может разниться статистика с поправкой и без поправки на инфляцию, рассмотрим приведенную ниже диаграмму изменения минимальной заработной платы на федеральном уровне США. На этой диаграмме представлены как номинальная величина минимальной заработной платы, так и ее реальная покупательная способность в долларах 2010 года.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации