Электронная библиотека » Александр Амзин » » онлайн чтение - страница 8


  • Текст добавлен: 21 апреля 2022, 14:08


Автор книги: Александр Амзин


Жанр: Культурология, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 25 страниц) [доступный отрывок для чтения: 8 страниц]

Шрифт:
- 100% +
7.1.4 Когорта

Когда римские легионеры выстраивались в когорты, они вряд ли думали о социологии и демографии. Управлять легионом, разделенным на десять когорт, было просто удобно. Военачальник мог специализировать некоторые из когорт, ставил им различные боевые задачи.

Американскому экономисту Паскалю Уэлптону в 1947 году пришла в голову счастливая мысль разделить общество, как легион, на когорты. Так появился когортный анализ, который теперь применяется везде, где надо разбить людей на группы, объединенные той или иной характеристикой. Когортный анализ позволяет избежать проклятия «среднего человека». Как писали Ильф и Петров:

Известно, сколько какой пищи съедает в год средний гражданин республики. Известно, сколько этот средний гражданин выпивает в среднем водки, с примерным указанием потребляемой закуски.


Но, конечно, все эти данные бессмысленны. Средняя гражданка пьет совсем другое количество водки, а средний ребенок, будем надеяться, не пьет вообще, а только портит статистику среднему гражданину.

Всякий раз следует задаваться вопросом – кто именно входит в выборку и насколько нас интересует именно эта выборка. В демографии чаще всего состав когорты определяется либо признаком (например, полом) человека, либо поколением, к которому он относится.

Поэтому демографы выражаются аккуратно. Например, так[63]63
  https://wciom.ru/index.php?id=238&uid=8833


[Закрыть]
: Вообще, героизация революции снижается от поколения нынешних пенсионеров к более молодым возрастным когортам. Молодежь 18–24 лет здесь является исключением – скорее всего, в связи с тем, что в памяти еще остался школьный материал.


Обратите внимание, вполне может оказаться, что люди какого-то определенного возраста героизируют революцию больше, чем пенсионеры. Отдельные личности среди пенсионеров, возможно, вовсе не любят революцию. Но разбиение на когорты позволяет увидеть общую картинку с нужной степенью точности.

Когортный анализ так удобен, что давно охватывает не только демографию. Например, если вам придется изучать, как читают материалы вашего отдела или издания, следует разбить посетителей по источникам. Вы увидите, что пользователи из социальных сетей ведут себя совершенно по-другому, чем заходящие напрямую или через поисковик. При этом когорты со «средним» поведением не окажется вовсе.

Умение понять, данные по каким когортам вам нужны – это тонкое ремесло. Правильно проинтерпретировать данные по группам – искусство.

7.1.5 Квантиль, квартиль, перцентиль

В новостях редко встречается слово «перцентиль» (оно же «персентиль», оно же «процентиль»[64]64
  Удивительно, но этот термин вы не встретите в крупных словарях. Из-за этого возникает путаница с родом. Для связанных слов «квантиль» и «квартиль» математики и статистики часто используют женский. Словари для них же фиксируют мужской. Мы используем женский для всех – для определенности, но не по убеждению.


[Закрыть]
). Зато оно частый гость в аналитических докладах, которые новостникам приходится читать и пересказывать понятными словами.

Перцентилью или процентилью называют меру, в которой процентное значение общих значений равно этой мере или меньше ее. Если вам неуютно от этого определения, представьте, что мы измерили рост 5000 человек. Мы выяснили, что 90 % результатов меньше или равны определенной величине, например, 185 сантиметрам. Тогда говорят, что девяностая перцентиль равна 185 сантиметрам. Это позволяет понять, как на самом деле распределяются результаты в выборке.

Например, если на избирательные участки согласно отчету еще до обеда пришло 75 % граждан, это может свидетельствовать о вбросах. Но аналитики данных будут оперировать не такими простыми словами, а статистическими терминами.


В матстатистике не обязательно используются перцентили. Общий термин – квантиль, то есть значение, которое величина не превышает с фиксированной вероятностью. Вероятность колеблется от 0 до 1. Если мы хотим сказать, что 90 % результатов измерений роста не превышают 185 сантиметров, то по-умному это звучит так: 0,9-квантиль равна 185 сантиметрам.

Отсюда рукой подать до уже знакомой нам медианы. Это так называемая 0,5-квантиль, то есть значение, не превышающее половины величин (например, из 5000 значений роста).


Перевели дух? Тогда следует добавить, что часто статистикам интересно разбить значения на четверти и посмотреть, что творится в нижней, двух средних и последней. Их называют квартилями (от quarta, четверть).

Первая квартиль охватывает значения, помещающиеся в 0,25-квантиль. Вторая квартиль – это та же медиана, 0,5-квантиль. Третья или верхняя квартиль – это 0,75-квантиль. Ну а четвертую упоминать бессмысленно, так как она включает в себя все значения.

Еще раз. Если, не дай бог, вам придется читать отчет, где говорится о перцентилях и квартилях, вы можете легко перевести их в проценты выборки. Но, пожалуйста, не надо употреблять эти термины в собственных текстах. Опыт показывает, что обычный читатель и даже многие журналисты нетвердо ориентируются в обычных процентах, не то что статистике.

Часто говорят, что такие термины встречаются слишком редко, но это не так. Перцентиль и квартиль регулярно попадаются в релизах об исследованиях IQ, описаниях развивающих приложений, отчетах о выборах и статьях об имущественном неравенстве.

Кроме того, это мощные инструменты популяризации. Теперь таблица, где написано, что IQ 125 соответствует 95,2-перцентили, менее загадочна и несет важный смысл. Вы легко сможете написать, что люди с IQ выше 125 встречаются реже чем в 5 % случаев.

7.1.6 Валюты и экономика

Имея дело с валютами, старайтесь четко понимать, что именно вы считаете, и какие коды валют соответствовали тому времени, о котором вы пишете. Это особенно важно при изучении договоров и не менее важно при работе с валютными конвертерами.

Характерный пример: если вы попросите Google перевести доллар США в рубли, то сделать это легко, написав запрос 1 USD in RUR. Вы увидите текущий курс, но здесь и прячется ошибка – Россия не использует код RUR с 1997 года. Google тихонько заменит его на текущий RUB, но другие конвертеры могут оказаться не такими умными.

Для справки: советские рубли в международной системе имели код SUR и в 1992 году их заменили на RUR по курсу один к одному. В 1997 году произошла деноминация, из рублевых сумм исчезли три нуля. Новая деноминированная единица получила международное название RUB. 1 RUB = 1000 RUR.

Пока все легко, так как вы можете помнить деноминацию, да и сама она была больше 20 лет назад.

Но вот республика Беларусь провела деноминацию сравнительно недавно, причем это уже вторая (а то и третья – как считать) деноминация за историю республики. Сначала там были расчетные билеты Национального банка, но сохранялись цены в советских рублях.

В 1994 году прошла деноминация, в результате которой стала использоваться валюта с кодом BYB. В 2000 году прошла еще одна деноминация, в результате которой перешли на BYR (знаменитый отсутствием копеек), а в 2016 году деноминировали BYR в 10000 раз и ввели текущую валюту – BYN. Все это белорусские рубли, но какие же они разные! На момент написания этой книги BYN, например, стоит полдоллара.

Журналист всегда должен подозревать ловушку, когда работает с незнакомыми валютами или деньгами, истории которых он не знает.

7.2 Типографика

Еще в нулевых слово «типографика» бродило между дизайнерами и верстальщиками, практически не заглядывая в редакцию. Самой близкой к этой тематике дискуссией интернет-журналистов было обсуждение буквы «ё» и её права на существование.

С тех пор многое поменялось. Интернет-издания по качеству догнали, а местами и обогнали печатные. Пользователи предъявили к оформлению текстов требования, которых не могли предъявлять ранее. Распространились системы автоматической постановки правильных тире, кавычек и прочих символов. Небольшой экран мобильника заставил обратить особое внимание на выравнивание, правила переноса, неразрывные пробелы и прочие хитрости, знакомые верстальщикам.

Существенно упростился сам набор хорошо оформленного текста. Причин здесь много – распространение офисных пакетов, правильные кавычки в текстовых сообщениях, типографская раскладка клавиатуры Ильи Бирмана[65]65
  https://ilyabirman.ru/projects/typography-layout/


[Закрыть]
, спасшая жизнь не одному текстовику и дизайнеру.

Тем не менее, стоит провести ликбез для тех, кто хочет понять, зачем всё это нужно. Нижеследующее не претендует на полноту или даже корректность, игнорируя множество спорных случаев. Цель этой подглавки – за 20 % времени дать 80 % правил. С остальным справятся специалисты.

7.2.1 Тире

Как и пробел, тире членит смыслы, но делает это обычно на уровне не слов, а фрагментов предложения. Чем ближе друг другу понятия, тем короче нужно тире.

Тире бывает несколько, но в них довольно просто разобраться[66]66
  https://www.artlebedev.ru/kovodstvo/sections/97/


[Закрыть]
.

• В русском языке между словами всегда используется длинное тире. Вот так: Москва – столица нашей Родины. Не забудьте поставить с обеих сторон пробел.

• Если вам надо поставить черточку в слове, ставьте дефис. Вот такой: «что-то», «где-либо», «Усть-Каменогорск». В телефонных номерах тоже дефисы. Общее правило – если черточка в одной единице смысла, то дефис.

• По правилам русской типографики между цифрами для обозначения числового диапазона тоже надо ставить длинное тире. Но выглядит лучше, если ставить короткое (оно же среднее) тире, существующее в английской типографике. Вот такое: 1922–1990. Старайтесь не использовать для подобных числовых диапазонов дефис.

• Минус длиннее дефиса, а его горизонтальная черта выровнена по отношению к такой же черте плюса. Если вы найдете на своей клавиатуре минус, ставьте его, пожалуйста, только в математических выражениях.

7.2.2 Пробелы

Удивительно, как эволюционировал пробел – знак, которого еще сравнительно недавно не существовало. Идея, что между словами можно что-то поставить для удобства чтения, еще тысячу лет назад была неочевидна. Например, еще в 14 веке в русских книгах абзац начинался буквицей, завершался четырьмя точками, предложения членились точками[67]67
  https://www.publish.ru/articles/199704_4041105


[Закрыть]
. Пробелов не было.

Сейчас невозможно представить текст без пробелов. Более того, мы обычно этого не замечаем, но пробелы и пустоты бывают разными. Бывает привычный междусловный пробел. Есть пробел неразрывный, чья функция не только разделять два слова, но и не давать второму перенестись на другую строчку без первого. К пробелам относятся абзацный отступ, межстрочные интервалы и даже межбуквенные пробелы.

Интересующихся приглашаю штудировать справочник Мильчина, а также «Ручной набор» Шульмейстера[36]. Оттуда можно почерпнуть завораживающие фразы вроде «отбивка с нормальным апрошем в полукегельную». Нормальный человек вряд ли захочет погружаться так глубоко.

К счастью, в XXI веке для любой работы действует правило – если задача может быть автоматизирована, её следует автоматизировать. Поэтому журналисту обычно не требуется разбираться в том, чем полукегельная шпация отличается от третной. Для этого существует система управления контентом издания, в которую встроен модуль-типограф.

Однако автор должен хорошо понимать структуру материала. И именно пробел – самый важный знак для выражения структуры каждого элемента текста без исключения. Вот несколько правил, которые вам пригодятся:

• Никогда не ставьте несколько пробелов подряд. Это тупо;

• Перед знаком препинания пробел не ставится. Поставьте его после;

• Не ставьте пробел между точкой/запятой и тире. Автоматическая проверка обычно требует так: «Я отвечал, что меня беспокоят мухи, – и мы оба замолчали». Правильно: «Я отвечал, что меня беспокоят мухи, – и мы оба замолчали»;

• Не ставьте пробел между цифрой и знаком процента или градуса. Это один из спорных моментов, в котором ГОСТ конфликтует с рекомендациями авторитетов. Примите сторону авторитетов, иначе когда-нибудь увидите, как процент перенесся на новую строчку;

• Никогда не обозначайте начало абзаца междусловным пробелом. Требуйте от верстальщика предусмотреть абзацные отступы, либо используйте для этого специальные средства;

• Включите в редакторе режим отображения невидимых символов. Он покажет, когда вы вставляете цитату с уже проставленными нестандартными пробелами. Уничтожьте их, они могут помешать вам и типографскому модулю в будущем.

• Если в вашем издании используются немые заголовки, то есть пробельные строки, разделяющие части текста, используйте или потребуйте отдельную кнопку для их вставки. Иначе вставленная вами пустая строка может оказаться не той высоты и разодрать текст. То же самое касается графических заголовков – завитушек, горизонтальных линий и проч.

• Главная идея пробела, как и тире, в разделении смыслов. Чем ближе по смыслу части понятий, тем меньше нужен пробел. Понимание этого принципа позволяет выводить правила, которые еще не скоро появятся в справочниках. Например, такое:

Эмодзи лучше отделять пробелом и выносить за точку, если вы относите его ко всему предложению. © Если вы иллюстрируете тот или иной предметп внутри предложения, пробел можно не ставить.

7.2.3 Кавычки и цитирование

Вокруг кавычек возникло много мифов и недопонимания. Приведем самые важные пункты тайного знания о кавычках.


В русской типографике основные кавычки – «ёлочки».

Внутри них ставятся внутренние – лапки („пример лапок"). Раз в тысячу лет могут понадобиться внутренние кавычки во внутренних. Тогда используются одинарные лапки (,текст').


Если вам понадобились одинарные лапки, с вашим текстом или цитатой что-то не так. Постарайтесь упростить материал.

Если вы по какой-то причине не можете набирать лапки, помните, что две одинаковых кавычки (««или»») рядом не ставятся. В этом случае следует попробовать избавиться от внешних кавычек.


Ставьте точку после закрывающих цитату кавычек, если перед ними не стоит многоточие, восклицательный или вопросительный знак. Точку стоит в таком случае перенести за кавычку, а не ставить их с обеих сторон кавычек. Внимание: если вы цитируете не целое предложение, а включаете цитату в свое на правах части предложения, то точку можно ставить и после многоточия с восклицательным и вопросительным знаком.

Не ставьте точку после закрывающей кавычки во всех остальных случаях.

Постарайтесь не задействовать сложное цитирование. Например, не вставляйте напрямую в цитату указание на автора.

«Я на выборы никогда не ходил, но в этот раз точно пойду за X голосовать, – заявил твиттер-бот – Кандидат от народа!»


Во-первых, велика вероятность, что не все правильно умеют оформлять подобного рода цитаты. Во-вторых, слишком часто коллеги берут в работу цитаты не глядя. Может случиться конфуз.

Хорошо, если для обильного цитирования у вас есть особое оформление блока цитаты. Это позволит избежать многих проблем при наборе.

7.2.4 Шрифты

Мы вступаем в страну, где легко заблудиться, поэтому я просто дам несколько полезных для журналиста определений. Давайте сразу договоримся – мы не будем говорить об истории шрифтов, о волнующих специалистов вопросах и о создании новых начертаний.

Наши задачи следующие: разобраться, как устроена шрифтовая часть мультимедийных материалов и иллюстраций с текстом; понять основы верстки медиа; дать возможность хоть как-то общаться с дизайнером и верстальщиком при постановке задач и, наконец, правильно понимать английские термины. С терминов и начнем.


Гарнитурой (typeset, font family) называется семейство шрифтов, объединенных стилем и набором знаков. Гарнитура может состоять из шрифтов разных видов и размеров (кеглей).

Шрифт (font) – более узкое понятие. Это член семейства шрифтов, состоящий из объединенных единым стилем букв и знаков.


Кегль (font size) – размер шрифта. В цифровых СМИ может измеряться в процентах от обычного, типографских пунктах (pt), пикселях (px), относительных единицах, равных стандартной высоте шрифта браузера (em).


Большинство шрифтов можно разделить на шрифты с засечками и без засечек. В разговорах, технических заданиях, совещаниях вы чаще всего будете использовать либо конкретные названия, либо именно это определение.

Позднее вы, возможно, столкнетесь с четырьмя основными видами шрифтов (их больше, но нас это не волнует):

• Антиква (serif) – шрифты с засечками. Типичная антиква – Times New Roman;

Брусковый (slab) – шрифт с мощными засечками, хорошо подходящий для детских книг и заголовков, но тяжеловатый для заполнения всей страницы.

• Гротеск (sans-serif) – шрифт без засечек. Типичные гротески – Helvetica и Arial. Гротески отлично подходят для больших текстов и экранов цифровых устройств, где засечки могут только мешать;

• Акцидентные шрифты (display typefaces) – эксцентричные шрифты, предназначенные для вывесок и заголовков, цепляющие взгляд, но не годящиеся для набора больших объемов текста.

• Остальные, включая рукописные (script) и символьные (symbol)[68]68
  Узнать больше вам поможет прекрасный классификатор РагаТуре: https://www.paratype.ru/help/class/


[Закрыть]
.

Все шрифты также делятся на моноширинные (monospace) и пропорциональные. У моноширинных, как несложно догадаться, каждая буква одинаковой ширины. Поэтому текст складывается в ровные строчки, а буквы стоят друг под дружкой. Типичный моноширинный шрифт (антиква) – Courier New. У пропорциональных все буквы разной ширины, их легче и привычнее читать.

Моноширинные шрифты очень удобны в программировании, анализе данных и некоторых других случаях. Для текста в цифровых медиа их сейчас используют довольно редко.

Ключевая роль шрифтов состоит в выстраивании визуальной иерархии материала. Заголовки должно быть легко отличить от других элементов текста. По размеру заголовка пользователь должен сразу ухватить его значимость.

Подписи под нетекстовыми элементами (изображениями, видеороликами, виджетами, интерактивными блоками) должны быть подчинены элементу, а, следовательно, в большинстве случаев уступать по размеру или быть менее заметными, чем обычный текст.

Начинающие понимают это и другие требования как необходимость использовать на каждую задачу по отдельному шрифту, а то и гарнитуре. Тем самым в силу определения шрифта и гарнитуры получается мешанина стилей, затрудняющая чтение и погружение в материал.

Общее правило – постараться не использовать на сайте более трёх начертаний и двух гарнитур. Часто сочетают шрифт с засечками и без засечек, подбирая шрифтовые пары. Стилевые различия подчеркивают разницу в функции заголовка и текста. Кегль и насыщенность управляют вниманием пользователя, сообщая о том, как элемент важнее.

Несколько советов напоследок:

• У каждого шрифта свой характер. Более замысловатый шрифт не значит хороший. Если вы не знаете, что хотите сказать шрифтом, выберите самый стандартный и незаметный гротеск;

• Шрифтов очень много, но кириллица во многих реализована безобразно. Сравните английский и русский текст, прежде чем выбирать шрифт за латиницу. Обращайте внимание на то, насколько отличается качество кириллицы от цифр. Это одна из самых заметных проблем.

• То, что вы привыкли к какому-либо шрифту – не аргумент в пользу его внедрения в проект или материал;

• Не просите дизайнера поиграть со шрифтами. Поставьте задачу точнее: сделать страницу академичнее, облегчить чтение, сделать заголовок более заметным. Вполне возможно, что решение лежит не в смене шрифта, а в выравнивании или подстройке элементов страницы;

• Дизайнер и верстальщик учитывают много факторов, о которых вы можете не знать. Например, продолжительность загрузки шрифта, его оптимальное отображение в старых браузерах и на мобильных устройствах. Часто их «нет» основано не только на вредности;

• Никогда, даже в шутку, не используйте шрифт Comic Sans.

7.3 Визуализация и анализ данных

Собрать данные – одно. Представить их в понятном читателю виде – совершенно другое. Структурированная информация гораздо лучше доходит, будучи выраженной графически. В мире, который руководствуется данными, навык графического представления информации почти также незаменим, как и навык хорошего письма1791.

Описание визуализации данных как дисциплины выходит далеко за тематические границы этой книги. Достаточно сказать, что анализ данных и их представление идут в журналистике рука об руку и образуют целый куст отдельных специализаций:

• Навык графического дизайна в совокупности с началами статистики и здравым смыслом дает нам создателя инфографики;

• Навык программирования вместе со способностью к вебдизайну и базовым умением строить запросы к базам данных – расследователя и аналитика, неизбежно использующего для вывода ответа в том числе графические построения;

• Понимание того, как инфографика или основанная на данных иллюстрация может изменить отношение читателя к герою, отличает высокооплачиваемого журналиста от линейного автора.


К сожалению, визуализация данных все еще сложна для одиночного освоения, а та ее часть, которая связана непосредственно с диаграммами, шкалами и графиками содержит множество мелочей, до которых не всякому человеку дано дойти своим умом.

Важно понимать, что любая информация о визуализации данных не пропадает втуне. Даже не выучив языки Python и R, не освоив Excel и Power BI, не прочтя всей нужной литературы (Бринтон[13], Вонг[79], Тафти[75–77]) вы при определенном усердии можете понять основные принципы визуализации.

Это пойдет вашим заметкам на пользу: в обрабатываемых данных станет видна структура. Вы поймете, какие и где данные принципиально можно найти. Сможете дать аналитикам и специалистам по инфографике такую задачу, которая усилит повествование.

Вот несколько очень коротких советов из разных областей, связанных с визуализацией данных. Они не заменят учебник, но позволят не совершать совсем грубых ошибок.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации