Электронная библиотека » Джордан Морроу » » онлайн чтение - страница 5


  • Текст добавлен: 25 января 2022, 10:40


Автор книги: Джордан Морроу


Жанр: О бизнесе популярно, Бизнес-Книги


сообщить о неприемлемом содержимом

Текущая страница: 5 (всего у книги 16 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +
Краткое содержание главы

Как мы поняли из этой главы, всем – абсолютно всем и каждому! – необходимо развивать навыки дата-грамотности. Не забывайте определение: дата-грамотность – это способность читать данные, работать с ними, анализировать их и общаться на языке данных. Дата-грамотность и ее отдельные элементы помогают организации достичь успеха в любой деятельности, будь то запуск нового продукта, изменение маркетинговой стратегии или еще что-то.

В заключение упомяну о двух крайне важных аспектах определения дата-грамотности – это свободное владение данными и принятие решений, подкрепленных данными. Мы еще поговорим об этом, но уже сейчас следует отметить, что свободное владение данными – это и есть способность разговаривать на языке данных. Что такое принятие решений, подкрепленных данными, я думаю, объяснять не нужно. Если мы обладаем дата-грамотностью, но не используем ее для принятия более обоснованных решений, то в чем тогда ее смысл?

04
Зонтик дата-грамотности

Разобравшись с определением дата-грамотности, важно понять, что она представляет собой один из кусочков мозаики – общей стратегии в сфере данных и аналитики. Если эту мозаику правильно собрать, у нас будет прекрасная картина, изображающая цель, к которой стремится наша организация. Таким образом, стратегия и должна стать отправной точкой в работе организации с данными – но, к сожалению, руководители слишком часто начинают не с этого. Только при наличии четкой и определенной стратегии можно подбирать необходимые инструменты и способы работы с данными и аналитикой. Давайте рассмотрим некоторые из таких инструментов.

Мы много говорили о дата-грамотности, а теперь давайте поговорим конкретно об анализе и обработке данных в научном смысле – о data science. Какую роль играют визуализация данных и управление данными? Относится ли к дата-грамотности такая область, как этика данных? В этой главе мы изучим эти (и некоторые другие) области мира данных. Мы рассмотрим их с точки зрения как общей стратегии, так и четырех элементах дата-грамотности… и в итоге увидим, как все элементы этого мира слаженно работают на общий результат. На рис. 4.1 приведены важнейшие области, о которых пойдет речь в этой главе:

● стратегия в сфере данных и аналитики;

● обработка данных;

● визуализация данных;

● топ-менеджмент;

● культура;

● качество данных;

● управление данными;

● этика и законодательство в сфере данных.

Подробно говорить о стратегии в сфере данных и аналитики мы не будем – эта тема заслуживает отдельной книги. Ее мы лишь слегка коснемся в одной из следующих глав, но сейчас нам важно одно: дата-грамотность – абсолютно необходимое условие для формирования успешной стратегии работы с данными (при проблемах с дата-грамотностью у сотрудников организации провалится любая стратегия). Для более полного погружения в тему я с удовольствием рекомендую вам замечательную книгу Бернарда Марра «Стратегия в сфере данных» (Data strategy). Для наших же целей подойдет небольшое введение в тему.


Стратегия в сфере данных и аналитики

В качестве такого введения давайте представим себе, что я пришел к вам и попросил вас построить дом. Но у меня нет ничего, кроме рисунка дома и кое-каких инструментов. Мы с вами даже не знаем, каким будет интерьер, но идея постройки дома меня чрезвычайно вдохновляет. Ах да, вы не строитель, да и у меня нет никакого опыта ни в строительстве, ни в проектировании, однако я по какой-то причине выбрал в качестве исполнителя задачи вас. Но есть и плюс: я хотя бы готов предоставить вам инструменты и материал. У вас есть коробка гвоздей, молоток, бревна и т. д. – и вы приступаете к работе. Как вы думаете, насколько успешно вы справитесь с задачей? Построите ли вы в таких условиях дом моей мечты? А, я еще не говорил? Это должен быть дом моей мечты, так что не разочаруйте меня!

Полагаю, все понимают, что такая стратегия постройки дома непременно провалится. Но… именно этого часто требуют и ожидают руководители организаций, когда дело касается данных и дата-аналитики. У них есть некая идеалистическая картина: чего мы хотим достичь. Они вкладывают деньги в инструменты и материалы (то есть данные), но руководствуются ли они четкой стратегией, чтобы достичь успеха? Рассчитывать, что дом будет успешно построен, можно только в одном случае: если у вас, помимо инструментов и материалов, есть чертежи, необходимые разрешения и порядок действий (то есть стратегия). С данными и дата-аналитикой все обстоит точно так же.

Мир данных и их анализа сложен – возможно, он куда сложнее, чем проектирование и строительство домов, однако следовать чертежам, то есть стратегии, необходимо и в том, и в другом случае. Говоря о стратегии в сфере данных и аналитики, нужно понимать, что она не является конечной целью. Конечная цель – это цели и задачи организации, а данные и аналитика – это инструменты и материалы, обеспечивающие успешную деятельность организации.

Если руководство организации хочет сформировать стратегию в сфере данных и аналитики, то один из ключевых факторов успеха – дата-грамотность. В примере со строительством дома я упомянул одну важную деталь. Обратили ли вы на нее внимание? Я допустил, что вы – не профессиональный строитель! Как вы думаете, многие ли сотрудники вашей организации – обученные специалисты по работе с данными? «Обученные» – в самом буквальном смысле! Большинство людей не изучали data science ни в школе, ни в колледже, ни в университете. Когда я прошу вас построить дом, предоставляя лишь инструменты, материалы и рисунок, вы оказываетесь в том же положении, что и множество сотрудников, которые пытаются увидеть некий смысл в предоставляемых им данных, хотя даже не умеют пользоваться аналитическими методами… В целом можно сказать, что стратегия обязательно должна включать в себя человеческий фактор дата-грамотности.

Дата-грамотность и обработка данных

Наука о данных – в том или ином виде – появилась давно. Желание использовать данные для проверки и доказательства гипотез существовало у людей на протяжении многих эпох. Иными словами, с тех самых пор, как человек начал использовать информацию о наиболее эффективных способах утоления голода (передвижение стад диких животных, местонахождение съедобных кореньев и т. д.), и существует обработка данных. А когда так называемые большие данные вышли на передний план в мире бизнеса, наука о данных стала всеобщим достоянием. Вы и сами наверняка не раз слышали шутки, связанные с большими данными. Мир больших данных (который становится все шире), интернет вещей и многое другое сделали data science привычным термином бизнес-языка. В октябре 2012 года в Harvard Business Review была опубликована любопытная статья, которая еще больше заинтересовала бизнес-аудиторию понятием обработки данных: «Специалист по данным – самая сексуальная профессия XXI века» (Data Scientist: The Sexiest Job of the 21st Century)[25]25
  Davenport, T. and Patil, D. J. (2012). Data Scientist: The Sexiest Job of the 21st Century, Harvard Business Review, October. https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century.


[Закрыть]
. Небывалое дело! Давайте радоваться, мы признаны сексуальными, наше время пришло!

Но рост популярности этой профессии тут же выявил и проблемы. Внезапно спрос на специалистов по данным превзошел предложение – не хватало людей, действительно имеющих соответствующее образование. В мае 2019 года в одной из статей было подчеркнуто: «По данным отчета, в текущем году количество вакансий специалистов по обработке данных может составить более 4000 – на 56 % больше, чем в 2018 году»[26]26
  Violino, B. (2019). 6 Ways to Deal with the Great Data Scientist Shortage, CIO, 22 May. https://www.cio.com/article/3397137/6-ways-to-deal-with-the-great-data-scientist-shortage.html.


[Закрыть]
. Однако меня в этой статье заинтересовало другое замечание: нехватка настоящих экспертов по обработке данных «не означает, что непрофессионалы не могут приобрести навыки, которыми обычно обладают специалисты в этой области». По-моему, это чистейшая правда. Впрочем, даже если руководители сумели отыскать профессионала (решив, что компании он все-таки необходим), могут возникнуть проблемы: как правильно его использовать, как вписать его в общий контекст… Как правило, это объясняется отсутствием стратегии в сфере данных и аналитики.

Учитывая растущий интерес к STEM (Science – естественные науки, Technology – научно-технические дисциплины, Engineering – инженерия, Mathematics – математика), современные люди все чаще и упорнее занимаются совершенствованием навыков, необходимых для экономики данных и дата-аналитики. Новая эпоха – информационная, цифровая, аналитическая – уже наступила, и организации не могут ждать, пока все их сотрудники полностью овладеют дата-грамотностью. Кроме того, STEM-образование, несомненно, замечательная вещь, но его недостаточно. Стоило бы добавить к этой аббревиатуре еще и букву А – Arts, гуманитарно-художественные дисциплины. Ни в коем случае нельзя пренебрегать литературой и искусством в нашем новом мире данных. Человек должен привносить в любую работу творчество и разнообразие, видеть то, чего не видит компьютер, придавать особую гуманистическую силу данным и аналитике. Кроме того, нужно уметь делать из данных истории.

Сейчас все больше людей получают или собираются получать соответствующее образование, но статья 2019 года, о которой говорилось выше, иллюстрирует одну очень важную деталь: раньше немногие стремились изучать обработку данных, статистику, количественный анализ и т. д. Но в условиях такой нехватки настоящих специалистов мы все же можем заполнить пробел – при помощи дата-грамотности.

Если взглянуть на пространство под зонтиком дата-грамотности (см. рис. 4.1), наука о данных как таковая крайне важна для всего этого пространства, а также для всех четырех уровней аналитических методов. Обработка данных помогает делать прогнозы, подталкивает руководителей организаций вглядываться в метафорический стеклянный шар, чтобы определять направление действий и придумывать решения. Сотрудники, владеющие обработкой данных, могут поставить себе на службу научный метод и другие способы тестирования гипотез, поиска решений и обретения знаний. Благодаря этому организации получают возможность двигаться вперед, изменяя расклад сил в своей отрасли. Словом, значение обработки данных в мире дата-грамотности сложно переоценить.

Приведу пример из личного опыта. Как-то раз мне довелось пообщаться с генеральным директором компании, специализирующейся не на чем-нибудь, а на data science. Я задал ему вопрос: «Сколько специалистов по обработке данных в вашем высшем руководстве или совете директоров?» Мой собеседник изобразил пальцами большой ноль. Удивительно: неужели сама мысль, что специалист по обработке данных может представлять компанию или выступать от ее имени, настолько всех пугает? Эта история иллюстрирует проблему – в пространстве данных и дата-аналитики постоянно действуют разрозненные и центробежные силы. В прошлом сфера данных, ПО и технологий всегда существовала в организациях как бы отдельно от всего остального. Ответственные за эту сферу сотрудники считались узкими специалистами, от них не требовалось владеть навыками коммуникации и публичных выступлений. Эту ситуацию необходимо в корне менять, и перемены должны стать частью стратегии.

Меня постоянно спрашивают: есть ли у специалистов по обработке данных собственное место в мире дата-грамотности? Я с полной уверенностью отвечаю: да! Если мы собираем мозаику информационно-аналитической стратегии и говорим о необходимости демократизации данных в организациях, то уметь эффективно общаться на языке данных должен каждый. Это означает, что внутриорганизационная подготовка специалистов-профессионалов по обработке данных будет отличаться от подготовки, которую должны пройти сотрудники, которые только начинают работать с данными. Нам нужно, чтобы настоящие специалисты учились выступать перед широкой публикой, эффективно общаться и помогать всем остальным путешествовать по миру данных. Готов поспорить, у большинства специалистов по обработке данных есть этот неприятный опыт: когда ты выступаешь перед аудиторией с результатами своей работы, а встречаешь абсолютно непонимающие взгляды. Масса важнейших знаний и идей остаются незамеченными просто потому, что аудитория не способна их воспринять. Дата-грамотность требует от специалистов строить выступление так, чтобы язык, на котором они говорят, был понятен каждому. Их роль должна измениться: теперь им следует вдохновлять других овладевать дата-грамотностью.

Что еще могут делать специалисты по данным в мире дата-грамотности? Мы установили, что не каждому нужно быть узким специалистом, но каждому нужна дата-грамотность. Так какое место в этом мире должны занимать узкоспециальные технические методы обработки и анализа? В организации должно – я подчеркиваю, должно – быть место для обработки данных в чистом виде. Это гарантирует, что люди, обладающие соответствующими профессиональными навыками, смогут строить работающие аналитические модели. Обработка данных в чистом виде – это использование данных для тестирования, построения гипотез, применения статистических методов, прогнозирования, моделирования, создания алгоритмов и т. д. Это техническая часть нашей мозаики. И она необходима каждой организации. Только в этом случае данные и дата-аналитика обретают истинную силу. А чтобы все подразделения и сотрудники организации смогли воспользоваться этой силой, необходима эффективная коммуникация.

Дата-грамотность и визуализация данных

Мир дата-грамотности огромен и состоит из множества движущихся частей, но есть один элемент, способный облегчить работу буквально всем: визуализация данных. Что это такое? Это упрощенный подход к изучению данных. Представьте себе, что вам нужно проанализировать таблицу данных из 100 000 строк и 50 столбцов. Обрадует вас такая перспектива? Визуализация данных дает возможность упрощать большие объемы данных, поскольку мы с вами способны воспринимать зрительные образы. Поясню на примерах.

Рис. 4.2 представляет собой одну из моих самых любимых визуализаций. Мы можем проследить за походом Наполеона в Россию 1812 года и увидеть, как таяла его армия. И все это – в упрощенном виде. А теперь представьте себе те же данные, но в виде объемной таблицы. Или в виде множества публикаций в различных журналах (и вам нужно выискивать цифры самостоятельно, а затем составлять целостную картину). Много удовольствия вы бы получили, пытаясь таким образом понять, что же произошло с армией? Эта визуализация помогает упростить представление о наполеоновском походе.

Слышали ли вы про вспышку холеры, которая произошла в XIX веке в Лондоне на Брод-стрит (ныне Бродвик-стрит)? Если нет, взгляните на рис. 4.3. Это очень интересное исследование: визуализация данных помогла обществу сдержать эпидемию опасного заболевания. Врач Джон Сноу определил, что источником вспышки холеры стала загрязненная вода из водоразборной колонки, которой пользовалось множество людей. Получив нужную информацию, власти Лондона установили причинно-следственную связь и распорядились закрыть колонку, что предотвратило дальнейшее распространение болезни. Согласитесь, визуализация данных сработала на удивление эффективно!

Эти примеры показывают, как полезно упрощать представление данных. А теперь давайте разберемся, что же такое визуализация. Слишком глубоко закапываться в эту тему мы не будем, лучше полистайте замечательную «Большую книгу об информационных панелях» (The Big Book of Dashboard) С. Векслера, Дж. Шеффера и Э. Котгрейва, – но все же давайте слегка коснемся вопроса.




Искусство визуализации данных уходит корнями в глубокое прошлое. Наши предки при помощи визуальных способов передачи информации рассказывали целые истории. Такие истории мы видим в древнеегипетских иероглифах, в письменности народов Мезоамерики. Как визуализация пробила себе путь в мир данных? Кто-то вспомнит про первые статистические измерения, визуализированные сотни лет назад, про первые графики или диаграммы – про них написаны сотни книг и статей. А мы, пожалуй, перенесемся в современный мир визуализации данных и бизнес-информации.

Еще раз зададимся вопросом из начала этого раздела: кто из вас с радостью взялся бы просеивать информацию из огромной таблицы на 100 000 строк и 50 столбцов в надежде почерпнуть ценные знания? Если бы мне предложил такое мой начальник, я посмотрел бы на него как на ненормального. Вряд ли многие из вас взялись бы за такую работу с энтузиазмом – и это вполне понятно. Даже если вы обнаружите что-то ценное в начале таблицы, где гарантия, что через 24 000 строк ваш инсайт не будет опровергнут, а вы этого даже не поймете, потому что пропустили строку 174 в столбце 26? Слежение за строками и столбцами способно свести с ума кого угодно. Конечно, это гипотетический пример, и я очень надеюсь, что никто из вас в обозримом будущем не столкнется ни с чем подобным.

Однако есть прекрасный способ упрощения подобных таблиц, который поможет вам и вашей организации описать случившееся (дескриптивный анализ) и получить ценные знания (диагностический анализ). Это и есть визуализация данных. Она способна упростить огромный объем данных, собранных и произведенных организациями, и, кроме того, играет очень важную роль в дата-грамотности и ее связи с четырьмя уровнями аналитических методов. Сейчас поясню.

Для начала давайте рассмотрим влияние визуализации на дата-грамотность. Все это вам уже знакомо. Вспомним определение: дата-грамотность – это способность читать данные, работать с ними, анализировать их и общаться на языке данных. Мало кто из нас специально изучал статистику, и, когда руководители организации пытаются демократизировать данные, большинство сотрудников оказываются не в состоянии воспринимать их как есть. Им требуются специальные компьютерные программы, чтобы упростить представление. Здесь-то в игру и вступает ценнейший инструмент работы с данными – визуализация. Такие компании, как Qlik, Tableau Software и ThoughtSpot (и это лишь некоторые), разрабатывают специальное ПО для упрощенного представления данных. Читать данные и работать с ними становится легче, мы можем ставить правильные вопросы и делиться с другими визуализациями – и нередко это способно сдвинуть с мертвой точки даже самую запутанную ситуацию. Сотрудники изучают данные, прорабатывая их на каждом из четырех аналитических уровней, и черпают ценные знания. Как?

Визуализация особенно важна на первом уровне аналитических методов. Как вы помните, первый уровень – это дескриптивная аналитика, описывающая, что произошло в прошлом или происходит в настоящий момент. А как описать происходящее, если у нас собраны миллионы и миллионы единиц данных? Все эти данные мы можем объединить, например, в графики и таким образом получить убедительную визуализацию, которая впоследствии поможет нам разобраться, почему что-либо произошло.

Второй уровень аналитики – это диагностические методы, для которых визуализация также имеет большое значение. Диагностический анализ – это уровень инсайтов, озарений, это уровень, на котором мы выявляем причины случившегося. Визуализация данных в этом случае может стать катализатором, запускающим цепочку нужных вопросов. Откуда здесь такое резко отклоняющееся значение? Почему этот элемент так далеко отстоит от других? Я вижу, что этот столбик на диаграмме значительно выше других: что это за категория и почему он такой? Я вижу, что этот кластер данных находится в определенном временном интервале, но откуда у нас другие данные, вне этого интервала? Мы задумываемся обо всем этом благодаря наглядности: перед нами визуализация данных, которая сама подсказывает нам нужные вопросы (третий элемент дата-грамотности) и помогает находить ответы, что позволяет нашей организации продвигаться вперед. А после этого уже можно строить прогнозы.

Мы переходим к третьему уровню аналитики – предиктивному анализу. Имея перед глазами визуализацию (скажем, график), мы видим тенденции и направления. Если у нас все в порядке с дата-грамотностью, мы можем считывать данные, работать с ними, «крутить» их как угодно, а затем анализировать информацию, задавая вопросы. Все это дает нам важные знания, чтобы впоследствии мы могли надавить на нужные бизнес-рычаги. Таким образом, визуализация данных позволяет нам предсказать, в каком направлении движется наша компания. Это можно проиллюстрировать на примере линейного графика (см. рис. 4.4).



На нашей визуализации мы видим три линии, обозначающие разные штаты: Аризону, Айдахо и Юту. Каждая из этих линий имеет тенденцию к движению вверх. Это «дескриптивный анализ»: мы узнаем, какой была численность населения в последние десятилетия. Затем у нас могут возникнуть вопросы. Почему в Аризоне такой быстрый рост? Какие факторы могут влиять на темпы роста? Может быть, теплый климат или большое количество рабочих мест? Какими бы ни были причины, у нас есть знания, которые ведут нас к прогностическому анализу.

В нашем примере прогностическая модель может показать, какой будет численность населения к 2020 году – началу нового временного периода и моменту следующей переписи.

На уровне предсказательных методов, где анализ и получение знаний поддерживаются данными и технологиями, визуализация помогает нам наглядно представить сделанные прогнозы. А затем можно заново запустить процессы всех четырех уровней.

Итак, визуализация данных занимает очень важное место в мире дата-грамотности. Дата-грамотностью должны обладать все, а визуализация помогает значительно упростить восприятие того, что иначе могло бы оказаться слишком сложным для неспециалистов. Каждый из нас может поставить себе на службу визуализацию данных – для нашего собственного карьерного роста и для процветания наших компаний.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5
  • 4.6 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации