Электронная библиотека » Билл Фрэнкс » » онлайн чтение - страница 4


  • Текст добавлен: 1 января 2016, 18:20


Автор книги: Билл Фрэнкс


Жанр: Личные финансы, Бизнес-Книги


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 4 (всего у книги 29 страниц) [доступный отрывок для чтения: 8 страниц]

Шрифт:
- 100% +
Аналитика 2.0: аналитика больших данных

В начале 2000-х началась эпоха Аналитики 2.0, открывшая перед нами мир больших данных{3}3
  Подробнее об этом вы можете прочитать в моей книге «Укрощение больших данных» (Bill Franks, Taming the Big Data Tidal Wave, Hoboken, NJ: John Wiley & Sons, 2012).


[Закрыть]
. Они во многих отношениях были новинкой – зачастую гораздо объемнее и сложнее, чем данные, которые использовались в эпоху Аналитики 1.0, и при этом необязательно так же структурированные. Большие данные могли включать в себя все что угодно – от документов, фотографий и видео до сенсорных данных. Множество больших данных, используемых для анализа, поступают из внешних источников, например социальных сетей. Несмотря на свое внешнее происхождение, они могут оказаться очень ценными.

Сегодня, в эпоху Аналитики 2.0, как видно на рис. 1.2, мы обнаружили, что для обработки больших данных и выполнения разнообразных аналитических процессов нам нужны новые аналитические технологии и новые вычислительные возможности. В результате из забвения на свет вышли такие технологии, как Hadoop (о ней мы расскажем позднее), а аналитические процессы были модернизированы, чтобы соответствовать этим новым технологиям. Основное внимание в эпоху Аналитики 2.0 сосредоточено на поиске наиболее дешевых способов сбора и хранения необработанных данных, а уже затем на поиске способов их применения.



Отчетливо выраженным трендом стало недавнее появление «науки о данных», изучающей способы анализа больших данных профессиональными аналитиками, а также такой профессии, как «исследователи данных». Основное различие между ними и традиционными профессиональными аналитиками состоит в выборе инструментов и платформ, используемых для анализа. Традиционные профессиональные специалисты в крупных организациях склонны использовать такие инструменты, как SAS и SQL, для анализа базы данных в окружении реляционной базы данных. Исследователи данных чаще применяют такие инструменты, как R и Python, для анализа данных в окружении Hadoop. Тем не менее эти различия носят тактический и в основном семантический характер. Любой специалист, хорошо разбирающийся в том или другом окружении, легко может переключаться между ними. Несмотря на разные наименования, профессиональные аналитики обладают практически одинаковыми базовыми наборами навыков и складом ума. (Подробнее мы обсудим эту тему в восьмой главе.)

В эпоху Аналитики 2.0 профессиональные аналитики хотя и не были включены в процесс принятия решений, но повысили свой статус в организациях до такого уровня, что могут напрямую влиять на принимающих решения лиц. Профессиональные аналитики перестали быть секретным ресурсом, тщательно огражденным от бизнес-сообщества.

Как мы увидим далее в этой главе, многие организации, особенно фирмы, работающие онлайн и в области электронной коммерции, начали разрабатывать коммерческие продукты и услуги, основанные исключительно на данных и аналитике. Первыми это предприняли онлайновые фирмы, они же первыми вступили в эпоху Аналитики 2.0. Одним из самых примечательных примеров является социальная сеть LinkedIn, создавшая такие продукты, как «Люди, которых вы можете знать» и «Группы, которые вам могут понравиться». Такие основанные на аналитике продукты используют информацию, собираемую в рамках управления и поддержания аккаунтов пользователей, и генерируют новую информацию, за которую во многих случаях пользователи платят.

Один из парадоксов Аналитики 2.0 состоит в том, что производимая аналитика зачастую оказывается не очень-то и продвинутой. Отчасти это было обусловлено тем, что объем и сложность данных затрудняют их перевод в пригодный для анализа формат. Отчасти объясняется незрелостью источников данных и аналитических инструментов. При всем поднятом вокруг нее ажиотаже эпоха Аналитики 2.0 по-прежнему в значительной степени опирается на отчетность и описательную аналитику с относительно малыми вкраплениями прогностической и предписывающей аналитики.

Одной лишь Аналитики 2.0 недостаточно

Эпоха Аналитики 2.0 выводит на передний план большие данные и новые возможности для применения аналитики. При этом нецелесообразно создавать отдельные команды, технологии и инструменты исключительно для анализа больших данных. Аналитические процессы должны охватывать любые данные и соответствовать любым требованиям, предъявляемым к аналитике. Вот почему Аналитика 2.0 – это не конечный результат.

Одно из заблуждений, характерных для эпохи Аналитики 2.0, проистекает из того факта, что многие профессиональные аналитики не прошли через эпоху Аналитики 1.0. Многие из них имеют подготовку в области компьютерных наук и пришли в аналитику из технологической сферы. Порой аналитики поколения 2.0 попросту не знают всего того, что делали крупные инновационные компании в эпоху Аналитики 1.0. Как следствие, они могут предположить, что все используемые ими концепции и методики являются совершенно новыми. Иногда это действительно так, но чаще всего нет. Давайте рассмотрим пример, который иллюстрирует эту ситуацию.

Как-то на конференции я услышал выступление одного молодого человека. Не буду называть его имя и компанию, поскольку моя цель – пролить свет на распространенную логическую ошибку, а не поставить кого-то в неловкое положение. Докладчик подробно изложил методы, посредством которых он со своей командой разрабатывал разнообразные аналитические процессы для сайта электронной коммерции его компании. И доводы, и методы были вполне разумными. Компания поступала правильно: например, применяла аффинитивный анализ и совместную фильтрацию для определения того, какие дополнительные продукты могли заинтересовать клиента исходя из истории его прошлых покупок и просмотров. Такого рода анализ традиционные ретейлеры применяли на протяжении многих лет.

Однако докладчик ошибочно заявил, что метод аффинитивного анализа нельзя было применять до появления больших данных и некоторых новых технологий. Он искренне верил в то, что применение широко распространенных алгоритмов открывает новые горизонты, поскольку не имел представления о происходившем на протяжении многих лет в традиционной розничной торговле. Метод аффинитивного анализа оказался в новинку только для этого молодого специалиста (и подобных ему). Парень попросту не знал истории аналитики. Действительно, в атмосфере ажиотажа вокруг больших данных легко предположить, что в прошлом ничего интересного не происходило. К сожалению, из-за такой неосведомленности можно потратить массу времени на выработку давно уже существующих решений, вместо того чтобы заняться более полезным делом.

Эпоха Аналитики 2.0 может многое выиграть, если будет заимствовать знания и опыт из эпохи Аналитики 1.0. Для достижения же максимального успеха организациям следует объединить все лучшее из эпохи Аналитики 1.0 и эпохи Аналитики 2.0, а затем двигаться дальше. Так мы придем в эпоху Аналитики 3.0.

Аналитика 3.0: всеобъемлющая аналитика воздействует максимально

Аналитика 3.0 сосредотачивается на дальнейшем развитии, а не на замене знаний, полученных в эпохи Аналитики 1.0 и 2.0. Подобно тому как Аналитика 2.0 не заменила собой Аналитику 1.0, так и Аналитика 3.0 не заменяет собой других. Аналитика 3.0 сочетает все предыдущие знания, накопленные ранее, в единой схеме деятельности, как это видно на рис. 1.3. Она объединяет традиционную аналитику на основе традиционных данных с новой аналитикой больших данных. Когда организации начали использовать большие данные, они обнаружили, что невозможно выделить аналитику больших данных в полностью автономную функцию. Большие данные – это не просто большие объемы обычных данных, требующие больше аналитики. Они требуют интеграции со всеми остальными процессами. Эпоха Аналитики 3.0 знаменует появление новой – интегрированной и развитой – аналитической парадигмы. Сейчас, в начале 2014 г., мы видим, что лидеры из сферы как традиционного, так и интернет-бизнеса начинают вступать в эпоху Аналитики 3.0. Операционная аналитика – естественное следствие этого тренда.



Причем Аналитика 3.0 вновь привлекает внимание к процессу обнаружения нужных данных. Этот процесс направлен на быстрое обнаружение новых знаний в данных и определение действий, продуктов и услуг, которые можно извлечь из добытых знаний. Полная реализация потенциала, заложенного в процесс обнаружения, требует от многих организаций значительной культурной эволюции. Аналитика должна стать сердцевиной стратегии предприятия, и повышение статуса аналитики должно направляться и санкционироваться сверху. Кроме того, необходимо перестроить существующие аналитические платформы и процессы. Далее в книге мы поговорим о процессе обнаружения данных и об изменениях, которые он потребует.

Разнообразие и новизна типов данных и доступных источников представляют собой один из главных вызовов в эпоху Аналитики 3.0 и в то же время ведут к появлению столь же разнообразных и инновационных аналитических технологий. Новые аналитические методы будут одной из определяющих характеристик эпохи Аналитики 3.0. Власть данных и расширение их обработки в конечном итоге подвигнут организации к широкому применению прогностической и предписывающей аналитики. Хотя потребность в описательной аналитике и отчетности по-прежнему останется, в эпоху Аналитики 3.0 организации наконец-то начнут осуществлять мечту об интегрированной и операционной аналитике. Она будет встроена не только в централизованные крупномасштабные корпоративные системы, но и в операционные приложения, используемые конечными пользователями, например в мобильных устройствах, банкоматах и интерактивных терминалах.

Развивайтесь до Аналитики 3.0

Эпоха Аналитики 3.0 представляет собой последний на сегодняшний день этап развития аналитики. Сочетая в себе все лучшее, что создано в эпохи Аналитики 1.0 и Аналитики 2.0, она развивает аналитику дальше.

Новые архитектуры, требуемые для Аналитики 3.0, добавят организациям сложностей. Аналитика 3.0 делает необходимым наличие параллельной обработки не только в окружении реляционной базы данных, но и в таком окружении, как распределенная файловая система Hadoop. Также может потребоваться смешение различных систем запоминания, графических процессоров и т. д. Все это мы рассмотрим в пятой главе.

Пожалуй, сильнее всего в эпохе Аналитики 3.0 меня, как профессионального аналитика, воодушевляет то обстоятельство, что мои коллеги наконец-то будут объединены в официально оформленную команду, ставшую стратегически значимой частью бизнес-организации. Такую команду возглавит директор по аналитике или как минимум руководитель уровня вице-президента, специалист, который будет курировать всю корпоративную аналитику. Более распространенной станет и должность директора по данным. Все эти роли мы обсудим подробнее в восьмой главе. Эпоха Аналитики 3.0 открывает новый захватывающий мир для профессиональных аналитиков.

Операционализация аналитики посредством Аналитики 3.0

Давайте рассмотрим один из видов анализа, который сегодня применяют многие крупные банки и телекоммуникационные компании. Он направлен на выявление действий, связанных с закрытием счета клиентом, и может проиллюстрировать операционную аналитику эпохи 3.0 в действии. Обратите внимание на то, что новым здесь является не прогнозирование убыли или текучести клиентов как таковое, а расширение сферы анализа и применения его результатов.

В процессе анализа текучести необходимо собирать данные о любых действиях, которые могут быть связаны с закрытием счета. Это касается источников как традиционных, так и больших данных, например истории транзакций, жалоб, запросов по нескольким каналам на аннулирование комиссии, постепенного уменьшения остатка на счете, заявлений в социальных сетях и т. д.

Со временем анализ текучести был усовершенствован, с тем чтобы выявлять определенные шаблоны действий, которые в сочетании гораздо опаснее, чем по отдельности. Такого рода анализ часто называют пат-анализом. Другими словами, не будет большой проблемы, если отклонить запрос на отмену комиссии, сделанный клиентом в тот момент, когда он проверяет свой счет онлайн и видит ее в первый раз. Но если клиент звонит в клиентскую службу и снова просит отменить комиссию, а вслед за звонком наносит визит в офис, то отказ клиенту в его просьбе может существенно повысить риск закрытия счета.

Построение пат-анализа для точного определения пути действий представляет собой довольно сложную задачу. Клиент может обратиться в банк в любое время и по любому каналу, включая колл-центр, филиал банка, чат в режиме онлайн или электронную почту. Банк должен знать, что именно уже произошло, чтобы предпринять правильное действие. Создание операционно-аналитического процесса требует обновления рекомендуемых действий по отношению к каждому клиенту после любого с ним контакта. Например, после того как клиент запросил об отмене комиссии и было принято решение об одобрении или отклонении запроса, эта новая информация должна быть немедленно включена в повторное вычисление правильной реакции во время следующего взаимодействия с клиентом. Отсутствие операционно-аналитического процесса в этом случае может привести к проблемам. Давайте посмотрим почему.

Легко опоздать навсегда

Операционная аналитика позволяет организации принимать наилучшее решение в любой момент времени. Использование же для аналитики данных, которые устарели всего лишь на несколько минут, может привести к неблагоприятным, а то и глубоко ошибочным решениям.

Например, я обращаюсь с просьбой об отмене комиссии в банк, который использует пакетную обработку данных только раз в сутки. Итак, банк получает мой запрос по электронной почте и отказывает мне. Его аналитики определяют, что в моем случае отказ не увеличит риска закрытия счета, и поэтому рекомендуют отклонить мой следующий запрос на отмену комиссии. Эта рекомендация загружается в систему и готова для использования на следующий день.

Назавтра я из машины снова звоню в банк с той же просьбой. Моя просьба отклоняется, как и было запланировано. Но отказ раздражает меня настолько, что я решаю зайти в филиал банка, мимо которого сейчас проезжаю, и лично поговорить с менеджером. Вот где начинаются проблемы. Поскольку обработка данных производится только вечером, то ни руководитель филиала, ни система не знают, что я только что звонил в банк и снова получил отказ. Рекомендация об отказе по-прежнему действует. Только вечером аналитики определят, что филиал должен был удовлетворить мой запрос, чтобы сохранить меня как клиента. Последнее взаимодействие существенно увеличило риск закрытия мной своего счета, однако руководитель филиала не знал об этом, поскольку его не снабдили аналитикой. Это классический пример операционного применения традиционной аналитики, и легко увидеть, почему такой подход может давать сбои.

При использовании же операционной аналитики система обновила бы данные, отразив мой последний звонок, а затем с учетом обновления немедленно выработала бы рекомендации удовлетворить просьбу, и, когда я входил в филиал, его руководитель уже был бы готов сообщить мне об отмене комиссии, благодаря чему я и дальше останусь с этим банком. Если еще несколько минут назад действовала рекомендация об отказе, то мой звонок в клиентскую службу полностью изменил бы представление об адекватной реакции. Ради своего преуспевания банк должен быть способным собирать все данные о взаимодействиях со мной в текущем режиме, а затем после каждого такого взаимодействия запускать аналитический процесс, чтобы правильно совершать свои дальнейшие шаги. Именно так работает операционная аналитика в эпоху Аналитики 3.0. Мой друг Джеймс Тейлор, генеральный директор компании Decision Management Solutions и автор книги «Системы, управляющие принятием решений: Практическое руководство по использованию бизнес-правил и прогностической аналитики» (Decision Management Systems: A Practical Guide to Using Business Rules and Predictive Analytics, 2011), много писал об операционной аналитике. Вот его мнение: «Организации, которые хотят процветать, а не просто выживать, должны преобразовать себя сверху донизу. Высокое качество операционных действий стало обязательным, а путь к такому качеству пролегает через аналитику. В планах каждого руководителя должен значиться переход к принятию каждого решения на основе аналитики и внедрению лучших решений во все операционные процессы».

Как аналитика меняет бизнес

Несмотря на все более широкое распространение аналитики, многие руководители не осознают, насколько фундаментально она меняет бизнес-модели. В этом разделе мы рассмотрим несколько важных для понимания концепций и трендов. Возможно, вашей организации потребуется более масштабно и без боязни рассмотреть, каким образом аналитика может изменить ваше будущее.

Аналитика как цель, а не побочный продукт

Четко выраженный тренд в операционной аналитике проявляется в том, что сегодня все большее количество продуктов собирает данные. Во многих случаях аналитика, применяемая к этим данным, является одним из главных – если не самым главным – назначением продукта. Другими словами, физический продукт сегодня зачастую является просто механизмом для сбора данных. Давайте посмотрим, что это означает.

В прошлом компании всегда создавали новые продукты, будь то игрушки, тарифные планы или типы банковского счета. Целью являлось, разумеется, успешное продвижение продукта, однако его успех мало зависел от данных или аналитики. Мало-помалу компании собирали данные о продажах продукта, его потребителях, а также о часто выявляемых дефектах и проблемах. Это позволяло понять, как можно улучшить продукт, однако данные получались как побочный результат продажи продукта, а не вследствие присущего ему свойства.

Сегодня же выпускаются продукты, чье единственное назначение – сбор данных, позволяющих применить аналитику. Сам по себе физический продукт фактически вторичен и является не более чем каналом для сбора и анализа данных. В одних случаях ценность продукта для потребителей определяется именно предусматриваемой им аналитикой; в других – ценность продукта для потребителей может заключаться в чем-то ином, в то время как компания извлекает пользу из аналитики. Когда аналитика используется во благо потребителей, тот продукт, который может обеспечить наиболее ценные данные и аналитику, а не традиционные функции, и преуспеет в конкуренции.

Кого интересует ваш продукт? Сверьтесь с аналитикой!

Одним из драйверов операционной аналитики является эволюция продуктов, которые существуют главным образом для обеспечения сбора и анализа данных. В некоторых случаях физические продукты служат не более чем инструментами сбора данных для аналитических процессов.

Таких продуктов появляется все больше. В эту категорию попадают многие доступные в Интернете бесплатные услуги. Возьмем, например, бесплатную электронную почту. Компании предоставляют ее вовсе не из любви к общественно-полезной деятельности, а потому что могут многое узнать об ее пользователях. Провайдер получает возможность размещать рекламу с учетом поведения пользователей, и она окупается, когда пользователи на нее откликаются. В некоторых случаях сервисы фактически читают от начала до конца электронные письма пользователей и анализируют их, чтобы генерировать рекламные предложения. Скажем, если вы часто переписываетесь с друзьями на спортивные темы, то можно держать пари, что будете получать много предложений, связанных со спортом. Кроме того, провайдер электронной почты может продать информацию о вашем интересе к спорту другим организациям, готовым заплатить за поиск любителей спорта. Так что надо очень внимательно читать правила хранения личной информации, прежде чем соглашаться с ними. В шестой главе мы поговорим о вопросах конфиденциальности более подробно.

На рынке сегодня также присутствуют аналитические процессы, которые напрямую превращаются в продукты. Наглядный тому пример – рекомендательный механизм популярного поставщика потокового видео Netflix{4}4
  См.: Xavier Amatriain and Justin Basilico, “Netflix Recommendations: Beyond the 5 Stars (Part 1)”, Netflix Tech Blog, 6 апреля 2012 г., на: http://techblog.netflix.com/2012/04/netflix‐recommendations‐beyond‐5‐stars.html


[Закрыть]
. Он использует данные о навигации пользователя по сайту и определяет, какие фильмы могут ему понравиться. Этот рекомендательный механизм рассматривается Netflix как реальный продукт. За него отвечают собственные продакт-менеджеры, управляющие им точно так же, как любым другим продуктом. Netflix постоянно старается добавить своему рекомендательному механизму новые функции и свойства, усилить его привлекательность для пользователей. Так, введен интерфейс Max, который превращает подбор рекомендаций в игру{5}5
  См.: Dawn C. Chmielewski, “Meet Max: The New Voice of Netflix Recommendations”, Los Angeles Times, 28 июня 2013 г., на: http://articles.latimes.com/2013/jun/28/entertainment/la‐et‐ct‐meet‐max‐new‐voice‐of‐netflix‐recommendations‐2013062


[Закрыть]
.

Успех Netflix в огромной степени приписывают именно ее рекомендательному механизму, хотя этот продукт, по сути, состоит из аналитики и использования данных. Механизм также представляет собой законченный операционный процесс, который управляет своими алгоритмами и предоставляет результаты пользователям миллионы раз в день без вмешательства человека.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации