Текст книги "Ценность ваших данных"
Автор книги: Сергей Кузнецов
Жанр: Базы данных, Компьютеры
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 35 страниц) [доступный отрывок для чтения: 12 страниц]
Одной из первых серьезных публикаций, появившихся в результате формирования взгляда на данные и информацию как на корпоративный ресурс – так называемого ресурсоориентированного взгляда на информацию (resource-based view of information), стал доклад «Управление знаниями как корпоративным ресурсом»[137]137
Berry J. F., Cook C. M. Managing Knowledge as a Corporate Resource. Department of Defense, Washington, DC. 1976.
[Закрыть], подготовленный в 1976 году для Министерства обороны США[138]138
Об этом говорится, в частности, в обзорной статье «Неподтвержденное происхождение управления знаниями» (The Unacknowledged Parentage of Knowledge Management)*.
* Lambe P. J. The Unacknowledged Parentage of Knowledge Management // Journal of Knowledge Management, 2011, 15 (2): 175–197. – URL: https://www.researchgate.net/publication/220363236_The_Unacknowledged_Parentage_of_Knowledge_Management.
[Закрыть]. В нем рассматривается подход к управлению знаниями с точки зрения информационных технологий, т. е. прежде всего в контексте управления данными (явными знаниями). Теоретические основы управления корпоративными знаниями в части управления корпоративными данными (в терминах корпоративной архитектуры данных) были заложены еще в 1970-х годах. Формирование взгляда на данные как на корпоративный ресурс было отчасти обусловлено ростом понимания нерациональности создания в компаниях многочисленных независимых хранилищ данных для различных приложений, контент в которых часто дублировался[139]139
Lambe P. J. The Unacknowledged Parentage of Knowledge Management // Journal of Knowledge Management, 2011, 15 (2): 175–197. – URL: https://www.researchgate.net/publication/220363236_The_Unacknowledged_Parentage_of_Knowledge_Management.
[Закрыть].
Устойчивый рост интереса к ресурсоориентированному взгляду на информацию в США с середины 1970-х годов до начала 1980-х прослеживается в статье «Оценка ценности информации в организациях: вызов для 1980-х»[140]140
Black S. H., Marchand D. Assessing the Value of Information in Organisations: A Challenge for the 1980’s // The Information Society Journal, 1982, 1 (3): 191–235.
[Закрыть]. Исследование начинается с момента, когда правительство США осознало угрозу утонуть в работе с бумагами, что повлекло бы неприемлемые затраты. В связи с этим была создана Комиссия по федеральным документам, которая пришла к выводу, что «данными и информацией можно и нужно управлять точно так же, как мы управляем людскими, физическими и финансовыми ресурсами. Данные и информация должны подчиняться тем же принципам в части бюджетной, управленческой и аудиторской практики, что и любые другие ресурсы».
В 1988 году хорошо проработанный подход к реализации управления данными в контексте ресурсоориентированного взгляда был представлен в известной книге Барка (С. Burk) и Хортона (F. Horton) «Информационная карта: Полное руководство по выявлению корпоративных информационных ресурсов»[141]141
Burk C., Horton F. Infomap: A Complete Guide to Discovering Corporate Information Resources. Englewood Cliffs, NJ: Prentice-Hall.
[Закрыть].
Чтобы правильно управлять любым ресурсом, необходимо понимать, какую роль он играет, его свойства, возможности, которые он предлагает, а также шаги, которые необходимо предпринять, чтобы использовать эти возможности. Но данные не только предоставляют огромные возможности, они также создают огромные проблемы. Например, в отличие от других ресурсов, данные могут быть легко скопированы, переданы многим людям с использованием информационных технологий, а затем использованы десятками различных способов. Но эффективное распространение данных происходит редко. Вместо этого большинство компаний и частных лиц, сознательно или нет, накапливают данные, что часто приводит к жестоким политическим битвам за право собственности. Даже в ситуациях, когда данные являются общими, отдельные лица и подразделения создают и изменяют свои собственные копии. Неизбежные несоответствия в первую очередь подрывают цель обмена данными. Кроме того, организациям трудно обеспечить соблюдение конфиденциальности и других политик, касающихся использования данных.
Какие свойства и особенности данных отличают их от других ресурсов организации? Ответу на этот вопрос посвящена следующая глава.
Литература к главе 3• Кольке Г. И. Формирование модели конкурентных преимуществ организации с точки зрения ресурсного подхода // Вестник Сибирского института бизнеса и информационных технологий, 2019, 1 (29): 45–52. – URL: https://cyberleninka.ru/article/n/formirovaniemodeli-konkurentnyh-preimuschestv-organizatsii-s-tochki-zreniya-resursnogo-podhoda.
• Мичурина О. Ю. Ресурсная концепция фирмы: интегративный аспект // Экономические науки, 2009, 10 (59): 164–168. – URL: https://ecsn.ru/files/pdf/200910/200910_164.pdf.
• Соколов Б. И., Воронов В. С. Институциональные основы информационно-финансового конструирования // Проблемы современной экономики, 2017, 2 (62), 146–151. – URL: https://cyberleninka.ru/article/n/institutsionalnye-osnovy-informatsionno-finansovogokonstruirovaniy.
• Evans N., Price J. Barriers to the Effective Deployment of Information Assets: An Executive Management Perspective // Interdisciplinary Journal of Information, 2012, 7: 177–199. – URL: https://www.researchgate.net/publication/289400090_Barriers_to_the_Effective_Deployment_of_Information_Assets_An_Executive_Management_Perspective.
• Levitin A. V., Redman T. C. Data as a resource: Properties, implications, and prescriptions // Sloan Management Review, 1998, 40 (1): 89–101. – URL: https://sloanreview.mit.edu/article/data-as-a-resource-properties-implications-and-prescriptions/.
• Moody D., Walsh P. Measuring the value of information: An asset valuation approach // Proceedings of the 7th European Conference on Information Systems, Copenhagen, Denmark.
• Otto B. Quality and Value of the Data Resource in Large Enterprises // Information Systems Management, 2015, 32 (3): 234–251. DOI: 10.1080/10580530.2015.1044344 – URL: https://www.researchgate.net/publication/275637181_Quality_and_Value_of_the_Data_Resource_in_Large_Enterprises.
• Wilson R. M. S., Stenson J. Valuation of information assets on the balance sheet: The recognition and approaches to the valuation of intangible assets // Business Information Review, 2008, 25 (3): 167–182. DOI: 10.1177/0266382108095039 – URL: https://journals.sagepub.com/doi/abs/10.1177/0266382108095039?journalCode=bira&.
Глава 4. Данные как ресурс: особенности и подходы к управлению
4.1. Свойства данных как ресурсаСвойства данных и информации как ресурса не раз обсуждались во многих публикациях. Одна из наиболее подробных и обстоятельных – статья американских специалистов Левитина (A. Levitin) и Редмана (T. Redman) «Данные как ресурс: свойства, особенности и рекомендации»[142]142
Levitin A. V., Redman T. C. Data as a resource: Properties, implications, and prescriptions // Sloan Management Review, 1998, 40 (1): 89–101. – URL: https://sloanreview.mit.edu/article/data-as-a-resource-properties-implications-and-prescriptions/.
[Закрыть]. Авторы подчеркивают, что в своей работе они рассматривают исключительно данные (а не информацию и знания), потому что считают, что данные заслуживают рассмотрения сами по себе[143]143
В следующих главах мы увидим, что, хотя часто понятия «данные» и «информация» не разделяют и считают синонимами, в то же время, когда обсуждается их роль как ресурса, то рассматривается прежде всего аспект данных, а когда обсуждается такое понятие, как «активы», – аспект информации.
[Закрыть]. В то же время многие выработанные ими рекомендации по управлению данными могут дополнить уже известные рекомендации по управлению информацией и знаниями, основанные на лучших практиках. Действительно, компания, которая не может эффективно управлять своими данными, вряд ли справится с работой по управлению своей информацией и знаниями.
Левитин и Редман, ссылаясь на авторитетный американский словарь The American Heritage Dictionary, приводят следующие определения понятия «ресурс» (resource):
● доступный запас, который может быть использован в случае необходимости;
● средство, которое может быть использовано с выгодой.
Таким образом, ресурсы необходимы организации для осуществления ее повседневной деятельности, а также являются потенциальным источником еще нереализованных выгод.
Имея в виду эти определения, мы можем выделить основные категории ресурсов, используемых современными организациями. Существуют традиционные ресурсы – финансовые, человеческие, здания (сооружения) и оборудование, сырье и энергия и так называемые ресурсы информационной эпохи – данные, информация и знания.
Данные можно рассматривать в двух аспектах.
● Данные как таковые – значения атрибутов, характеризующих тот или иной объект определенного типа в соответствии с некоторой моделью данных, описывающей этот тип. Например: тип объекта – сотрудник; модель данных: фамилия, имя, отчество; значения: Иванов, Иван, Иванович.
● Записи данных – физические проявления данных, размещенные в бумажных картотеках, электронных таблицах, базах данных и представляемые пользователям таким образом, чтобы их было легко хранить и использовать.
Остановимся на основных отличительных свойствах данных и записей данных и обсудим, как они соотносятся со свойствами традиционных ресурсов (табл. 4.1).
* Levitin A. V., Redman T. C. Data as a resource: Properties, implications, and prescriptions // Sloan Management Review, 1998, 40 (1): 89–101. – URL: https://sloanreview.mit.edu/article/data-as-a-resource-properties-implications-and-prescriptions/.
1. Нематериальность
В литературе существует всеобщее согласие, что наиболее яркой характеристикой, отличающей данные от традиционных ресурсов, служит их нематериальность (intangibility). В прошлом нематериальность данных заставляла некоторых исследователей возражать против рассмотрения данных (а также информации и знаний) в качестве ресурсов. Эта точка зрения становилась непопулярной по мере возрастания роли нематериальных ресурсов во всех сферах, от традиционного производства до финансовых услуг, страхования и других отраслей, интенсивно потребляющих информацию.
При этом важно проводить различие между данными как таковыми и представлением данных на определенном носителе. Если рассматривать данные как таковые, то они явно нематериальны. Но записи данных вполне материальны, будь они на бумаге, микрофильмах или компьютерных носителях (например, оптический диск или флеш-накопитель). В некоторых случаях нам требуется специальное оборудование, такое как компьютер, чтобы убедиться в наличии записей данных, но эта потребность не делает их нематериальными.
Финансовые ресурсы (реализация которых представляет собой либо наличные деньги, либо записи данных) в принципе также можно рассматривать как нематериальные. Однако чаще их считают материальными, поскольку во многих случаях (в частности, в финансовой сфере) под материальностью понимают способность оцениваться в денежном выражении.
2. Расходуемость
Важная характеристика любого ресурса – расходуемость (сonsumability). Ресурс является расходуемым, если использование уменьшает его объем, доступный для использования в будущем. Деньги, сырье и энергия – примеры расходуемых ресурсов. Очевидно, что ни данные как таковые, ни записи данных не являются расходуемыми.
Иногда утверждается, что нерасходуемость данных отличает их от всех остальных более традиционных ресурсов. Но человеческие ресурсы, равно как здания (сооружения) и оборудование, также не подлежат расходованию в соответствии с данным выше определением. Действительно, назначение работника или машины для выполнения конкретной задачи не исключает переназначения после завершения задачи. Что касается вопросов, связанных с износом, то мы их обсудим позже, когда будем рассматривать характеристику «обесцениваемость» (depreciability).
3. Возможность совместного использования
Под возможностью совместного использования (shareability) ресурсов мы подразумеваем возможность того, что несколько пользователей могут одновременно использовать одну и ту же единицу ресурса. Ни один из традиционных ресурсов не является общим в соответствии с этим определением. Например, два пользователя не могут совместно использовать одну и ту же денежную купюру. Они могут делить здание, но не одну и ту же его часть. Однако данные для совместного использования доступны, причем двумя способами. Во-первых, одни и те же данные могут иметь несколько представлений в разных наборах записей, каждый из которых может использоваться одновременно разными пользователями. Это делает данные как таковые общедоступным ресурсом. Во-вторых, современные системы управления базами данных обеспечивают одновременный многопользовательский доступ к одним и тем же записям данных. Однако эта возможность может быть затруднена ограничениями носителя (например, бумажные записи недоступны для одновременного использования). Возможность совместного использования также может быть намеренно ограничена по соображениям безопасности с помощью шифрования или путем ограничения доступа к записям данных с помощью паролей. Совместное использование данных подразумевает как преимущества, так и опасности, которые не имеют отношения к управлению традиционными ресурсами.
4. Копируемость
Еще одно свойство данных – их копируемость (copyability): можно создать идентичную единицу рассматриваемого ресурса за долю стоимости оригинала. В данном определении требование к снижению стоимости имеет решающее значение, поскольку без него мы были бы вынуждены заключить, что оборудование, сырье и энергия также являются копируемыми ресурсами. На самом деле, конечно, копируются записи данных, а не сами данные.
Поскольку компьютерные записи являются как нерасходуемыми, так и совместно используемыми, теоретически нет необходимости их копировать. Более того, дополнительные копии не только требуют дополнительных носителей, но и, что важнее, создают проблему поддержания согласованности. С другой стороны, для копирования есть практические причины. Во-первых, оно позволяет пользователям работать с данными в более удобных условиях. Во-вторых, дает им возможность контролировать свою собственную копию данных, что может быть важным по различным политическим соображениям. В-третьих, копирование может повысить долговечность данных – снизить вероятность их непреднамеренного уничтожения (см. ниже). Определение желаемой степени избыточности – важный вопрос при управлении данными как ресурсом.
5. Транспортабельность
Как бы ни была важна способность к копированию, именно транспортабельность (transportability) положила начало информационному веку, обеспечивая почти мгновенный перенос данных на большие расстояния. Возможность локального копирования данных существовала еще до того, как прогресс в области телекоммуникационных технологий сделал возможной передачу данных между удаленными пунктами. (Если быть точным, электронная передача данных на самом деле является не транспортировкой записей данных, а скорее созданием копий в пункте назначения.)
Эффективность современных телекоммуникаций не ограничивается скоростью передачи данных; качество и экономическая эффективность одинаково впечатляют. За исключением, возможно, электроэнергии, никакие другие ресурсы не могут транспортироваться с такой легкостью и эффективностью, как данные, хранящиеся в электронном виде. Другое возможное исключение – деньги, которые также могут передаваться в электронном виде.
6. Незаменяемость
Заменяемость (fungibility) означает, что одна единица рассматриваемого ресурса может быть заменена другой единицей того же ресурса, если последняя доступна. Деньги, сырье и энергия заменяемы. Человеческие ресурсы, здания (сооружения) и оборудование также заменяемы, хотя их замена может быть дорогостоящей и неудобной. Но единицы данных (т. е. отдельные элементы данных) уникальны: мы не можем заменить дату рождения человека другим элементом данных (например, элементом «имя» или «пол») об этом человеке или о ком-то другом. Хотя иногда мы можем вывести значение одного элемента данных из значения другого (например, определить возраст на основе даты рождения), такие ситуации являются исключительными. Что касается записей данных, мы, очевидно, можем заменить одну запись другой, если они обе представляют один и тот же элемент данных.
Незаменяемость (nonfungibility) данных вызывает особые проблемы управления. Например, в качестве защиты от возможных дефектов в единицах других ресурсов менеджеры могут выбрать сохранение большего объема рассматриваемого ресурса. Но для данных эта стратегия бессмысленна: дефектный элемент данных не может быть заменен другим элементом данных. И конечно, хранение дополнительных копий записей данных не поможет, если копии сделаны с негодного оригинала или устарели.
7. Недолговечность
Под недолговечностью (fragility) ресурса мы подразумеваем легкость, с которой он может быть непреднамеренно уничтожен или потерян при обычном использовании. Традиционные ресурсы обычно не квалифицируются как недолговечные. Ситуация с данными совершенно иная. Хотя бумажные записи могут быть непреднамеренно потеряны или уничтожены, именно удивительная легкость, с которой записи данных, хранящиеся в компьютере, могут быть непреднамеренно перезаписаны или полностью стерты, заставляет нас считать их недолговечными. Кроме того, оцифрованные данные могут быть случайно уничтожены, когда новые информационные системы заменяют старые, или могут быть легко потеряны среди больших объемов других данных. Конечно, хранящиеся на компьютере данные могут быть защищены от перезаписи и регулярно дублироваться в виде резервных копий. Тем не менее многим пользователям не хватает навыков, необходимых для уверенной работы с такими механизмами защиты. Учитывая недолговечность данных, неудивительно, что многие пользователи склонны превышать меры разумной осторожности. Практика показывает, что неоправданное распространение копий данных часто вызвано беспокойством о недолговечности данных.
8. Универсальность
Универсальный (versatile) ресурс – ресурс, который может быть использован для различных целей. Например, конкретное сырье для конкретного производственного процесса может иметь ограниченное альтернативное применение. С другой стороны, деньги имеют самый широкий спектр возможного использования. Данные занимают среднее положение между этими двумя полюсами.
Универсальность данных, наряду с их другими свойствами, предоставляет организациям ценные источники новых возможностей для развития бизнеса и улучшений. Один из примеров – целевой (targeted) маркетинг, основанный на данных (data driven). Отрицательной стороной универсальности данных является возможность злоупотреблений. Например, когда данные, законно собранные для одной цели, используются для другой, незаконной. Данные о возрасте и состоянии здоровья человека, законно собранные в медицинских целях, не должны влиять на возможности продвижения этого человека по службе. Неоднозначности в семантике данных усугубляют эту проблему. Например, продавец может считать продажу завершенной, когда он и клиент устно договорились о сделке. Но юридический отдел не считает продажу завершенной, пока не подписан контракт, производственный отдел – пока продукт не доставлен, а финансовый отдел – пока не получен платеж.
Практическая важность проблем неверно истолкованной семантики данных часто недооценивается. В результате принимаются неоптимальные, даже крайне неправильные решения. Кроме того, ошибочное толкование семантики данных может привести к конфликтам. Например, все различные интерпретации продажи верны с точки зрения (обычно ограниченной) функциональных подразделений. Поэтому следует ожидать, что они будут энергично защищать свои интерпретации. Это может поставить в тупик компанию, которой необходимо увеличить продажи.
9. Оцениваемость
Под оценкой (valuation) ресурса мы подразумеваем выражение его ценности в денежном эквиваленте. Для традиционных ресурсов ценность определяют либо рыночные силы, либо устоявшаяся практика бухгалтерского учета. Хотя некоторые наборы данных можно купить на открытом рынке (например, исторические показатели финансовых рынков, данные о точках продаж, многие виды списков клиентов), большинство наборов данных не подлежат продаже, и их оценка создает сложные теоретические и практические проблемы.
Десятилетия исследований этих проблем не дали четких результатов по нескольким причинам: неспособность отделить информационное содержание от информационных технологий, склонность анализировать данные как заменяемый товар или ресурс, отсутствие внутренней (intrinsic) ценности данных (т. е. ценность данных зависит от конкретных приложений), а также универсальность использования данных.
Оценка данных вызывает несколько дополнительных проблем. Во-первых, всегда легче оценить затраты на данные, чем оценить стоимость приносимых ими выгод, что может привести к ошибочным решениям не получать данные, полезность которых вызывает сомнения. Во-вторых, проблемы, связанные с внутренними ценами на передачу данных, могут быть трудноразрешимыми. Например, некоторые организации взимают с пользователей плату за доступ к наборам данных. Такая практика может препятствовать использованию и в итоге противоречить намерениям руководства. С другой стороны, без выяснения готовности пользователей платить трудно отсеять те наборы данных, которые не приносят никакой пользы[144]144
В следующей главе мы подробно рассмотрим основные модели, которые могут быть применены для оценки данных и информации.
[Закрыть].
10. Обесцениваемость
Обесценивание (depreciation) определяется как уменьшение или потеря стоимости из-за износа, возраста или по другим причинам. Здания, оборудование и большинство сырьевых материалов (кроме энергии) обесцениваются. Потеря стоимости финансовых и людских ресурсов неоднозначна: для первых она осложняется возможностью инфляции и дефляции, для вторых трудности связаны с различными соотношениями между возрастом и производительностью труда, а также с различиями между отдельными работниками.
Ценность данных обычно не уменьшается из-за использования. Но есть и исключения. Чем больше людей используют информацию о состоянии курсов акций на бирже, тем меньше ее ценность для каждого человека. Аналогичным образом, предприятия не продают и не делятся своими данными, поскольку это может снизить их ценность. Во многих случаях имеет значение истечение времени. Если представляют интерес только текущие значения атрибутов (например, размер зарплаты), они должны обновляться по мере изменения аспектов реального мира, которые они описывают. Если данные имеют временны́е метки, то они, как правило, становятся менее ценными с течением времени (например, данные о зарплате сотрудника за текущий год, вероятно, будут намного менее ценными через десять лет). Но здесь также есть исключения. Методы интеллектуального анализа данных (data-mining) обеспечивают успешное использование подробных исторических записей, поэтому более старые данные могут быть весьма ценными. Таким образом, в большинстве случаев, за некоторыми исключениями, данные не обесцениваются с использованием, но они обесцениваются с течением времени.
11. Множественность источников
Как правило, традиционные ресурсы производятся за пределами организации, использующей их, за исключением финансовых ресурсов, которые могут образовываться как вне, так и внутри компаний. Такая же дихотомия источников происхождения существует и для данных.
В отличие от других ресурсов, данные генерируются огромным количеством источников. Каждая операция с поставщиками и клиентами, большинство внутренних операций, а также управленческая и экспертная деятельность – все это порождает данные. Хотя по отношению к данным применимы такие модели управления, как «потребитель – поставщик», само разнообразие источников данных добавляет массу сложностей.
Часто источники многих наборов данных не документированы или даже неизвестны. Как правило, эти данные не могут быть ни использованы, ни улучшены. Интернет только усугубляет проблему. Конечно, мы не всегда знаем источник других ресурсов, например нескольких литров бензина. Но согласованные стандарты помогают гарантировать, что бензин из разных источников взаимозаменяем. Наличие же у данных такого свойства, как незаменяемость, препятствует стандартизации и осложняет работу с источниками[145]145
Основные виды источников данных будут нами рассмотрены в главе «Данные как объект управления» (глава 12).
[Закрыть].
12. Возобновляемость
Всякий раз, когда реальный мир меняется, описывающие его данные также изменяются или создаются новые данные. Новые данные появляются в результате повседневной деятельности организаций или индивидуумов с поразительной скоростью. Это свойство данных, которое можно назвать возобновляемостью (renewability), в гораздо меньшей степени относится к другим ресурсам, за исключением, возможно, солнечной энергии. Другие ресурсы, конечно, могут быть возобновлены. Но спонтанный характер, скорость и степень обновления данных гораздо выше, чем у любого другого ресурса.
Ситуация немного сложнее для записей данных. В большинстве случаев требуется время и усилия, чтобы изменения были отражены. Например, адрес человека меняется в день его переезда, но до обновления базы данных проходит некоторое время. Информационные технологии могут уменьшить время задержки во многих ситуациях, но оно не может быть устранено полностью.
Естественно, менеджеры хотят использовать последние данные. Свойство возобновляемости выдвигает для исполнения этого желания два требования. Во-первых, поскольку обеспечение актуальности данных – важная задача, бизнес-процессы, фиксирующие изменения, должны быть надежными. Во-вторых, механизмы обеспечения актуальности должны быть синхронизированы, иначе в избыточных базах данных обязательно возникнут несоответствия. При неучете этих требований совещания по принятию решений могут перерасти в жаркий обмен мнениями о том, чьи данные точнее.
13. Компьютерное (электронное) хранилище
Данные, в отличие от большинства других ресурсов, могут храниться на компьютерах (в электронных хранилищах). Исключение составляют финансовые ресурсы, которые могут храниться в виде электронных денежных средств. Это свойство вносит свой вклад в обеспечение других свойств, таких как копируемость, возможность совместного использования и транспортабельность. Электронные средства хранения облегчают управление данными, поскольку стоимость хранения данных невелика по сравнению со стоимостью хранения других ресурсов. С другой стороны, дешевое хранилище может способствовать принятию решений о сохранении всего, включая данные, которые больше не нужны. Непреднамеренным последствием является то, что полезные данные становится труднее найти. Дешевое хранилище также может способствовать принятию несколькими подразделениями в рамках организации независимых решений о хранении собственных копий, что приводит к избыточности данных.
В следующем разделе мы обсудим, каким образом специфические свойства данных влияют на подходы к управлению этим ресурсом.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?