Электронная библиотека » Елена Бродовская » » онлайн чтение - страница 1


  • Текст добавлен: 25 июля 2019, 14:01


Автор книги: Елена Бродовская


Жанр: Эзотерика, Религия


сообщить о неприемлемом содержимом

Текущая страница: 1 (всего у книги 5 страниц) [доступный отрывок для чтения: 1 страниц]

Шрифт:
- 100% +

Е. В. Бродовская, А. Ю. Домбровская
Большие данные в исследовании политических процессов Учебное пособие

Введение

Появление в конце XX в. интернет-коммуникации и ее интенсивное развитие оказало колоссальное воздействие на все сферы жизнедеятельности общества. С одной стороны, киберпространство предложило новый способ социального поведения людей, в том числе гражданского и политического участия. С другой – интернет-технологии обеспечили возможность аккумулирования цифровых «следов» поведения пользователей. Эти данные, идущие от поисковых систем, социальных медиа, мессенджеров, сенсорных устройств, огромные по объему и собираемые специальными машинами, называют большими данными – Big Data. Большие данные обладают рядом особых свойств:

– большим объемом, который несовместим с хранением на персональном компьютере;

– большой скоростью производства;

– содержательным многообразием;

– хаотичностью, неструктурированностью;

– гибкостью (совместимостью, подстраиваемостью под различные базы данных);

– корреляционностью.

Вместе с тем величина больших данных – это не главное в определении этого понятия. Основное – это природа их формирования. Большие данные создаются без исследовательского участия, это неспровоцированная информация, это автоматически сгенерированные данные о фактах социального поведения, которые невозможно обработать имеющимися сегодня пакетами для статистической обработки данных.

Большие данные впервые в истории прикладного политического анализа поставили вопрос о том, что основная проблема – не сбор информации, так как большие данные – это уже аккумулированный огромный массив постоянно пополняемой информации, вопрос заключается в способах анализа неструктурированных данных.

Вполне очевидно, что Big Data, этот глобальный массив социальной информации, представляет собой объект исследования большого числа научных дисциплин. Интегральной областью, изучающей взаимодействие информационных, политических, социальных и духовных процессов, является социальный компьютинг. Его основной метод – киберметрический анализ, который позволяет аккумулировать большие данные и анализировать репрезентированные в интернет-контенте цифровые маркеры политических процессов.

Для современного профессионала в сфере гуманитарного знания, и прежде всего политолога, реализующего интернет-технологии в политике и управлении (социально-медийную аналитику, технологии создания и продвижения онлайн-сетевых политических и коммерческих брендов и т. д.), весьма важной компетенцией служит умение применить техники киберметрии для оценки состояния и выявления тенденций в развитии политических процессов по цифровым маркерам. Немаловажно умение применить в научном исследовании методы киберметрии для аспирантов общественных и гуманитарных направлений подготовки, в том числе по научной специальности «Политология».

Учебное пособие имеет цель дать общее представление о понятии, эвристических возможностях метода больших данных в прикладном анализе политических процессов, а также сформировать навыки применения киберметрии в изучении цифровых маркеров политических изменений. Учебные кейсы, показанные в издании, направлены на формирование компетенций, связанных со способностью осуществлять графическую вербальную интерпретацию больших данных, автоматически генерируемых специальными инструментами анализа интернет-контента. Список контрольных вопросов для самопроверки, рекомендуемая литература по теме и приложения помогут студентам освоить методы применения больших данных в исследовании политических процессов.

Рекомендуется магистрантам направления «Интернет-технологии в политике и управлении» и аспирантам научной специальности «Политология», преподавателям высшей школы, читающим предметы, связанные с оценкой роли Интернета в современных реалиях, ученым, исследующим проблемы интернет-коммуникации с применением киберметрического анализа.

Глава I
Теоретико-методологические основы исследований с применением больших данных в системе методов социального компьютинга

Термин «большие данные» (Big Data) используется в двух смыслах. Это гигантские массивы информации – цифровые следы, аккумулируемые специальными инструментами из различных источников: социальных медиа, мессенджеров, сенсорных устройств и т. д. Большие данные в этом смысле характеризуют глобальный объем, неструктурированность, неспровоцированность создания. Дефиниция «большие данные» также может обозначать метод анализа гигантского по объему неструктурированного массива информации. В этой ипостаси большие данные отличает высокий эвристический потенциал оценки состояния и динамики массового сознания, гражданского и политического участия, жизненных стратегий пользователей, а также установления значимых корреляций для прогнозирования социальных и политических процессов по цифровым маркерам. Анализ больших данных осуществляется с помощью методов социального компьютинга. Поэтому важным представляется вначале рассмотреть понятие и сущность данного направления современных исследований и определить место автоматизированного анализа больших данных в системе методов социального компьютинга.

При определении понятия социального компьютинга также необходимо учитывать существование двух его проявлений – как области научных исследований и как сферы компьютерных технологий.

Приоритетная задача настоящего пособия состоит в анализе первого значения понятия. В этом случае социальный компьютинг понимается как область исследований, основанная на междисциплинарности и полипарадигмальности подхода к изучению взаимосвязи информационных, коммуникационных и социальных процессов, которая формируется в условиях функционирования и развития глобальной электронной сети.

Термин “Social Сomputing” дословно переводится как социальные «вычисления». Другими словами, это сплав социальной и компьютерной науки, сформировавший новую парадигму междисциплинарных исследований. Эта парадигма основана на позитивистском восприятии цифровых следов социальных связей индивидов как маркеров социальных и политических процессов.

Наиболее понятное и адекватное понимание социального компьютинга предложено А. А. Давыдовым [28], [29]. В его публикациях социальный компьютинг характеризуется как общий термин для обозначения группы технологий на стыке исследований и приложений в областях социального поведения и вычислительных систем или как совокупность социотехнических средств для анализа и использования человеческих связей как части процесса анализа больших данных.

Вместе с тем в специальной литературе встречается сужение определения социального компьютинга до использования вычислительных методов с целью изучения социального поведения. Данная трактовка рассматриваемого понятия не учитывает такой важный элемент социального компьютинга, как наличие взаимосвязи людей посредством Интернета, электронных социальных сетей.

Заслуживает внимания опыт определения термина «социальный компьютинг» на основе облака тегов, составленного по материалам докладов конференции “Social Computing, Behavioral-Cultural Modeling and Prediction”. В фокусе семантического ядра оказались понятия сети, социального, моделей и моделирования, динамики, анализа общественного мнения, двусторонней связи, реального и виртуального миров, симуляции, взаимодействия, информальных групп, социальных графов, анализа больших данных и проч.

Анализ облака тегов позволил выявить семантическое пространство «социального компьютинга» и редуцировать его к такому семантическому ряду: «моделирование социального взаимодействия общностей и групп с использованием методов анализа больших данных, репрезентированных в интернет-контенте».

Исходя из этого, многочисленные определения социального компьютинга сводятся к указанию на значимость синтеза точного и социально-гуманитарного знания в процессе исследования влияния интернет-коммуникации на сознание и поведение людей.

Сегодня в мировом научном сообществе формируется и развивается ряд междисциплинарных направлений, близких к области исследований социального компьютинга.

Социология Интернета/социология киберпространства (Sociology of the Internet/Sociology of cyberspace) – отрасль социологии, объектом которой является исследование функционирующего в сети пространства социальных связей, а предметом анализа – социальные процессы и отношения в киберпространстве.

Цифровая социология (Digital sociology) – еще одна отрасль социологической науки, ориентированная на изучение цифровых медиа и их роли в повседневной жизни пользователей, социальных эффектов новых медиа, их воздействие на реальные социальные связи и процессы. Объект изучения цифровой социологии значительно шире, чем объект социологии Интернета, социологии онлайн-сообществ, социологии социальных медиа и т. п., и включает не только интернет-пространство как особый социокультурный и технологический феномен, но и те социальные среды, которые создают другие телекоммуникационные технологии. В предметное поле цифровой социологии также входят Интернет вещей и технологии работы с большими данными, которые, в свою очередь, формируют цифровую среду (digital space). Цифровая социология в этой связи может рассматриваться в самом широком понимании как сфера актуализации возможностей, которые дают цифровые инструменты для переосмысления структуры социологического знания. В этом смысле социальный компьютинг может рассматриваться как возможность «переформатирования» данных прикладных отраслей гуманитарных наук.

Культуральные «вычисления» (Cultural Computing) – направление исследований, сфокусированных на изучении культурных эффектов развития телекоммуникационных систем, выявлении цифровых маркеров культурных процессов, происходящих в виртуальном пространстве, в целом, воздействии интернет-коммуниации на развитие сферы культуры и искусства, Когнитивные «вычисления» (Cognitive Computing) – направление исследований, в которых применяются технологии оперативной обработки больших данных, структурирования хаотичных потоков глобальных по объему массивов информации.

Эмоциональные «вычисления» (Affective Computing – междисциплинарная область, направленная на разработку интеллектуальных систем для обнаружения, распознавания, интерпретации и моделирования человеческих эмоций. Наибольшее применение эмоциональные «вычисления» находят в сфере развития виртуальной и дополненной реальности, цифровой медицины, игровой индустрии.

Контекстуальные «вычисления» (Context Computing) и иные виды автоматического и автоматизированного анализа больших данных, которые осуществляют программы искусственного социального интеллекта (Artificial Social Intelligence Agents). Контекстуальные «вычисления» ориентированы на создание систем, учитывающих социальный инвайронмент, ситуацию, в которой пребывает пользователь. Контекстуальные «вычисления» также неоценимы в разработке логики аккумулирования и анализа больших данных, позволяют учесть контексты формирования измеряемых информационных потоков.

Ключевые исследовательские задачи исследований в сфере социального компьютинга и смежных направлений:

• разработка методологических, методических и организационных основ изучения интернет-пространства и т. д.;

• исследование внутренних механизмов строения и развития социальных структур виртуального социального пространства;

• анализ процессов формирования и развития виртуальных сообществ;

• изучение особенностей социальных действий и поведения людей в условиях интернет-пространства;

• изучение влияния виртуальной среды (online) на сообщества, структуры и процессы, имеющие место в «реальной» жизни (offline), изучение феномена перехода виртуальных структур, сообществ, событий и т. д. в «реальное» пространство (так называемая девиртуализация);

• разработка методов автоматизированного анализа интернет-контента;

• создание методов автоматизированного структурирования информационных потоков в социальных медиа;

• формирование методов создания компьютерных корпусов основных языков России и постсоветского пространства;

• разработка методов создания базы цифровых маркеров социальной напряженности на основных языках народов России и постсоветского пространства;

• формирование методов создания базы цифровых маркеров межнациональных и межрелигиозных конфликтов на основных языках народов России и постсоветского пространства;

• разработка методов создания базы цифровых маркеров не-конвенциональных массовых; политических протестов на основных языках народов России и постсоветского пространства;

• формирование методов создания базы цифровых маркеров распространения экстремизма и терроризма на основных языках народов России и постсоветского пространства;

• разработка методов создания базы цифровых маркеров фальсификации отечественной и мировой истории на основных языках народов России и постсоветского пространства;

• формирование методов создания базы цифровых маркеров фейковой новостной информации на основных языках народов России и постсоветского пространства;

• разработка методов создания базы цифровых маркеров сецессии субъектов Федерации/дезинтеграции общества на основных языках народов России;

• формирование методов создания базы цифровых маркеров электорального поведения на основных языках народов России;

• разработка методов создания базы цифровых маркеров гражданской и добровольческой активности на основных языках народов России;

• формирование методов сегментирования хабов, лидеров общественного мнения, онлайн-сообществ Рунета и др.

Перечисленные направления исследований в сфере больших данных – лишь небольшой список возможных позиций предметного поля Big Data – эмпирического анализа.

Главная особенность методологии исследований в сфере социального компьютинга состоит в ее междисциплинарности и полипарадигмальности. Логика Big Data анализа должна основываться на применении фундаментальной базы, отраженной в теоретических подходах и концепциях. Ниже описаны те из них, которые в зависимости от предмета исследования, могут составлять в различных комбинациях теоретическую основу анализа больших данных – цифровых маркеров политических процессов:

– теория глобальной информационной сети (С. Колеман [105], Д. Тапскотт [86]), анализирующая социальные механизмы воздействия Интернета на различные сферы общественной жизни;

– концепция коллективного поведения (Г. Лебон [53], Г. Тард [83], Г. Ортега-и-Гассет [67], С. Московичи [59] и др.), описывающая механизмы массовых действий и факторов, воздействующих на них. Концепция во многом объясняет процессы мобилизации массового сознания, которые могут быть характерны и для социльных медиа;

– теории социального и политического конфликта (Р. Дарендорф, М. Дойч и Л. Козер [41]) раскрывают причины и стадии указанных видов конфликтов и могут служить фундаментом исследований, направленных на выявление цифровых маркеров конфликтных процессов в глобальной сети;

– концепция относительной депривации (Н. Смелзер [122], Р. Тед [126]), позволяющая описать состояние индивидов и социальных общностей, при котором возможно формирование протестных установок, в том числе с применением информационных потоков в новых медиа;

– концепция сетевого взаимодействия (М. Кастельс [104]), отражающая механизмы формирования, развития и функционирования социальных связей в новых медиа;

– теория «сетевого клуба» (Дж. Коэн, Э. Шмидт [93]), описывающая специфику коммуникации и жизненных стратегий пользователей глобальной сети;

– концепция «умной толпы» (Х. Дженкинс [113], Г. Рейнгольд [72]), раскрывающая особенности коллективного сознания индивидов в информационном обществе;

– подход политических мимов (С. Шомова [94], С. Грин [109]), анализирующий механизмы воздействия цифровых визуальных образов на политические установки интернет-пользователей.

Методологическую базу данных исследований в зависимости от специфики предметного поля эмпирического анализа могут составлять следующие подходы социологии и политической науки, комбинируемые исходя из исследовательской цели.

В рамках социальной феноменологии Интернет рассматривается как интерсубъективная среда повседневности, которая постоянно меняется в процессе коммуникации множества индивидов. Понятие «интерсубъективного мира» (А. Шюц [99]) применяется в объяснительных моделях устойчивой коммуникации в сетевых сообществах. Теория «коллективных представлений» (П. Бергер и Т. Лукман [11]) используется для объяснения влияния интернет-контента на формирование идентичности личности.

Структурный функционализм (Т. Парсонс [35]) позволяет рассмотреть функции Интернета с позиций транслирования им ценностей и норм, а также выполнения им функций обеспечения адаптации, целедостижения, интеграции и сохранения образца.

Социетальный институционализм наиболее применим к анализу политических сетей (policy networks), понимаемых как взаимодействие акторов, характеризующееся устойчивостью, наличием определенных моделей координации, воплощаемых в коллективных действиях (К. Хай [41]).

Методологические основы овладения технологиями интеллектуального поиска цифровых маркеров базируются на следующих подходах: новый институционализм, сетевой и когнитивный подходы, интеллектуальный анализ данных (Data Mining, Text Mining, Predictor Mining, Social Computing).

Новый институционализм позволяет рассматривать в качестве факторов, влияющих на восприятие сетевого имиджа политических партий, политические институты, акторов, их ресурсы и стратегии (Г. О'Доннелл [65], Ф. Шмиттер [118] и др.), а также анализировать рациональность выбора стратегии политического (в том числе электорального) поведения (К. Шепсл [119], Д. Норт [63] и др.).

Когнитивный подход акцентирован на анализе процессов формирования субъективного политического мира, субъективного восприятия и интерпретации сообщений, транслируемых в пространстве социальных медиа, выбора стратегии политического поведения (Р. Дж. Далтон [106], П. Данливи [27] и др.). Значимыми для решения задач интеллектуального поиска цифровых маркеров политических процессов являются такие аспекты когнитивного подхода, как технологии информационного влияния, манипулятивное воздействие, убеждающая коммуникация и др. (М. Грачев [22], [23], М. Вершинин [20], А. Балашов [9], И. Быков [15], [16], М. Щенников [95] и др.).

Сетевой подход делает возможным исследовать взаимосвязь между мобилизацией политического действия и сетевой активностью интернет-пользователей (Г. Градосельская [21], С. Грин [109], Л. Сморгунов [80], Ф. Ховард [112], А. Шерстобитов [49], А. Роменков [27], Д. Мартьянов [56], И. Мирошниченко [57], [58] и другие сетевые интеракции как коллективное действие (И. Кравченко [44]), инструменты вовлечения в сетевой политический протест (В. Костюшев [42] и др.).

Интеллектуальный анализ (Data Mining, Text Mining, Predictor Mining, Social Computing) как междисциплинарная область, возникшая на пересечении прикладной статистики, искусственного интеллекта, теории баз данных и др., содержит систему методов обнаружения цифровых маркеров социально-политических процессов (А. А. Азаров [1], [3], Е. В. Бродовская [101], [102], [115], А. Ю. Домбровская [14], А. А. Фильченков [2] и др.).

Представленные ниже теории и подходы осуществляют математическое сопровождение исследований в сфере социального компьютинга и, в первую очередь, исследований больших данных – маркеров политических процессов [14].

Теория графов позволяет установить наличие коммуникационных связей между интернет-пользователями, имеющими сходные политические ориентации. Эти связи описываются в виде математических моделей сетей. Использование математических формализмов обусловлено существенным развитием данной области. Разработано множество способов представления графов, алгоритмов работы с ними.

Теория игр – это комплекс математических методов изучения оптимальных стратегий. Игрой называется упрощенная математическая модель конфликтной ситуации, отличающаяся от реального конфликта тем, что она ведется по определенным правилам. Суть игры состоит в том, что каждый из участников принимает такие решения в развивающейся конфликтной ситуации, которые, как он полагает, могут обеспечить ему наилучший исход. Исход игры представляет собой значение некоторой функции, называемой функцией выигрыша (платежной функцией), которая может задаваться либо аналитическим выражением, либо таблично (матрицей). Величина выигрыша зависит от стратегии, применяемой игроком. Теория игр позволяет описывать поведение совокупности объектов – стратегии их поведения при заданных ресурсах и связях между объектами. Таким образом, теория игр позволяет выявить поведенческие установки интернет-пользователей сети, включенных в определенные конфликтные ситуации, в том числе политические.

Теория вероятностей и математическая статистика. Эти методологические подходы существуют для аккумулирования и анализа взаимосвязей различных данных, исследования структурных характеристик социальных явлений, в том числе отраженных в сети политических ориентаций пользователей и представления их в математической форме.

Машинное обучение. Машинное обучение – это подраздел теории искусственного интеллекта, изучающий алгоритмы, способные к обобщению и обучению. Машинное обучение используется с целью автоматизации решения комплексных задач в различных областях человеческой деятельности. Методы машинного обучения позволяют автоматически выявлять различные особенности исследуемых данных. Примером применения машинного обучения в процессе изучения цифровых маркеров политических процессов является разработка программы, генерирующей ссылки на аккаунты социальных сетей, в которых репрезентированы, к примеру, протестные установки.

Информационный поиск. Информационным поиском называется процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности. Иначе говоря, это выявление в некоторой совокупности текстов (документов, сообщений и т. д.) таких, которые посвящены определенной теме, удовлетворяющей поисковым критериям или содержащей необходимые данные или сведения. В контексте изучения больших данных – маркеров политических процессов – этой неструктурированной информацией являются, к примеру, массив сообщений социальных сетей, в которых аккумулированы цифровые следы проявления различных стратегий гражданского и политического участия пользователей.

Интеллектуальный анализ данных. Интеллектуальный анализ данных (Data mining) – это технология определения латентных взаимосвязей внутри больших баз данных. Одной из областей применения интеллектуального анализа данных является оценка эффективности контекстной политической рекламы. Этот метод применяют, чтобы выявить предпочтения избирателей и соответственно разработать рекомендации по совершенствованию онлайн сетевой политической рекламы. Характер электоральных установок пользователей присутствует в данных неявным образом. С помощью интеллектуального анализа данных можно, например, выяснить, что клиент, планирующий вступить в онлайн-группу X, как правило, выражает политические ориентации Y. То есть данный метод позволит выявить политические или гражданские установки, репрезентируемые в «семантической связке», то есть одно в сопровождении другого (их).

Интеллектуальный анализ текстов. В междисциплинарном смысле интеллектуальный анализ текстов находится на стыке статистики, машинного обучения, информационного поиска, интеллектуального анализа данных и компьютерной лингвистики. Этот метод позволяет извлекать знания, связи и другую информацию из текстовых массивов. Как правило, здесь используются средства выявления шаблонов и тенденций с помощью статистического анализа шаблонов.

Рассматривая математическое сопровождение исследований в сфере социального компьютига, важно сделать акцент на методиках вычисления количественных оценок характеристик социально значимых ценностей и поведения. На данный момент предложен математический аппарат оценки интенсивности ценностных установок и поведения по данным об эпизодах поведения, разработана его программная реализация. Этот инструментарий предназначен для косвенных измерений интенсивности по сведениям о нескольких последних и рекордных эпизодах, что позволяет производить мониторинг интенсивности с необходимой регулярностью. Такой подход применялся ранее при проведении опросов респондентов об эпизодах их поведения.

Но с таким же успехом он может быть использован и при обработке данных, полученных из интернет-контента.

Рассмотренные подходы являются средством оценки интенсивности и содержательного проявления маркеров политических процессов, в том числе политического поведения пользователей.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> 1
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации