Текст книги "Записки профайлера. Искусство менталиста"
Автор книги: Алексей Филатов
Жанр: Общая психология, Книги по психологии
Возрастные ограничения: +16
сообщить о неприемлемом содержимом
Текущая страница: 8 (всего у книги 15 страниц)
Раздел V. Big Data и цифровой профайлинг
Deepfake в реальной жизни
Современные компьютерные технологии в купе с инструментарием профайлинга уже сегодня превращают еще недавно, казалось бы, фантастические сцены из фильмов «Ее звали Никита», «Миссия невыполнима» и «Джейс Бонд» в реальность. В них были сцены общения голограммы с живым человеком. И нередко эта голограмма оказывалась мошеннически подстроенное изображение, созданное для того, чтобы ввести в заблуждение каких-то негодяев.
Многие еще помнят нашумевшее приложение MSORD, технология которого выросла в возможность наложить собственную мимику на любое лицо в режиме реального времени.
Но вся соль заключается в том, что уже пошли дальше. Сегодня уже легко сконструировать абсолютно реалистичное видеоизображение с правильной артикуляцией!
Значимость этого приложения нам еще предстоит прочувствовать. Безусловно, для киношников и рекламистов – это огромный подарок, но при этом, – уверен, количество фейковых новостей и контента уже скоро возрастет многократно.
Поэтому надо, просто надо изучать качественный профайлинг и детекцию лжи.
Технологии deepfake и профайлинговые экспертизы
Современные технологии, при всей моей любви к ним, увеличивают количество фейков.
Несколько лет назад была отработана технология наложения своей мимики на чужое лицо, да еще так, что его не отличить от настоящего. Включая речь. Т. е. профессионал за несколько минут может сделать видеоролик с известным человеком, несущим какую-то пургу и выложить его в сеть, при этом понять, что это фейк не сможет ни человек, ни машина. Киношники в восторге, поскольку уже внедрили у себя эту технологию, впрочем, так же, как и журналисты, занимающиеся распространением фейковых новостей.
А между тем, уже появились факты того, что как минимум несколько человек было несправедливо осуждены и посажены в тюрьму из-за подобных фейковых видео-признаний и видеороликов. И это, конечно, жесть. Потому, что гарантированно отличить реальное видео от сделанного нельзя. Нет еще такой технологии. Пятерка мировых лидеров уже потратила несколько миллиардов на то, чтобы такую технологию создать, но пока безрезультатно: киношники пока побеждают.
Существует нейросеть, способная оживить картинки, сделав из них примерно то, как двигались картинки в газетах в фильмах про Гарри Поттера. Такие фотографии могут совершать произвольные движения, разговаривать, выбегать из кадра, при этом фон картинки самостоятельно достраивается, а пользователь может вручную изменить положение частей тела модели перед началом анимации.
https://youtu.be/G63goXc5MyU
Эту нейросеть, как и предыдущую, обучили в Израиле, в университете Тель-Авива совместно с соц-сетью, под руководством одного из столпов этого процесса – Иры Шлицерман. Киношники, конечно, обрадуются, но лет через 5, когда технология войдет в рутину, всему видео-контенту, особенно значимому для судопроизводственной практики, доверять будет трудно, ибо смастерить можно будет практически все, обладая средними навыками в компьютерной графике.
Как будет работать профайлинг и верификация лжи в условиях, когда подлинность практически любой видеозаписи, до сих пор являющейся одним из основных доказательств в суде, можно будет поставить под сомнение – я не знаю. Но уверен, что будет еще более интересно.
Делаем выводы
Профайлинг по социальным сетям
Как-то я проводил обучающий курс для работников силовых структур по профайлингу и особенно по профайлингу в соцсетях.
Удивило меня то, насколько глубоко некоторые понимают, а некоторые не понимают эту тему.
Сегодняшние социальные сети стали очень подробным источником информации о человеке и то, какой информационный след о себе он оставляет в интернете, может его очень даже детально характеризовать.
И речь даже не о какой-то продвинутой психодиагностике в соцсетях или анализа аккаунта, что уже активно отрабатывается и оцифровывается даже в РФ, а о том, что Интернет потихоньку и для многих незаметно становится персонифицирующим, т. е. по тому, как человек ведет себя в Интернете, кто-то иной или государство, уже может составить не только картину мира, но психологический портрет пользователя.
Существует указ о создании единой базы данных о гражданах РФ с довольно-таки подробной информацией о всех нас (о чем я писал в своем канале). Также был окончательно принят закон о мессенджерах.
Между тем, я уже давно слежу за регуляцией сбора персонализированной информации в Китае и о том, что с ней дальше делают гиганты и государство. Там все довольно интересно.
С 1 октября 2017 года в Китае вводят обязательную идентификацию личности пользователей для написания комментариев в Интернете. Это примерно тоже самое, что синхронизировать ваш аккаунт на госуслугах с вашими страничками в социальных сетях, при этом все неподтвержденные аккаунты и фейки будут заблокированы.
«Это положение позволит повысить уровень научности и культуры среди комментариев в Интернете, будет содействовать здоровому развитию интернет-сообщества, защитит интересы граждан, юридических лиц и других организаций, а также государственную безопасность и общественные интересы», – говорится в законодательном акте канцелярии по делам Интернета КНР. Комментировать это не буду, пускай каждый подумает и оценит, однако очевидно, что эхо этих процессов докатится и до нас. В общем, будьте аккуратны в Интернете.
Между тем – вот часть того, чем мы занимались на тренинге по анализу и профилированию пользователей по соцсетям. Несмотря на то, что это только 1/20 часть материала – уверен и это будет полезно.
Соцсети и гиганты слежки
Для миллиардов людей по всему миру именно сервисы «Google» и некоторые соцсети являются проводниками в Интернет. И хотя эти сервисы в основном бесплатны, пользователи платят за них свою цену, предоставляя компаниям свои персональные данные.
Правозащитники утверждают, что обе компании угрожают правам человека, в том числе свободе выражения мнения и свободе мысли. Виной тому – бизнес-модель, основанная на массированном сборе данных о поведении пользователей, которые затем обрабатываются с помощью сложных алгоритмов и используются, в первую очередь, для получения дохода от рекламы.
Такая бизнес-модель позволила двум гигантам сконцентрировать огромную власть, включая финансовую мощь, политическое влияние и способность формировать цифровой опыт миллиардов людей. Это привело к беспрецедентной асимметрии знаний между компаниями и пользователями Интернета – как утверждает исследовательница Шошана Зубофф (Shoshana Zuboff): «Они знают о нас все; мы не знаем о них почти ничего».
У нее книга, «Эпоха надзорного капитализма», посвященная этой. Но и Россия не отстает, а во многом идет впереди.
Власти Москвы уже несколько лет покупают у мобильных операторов данные о перемещении абонентов. Также фиксируются маршруты такси, данные с камер наблюдения и поездки по карте «Тройка». Таким образом, мэрия собирает многоуровневую базу данных о перемещениях москвичей. Официально данные не персонализированы – там нет имен и фамилий, а собирают их для оптимизации транспортной сети. Но по перемещениям человека несложно установить его личность. А главное – власти делают все это без ведома людей, чьи данные собирают.
К тому же, московская система видеокамер как минимум в центре города (и в местах, где проходят митинги) снимает 3D маску лица каждого прохожего, которую невозможно обмануть ни с помощью капюшона, ни с помощью медицинской маски: система собирает 3D изображение с разных сторон и синтезирует в одно.
Признаки шизофрении в соцсетях
Привожу перевод хорошей статьи о выявлении психоза (приступа шизофрении) в соцсети.
https://psyandneuro.ru/novosti/detecting-relapse-in-youth-with-psychotic-disorders/
Было проанализировано 52 815 постов в соцсети у пациентов с диагностированным психозом. У пациентов с манифестацией шизофрении авторы выявили значительные изменения в словарном составе записей в соцсети в течение месяца, предшествующего госпитализации, по сравнению с периодом относительного здоровья.
Отмечалось повышение частоты употребления лексики, относящейся к ненормативной (p <0.0001, Т-критерий), лексики, относящейся к категориям гнева (p <0.001) и смерти (p <0.0001), лексики, отражающей сниженное настроение (p <0.001), а также относящейся к слуховой (p <0.0001) сфере и сфере ощущений (p <0.01).
В период, предшествовавший госпитализации, была повышена активность в социальной сети с 5 утра до 12 часов дня (p <0.01) и с 22 часов вечера до 5 утра (p <0.01), что согласуется с нарушениями циркадного ритма при развитии обострения.
Лексика из следующих категорий использовалась реже, чем обычно: работа (p <0.01), друзья (p <0.0001), достижения (p <0.05), тело (p <0.01) и здоровье (p <0.0001), что соотносится со снижением академической успеваемости и нарастающей социальной изоляцией, часто сопряженными с началом обострения.
Отмечалось значимое повышение частоты использования местоимений первого (p <0.0001) и второго (p <0.001) лица.
Умный город и цифровой профайлинг
На «Techcrunch» есть статью о том, что в открытый доступ попали внутренности «умного» города, а именно – база данных пекинской системы видеонаблюдения.
https://techcrunch.com/2019/05/03/china-smart-city-exposed/
Система следит за жителями нескольких микрорайонов Пекина, в том числе района, в котором расположены посольства. Камеры наблюдения автоматически распознают лица людей и могут находить их в общей базе китайского МВД.
Данные системы позволяют определить, куда шел определенный человек, когда и как долго. Фактически – составить картину его ежедневной жизни.
Что умеет система:
– определяет лицо и сопоставляет его с данными баз документов;
– определяет очки либо маску (китайцы часто носят маски из-за смога);
– примерно оценивает возраст и привлекательность человека, а потом сопоставляет эти данные с базами;
– определяет этническую принадлежность человека: для китайцев принципиально важно определять и, как бы сказать помягче, – наблюдать за уйгурами и жителями Тайваня;
– определяет по лицам разыскиваемых людей и составляет их маршруты;
– категоризирует граждан на несколько категорий, определяя, например, такие теги как «наркозависимый» и «недавно вышел из тюрьмы».
Также система может собирать данные о мобильных устройствах прохожих («IMEI», «IMSI») с помощью специального оборудования – это вообще отдельная тема: вышки по WiFi и GPRS сигналу практически круглосуточно отслеживают местонахождение людей, составляя их привычные траектории движения и периодически производя их «чек-ины».
В конце 2017 года эта тема уже поднималась, но тогда было признано, что еще не все так серьезно. И вот, прошло всего полтора года – и все уже совсем серьезно.
При этом, надо сказать, китайское законодательство относится к этому вполне лояльно. И наше тоже. Такой вот цифровой профайлинг в действии уже не просто в уйгурской провинции Синьцзян, а в самом Пекине.
По уровню такой цифровизации мы, конечно, отстаем от Китая, а Европа и Америка – и подавно. Но это дело времени…
Российский государственный цифровой профайлинг
Я писал про американскую программу «Palantir», которая решает комплексные задачи по объединению различных полицейских баз данных, их анализу и прогностике появления тех или иных криминальных событий в конкретных районах и у конкретных людей.
В российских СМИ в свое время была информация о подобных программах в РФ. У нас все не менее круто. Разработками таких систем у нас занимается целый Научный центр при АП РФ.
Это системы:
– «ПСКОВ» – Поисковая система категории особой важности, способная извлекать даже данные из анонимной сети «Tor»;
– «Шерлок», система способная деанонимизировать практически любого человека всего по нескольким параметрам его персональных данных;
– Посейдон – система мониторинга протестной активности;
– Медиамонитор, анализирующий социальные сети по весьма специфическим запросам.
Демонстрацию системы «Шерлок» я лично видел на одной приватной встрече руководителей служб безопасности нескольких крупнейших компаний РФ зимой прошлого года. И она меня сильно впечатлила. Поэтому то, что написали СМИ – правда.
Интересно, что вместе с вот этими инициативами все складывается в весьма масштабную систему:
1) Осенью 2019 года Московское правительство проведет конкурс на подключение 105 тыс. камер наблюдения к системе распознавания лиц. Если проект будет реализован, в городе появится одна из крупнейших в мире систем слежения. По данным издания, в конкурсе могут принять участие три компании: «Центр речевых технологий» и «VisionLabs», доли в которых принадлежат «Сбербанку», и «NTechLab», совладельцем которой является «Ростех». Подробнее по ссылке в QR-коде.
https://hightech.fm/2019/07/16/moscow-recognition
2) Никаких обезличенных данных на самом деле не существует: определить и найти человека даже по малой части его данных – довольно простая штука.
3) Налоговиками создается база со всеми данными граждан: от ФИО до родственных связей. Одна из целей – улучшить собираемость налогов.
Вот, к примеру, в опубликованной журналом «Nature Communications» статье утверждается, что знаний персональных данных совсем не обязательно, чтобы понять, о ком именно в базе данных идет речь. Собрав всего три показателя, например, почтовый индекс, дату рождения и пол, можно сузить поиск до очень небольшого круга лиц. А при наличии 15 показателей, собранных из баз данных с социально-демографическими характеристиками людей, опросов и медицинских баз, можно точно определить конкретного человека. Хотя это и так очевидно всем, кто работает в интернете.
Тем временем у нас никаких ученых, исследователей или общественных активистов на высокие заседания, где вершится судьба данных на десятилетия вперед, никто не зовет. Тихо, спокойно и без лишнего внимания Ассоциация больших данных, в которую входят «Сбербанк», «Газпромбанк», «Яндекс», «VK» (ранее «Mail.Ru Group»), «Ростелеком», «Мегафон», сама решает, как им с ними поступить. А именно: разрешить использовать данные без согласия в целях, которые им покажутся важными. Дескать, получить согласие десятков миллионов клиентов, абонентов и пользователей интернет-ресурсов просто невозможно. Да и использоваться будут не персональные, а «обезличенные данные».
В общем, в этой теме мы если не впереди планеты всей, то уж точно не отстаем. Вот только нужно определиться: это хорошо или плохо. Или точнее: для кого это хорошо, а для кого – плохо.
Китайский психологический профайлинг
Была история, когда утекла база данных из профилей 2,4 млн человек, принадлежащая китайской интернет компании «Zhenhua Data». За изощренность и тотальность собранной на миллионы людей информации компанию теперь называют «Cambridge Analytica на стероидах», а среди основных клиентов фирмы значатся китайская компартия и разведывательные службы. Руководитель компании Ванг Сюэфен, ранее работавший в американской компании IBM, не скрывает своих подходов к сбору данных и в соцсетях с энтузиазмом рассуждает о манипуляции общественным мнением и «психологической войне».
В профайлах Zhenhua Data о каждом человеке собраны такие базисные вещи, как возраст, адреса, брачный статус, дерево родственников, политические предпочтения и аккаунты в соцсетях. Более необычно то, что в базе присутствуют такие данные, как выписки с банковских счетов, сведения с рабочих мест и данные о психологическом профиле человека. Источник этой информации – профили в ряде наиболее популярных соцсетей, но также имеются персональные данные, предположительно добытые хакерами и купленные на просторах даркнета. Короче со всего мира по ниточке и вот вам «цифровая кукла вуду» китайского производства.
В слитой базе данных есть инфа об американцах, индийцах, канадцах, британцах, даже жителях Папуа – Новой Гвинеи и других стран. Например, в Австралии слежка в основном велась за государственными чиновниками, военными, дипломатами, учеными, социальными работниками, бизнесменами, журналистами, адвокатами и даже за певицей Натали Имбрульей. Для полноты картины, информацию собирали не только о непосредственных объектах слежки, но и о их семьях, детях и так далее. Профили включали не только информацию о прошлых и текущих делах объекта, но и прогнозы о будущем – например о карьерных перспективах человека.
Такие утечки потихоньку вскрывают масштабы развернувшейся тотальной слежки за людьми. «ZhenhuaData» и ее база данных, по крайней мере в преломлении журналистов, используются для шпионажа: китайские data-ученые составляют карты психической и социальной жизни западных чиновников и бизнесменов, чтобы иметь возможность их шантажировать. Но эти же данные могут использоваться вообще для чего угодно – хоть для получения коммерческой выгоды, хоть для тренировки искусственного интеллекта.
«Zhenhua Data» хвасталась, что на нее работает 20 центров сбора информации, разбросанных по всему миру. В свою очередь «Zhenhua Data» – одна из множества частных компаний, задействованных в информационной пирамиде, на вершине которой находятся главы правительств и технологических гигантов.
За каждым из нас следят одновременно множество институтов и инстанций. Если интернет – это пространство, то каждый из нас окружен в этом пространстве роем несмыкающихся глаз, облачных мозгов и призрачных алгоритмов. Мы неизбежно двигаемся к тотальной прозрачности, и единственный выход в таком раскладе – стать главным наблюдателем за собой, понимать себя и управлять собой раньше и лучше, чем это сможет сделать Большой Другой.
Программы автоматического прогнозирования событий
В британском издании «The Guardian публиковали статью, о которой долго велась дискуссия. Материал о том, как военные в Германии пытались предсказывать будущее с помощью профессоров литературы в проекте под кодовым названием «Кассандра» (так в древнегреческих мифах звали дочь троянского царя Приама, которая могла предсказывать будущее).
Подход был довольно интересный, но уже известный: брался известный своими конфликтами регион, анализировалась тамошняя литература и текстам выставлялись оценки по девяти параметрам:
– тематический охват,
– была ли цензура текста,
– была ли цензура самого автора,
– реакция СМИ,
– скандалы вокруг текста,
– скандалы вокруг автора,
– литературные премии для автора,
– литературные премии для текста и, наконец,
– нарративная стратегия (подразумевалось: поддерживает ли автор какую-либо сторону конфликта или нет, и некоторые другие критерии).
Книгам присваивалась оценка от -1 до +3, чем выше была оценка, тем «опаснее» был текст. Чем больше «опасных» текстов выходит, тем «опаснее» становится регион. Если какого-то автора запрещают и гонят прочь из страны, значит его книге надо прибавить очков по степени «опасности». «Неужели все так просто?» – спросите вы, – и как это может работать?» Выясняется, что работать в целом может, и довольно неплохо. Но не во всем – работа алгоритма не была стабильной и где-то показывала феноменальную предиктивную эффективность, а где-то не показывала ничего.
Проект «Кассандра» немцы закрыли в 2020 году, во время пандемии, видимо, долгосрочные и не слишком надежные данные военным Германии были не очень нужны. Из достигнутого, например, удалось за год предсказать грядущий конфликт в Армении и Азербайджане. Минкультуры Азербайджана снабдило грузинские библиотеки книгами, которые несли явные антиармянские настроения. Были и признаки, что Азербайджан наращивает пропагандистские усилия и вуаля, год спустя – разразилась война в Нагорном Карабахе, в которой погибло 6000 человек.
Чтение по губам
Существует нейросеть «LipNet» – программа, умеющая читать по губам с правильностью более 93 %.
О «LipNet» я писал уже несколько раз и детали о ней можно узнать здесь:
t.me/ProProfiling/306
Юрген Шмидхубер – руководитель команды создателей «LipNet», и один из самых авторитетных европейцев в области машинного обучения и нейросетей, отвечая на вопрос: «Что сейчас происходит с LipNet?», когда новости о ней пропали, сказал только одно слово «Cortana». А это – голосовой помощник от Microsoft.
Вообще чтение по губам – очень полезный навык не только для профайлинга, но и вообще для жизни: иногда важно понимать то, что говорят при громко включенной музыке за соседним столиком.
Доказано, что если человек видит губы своего собеседника, то он понимает его гораздо лучше. Кстати, это особенно важно при изучении иностранных языков. Когда-то в начале 2000-х, когда был тренинговый бум, я даже посещал в Москве приличные курсы по чтению по губам ведущих российских сурдопедагогов. Но редкий профессионал по губам способен прочитать больше, чем 40 % речи, если к этому добавить жестикуляцию и мимику, то процент чтения доходит до 60. Вообще это отдельная сурдопедагогическая тема, входящая в лечение нейросенсорной тугоухости, но сейчас она активно оцифровывается.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.