Взлом мозгов. Сбор данных из социальных сетей

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была и останется теперь навечно Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. О том, как 24-летний либеральный канадский гей с пирсингом в носу и розовыми волосами оказался в составе британского военного подрядчика, разработал инструменты психологической войны для американских ультра-правых и рассказал об этом всему миру

Это третья часть, и посвящена она различным методикам сбора приватных данных и тому, как команда психологов и аналитиков построила невероятно точную модель американского общества. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с сугубо техническими.

Часть фактов автор данной статьи ставит под сомнение, однако публикует как есть со слов Кристофера Уайли, указанных в его мемуарах. По ряду вопросов мнение автора и разоблачителя могут расходиться.

Первая и вторая части, напомню, есть на Хабре и доступны также по ссылке внизу, в блоке навигации

Часть фактов автор данной статьи ставит под сомнение, однако публикует как есть со слов Уайли, указанных в его мемуарах. По ряду вопросов мнение автора и разоблачителя могут расходиться.

Создание Cambridge Analytica

Главные злодеи действующие лица:

  • Робер Мерсер - Миллиардер, Республиканец, спонсор партии.

  • Стив Беннон - Советник Дональда Трампа, один из активнейших организаторов его предвыборной кампании.

  • Александр Никс - Директор SCL.

Александр Никс
Александр Никс

Стив Беннон совместно с Александром Никсом уговорили господина Мерсера вложить 20 миллионов долларов в новую дочернюю организацию SCL - Cambridge Analytica.

  • Мерсер получил 90% компании за инвестиции в $20 млн.

  • Беннон – управление новосозданной компанией.

  • SCL – 10% своей дочерней компании Cambridge Analytica (CA).

Но почему Мерсеру не вложил эти 20 миллионов в избирательную кампания Дональда Трампа? Почему такие сложности?

  1. CA первоначально создавалась для деятельности за рамками правового поля – прямое вмешательство в выборный процесс методами информационной войны.

  2. В законах о финансировании избирательных кампаний есть большой список ограничений и требований к прозрачности. На частную компанию CA они не распространяются.

  3. CA была зарегистрирована в США, в отличии от SCL - британской компании.

  4. Избирательная кампания всегда под микроскопом противников, частная компания – в тени.

При создании CA от вдохновляющего Мерсера и Беннона звучали следующие тезисы:

  • Мы создадим настоящий Палантир!”

Смотрели Властелин колец? Палантир - всевидящее Око Саурона. Но и еще Палантир – это на момент создания CA самый известный и эффективный программный продукт для сбора и анализа разведывательных данных. Палантир был создан коллегами Илона Маска по PayPal во главе с Питером Тиллем.
Смотрели Властелин колец? Палантир - всевидящее Око Саурона. Но и еще Палантир – это на момент создания CA самый известный и эффективный программный продукт для сбора и анализа разведывательных данных. Палантир был создан коллегами Илона Маска по PayPal во главе с Питером Тиллем.
“The Sims в реальности!”
“The Sims в реальности!”

Играли в The Sims? Симулятор жизни, где можно следить за своей виртуальной семьей и влиять на поведение каждого человечка. Эдакая песочница с возможностью быстрой перемотки вперед или загрузкой предыдущего состояния. Наши злые гении решили играть подобным образом избирателями США, моделируя общество и влияя на их решения. В целом, это позволило бы в разы поднять эффективность рыночной разведки для хедж-фондов самого Мерсера.

  • “Uber информационной войны!”

Нет тут не про индусов за рулем) Uber в свое время стал “market changer”ом, одним приложением убив всю вековую индустрию такси.

История названия

До создания компании CA Стив Беннон частенько приезжал в Лондон. Александр Никс и Кристофер Уайли презентовали ему свои разработки, рассказывали выдуманные истории о работе с Кембриджем и профессорами оттуда, и, когда Беннон попросил показать ему офис в Кембридже, они это сделали.

За пару дней арендовали фейковый офис с оборудованием, посадили туда красивых сотрудниц в максимально откровенных, но деловых нарядах, создали иллюзию работы.

В дальнейшем Беннон каждый раз прилетая в Лондон, назначал встречу именно в этом офисе и его приходилось арендовать снова и снова – вот такая “потемкинская деревня” от SCL! Ну и когда пришло время выбирать название для дочерней компании SCL, именно Беннон настоял на Cambridge Analytica – “Ведь именно там вы базируетесь!"

Таким образом, первой успешно “обработанной” целью Cambridge Analytica стал сам его создатель – Стив Бэннон. Если даже его удалось одурачить, то был ли шанс у простых избирателей?

Facebook, еще не Meta.

“Определение характеристик личности пользователя на основе взаимодействия и характеристик системы социальных сетей” – патент самого Facebook. Ведь чем больше социальная сеть знает о вас, тем легче эти данные монетизировать. Фейсбук не только проводили такие исследования самостоятельно, но и поддерживали исследования в обмен на данные.

Были ли ограничения у Facebook или хотя бы партнеров соцсети на сбор? Формально, да…

Например, по задумке Александра Когана и под руководством Кристофера Уайли, Кембридж Аналитика собирала данные с помощью множества приложений, одним из которых было “This is Your Digital Life”. По одной установке пользователем Фейсбук и нажатием на одну кнопку данное приложение получило доступ к:

  • Информации профиля пользователя

  • Лайкам пользователя

  • Его геолокации

  • Дате рождения

А также получало доступ к аналогичной информации всех его друзей! В среднем, у одного пользователя 150-300 друзей в Фейсбуке, которых он таким образом “сдавал”. “Если друг оказался вдруг…”

В зависимости от настроек приватности, у установившего приложение также утекало:

  • Новостная лента

  • Личные сообщения (!)

  • Посты

Пруфы? Сообщение Фейсбук после обличения CA прилагаю, подробности – спойлеры на последнюю часть нашего цикла.

Таким образом, Фейсбук не препятствовал сбору данных, позволял собирать их по одному клику у пользователей и раздавал данные его друзей без всякого контроля. Но что дают эти данные?

Остальное — спойлеры, наберитесь терпения.
Остальное — спойлеры, наберитесь терпения.

Это не ИРЛ(In Real Life)!

Это же в Интернете, а не реальность! Многие считают, что эти данные не связаны с реальностью, но они – результат нашей реальной жизни. Они – наша реакция на все происходящее.

Социальные сети осуществляют качественное и независимое наблюдение за цифровой “естественной средой”. И, по результатам исследования 2015 года, одни лишь ваши лайки позволяют предсказать наше поведение:

  • 10 лайков > предсказание коллеги.

  • 150 лайков > предсказание члена вашей семьи.

  • 300 лайков > предсказание вашей супруги/супруга/партнера.

В отличии от вашей семьи, партнера и коллег, с социальной сетью мы взаимодействуем постоянно, не так строго контролируем “маски” и гораздо больше откровенничаем. В результате социальная сеть может знать ваши привычки даже лучше, чем вы сами.

Первый массовый сбор

В качестве тестового бюджета CA выделила $10тыс. Цель была проста: собрать 10 тысяч профилей в Фейсбук. Как это проще всего сделать?

Заплатить каждому лоху по доллару!

Для этого CA запустила свои кампанию на площадке Amazon Mechanicalturk. Это площадка для простой подработки через интернет: решать капчи, сортировать картинки и любые другие элементарные задачи, которые легко делает человек и сложно сделать машине.

CA платила $1 за прохождение психологического теста через профиль Фейсбук, в результате чего за этот самый бакс CA получала:

  • Результаты психологического теста IPIP-NEO-120 (120 вопросов).

Знакомый тест?
Знакомый тест?
  • Все лайки пользователя и всех его друзей, что позволяло провести параллели с результатами теста и сделать надежные выводы.

  • ФИО, пол, возраст, местоположение, статусы, и, в ряде случаев, личные сообщения.

Выгодная сделка?
В дальнейшем CA использовала и тест с вопросами о девиантном поведении для выявления будущих точек влияния.

От желающих не было отбоя.
Дальше – больше: бюджет раздули до $100тыс, платформа та же, и снова бюджет выработан до нуля.

Контрольные звонки и агрегация

Никс и Беннон, вдохновленные столь эффективным сбором, решили провести контрольный тест.
Для этого были случайно выбраны автоматически сгенерированные профили нескольких жителей США. Сам Никс обзванивал этих людей, а Беннон слушал.

“Здравствуйте, мы звоним из Кембриджского университета и проводим опрос…”

А что же они видели перед звонком?

  • Женщина на фотографии.

  • ФИО.

  • Дата рождения.

  • Место работы.

  • Ее адрес и фотографии дома.

  • В 2012 году голосовала за Митта Ромни.

  • Водит ауди, фото машины.

  • Любит Кети Перри.

  • “Простушка”.

Но самым поразительным стал факт того, что она не проходила тест в Фейсбук.

Тест прошел ее друг в Фейсбуке, эти данные были объединены с открытыми данными и полученными/купленными от государственных и коммерческих бюро:

  • Ее заявки на ипотеку.

  • Доход и кредитная история.

  • Разрешение на оружие.

  • Путешествия из программы лояльности авиакомпаний.

  • Данные об ее здоровье от страховых компаний.

В процессе “опроса” по телефону она подтвердила каждую строчку.

CA воссоздали ее жизнь “in silico”, а она даже понятия не имела об этом.

Развитие

К августу 2014 года, за 2 месяца работы, CA собрала данные 87 миллионов пользователей. Список “работников Mturk” был истощен и был привлечен иной подрядчик для “проведения опросов” (сбора данных) Qualtrics.

В дальнейшем были использованы и более грязные эффективные способы сбора данных – расширения для браузера.

Расширения, которые установлены в вашем браузере, по умолчанию имеют доступ ко всем данным браузера. Включая сookies/пересылаемые данные на ВСЕХ доменах. И обнаружить какой-то злонамеренный сбор браузер не может, ведь тот же блокировщик рекламы постоянно сканирует все страницы, и браузер его активность не замечает.

На тот момент все распространяемые CA расширения успешно проходили проверки антивирусов и проверки магазинов расширений, ведь ничего однозначно вредоносного они не делали!

Эти расширения, как правило, были максимально просты:

  • Календари.

  • Калькуляторы.

  • Темы для Фейсбука.

И многое другое.
Поэтому при установке расширения задумайтесь, насколько вы ему доверяете.

В свое время Александру Никсу MI6 отказали в сотрудничестве, теперь он был готов продать разведданные кому угодно, лишь бы его заслуги признали. АНБ и ЦРУ согласились, и летом 2014 года CA начало с ними сотрудничать.

Посредником для передачи разведданных выступили Palantir – в этот момент на рынке сбора разведданных уже был другой лидер.

Интересен тот факт, что АНБ и ЦРУ официально запрещено собирать подобные данные на граждан США. Но службы могут пользоваться “добровольно представленными данными” от частных лиц и компаний, тем самым обеляя массовую слежку чужими руками.

Итог

  • К осени 2014 года была создана уникальная система слежки и сбора данных более ста миллионов граждан США.

  • Противодействие социальной сети – отсутствовало.

  • Торговля данными граждан – процветала.

  • Команда психологов и аналитиков построила невероятно точную модель американского общества.

Мерсер строил на этом прогнозы для своих хедж-фондов. А вот как именно этим воспользовались Беннон и ультраправые республиканцы?

Узнаете в следующей части этого цикла!

Автор: Forbidden World

Оригинал

Что было и что будет

1. PSYOPS

2. Новые источники и обработка данных

3. Сбор данных из соц. сетей <---- вы здесь

4. Эксплуатация: фейки и манипуляции, Брекзит и Трамп.

5. Расследование: Россия, Ассанж, Facebook.

Источник: https://habr.com/ru/post/648279/


Интересные статьи

Интересные статьи

Всем привет! Сделать хорошее аналитическое хранилище (DWH), когда в команде десяток-другой крутых специалистов и пара лет времени — не сложно. Проекты по созданию DWH, Data Lake и BI обычно очень рес...
Всем привет! В этой статье пойдет речь о том как ускорить запись большого объема информации в реляционную базу данных для приложений, написанных с использованием Spring Boot. При запис...
В прошлой статье мы описали эксперимент по определению минимального объема вручную размеченных срезов для обучения нейронной сети на данных сейсморазведки. Сегодня мы продолжаем эту тему, выбирая...
Во многих случаях, успешные социальные инженеры обладают сильными человеческими качествами. Они очаровательны, вежливы и просты — социальные качества, необходимые для установления быстрой связи и...
GDPR создавали, чтобы дать гражданам ЕС больше контроля над персональными данными. И с точки зрения количества жалоб цель была «достигнута»: за прошедший год европейцы стали чаще сообщать о наруш...