March 21, 2018

Беззащитные данные: как Facebook оказалась в центре самого большого скандала в истории

Евгений Черешнев

Cambridge Analytica придумывала, как высасывать из пользователей Facebook максимальное количество информации: она делала всевозможные веселые приложения и тесты, а потом составляла профили, помогающие манипулировать людьми

Акции Facebook падают — со вчерашнего дня капитализация компании «провалилась» на $40 млрд. Причина — масштабный и нехорошо пахнущий скандал: бывший сотрудник компании Cambridge Analytica (далее CA) Крис Уайли (Chris Wylie) дал интервью The Guardian, в котором признался, что компания использовала данные пользователей Facebook без их ведома, для профилирования и «промывания мозгов».

А конкретно — для активной доставки контента, влияющего на решения людей, в том числе во время выборов президента США. Крис признался, что покровителем затеи был не кто иной, как Стив Бенон, доверенный советник Трампа, и именно он придумал проекту название «psychological-warfare mindfu@k tool» ( если смягчить перевод — «инструмент для запудривания мозгов»). Об этой истории на данный момент написала практически вся западная пресса: The Guardian, NY Times, Observer, и маятник только начинает раскачиваться, ибо все вопросы, которые витали в воздухе относительно понятия «приватность» внезапно стали как никогда актуальными и наглядными. Оказалось, что как минимум одна коммерческая компания может влиять на то, кто будет президентом любой развитой страны.

Ситуация очень сложная с технической точки зрения, поэтому большинство спикеров не комментируют, что, собственно, произошло и почему это настолько важно, что инвесторы сбрасывают акции Facebook. Мне кажется, важно объяснить суть, а для этого вспомним порядок событий. Изложение сознательно упрощено, чтобы не уходить в технические дебри:

1) Компания Cambridge Analytica во главе с СЕО Александром Никсом (Alexander Nix) понимает, что данные о человеке можно использовать для манипуляции общественным мнением.

2) Компания поднимает инвестиции, нанимает инженеров, чтобы сделать программное обеспечение, способное анализировать поведенческие данные человека: что пользователь пишет в интернете, с кем общается, его лексикон, маршруты движения, предпочтения в литературе, фильмах и музыке и т. д. На основании этих данных делаются конкретные заключения: что надо сказать человеку и в каких выражениях/форме, чтобы он поверил и отреагировал предсказуемо — так, как надо заказчику.

3) Компания проводит тесты своего софта и понимает, что она не ошиблась: условно, если холерикам и сангвиникам, собирателям и революционерам давать разный контент и упаковывать одни идеи в разные сообщения — кому-то видео чиновника со скрытой камеры, кому-то скриншот почтового ящика Хилари Клинтон, кому-то подкаст никому не известного блогера, — люди реагируют с потрясающим уровнем конверсии (соотношение кликов к количеству показанной рекламы).

В CA понимают — это золотая жила, но для того, чтобы развернуться, им нужно еще больше данных о людях.

4) Cambridge Analytica придумывает ход конем, чтобы высасывать из пользователей Facebook максимальное количество информации: о них, их друзьях и знакомых, а главное — дополнительную личную информацию для составления психологического портрета пользователей. Они своими руками и руками внешних подрядчиков начинают делать всевозможные веселые приложения и онлайн-тесты, пройдя которые, можно узнать, условно, «кто ты во «Властелине колец» и «кто ты на самом деле по гороскопу», и поделиться смешным рейтингом с друзьями.

Затея срабатывает — люди не чуют подвоха, соглашаются на любые условия работы приложения и начинают отдавать кучу личной информации о себе и своих друзьях. Эти приложения по сути представляют собой психологическое анкетирование (до 2015 года это было возможно в космических масштабах и почти без ограничений, в 2015-м Facebook изменил свой API и запретил приложениям собирать большую часть информации о «друзьях друзей», но это драматично не повлияло на бизнес CA, ибо их главный конек был и остается в социальном инжиниринге).

5) Помимо FB компания Cambridge Analitica покупает данные у дата-брокеров (на рынке более 2000 компаний, в том или ином виде специализирующихся на перепродаже наших данных — истории покупок, истории поиска и веб-серфинга и т. д.). Сопоставляя данные профилей FB, покупную информацию и данные из «веселых» приложений и «даркнета», где публикуют, например, украденные хакерами базы данных, они получают возможность делать предсказания о конкретных людях с колоссальной точностью.

По исследованиям компании Biolink.Tech, всего можно выделить 14 типов данных. Например, чтобы вы понимали возможности: с высокой достоверностью даже по анонимным данным можно определить пол человека, расу, профессию, социальный статус и примерный уровень доходов. А также личные качества: гей или натурал, изменят жене/мужу или нет, за кого будет голосовать из списка кандидатов, шовинист или нет, расист или нет, правые или левые взгляды — список классификаций почти бесконечный.

Как писал Джордж Оруэлл, «кто контролирует прошлое, контролирует будущее». И тут это как нельзя точно описывает суть — если ты знаешь, что делал человек последние 10 лет, ты почти гарантированно сможешь сказать, что он будет делать завтра.

6) CA убедилась, что машинка по поиску целей работает. С каналами доставки мозговых бомб тоже все было понятно — социальные сети. Осталось решить простую проблему — контент. Они начали в прямом смысле планировать кампании по изменению общественного мнения через компромат, настоящий и выдуманный контент, компрометирующий или, наоборот, выставляющий в хорошем свете конкретного человека или фракцию. Гендиректор компании открыто признался в одном из своих интервью — «не важно, правдива новость или нет, если в нее поверят». Это в сути своей отражает бизнес-модель CA: собрать базу из 50 млн человек, разбить их по типам, понять цель заказчика и начать одним людям скармливать одно, другим — другое, третьим — третье, чтобы все начали ругаться друг с другом, но в сухом остатке была достигнута цель — победа кандидата Х на выборах или принятие решения на референдуме по выходу Англии из Евросоюза. Автор не утверждает, что в CA это сделали, лишь указывает, что у них могла быть такая возможность, компания открыто продавала свои услуги на рынке.

The Guardian упоминает о том, что они делали питч даже компании «Лукойл», которая не совсем поняла, как их возможности связаны с нефтяным бизнесом, и якобы на этом разговор и закончился. Зная косность и консервативность нефтянки и то, как «быстро» они принимают стратегические решения вне своей прямой экспертизы, полагаю, что «Лукойл» — ложный след. Это лишь пример разнообразия клиентской базы CA.

6) Facebook напряглись, что у них в пуле есть партнер, который высасывает из их абонентской базы столько данных. По заявлению вице-президента Facebook Пола Греваля (Paul Grewal), FB отрезал CA доступ к данным после изменения правил в 2015-м. Он четко обозначил позицию: мол, они нарушили наше лицензионное соглашение, и мы потребовали письменных доказательств, что данные, полученные о наших пользователях, уничтожены. Были ли они уничтожены на самом деле — неизвестно, но в этом сейчас будет разбираться экспертная группа, автор уверен, что власти UK и EU выдадут соответствующий ордер.

Евгений ЧерешневИсточник