Анализ информационных кампаний: выявление скоординированных действий, ботов и вбросов
Анализ информационных кампаний: выявление скоординированных действий, ботов и вбросов
Отдельные фейковые новости и манипуляции — это лишь вершина айсберга. В современном информационном пространстве дезинформация часто распространяется в рамках скоординированных кампаний — организованных действий групп аккаунтов, ботов, троллей и медиаресурсов, направленных на формирование определенного общественного мнения. Данная статья посвящена методам выявления, анализа и документирования таких кампаний.
Что такое скоординированная информационная кампания?
Скоординированная кампания — это использование множества аккаунтов, страниц, сайтов и других ресурсов для продвижения определенного нарратива, часто с нарушением правил платформ и использованием неаутентичного поведения.
Признаки скоординированной кампании:
Резкий рост числа постов на определенную тему в короткий промежуток времени
Множество аккаунтов публикуют идентичные или очень похожие сообщения
Аккаунты начинают и прекращают активность одновременно
Подписки, репосты, лайки между аккаунтами образуют плотный кластер
Общие шаблоны (написанные фразы, хэштеги)
Повторяющиеся формулировки, ошибки, хэштеги
Созданы недавно, мало личного контента, накрученные подписчики
Управляется скриптом, публикует по расписанию, репостит
Реальный человек, оплачиваемый для продвижения определенных нарративов
Создан давно, не использовался, затем активирован для кампании
Почти идентичный аккаунт (зеркало)
Сеть из сотен аккаунтов, управляемая одной группой
Методология выявления скоординированных кампаний
Этап 1: Обнаружение аномальной активности
Инструменты для обнаружения всплесков:
- CrowdTangle: Анализ распространения постов в Facebook/Instagram.
- TweetDeck + search operators: Мониторинг Twitter в реальном времени.
- Telegram Analytics (TGStat, Telemetr): Динамика упоминаний.
- Google Trends: Общая популярность темы.
Этап 2: Выявление подозрительных аккаунтов
После обнаружения всплеска — сбор подозрительных аккаунтов, участвующих в нем.
- Дата создания: Большинство аккаунтов создано недавно (дни, недели).
- Имена / юзернеймы: Сгенерированные (СлучайноеИмя123).
- Аватар: Отсутствует, стоковый, или украденный (обратный поиск).
- Активность: Только репосты (оригинального контента нет), нет личных постов.
- Содержание: Только на одну тему, копипаста.
- Взаимодействия: Подозрительные репосты и лайки.
Этап 3: Анализ сетевых связей (социальный граф)
Построение визуализации связей между подозрительными аккаунтами.
- Звездообразный кластер: Один аккаунт (центр) — источник, остальные (периферия) репостят.
- Полносвязный кластер: Аккаунты подписаны друг на друга (неестественно).
- Изолированный кластер: Не взаимодействует с обычными пользователями.
Этап 4: Анализ контента и лингвистики
- Повторяющиеся фразы: Одинаковые формулировки, хэштеги.
- Синтаксические конструкции, ошибки: Однотипные ошибки указывают на один источник.
- Средняя длина сообщений: Неестественная краткость или одинаковость.
- Python + NLTK / spaCy: Частотный анализ, кластеризация текстов.
- LSTM / BERT (продвинутый уровень): Классификация авторства, выявление одного автора.
Этап 5: Анализ временных паттернов
Построение временной шкалы активности.
- Синхронный старт / финиш: Аккаунты начинают постить одновременно (поработали 2 дня и замолкли).
- Периодичность: Публикация через равные промежутки (бот).
- Регулярное «дежурство»: Активность в одни и те же часы (рабочие часы троллей).
Этап 6: Анализ распространения в медиасреде
- Первоисточник (источник утечки/вброса). Откуда пошла тема?
- Сайты-подсайты: Созданные специально для кампании (список).
- Репост другими СМИ: Кто подхватил, на каком уровне эскалации?
- Нарратив (история, смысл): Как меняется со временем?
Этап 7: Документирование кампании
Фиксация данных для анализа и возможного использования.
- Список аккаунтов (ID, дата создания, имя, юзернейм, URL).
- Скриншоты (с адресной строкой браузера, датой).
- Список публикаций.
- Даты начала/пика/затухания кампании.
Методика 1: Поиск ботов по шаблону имени
Боты часто используют шаблонные имена: «Имя_Фамилия_число», «Слово + число».
- Собрать 100+ подозрительных аккаунтов.
- Найти общие шаблоны в именах.
- Поискать другие аккаунты с такими же шаблонами.
- Проанализировать их активность (та же тематика, одновременный старт).
Методика 2: Анализ сетевых связей (Gephi)
- Собрать 200+ аккаунтов (подозрительных и обычных).
- Внести данные в Gephi (таблицы: ID, связи «подписан на», репостнул у»).
- Визуализировать граф (алгоритм Force Atlas 2).
- Найти кластеры с высокой плотностью связей (неестественную).
- Изучить их (те же даты создания, те же формулировки).
Методика 3: Временной анализ активности
- Собрать таймстампы публикаций подозрительных аккаунтов.
- Построить гистограмму активности по часам.
- Сравнить с нормальным распределением (обычные аккаунты).
- Обнаружить пики в нехарактерное время (ночью).
- Обнаружить повторяющиеся интервалы (каждые 4 часа).
Методика 4: Проверка на предмет связи с известными фермами троллей
Существуют базы известных тролль-ферм (например, IRA — Internet Research Agency, Агентство интернет-исследований, АНО «Диалог» — российские, ЦИПсО — украинские, Trolls from Rwanda — наемные).
- IP-адреса (если есть доступ). Совпадают ли с IP известных ферм?
- Языковые особенности (орфография, сленг) — характерные для конкретного региона.
- Время активности (рабочее время часового пояса).
Кейс: Выявление бот-фермы в поддержку корпорации
Задача: Внезапно тысячи постов в соцсетях хвалят корпорацию N (на фоне скандала). Выявить ботов.
- Сбор данных: Через Twitter API (или парсинг) собраны аккаунты, упоминавшие корпорацию N за 48 часов (5000 аккаунтов).
- Выявление подозрительных:
- 3000 аккаунтов созданы в течение последнего месяца.
- Имена:
user_1234,client_5678. - Аватары: геометрические фигуры, отсутствуют.
- Анализ контента:
- 2500 из 3000 написали один из 10 шаблонных текстов («N — лучшая!», «Я люблю N!»).
- Ошибки: одинаковые («лучшая» написано как «лучшаяя»).
- Временной анализ:
- Анализ сети:
- Все подозрительные аккаунты подписаны на @Official_N (аккаунт корпорации) и друг на друга. Искусственная связка.
- Триангуляция: Независимых обзоров, положительных отзывов от реальных пользователей нет. Официального заявления — нет.
- Вывод: Бот-ферма (или скоординированные неаутентичные действия). Искусственная поддержка. Тысячи аккаунтов созданы для этой кампании.
Инструменты для анализа кампаний
Анализ распространения в Facebook/Instagram
Оценка вероятности бота (Twitter)
Визуализация распространения (Twitter)
Telegram Analytics (TGStat, Telemetr)
Python (pandas, networkx, matplotlib)
- Аккаунты реальных людей: Не все активные сторонники — боты. Осторожно: обвинение реального человека.
- Правила платформ: Некоторые методы (массовый сбор данных) нарушают правила.
- Атрибуция: Даже доказанная скоординированная кампания может не доказывать, кто за ней стоит. Осторожно с обвинениями конкретного правительства, организации без прямых улик.
Выявление скоординированных кампаний — это детективная работа, сочетающая сбор данных, сетевой анализ, лингвистику и временной анализ. Боты, тролли и фермы аккаунтов оставляют множественные цифровые следы: паттерны регистрации, шаблонный контент, синхронную активность, аномальные сетевые связи. Комбинация инструментов (CrowdTangle для соцсетей, Gephi для графов, Botometer для проверки ботов) и аналитического мышления позволяет выявить искусственную активность и понять реальные масштабы информационной операции.