Временной анализ: паттерны активности, определение часового пояса и режима дня
Временной анализ: паттерны активности, определение часового пояса и режима дня
Время — один из самых информативных параметров в социальных сетях. Когда цель публикует посты, комментирует, ставит лайки, в какое время суток активна — все это может рассказать о ее режиме дня, часовом поясе, роде занятий, психотипе и даже о значимых событиях в жизни. Временной анализ позволяет выявить паттерны, которые неочевидны при просмотре отдельных публикаций. Данная статья посвящена методикам сбора и анализа временных данных в SOCMINT.
- Определение часового пояса: Где географически находится цель.
- Выявление режима дня: Время сна, работы, отдыха.
- Идентификация профессиональной деятельности: Работа в стандартное рабочее время или ненормированный график.
- Обнаружение аномалий: Отклонения от обычного паттерна (стресс, отпуск, важное событие).
- Верификация алиби: Согласованность временных меток с заявленными событиями.
- Прогнозирование: Когда цель вероятнее всего будет онлайн.
Типы временных данных в социальных сетях
"отредактировано 10 минут назад"
Методология временного анализа
- Ручной сбор:
- Прокрутка ленты, запись дат и времени постов.
- Создание таблицы (Excel/Google Sheets) с колонками: дата, время, тип активности (пост, комментарий, лайк, репост).
- Автоматизированный сбор:
- Instaloader (Instagram): Скачивание постов с временными метками.
- VK API: Получение времени публикации постов и комментариев.
- Telethon / Pyrogram (Telegram): Сбор времени сообщений.
- Twint / snscrape (Twitter): Сбор твитов с временными метками.
- Структурирование данных:
Этап 2: Визуализация временных данных
- Гистограммы активности:
- По часам суток: когда цель наиболее активна.
- По дням недели: выходные vs будни.
- По месяцам: сезонные паттерны.
- Календарные тепловые карты:
- Визуализация активности по дням года.
- Инструменты: Python (matplotlib, seaborn), Excel, Google Sheets.
- Таймлайны:
Пример кода (Python + matplotlib):
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime
# Загрузка данных (предположим, CSV с колонкой 'timestamp')
df = pd.read_csv('activity.csv')
df['datetime'] = pd.to_datetime(df['timestamp'])
df['hour'] = df['datetime'].dt.hour
df['dayofweek'] = df['datetime'].dt.dayofweek
# Гистограмма по часам
plt.figure(figsize=(10, 6))
plt.hist(df['hour'], bins=24, edgecolor='black')
plt.title('Активность по часам суток')
plt.xlabel('Час')
plt.ylabel('Количество публикаций')
plt.xticks(range(0, 24))
plt.show()
# Тепловая карта по дням недели и часам
pivot = pd.crosstab(df['dayofweek'], df['hour'])
plt.figure(figsize=(12, 8))
plt.imshow(pivot, aspect='auto', cmap='YlOrRd')
plt.colorbar(label='Количество')
plt.xlabel('Час')
plt.ylabel('День недели (0=пн, 6=вс)')
plt.show()Этап 3: Определение часового пояса
Часовой пояс можно определить, если известны:
- Геолокация (из других источников).
- Паттерн активности (сон ночью по местному времени).
- Время восхода/заката на фото.
- Анализ времени сна:
- Если активность резко падает с 00:00 до 07:00 (по UTC), а пик в 15:00-18:00 — вероятный часовой пояс UTC+3 (Москва).
- Сравнение с временем восхода/заката:
- На фото видно солнце низко над горизонтом. Определить примерное время съемки по теням. Сравнить с таблицами восхода/заката для предполагаемых регионов.
- Сверка с геолокацией:
- Метод "часового пояса по событиям":
На основе гистограммы активности можно определить:
- Утренний тип ("жаворонок"): Пик активности 06:00-12:00.
- Вечерний тип ("сова"): Пик активности 18:00-00:00.
- Ночной тип: Активность в 00:00-06:00.
- Рабочий режим: Активность в будни с 09:00-18:00, выходные — иначе.
- Ненормированный график: Активность в разное время, без четких пиков.
- Декретный отпуск / безработный: Активность равномерно в течение дня.
Отклонения от обычного паттерна могут указывать на:
- Смена часового пояса: Сдвиг времени активности (перелет).
- Стресс / болезнь: Резкое снижение или повышение активности в необычное время.
- Важное событие: Резкий всплеск активности (свадьба, рождение ребенка, происшествие).
- Отпуск: Активность в будни днем (обычно в рабочее время — тишина).
- Блокировка / смена аккаунта: Внезапное прекращение активности.
- Статистические методы: Z-score, IQR (межквартильный размах).
- Визуальный анализ: Резкие пики или провалы на графиках.
Этап 6: Анализ временных меток в мультимедиа
Фото и видео содержат временные метки в EXIF, которые могут отличаться от времени публикации.
- Задержка между съемкой и публикацией: Может указывать на цензуру, обдумывание, или что фото не принадлежит автору.
- Согласованность: Время съемки должно соответствовать времени, указанному в посте ("сегодня утром").
- Хронология событий: Последовательность фото.
Практические методики временного анализа
Методика 1: Определение часового пояса цели
- Сбор временных меток всех постов за последние 3 месяца.
- Построение гистограммы активности по часам UTC.
- Выявление "мертвой зоны" — периода минимальной активности (предположительно сон).
- Расчет: Если мертвая зона с 23:00 до 06:00 UTC, то цель вероятно в UTC+3 (Москва, Стамбул, Киев). Если с 03:00 до 10:00 UTC — UTC-5 (Нью-Йорк).
- Верификация: Сравнить с геолокациями из других источников (фото, чекины).
- Исходные данные: Цель утверждает, что в день X была в городе Y с 10:00 до 18:00.
- Сбор временных меток:
- Анализ:
- Если посты публиковались в 11:00, 14:00, 17:00 — это не противоречит нахождению в городе.
- Если в 12:00 есть чекин в кафе в городе Y — подтверждение.
- Если в 15:00 опубликовано фото с геотегом другого города — алиби ложно.
- Вывод: Степень подтверждения или опровержения алиби.
Методика 3: Прогнозирование активности
Для оперативных задач может быть полезно знать, когда цель вероятнее всего будет онлайн.
- Анализ паттерна за последние 30 дней.
- Выявление окон активности:
- Утро: 08:00-09:00 (проверка соцсетей после пробуждения).
- День: 12:00-13:00 (обеденный перерыв).
- Вечер: 19:00-23:00 (основное время).
- Прогноз: Цель вероятнее всего ответит на сообщение в 20:00-21:00 по местному времени.
Методика 4: Выявление значимых событий по временным аномалиям
- Построение графика активности за весь период.
- Выявление аномальных пиков:
- Анализ контента в этот период:
- Поиск корреляций с внешними событиями (новости, даты).
Инструменты для временного анализа
Instaloader, VK API, Telethon, snscrape
Python (matplotlib, seaborn, plotly), Excel, Google Sheets
Timeline JS, Google Sheets Timeline
Google Calendar (для наглядности)
Кейс: Анализ активности подозреваемого в деле о киберпреступлении
Задача: Определить, работает ли подозреваемый в ночное время, что характерно для хакерской активности.
- Сбор данных: 500 постов и комментариев из VK, Instagram, Twitter за 6 месяцев.
- Визуализация:
- Сравнение с режимом: В рабочие дни (пн-пт) активность сдвинута на ночь. В выходные — дневная активность.
- Корреляция: В периоды публичных утечек (связанных с делом) наблюдались всплески активности в 03:00-04:00.
- Вывод: Паттерн активности соответствует ненормированному ночному графику, что косвенно подтверждает занятость в ночные часы, характерные для киберпреступной деятельности.
Временной анализ превращает разрозненные временные метки в целостную картину режима дня, географического положения и значимых событий в жизни цели. Паттерны активности — один из наиболее объективных источников информации, так как их сложнее фальсифицировать, чем текстовый контент. Умение собирать, визуализировать и интерпретировать временные данные — ключевой навык SOCMINT-специалиста.