May 24, 2024

Отслеживание спамного трафика в Яндекс Метрике

Дано:

В отчете Яндекс Метрики – Поисковые системы

В начале февраля замечен резкий всплеск трафика

Задача: убрать из отчета спамный трафик и отобразить корректные данные за период 2023-2024 гг.

Данный всплеск был из поисковой системы Яндекс. Дополнительно можно увидеть, что есть трафик с utm - метками. Первая мысль неужели Яндекс присваивает рекламный трафик поисковому?

Но на деле оказалось, что специалисты по рекламе используют другие метки.

Далее начала смотреть из каких стран и городов пошел всплеск трафика и с фейковыми рекламными метками.

Далее исключаю из отчета Китай, фейковые рекламные метки и ставлю роботность – только люди.

Но можно увидеть, что полностью спамный трафик исключить не удалось.

Далее добавили отслеживание UserAgent (Заголовок запроса User-Agent - это строка с характеристиками, по которым сервера и сетевые узлы могут определить тип приложения, операционную систему, производителя и/или версию пользовательского агента.) И видим, что есть определенный UserAgent в спамном трафике.

Как в GTM настроить отслеживание UserAgent:

Функционал Яндекс.Метрики не позволяет исключить спамный трафик из отчетов статистики

  1. Мы видим, что всплеск трафика пошел из таких регионов как Китай, Москва (Россия), а также местоположение со статусом «Не определено»
  2. Мы добавили параметр визитов UserAgent в Яндекс.Метрику (с 24 марта 2024 года) и он подтвердил нашу гипотезу – Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Mobile Safari/537.36
  3. Чтобы построить отчет, где мы хотим увидеть трафик без данного значения UserAgent, мы не можем поставить условие с отрицанием. Это подтвердила поддержка Яндекс.Метрики – https://skr.sh/sPAnlkqglTI

Промежуточные итоги в определении признаков спамного трафика

  1. Страна со спамными визитами – Китай
  2. Визиты, которые содержат:
    utm_medium=rtb-cpm
    utm_medium=vdo.cpm
  3. Местоположение «Не определено»

Решающим элементом стали IP-адреса в отчете Яндекс.Метрики по спамным признакам. Когда убрали конкретные IP-адреса, визиты из Китая автоматически убрались, поэтому частично остались Германия и Финлядния, визиты которых также убрала.

Финальный вариант

Параметры, которые я предлагаю учитывать при заполнении отчетов еженедельных

1. Роботность: только люди

2. Источники: последний значимый – Яндекс

3. IP – !~45.11.95.xxx|93.177.79.xxx|185.26.30.xxx|45.11.95.xxx|185.191.56.xxx

4. Utm_medium – !~rtb-cpm|vdo.cpm

5. География: не Германия не Финлядния (возможно еше не Франция)

Как это выглядит в отчете. Слева с отфильтрованным трафиком по спамным признакам (сплошная линия). Справа общий трафик со спамом (пунктирная линия)