Как работают сеансы в Google Analytics
Автор: Том Каппер (Tom Capper), консультант по аналитике в агентстве интернет-маркетинга Distilled
Как устроены сеансы в Google Analytics, в каких случаях этот показатель может возвращать неожиданные результаты, и как сеансы могут влиять на время пребывания на странице (Time on page)? Рассмотрим в статье.
Google Analytics используют все, а многие специалисты – на ежедневной основе. Данные из GA учитываются практически везде, начиная от решений о вложении средств и заканчивая отчётами о достигнутых результатах. Поэтому важно понимать основные «строительные блоки» этой платформы.
Когда вы впервые внедряете Google Analytics на свой сайт, то получаете код отслеживания и добавляете его на каждую страницу, чтобы при каждой её загрузке система регистрировала просмотр страницы. На рисунке ниже мы обозначили этот показатель буквой «P» (pageview), а два других типа обращений – события и транзакции – буквами «Е» (event) и «Т» (transaction) соответственно.
Работа Google Analytics заключается в том, чтобы получить и объединить эти данные по взаимодействиям в так называемые «сеансы», которые мы обозначили чёрным. Если на сайте было зафиксировано несколько сеансов из одного и того же браузера, то это будет один пользователь, которого мы пометили розовым цветом. При этом изображённые выше восемь обращений могут быть одним длинным сеансом.
В данной статье мы сосредоточимся на том, как Google Analytics разделяет эти типы взаимодействий на сеансы. Для этого у нас есть несколько реальных примеров.
В целом понять, как происходит разделение сеансов, можно на примере супермаркета. Допустим, покупатели идут по улице (это будет источник), затем они заходят непосредственно в магазин, берут нужные товары и идут на кассу. Так может выглядеть длинный сеанс.
В случае магазина отдельные сеансы выделить несложно, поскольку здесь всё предельно понятно и однозначно. Однако в случае веб-сайтов, когда люди отходят от компьютера, а затем возвращаются, становится труднее точно разделить сеансы, поскольку вы не знаете, когда именно эти люди приходят и уходят.
В упрощённом виде сеанс может выглядеть так: пользователь пришёл на сайт из Google, перешёл на страницу категории, а затем – на страницу товара и оформил покупку. Мы получили один длинный сеанс, а источником являлся Google. Давайте посмотрим, какие вещи могут нарушать регистрацию этих данных и разбивать один сеанс на несколько.
Что может приводить к разбивке сеансов в GA
- Часовой пояс
Первый и наиболее раздражающий фактор – это часовой пояс, установленный в настройках Google Analytics. Полночь в этом часовом поясе может разбить сеанс на два.
Допустим, на часах 12 часов ночи, а какой-то пользователь просматривает сайт, чтобы приобрести товар. Google Analytics разделит этот сеанс на два отдельных сеанса, поскольку у одного сеанса не может быть двух дат. В результате мы получим один сеанс с источником «Google» и второй, источником у которого будет страница сайта. В итоге мы получим self-referral трафик – пока не исключим его в настройках, что также не сильно поможет в данном случае.
- Получасовые «кофе-брейки»
Эта проблема возникает, когда пользователь отлучается от компьютера. Например, чтобы сделать себе кофе. Когда вы находитесь в крупном супермаркете и идёте в кафе, чтобы выпить чашку кофе, то все ваши передвижения будет представлять собой один длинный сеанс. В Google Analytics, если пользователь отлучится на полчаса, сеанс по умолчанию будет разделён на два.
У одного сеанса целевой страницей будет страница категории, а источником – Google, тогда как у второго сеанса посадочной страницей будет блог, и вы опять получите self-referral трафик, поскольку, когда пользователь вернётся, то опять начнёт перемещаться по сайту.
Этот временной промежуток, 30 минут, можно менять в настройках. Однако большинство пользователей Google Analytics этого не делают. Кроме того, единственно правильной цифры тут не существует.
- Пользователь уходит с сайта и возвращается
Следующая проблема возникает в том случае, если пользователь покидает сайт, а затем возвращается назад. Если человек перешёл на сайт из Google, побродил по нему, а затем снова перешёл на него из Bing, то логично ожидать, что эти действия будут учтены как два разных сеанса с разными источниками.
Но бывают ситуации, когда сеанс не должен разбиваться, но тем не менее это происходит. В частности, процесс нарушается, если в нём задействованы внешние платёжные сервисы.
Например, если пользователь перейдёт со страницы категории в PayPal, чтобы оплатить заказ, то пока PayPal не будет исключён из вашего списка referral, это будет одна сессия со входом из Google и вторая сессия со входом со страницы оплаты. Хотя на самом деле это один и тот же сеанс.
Последняя проблема, которую мы рассмотрим, касается не того, как разделяются сеансы, а того, как они устроены.
- Возвратные прямые переходы
Если вы перешли из Google на страницу категории, уехали в отпуск, а потом использовали закладку или просто ввели URL в адресную строку, чтобы вернуться на сайт, то это должны быть два разных сеанса – один из Google и второй из Direct. И это вполне логично, не правда ли?
По факту же, поскольку большинство отчётов Google Analytics учитывают последний непрямой переход, то вы получите два сеанса со входом из Google. Опять же, вы можете изменить время ожидания в настройках.
Итак, мы рассмотрели несколько ситуаций, когда сеансы могут работать не так, как ожидается.
В качестве бонуса мы рассмотрим, как эти особенности сеансов в Google Analytics влияют на конкретную метрику – время на странице. Наша цель – убедить вас перестать её использовать.
Три сценария, когда особенности сеансов влияют на время на странице
Здесь важно понимать следующее: поскольку Google Analytics обычно располагает очень небольшим количеством данных для работы, система знает только, что пользователь прибыл на страницу, регистрирует просмотр и на этом сбор данных может завершиться. Если пользователь посетил лишь одну страницу за визит, GA не будет знать, как долго он пробыл на этой странице – 10 секунд или несколько часов.
В данном случае у них нет дальнейших данных, с которыми можно было бы работать. Поэтому они говорят: «Ок, мы не собираемся включать эту информацию в среднее время на странице». Таким образом мы получаем следующую формулу:
Время на странице = общее время : (просмотры – eходы)
Однако у этой системы есть недостатки, нарушающие учёт данных в некоторых ситуациях. Давайте рассмотрим эти сценарии подробнее.
- Интуитивное время на странице = реальное время на странице
В первом сценарии пользователь попадает на страницу. Система регистрирует просмотр. Отлично. Через 10 секунд пользователь запускает некое событие, добавленное этим сайтом. Через 20 секунд он переходит на другую страницу на сайте. В этом случае всё работает так, как и ожидалось, поскольку есть следующая страница на сайте, поэтому у Google Analytics есть дополнительные данные о ещё одном просмотре страницы, который произошёл после первого. GA знает, что пользователь пробыл на странице 20 секунд.
В данном случае интуитивное время на странице равно 20 секундам, а реальное время также равно 20 секундам.
- Интуитивное время на странице больше, чем измеренное
Давайте представим, что мы получили просмотр страницы, а спустя 10 секунд – событие, однако на этот раз вместо того, чтобы бродить по сайту, пользователь просто ушёл. Поэтому никаких данных нет, но Google Analytics знает, что пользователь был на сайте в течение 10 секунд.
Таким образом, интуитивное время на странице по-прежнему составляет 20 секунд. Это то время, которые пользователь действительно потратил, глядя на страницу. Однако измеренное время будет равно 10 секундам.
- Измеренное время на странице равно нулю
Допустим, пользователь просматривает страницу в течение 20 секунд и уходит. Он не запускает событие. Поэтому интуитивное время на странице составляет 20 секунд, а измеренное – равно нулю.
Если мы попробуем вычислить среднее время для страницы, которая появлялась в этих трёх сценариях, то можем предположить, что оно будет равно 20 секундам, поскольку именно столько времени мы на самом деле потратили. Однако, когда мы посмотрим на данные, доступные в Google Analytics, то нашей следующей догадкой будет цифра в 10 секунд.
Какая же цифра будет на самом деле с учётом упомянутой выше формулы?
Общее время на странице по всем трём сценариям будет равно 30 секундам. Разделив его на разность количества просмотров (3) и уходов (2), в результате мы получим 30 секунд как среднее время по этим трём сеансам. При этом оно будет длиннее каждого из них. И это не имеет никакого смысла с учётом приведённых выше данных.
Отсюда последний совет: откажитесь от использования среднего времени на странице как отчётного показателя.
___________________________________________________________