Как системы веб-аналитики собирают данные
Коды учета
Данный метод основан на внедрении определенного кода в исходный текст страниц веб-сайта. Внедряемый код называется счетчиком или кодом системы веб-аналитики. При каждой загрузке страницы внедренный код формирует и передает серверу расширенную информацию о посетителе, такую как сведения о поддержке технологий Adobe Flash и Java в веб-браузере, разрешение экрана, ссылка на страницу, с которой посетитель пришел на анализируемый сайт и многое другое.
Код учета является скриптом Javascript, который выполняется в веб-браузере посетителя. В серой теории код учета может основываться на Adobe Flash или другой технологии, однако на практике для учета используется именно Javascript, который отлично поддерживается веб-браузерами (кроме браузеров некоторых мобильных устройств).
В системах, основанных на кодах учета можно выделить два типа:
Это профессиональные инструменты, разработанные для анализа посещаемости сайта. Большинство веб-аналитических систем – это коммерческие продукты с довольно высокой стоимостью.
Примеры: Google Analytics, Omniture, Index Tools.
К этому типу относятся счетчики рейтингов и каталогов веб-ресурсов. Пузомерки дают ограниченные сведения о посетителях, поскольку их главное назначение – не аналитика в чистом виде, а участие в рейтинге и публичное предоставление информации. Код пузомерки может отображаться на сайте в виде счетчика посещаемости.
Примеры: top.bigmir.net, catalog.i.ua, liveinternet.ru.
Идентификация посетителей в таких системах осуществляется на основании данных куки, которые передаются при запросе каждой страницы. На сегодняшний момент это наиболее точный способ отслеживания посетителей.
Поскольку код учета является небольшой программой на языке Javascript, то учет посещаемости невозможен в тех случаях, когда Javascript не работает. А не работает он в содержимом сайтов, не основанном на html. Таким образом, невозможно отследить посещения RSS-каналов, загрузку pdf- и doc-файлов.
Кроме того, необходимо помнить, что не все посетители веб-сайта – это люди из плоти и крови. Огромное количество посещений создается ботами – программами, которые индексируют выбранные страницы или весь сайт с определенной целью. Такими ботами могут быть поисковые роботы, которые индексируют содержимое страниц. Боты не интерпретируют Javascript-код, поэтому не фиксируются системами веб-аналитики. В ряде случаев полезно знать о посещении веб-сайта роботами: например, для того чтобы определить как часто поисковый бот заглядывает на сайт для индексации содержимого.