Finikoff Channel | Мануалы
July 18

Песочница сайтов, теневые баны и другие ловушки от Google — что нужно знать для успешной работы? 

В конце мая произошла крупнейшая утечка конфиденциальных данных Google — в ночь с 27 на 28 мая около 2500 документов оказались в сети. Известно, что информация о возможности утечки поступила от анонимного пользователя на почту основателя Moz.com, Ренда Фишкина, еще 5 мая, но тогда на это не обратили внимание.

Теперь, когда шумиха немного поутихла, давайте разберем, что именно попало в сеть и как сеошникам использовать эту информацию в своей работе.

Рассекречено: метрика авторитета домена

Использование метрики «siteAuthority» отрицалось сотрудниками Google, так как это означало бы, что авторитет сайта и дата его создания влияют на ранжирование страницы в поиске.

Хотя из утекших документов неясно, как именно учитывается эта метрика и насколько сильно она влияет на результаты поиска, сам факт ее существования и применения — это значимая новость.

Рассекречено: данные о кликах используются для ранжирования в поиске

Формально это не новость, так как многие поисковые системы используют данные о частоте кликов пользователя для улучшения результатов поиска. Системы анализа кликов, такие как NavBoost и Glue, существуют примерно с 2005 года и работают следующим образом:

1. Сбор данных о кликах:
- Система фиксирует каждый клик пользователя по ссылкам в результатах поиска.

2. Анализ поведения:
- На основе этих данных система анализирует поведение пользователей, чтобы понять, какие результаты они считают наиболее полезными.

3. Корректировка результатов:
- Система использует собранные данные для корректировки алгоритмов ранжирования, чтобы в будущем предоставлять пользователям более релевантные результаты поиска.

Но просто кликов недостаточно. В утекших документах содержатся сведения о кликах под кодовым названием «голоса» от пользователей — «избирателей», а также данные о:

- неудачных кликах;
- кликах по странам и городам;
- самых длинных кликах в течение интернет-сессии.

Последний пункт указывает на то, что поисковик отслеживает время пребывания на сайте. В этом не было бы ничего страшного, если бы Google не отрицал ранее факт отслеживания кликов.

Инженер Google Search Пол Хаар упомянул в своем резюме 2019 года использование сервиса учета кликов NavBoost, хотя ранее отрицал этот факт. Его коллега, Гарри Ийеш, на конференции SMX West в 2016 году также заявлял, что «непосредственное использование кликов в ранжировании было бы ошибкой».

Такая ложь в будущем может привести Google к судебным искам от западных пользователей, которые особенно чувствительны к вопросам конфиденциальности.

Рассекречено: "песочница" сайтов — существует!

В августе 2019 года представители компании отрицали само существование фильтра Sandbox, или "песочницы".

«Песочница» сайтов — это фильтр, который держит новые сайты под особым контролем, скрывая их в теневом фильтре. Хотя сайт формально ранжируется по всем показателям, фактически он не появляется в результатах поиска.

Фильтр Sandbox действует три месяца, после чего снимается, если содержимое сайта соответствует правилам поисковой системы.

Рассекречено: ссылки на достоверные источники улучшают ранжирование сайта

При этом больший вес имеют ссылки на сайты, которые занимают высокие позиции в выдаче, а также на новостные ресурсы. Использовать это в работе несложно: при наполнении сайтов контентом ссылайтесь на официальные источники, первоисточники и крупные сайты.

Например, если рассказываете о сливе данных Google, укажите ссылку на ресурс со слитыми документами как на первоисточник. Учтите, что Google оценивает «вес» ссылок на основе внутреннего критерия Homepage Trust.

Рассекречено: ключевые слова в title и description имеют значение

Ключевые слова в заголовках и title лучше вставлять. Google оценивает, насколько заголовки соответствуют запросам пользователей. Также важна «свежесть» контента.

Значение имеет не только дата публикации, но и дата изменения и обновления материалов. Поэтому в идеале дата обновления контента должна указываться отдельно.

Рассекречено: Google понижает Trust и Page Rank для новых сайтов

Новые сайты помечаются флажком «маленького личного сайта»:

https://hexdocs.pm/google_api_content_warehouse/api-reference.html

Из слитых документов пока неясно, применяется ли флажок "маленького личного сайта" ко всем новым сайтам или только к одностраничным сайтам и мини-блогам.

Заключение:

Утечка, произошедшая в мае 2024 года, вызвала настоящий фурор в мире SEO, раскрыв тщательно охраняемые секреты алгоритмов ранжирования Google. В результате случайного обнаружения внутренних документов Google, стало известно более 14 000 факторов, влияющих на рейтинг сайтов, что предоставило уникальное понимание механизмов, по которым веб-сайты поднимаются в поисковой выдаче.

https://t.me/road_to_100m