Today

Слитые факторы ранжирования Google - что можно применять на практике?

Автор статьи - Олег Шестаков - основатель Rush Agency, Rush Analytics & SEO-AGENTS.IO
Мой Telegram канала где еще больше таких материалов - https://t.me/oshestakovdigital

Я уже выпускал в том году обзор этого слива, но вчера мне попалась статья, где автор посмотрел на слив несколько под другим углом - он разобрал именно репозиторий PerDocData, в котором и содержатся основные факторы ранжирования, на которые можно влиять. При чем факторы разбиты на так понятные нам группы: траст, текстовое ранжирование, поведенческие и т.д.

Оригинал статьи на английском языке: https://www.hobo-web.co.uk/perdocdata/ - можете закинуть в Claude / ChatGPT - отлично переведет на русский. Рекомендую полную статью к прочтению, ниже хайлайты которые мне зашли:

Что отметил интересного по группам факторов

Траст и Авторитетность

  • siteAuthority - да, у Гугла есть четкое понятие траста/авторитетности для всего домена. Это пожалуй самый важный фактор ранжирования. Что бы они там ни отрицали в Твиттере 😁
  • nsrDataProto - глобальная метрика качества сайта. Тут не совсем про траст, а про качество.

Что делать: удалять мусорные страницы с сайта, чтобы не ронять показатель качества

  • onsiteProminence - значимость страниц на уровне сайта. Высокотрафиковые страницы и близкие от главной страницы получают намного больше веса и приоритета.

Что делать: есть важные для продвижения страницы? Поставь ссылки на них на видное место на главной странице

  • domainAge / hostAge - возраст домена / хоста учитывается в явном виде. Кто бы что ни говорил. «Песочница» существует, работает в том числе и по возрасту домена

Качество контента:

  • OriginalContentScore - измеряется от 0 до 512. Определяет качество контента на сайте.

Что делать: удалять мусор и tin контент

  • shingleInfo - старый добрый алгоритм шинглов, когда весь текст режется на кусочки, потом сравнивается с такими же кусочками на других сайтах. Используется для выявления копипаста
  • titleHardTokenCountWithoutStopwords - оценивает качество Тайтлов. Скорее всего оценивает читаемость Тайтлов, наличие «воды» и слов-паразитов. Вероятно заранее оценивает несет ли смысл ваш Тайтл и какой у него будет CTR

Определение спама (ваша любимая секция 😂)

  • spambrainData / spambrainTotalDocSpamScore - оценка спамности на уровне домена и СТРАНИЦ основным анти-спам алгоритмом Google
  • spamrank!!! - да старый добрый Spamrank - вашу страницу будет понижать в выдаче, если вы ссылаетесь на заведомо размеченные как спам документы. Смотрите на кого ссылаетесь! Вот тут можно почитать как работает алгоритм SpamRank в оригинале
  • spamMuppetSignals - специальный классификатор хакнутых сайтов, который не дает страницам ВЗЛОМАННЫХ сайтов аранжироваться. Фильтр "анти-пирог" я бы сказал. Но никто не говорит, что такие страницы не могут передавать вес 😉
  • GibberishScore - метрика низкокачественного и авто-сгенерированного контента. Про ИИ тут ни слова
  • spamCookbookAction - определяет «типичные» методы поискового спама.

Что делать: придумывайте нетипичные, которые Google еще не видел и не положил в свой CookBook

  • urlPoisoningData - анти-наглый-EMD алгоритм 😁

Что делать: brusovye-doma-ekb.ru. Что не делать: kupit-brusovie-doma-v-ekb-nedorog.ru/deshevye-doma-iz-kleenogo-brusa

  • IsAnchorBayesSpam - бинарный факторы - спамите ли вы анкорами ссылок или нет.

Что делать: 80% разбивки, 20% анкеров

Поведенческие факторы

  • impressions - сколько всего кликов было с поиска. Используется для расчета CTR
  • GoodClicks, BadClicks - короткие и длинные клики. Коротки - значит пользователь зашел на сайт и вернулся в выдачу.

Что делать: давать понять в самом начале контента, что пользователь попал туда, куда он хотел.

Что еще делать: накручивать поведенческие длинными кликами.

Что еще делать (на свой страх и риск): скручивать конкурентов короткими кликами

  • LastLongestClicks - Ластклик как в Яндексе + Dwell Time. 1 в 1 как в Яндексе - последний клик с длинной сессией.

Что делать: думаю вы уже поняли 😏

Факторы семантического поиска и Топикальной Релевантности:

  • webrefEntities / EntityAnnotations - привязка сущностей из KnowledgeGraph к контенту вашей страницы. Что делать: оптимизировать под сущности, а не под ключи.
  • site2vecEmbedding - сжатый вектор эмбеддинга всего сайта. Используется для определения общей тематики сайта, измерения тематической близости и выявления отклонений от топикальной релевантности.

Что делать: не писать на сайт про яхты статьи про бульдозеры

  • asteroidBeltIntents - система для детальной классификации интентов документа. Присваивает странице оценки по множеству интентов. Данная фича выходит за рамки простой классификации на информационной/коммерческий интент.

Что делать: покрывать все суб-интенты, связанные с основным интентом

  • commercialScore - ПРЯМОЕ определение коммерческости интента, раскрытого на странице. Другими словами эту штука определяет «Продается ли здесь что-то?» Именно эта штука используется для баланса страниц с коммерческим и информационным интентом.

Что делать: если вы что-то продаете - посмотрите на конкурентов в ТОПе - как они показывают свою «коммерческость» Google

  • topPetacatTaxId - ID основной категории сайта в внутренней таксономии Google Petacat. Применяется для сопоставления запроса и результата, а также оценки тематической релевантности.

Что делать: строить тематическую (=топикальную) релевантность своего сайта, чтобы получить буст в ранжировании. Отличный подход описан здесь

Там есть еще ряд интересных секций - и про индексацию и про EEAT и про техническое состояние сайта - очень рекомендую ознакомиться

Основные полезности, которые можно применять:

  • Траст и авторитетность существуют как неотъемлемые факторы ранжирования. Page Rank тоже все еще используется напрямую, хоть и с «наворотами» + возраст домена имеет значение.
  • Качество контента оценивается как ПОСТРАНИЧНО, так и по всему сайту в целом. Мусорные и «тонкие» страницы условного 2018 года - будут тянуть вниз ваши супер-редакторские лонгриды из 2026 года. Чистим мусор
  • Спам анкорами ссылок определяется бинарно - вы или спамер или нет. Если вам разметили как спамера - у меня для вас плохие новости 😁
  • Если занимаетесь поисковым спамом - избегайте «заезженных» способов, изобретайте новые
  • EMD-домены все еще отлично работают! Но не стоит злоупотреблять вхождениями
  • Поведенческие факторы работают почти так же как в Яндексе. Можно и нужно накручивать. Почему ни у кого не получается - это другой вопрос 😉
  • Топикальная (тематическая) авторитетность и релевантность - краеугольный фактор успеха в ТОПах Google. Отпимизируйте под интенты и сущности, не под ключевые слова.

Автор статьи - Олег Шестаков - основатель Rush Agency, Rush Analytics & SEO-AGENTS.IO

Мой Telegram канала где еще больше таких материалов - https://t.me/oshestakovdigital

Понравилась статья? Поделись с друзьями и коллегами!