Слитые факторы ранжирования Google - что можно применять на практике?
Автор статьи - Олег Шестаков - основатель Rush Agency, Rush Analytics & SEO-AGENTS.IO
Мой Telegram канала где еще больше таких материалов - https://t.me/oshestakovdigital
Я уже выпускал в том году обзор этого слива, но вчера мне попалась статья, где автор посмотрел на слив несколько под другим углом - он разобрал именно репозиторий PerDocData, в котором и содержатся основные факторы ранжирования, на которые можно влиять. При чем факторы разбиты на так понятные нам группы: траст, текстовое ранжирование, поведенческие и т.д.
Оригинал статьи на английском языке: https://www.hobo-web.co.uk/perdocdata/ - можете закинуть в Claude / ChatGPT - отлично переведет на русский. Рекомендую полную статью к прочтению, ниже хайлайты которые мне зашли:
Что отметил интересного по группам факторов
- siteAuthority - да, у Гугла есть четкое понятие траста/авторитетности для всего домена. Это пожалуй самый важный фактор ранжирования. Что бы они там ни отрицали в Твиттере 😁
- nsrDataProto - глобальная метрика качества сайта. Тут не совсем про траст, а про качество.
Что делать: удалять мусорные страницы с сайта, чтобы не ронять показатель качества
- onsiteProminence - значимость страниц на уровне сайта. Высокотрафиковые страницы и близкие от главной страницы получают намного больше веса и приоритета.
Что делать: есть важные для продвижения страницы? Поставь ссылки на них на видное место на главной странице
- domainAge / hostAge - возраст домена / хоста учитывается в явном виде. Кто бы что ни говорил. «Песочница» существует, работает в том числе и по возрасту домена
Что делать: удалять мусор и tin контент
- shingleInfo - старый добрый алгоритм шинглов, когда весь текст режется на кусочки, потом сравнивается с такими же кусочками на других сайтах. Используется для выявления копипаста
- titleHardTokenCountWithoutStopwords - оценивает качество Тайтлов. Скорее всего оценивает читаемость Тайтлов, наличие «воды» и слов-паразитов. Вероятно заранее оценивает несет ли смысл ваш Тайтл и какой у него будет CTR
Определение спама (ваша любимая секция 😂)
- spambrainData / spambrainTotalDocSpamScore - оценка спамности на уровне домена и СТРАНИЦ основным анти-спам алгоритмом Google
- spamrank!!! - да старый добрый Spamrank - вашу страницу будет понижать в выдаче, если вы ссылаетесь на заведомо размеченные как спам документы. Смотрите на кого ссылаетесь! Вот тут можно почитать как работает алгоритм SpamRank в оригинале
- spamMuppetSignals - специальный классификатор хакнутых сайтов, который не дает страницам ВЗЛОМАННЫХ сайтов аранжироваться. Фильтр "анти-пирог" я бы сказал. Но никто не говорит, что такие страницы не могут передавать вес 😉
- GibberishScore - метрика низкокачественного и авто-сгенерированного контента. Про ИИ тут ни слова
- spamCookbookAction - определяет «типичные» методы поискового спама.
Что делать: придумывайте нетипичные, которые Google еще не видел и не положил в свой CookBook
Что делать: brusovye-doma-ekb.ru. Что не делать: kupit-brusovie-doma-v-ekb-nedorog.ru/deshevye-doma-iz-kleenogo-brusa
Что делать: 80% разбивки, 20% анкеров
- impressions - сколько всего кликов было с поиска. Используется для расчета CTR
- GoodClicks, BadClicks - короткие и длинные клики. Коротки - значит пользователь зашел на сайт и вернулся в выдачу.
Что делать: давать понять в самом начале контента, что пользователь попал туда, куда он хотел.
Что еще делать: накручивать поведенческие длинными кликами.
Что еще делать (на свой страх и риск): скручивать конкурентов короткими кликами
- LastLongestClicks - Ластклик как в Яндексе + Dwell Time. 1 в 1 как в Яндексе - последний клик с длинной сессией.
Что делать: думаю вы уже поняли 😏
Факторы семантического поиска и Топикальной Релевантности:
- webrefEntities / EntityAnnotations - привязка сущностей из KnowledgeGraph к контенту вашей страницы. Что делать: оптимизировать под сущности, а не под ключи.
- site2vecEmbedding - сжатый вектор эмбеддинга всего сайта. Используется для определения общей тематики сайта, измерения тематической близости и выявления отклонений от топикальной релевантности.
Что делать: не писать на сайт про яхты статьи про бульдозеры
- asteroidBeltIntents - система для детальной классификации интентов документа. Присваивает странице оценки по множеству интентов. Данная фича выходит за рамки простой классификации на информационной/коммерческий интент.
Что делать: покрывать все суб-интенты, связанные с основным интентом
- commercialScore - ПРЯМОЕ определение коммерческости интента, раскрытого на странице. Другими словами эту штука определяет «Продается ли здесь что-то?» Именно эта штука используется для баланса страниц с коммерческим и информационным интентом.
Что делать: если вы что-то продаете - посмотрите на конкурентов в ТОПе - как они показывают свою «коммерческость» Google
- topPetacatTaxId - ID основной категории сайта в внутренней таксономии Google Petacat. Применяется для сопоставления запроса и результата, а также оценки тематической релевантности.
Что делать: строить тематическую (=топикальную) релевантность своего сайта, чтобы получить буст в ранжировании. Отличный подход описан здесь
Там есть еще ряд интересных секций - и про индексацию и про EEAT и про техническое состояние сайта - очень рекомендую ознакомиться
Основные полезности, которые можно применять:
- Траст и авторитетность существуют как неотъемлемые факторы ранжирования. Page Rank тоже все еще используется напрямую, хоть и с «наворотами» + возраст домена имеет значение.
- Качество контента оценивается как ПОСТРАНИЧНО, так и по всему сайту в целом. Мусорные и «тонкие» страницы условного 2018 года - будут тянуть вниз ваши супер-редакторские лонгриды из 2026 года. Чистим мусор
- Спам анкорами ссылок определяется бинарно - вы или спамер или нет. Если вам разметили как спамера - у меня для вас плохие новости 😁
- Если занимаетесь поисковым спамом - избегайте «заезженных» способов, изобретайте новые
- EMD-домены все еще отлично работают! Но не стоит злоупотреблять вхождениями
- Поведенческие факторы работают почти так же как в Яндексе. Можно и нужно накручивать. Почему ни у кого не получается - это другой вопрос 😉
- Топикальная (тематическая) авторитетность и релевантность - краеугольный фактор успеха в ТОПах Google. Отпимизируйте под интенты и сущности, не под ключевые слова.
Автор статьи - Олег Шестаков - основатель Rush Agency, Rush Analytics & SEO-AGENTS.IO
Мой Telegram канала где еще больше таких материалов - https://t.me/oshestakovdigital