Ищем замену дорогому кластеризатору Just Magic или обзор 7 сервисов кластеризации на реальном ядре
В данной статье хотелось бы сделать обзор нескольких кластеризаторов, а главное попытаться сравнить качество кластеризации у того или иного инструмента.
На входе были взяты запросы, которые предварительно вручную были проверены на соответствие как минимум 3-м урлам в выдаче по методу хард. Список данных запросов с частоткой за год, а также вручную проставленным кластером после проверки через Арсенкин находится по данной ссылке.
Я специально в ряде кластеров старался выбирать запросы, которые не выглядят уж явно похожими, например:
Также я не пробивал запросы на коммерческость. Цель статьи просто сравнить сервисы кластеризаций. Вот в эти сервисы было загружено данное ядро:
· Key Assort (десктопный софт, работает за XML Лимиты)
· Кластеризатор Rush Analitycs
Теперь пройдемся по каждому кластеризатору более детальнее.
Keys.so
Начать хочу именно с него, потому что в его входящих настройках нет стандартного выбора метода кластеризации Soft или Hard, при этом выбирается степень похожести запросов
А если в вашем ядре содержаться неизвестные сервису фразу, то он и вовсе их проигнорирует. Так что в качестве инструмента кластеризации, мне он не понравился. На выходе получился файл с довольно большим количеством нераспределенных фраз
Может быть сыграла роль степень похожести, потому что ее указал на 70%. За данные из Кейс.cо хочу сказать спасибо Роман Михальчук, потому что наша подписка закончилась, новую клиент пока не оплатил, поэтому чтобы не затягивать пришлось просить Романа.
Можно конечно поиграть со степенью похожести, но мне не понравилось, что он игнорирует неизвестные ему фразы, скорее всего кластеризация делается по его слепкам, а не по реальной выдаче. Стоимость сервиса входит в платные тарифы, если вдруг кто не знает тарифов кейсо, то скрин ниже
Rush Analitycs
Многие хвалят данный сервис за то, что он делает отличную по качеству кластеризацию. Так ли это? Для начала понравилось, что помимо кластеризации Rush дает дополнительные данные бесплатно, а именно:
· Топовый урл у которого самая лучшая видимость по кластеру
Данные инструменты могут помочь в лучшей оптимизации страницы особенно под позиционное продвижение. При этом раш не смог кластеризовать 5 слов из 53 на входе
За кластеризацию 53 запросов с меня взяли 29.15 лимитов, при этом при регистрации дается бесплатно 200 лимитов. Сетка тарифов выглядит так
В общем не дешевый инструмент, который еще к тому же не может распределить примерно 10% запросов. На объёме потери могут быть колоссальными.
Just Magic
Тут думаю рассказывать нечего, однако ряд запросов Just Magic все-таки разбил более узко. Например данные запросы он разносит по разным кластерам:
· аккумулятор автомобильный bosch
А при ручной проверке – это один кластер
Поэтому проверять нужно даже за ним, ну и по стоимости всем известно, что он довольно дорогой. При этом мэджик предложил самую широкую структуру. Из 53 запросов он сделал 10 кластерных групп. Все файлы по проектам я приложу, и вы сможете сами с ними ознакомиться. Стоимость сервиса не пишу, потому что вы ее и так знаете.
Кластеризатор Арсенкина
Слышал в нашем чате, что данный сервис плохо выполняет задачу и кластеризует довольно слабо. На моей выборке из 53 запросов Арсенкин почти приблизился к ручному результату
То есть он не смог кластеризовать всего 2 запроса, при этом 1 из них я также помечал себе в ручной таблице красным, потому что по нему не нашлось 3 урлов, которые бы совпадали во всем списке. По поводу второго запроса вполне можно согласиться вынести его, потому что я заметил, что выдача из 3 урлов часто достигается за счет сервисов самого яндекса.
При анализе запросов для стартовой выборки бывало такое что 2 из 3 урлов похожести составляли Маркет и Дзен, поэтому важно фильтровать сайты самого маркета, а также доски типа авито, и сайты типа auto.ru и прочее. В каждой тематике они могут быть свои, но портить всю картинку кластеризации.
Кластеризатор Арсенкина доступен при любой платной подписке. Я оплатил 300 рублей. За кластеризацию 53 запросов у меня сняли 108 лимитов, при 1500 доступных ежедневно. Большие ядра конечно не загнать, но в целом по моей выборке нареканий нет.
Кластеризатор Megaindex
В данном сервисе кластеризация совпала с Арсенкиным. Сервис не смог распределить все те же 2 запроса
Порадовало то, что он доступен в бесплатном режиме. Дается около 1000 лимитов.
Которые можно потратить на кластеризацию. Опять же на моей выборке Мегаиндекс показал результат, приближенный к ручной кластеризации.
Key Assort
Десктопная программа, которая также выполняет кластеризацию на основе выдачи. Работает за XML лимиты, поэтому если у вас есть бесплатные лимиты, то можно кластеризовать вообще бесплатно, либо подключиться к сервису xmlproxy и покупать дешевые лимиты.
Сама программа платная, ее версия стоит 1900 рублей. Однако у софта есть бесплатная версия отличия которой состоят лиш в том, что вы не можете делать экспорт в эксель
Поэтому кто хочет попробовать то можно скачивать. В самой программе при кластеризации можно выставлять всевозможные настройки
Например автоматом исключать сервисы яндекса, спектральную примесь и свежие результаты. Также можно настроить сбор данных
Еще 1 фишка в том, что, собрав данные по ядру 1 раз можно меняя настройки делать перекластеризацию. Я убрал все галки кроме сервисов Яндекс и получил такую картину
При отключении галки сервисы Яндекс результат поменялся всего на 1 запрос
Видно, что из 3-х запросов – 2 составляют все те же, что не сделал арсенкин и мегаиндекс.
Еще 1 фишка программы – это возможность просмотра топа тематики по заданному ядру
Можно посмотреть у какого сайта самое широкое количество запросов в топе и более детально проанализировать.
Кластеризатор Coolakov
Данный сервис бесплатен. На моей выборке его результаты совпали с результатами программы Key Assort без доп настроек
То есть он показал все те же 3 запроса, которые не смог кластеризовать. Лимит сервиса 1000 запросов за 1 раз. Для крупных проектов однозначно не подходит, но для быстрой кластеризации категории, вполне.
Ну и завершает эту статью сервис кластеризации от Topvisor. Топвизор также неплохо справился с задачей показав приближенную кластеризацию к ручной, а также создал 8 кластер более узко разбив аккумуляторы для мотоциклов. Вынес там отдельно категорию на 12 вольт
В целом вполне логичный ход. Однако запросы, которые он вынес под эту группу все же не пересекаются с кластеризатором Just Magic, который единственный вынес это в отдельную подгруппу. За кластеризацию 53 запросов с меня сняли 14.58р. Это примерно 27 копеек за запрос.
Теперь небольшие выводы, к которым я пришел. Самым дешевым вариантом работы с большим ядром является программа Key Assort. Причем кому не хочется покупать лицензию можно держать бесплатную версию при необходимости копируя запросы в эксель ctrl c + ctrl V.
По максимальной приближенности к ручной кластеризации у меня лидируют
Хваленый раш аналитикс потерял 10 % запросов на этапе кластеризации, Keysso вообще не кластеризует в реалтайме. Для тех кто ищет адекватную замену мэджику наверное лучше приобретать кейассорт и выстраивать свои настройки + смотреть результат.
Для быстрой кластеризации небольшого ядра отлично подходят Арсенкин, Кулаков и бесплатный Мегаиндекс. Ну а на этом у меня все. Спасибо за внимаение. Файлы проектов из кластеризаций https://drive.google.com/file/d/1FQtxmD10p59v0WojKK0kQHBlHSJp0FXx/view?usp=sharing доступны по ссылке.