March 5, 2022

Парсер 2Gis

ВНИМАНИЕ

ПАРСЕР ПРЕДНАЗНАЧЕН ТОЛЬКО ДЛЯ ЛИЧНОГО ИСПОЛЬЗОВАНИЯ В ОЗНАКОМИТЕЛЬНЫХ ЦЕЛЯХ!

КОМПАНИЯ 2ГИС ЗАПРЕЩАЕТ ИСПОЛЬЗОВАНИЯ ТЕХНИЧЕСКИХ СРЕДСТВ СБОРА ИНФОРМАЦИИ С ИХ КАРТ С ЦЕЛЬЮ ПОЛУЧЕНИЯ РАЗЛИЧНОЙ ВЫГОДЫ!

Парсер 2Гис - это многопоточный парсер, который собирает данные о компаниях по вашим запросам.

ОСОБЕННОСТИ ПРОДУКТА:

  • Быстрая работа (многопоточный режим почти без ущерба производительности пк)
  • Возможность работать сразу с несколькими поисковыми запросами одновременно (количество неограничено)
  • Поддерживаются ЛЮБЫЕ ГОРОДА и ЛЮБЫЕ СТРАНЫ! (Мск, Нск, Спб и тд, разницы нет)
  • Нет ограничений на количество собираемых объектов
  • Встроенный captcha модель с различными вариантами решения (авто или ручной режим)
  • Сохранение результатов парсинга в БД (можно экспортировать с различными параметрами)
  • Логирование работы

ИНСТРУКЦИЯ ПО РАБОТЕ С ПРОГРАММОЙ

Главное окно программы выглядит так.

Файл с рабочими ссылками для поиска - это тхт документ, в который вы загружаете свои ссылки для поиска. Пример:

https://2gis.ru/tomsk/search/кафе?m=84.948637%2C56.488128%2F11

https://2gis.ru/tomsk/search/автосервис?m=84.948637%2C56.488128%2F11

https://2gis.ru/search/больница/geo/1267655302447182/82.117293%2C58.550338?m=82.985198%2C58.435281%2F7.28

Обратите внимание, вы можете максимально точно составить поисковый запрос. В примере выше один из запросов - больницы в томской области. Для того, чтобы получить подобную ссылку, достаточно открыть 2Гис, выбрать нужные параметры и скопировать URL из браузера.

Количество потоков - чем больше потоков, тем быстрее собираются данные. Но при этом вероятность поймать капчу становится выше. Я бы придерживался поговорки: "тише едешь, дальше будешь" :)

Интервал между запрсоами - этот параметр отвечает за то, как часто будут отправляться запросы для забора подробнйо информации. Простыми словами - чем меньше цифры, тем быстрее работа, но, как и в случае с потоками, тем выше вероятность поймать капчу. Я рекомендую придерживаться стандартных значений или выше.

Модуль captcha

Как правило, капча возникает из-за некачественного ip. Скрипт хорошо обрабатывает это событие, поэтому можно не волноваться!

Есть два варианта: автоматическое решение и ручной метод. Начнем с автоматического.

Сейчас в программе доступен один сервис разгадывания капч. Это 2captcha. (Если кому-то нужен другой сервис, напишите, я добавлю индивидуально за отдельную плату).

Вставляем ключ, полученный на сайте. Указываем количество попыток решения капчи (параметр сделан для того, чтобы в случае множества колчиества неудач, можно было бы прекратить попытки решения). Указываем максимальное количество запросов. Обычно это 5-7. Но я ставлю 10-15.

Теперь отдельно поговорим о ручном методе решения капчи.

В этом методе есть особенность.

Когда скрипт наткнется на капчу, вы увидите новую вкладку в программе. Открыв ее вы увидите саму капчу. Решается она следующим образом. Выбираете номера нужных квадратов и вписываете их в выделенную строку ЧЕРЕЗ ПРОБЕЛ! После того, как вписали, нажимаете указанную стрелкой кнопку. Скрипт продолжит работу.

База данных

База данных выглядит как на скриншоте. Скачать демо этой базы можно по ссылке.

Экспорт базы из программы возможен в следующих вариантах:

СТОИМОСТЬ ПРОГРАММЫ

Софт работает под windows. Один ключ - одна машина. Смена ключа - бесплатно, но не чаще 2 раз в месяц.

Версия 3.0

2099р/мес

799р/неделя

За покупкой: https://t.me/TakeshiSoft

P.S.

Могу собрать для вас базу по любому запросу в любом количестве. Стоимость за 1000 строк - 490р.