August 19, 2022

Парсинг тегов с Яндекс.Картинок в несколько кликов

Автоматизация — везде! Главное делать все с умом! Статья от куратора закрытого сообщества Романа Михальчука.

Прочитав статью «Нетипичное использование Яндекс.Картинок по технологиям курса!» появилась мысль автоматизировать это дело. И получилось на самом деле очень интересно…

Необходимые инструменты

  1. Screaming Frog SEO или Netpeak spider
  2. Excel

Итак приступим

А теперь тоже самое но текстом

  1. Открываем Screaming Frog SEO или Netpeak spider
  2. Заходим в настройки парсинга
  3. Добавляем новое поле, где выбираем Xpath в пустое поле вставляем: //span[@class='button2__text'] и extract text.

4. Теперь вбиваем в яндекс картинках интересующий запрос — в моем случае женские брюки и копируем адрес https://yandex.ru/images/search?text=женские%20брюки&from=tabbar

5. Вставляем его в лягушку и нажимаем старт

6. На выходе получаем длинную строку со списком тегов, которую экспортируем в excel

7. Теперь с этой строки делаем столбик (выделяем и при вставке нажимаем специальную вставку)

8. Теперь формируем урл для второй итерации (https://yandex.ru/images/search?text= + главный ключ (женские брюки) + теги 1 уровня, что мы спарсили (бананы) + &from=tabbar) — используется формула excel СЦЕПИТЬ.

9. Полученные урл добавляем в лягушку и снова парсим

10. На выходе получаем ОГРОМНЫЙ список тегов, которые пробиваем на частотность и коммерцию — чистим от мусора