July 9, 2023

Google and Yandex dorking  

Многие оперативные задачи, с которыми вы сталкиваетесь повседневно, по поиску информации в сети, могут быть решены банальным гуглением с правильными операторами за пару минут. Это и называют Доркингом. Доркинг возможен во многих поисковых системах, но сегодня разберем два самых популярных варианта - Google and Yandex

Google dorks

Пожалуй начнём с синтаксиса:

""

Кавычки позволяют получить результат по определенным словам

-

Знак минус позволяет исключить из поиска определенное слово

+

Плюс позволяет добавить в поиск определенное слово

|

Выполняет функцию "или". Полезно в случае поиска различных слов и файлов (разберем далее). Например запрос:

Теперь перейдем к командам:

site:

Этот оператор позволяет вести поиск по определенному сайту. После ":" указывайте url сайта (кстати, лучше указывать его без протоколов https и www) Пример: site:cia.gov

filetype:

Оператор, позволяющий искать файлы на сайтах. Поддерживаются следующие типы файлов:

  1. Документы: doc, docx, xls, xlsx, ppt, pptx, pdf, txt, rtf и другие.
  2. Архивы: zip, rar, 7z, tar, gzip и другие.
  3. Изображения: jpg, jpeg, png, gif, bmp и другие.
  4. Видео: mp4, avi, mov, wmv, flv и другие.
  5. Аудио: mp3, wav, ogg, flac и другие.
  6. Программные файлы: exe, apk, deb, rpm, msi и другие.
  7. Текстовые файлы: txt, csv, log и другие.
  8. Презентации: ppt, pptx, odp и другие.
  9. Таблицы: xls, xlsx, ods и другие.
  10. Программные коды: c, cpp, java, python, html, css, js и другие.

Если вы хотите получить в одном запросе несколько файлов то указывайте их через "|".

Пример: site:cia.gov filetype:pdf | filetype:doc

inurl:

Данный оператор позволяет находить информацию содержащую url определенное слово в директории сайта.

Директория сайта - это структурированная система организации и хранения файлов и папок на веб-сервере, которая позволяет обращаться к различным страницам и содержимому сайта через уникальные URL-адреса.

Важно отметить, что всегда стоит изучать как устроена директория сайта, ведь у сайта всегда есть отдельные папки в которых храниться полезная информацию. На сайте может быть опубликован список персонала в виде карточек по фамилиям (данный пример будет разобран в следующей статье). Или же в определенной директории могут публиковаться все документы по интересующей вас тематике.

Для примера возьмём сайт ЦРУ. В нём есть открытая библиотека в которой публикуются рассекреченные документы и статьи. Библиотека очень интересная, советую всем с ней ознакомиться.

Стандартный вид Url ссылки на файл в библиотеке сайта ЦРУ имеет слудующий вид: https://www.cia.gov/readingroom/docs/CIA-RDP96-00788R001700210016-5.pdf

В нашем случае интересно посмотреть все файлы, находящиется в папке readingroom:

Пример: site:cia.gov filetype:pdf inurl:readingroom

intext:

Позволяет находить опреденные слова, упоминаемые на сайте или в документе. Давайте найдем все отчёты о сбитом лётчике Фрэнсисе Пауерсе.

Пример: site:cia.gov filetype:pdf intext:Powers

Мы разобрали самые часто используемые операторы google dorks, если же вы хотите подробнее углубиться в эту тему советую посетить Google Hacking Online. Данный сервис автоматически генерирует дорки для сайта, который вы укажите в строке поиска, в зависимости от задачи. Далее мы разберём углубленный поиск в Yandex.

Yandex dorks

По своей сути доркинг в Яндекс почти не отличается от Google, за тем исключением, что структура некоторых запросов другая. Полезность Яндекс доркинга завключается в том, что Яндекс направлен на СНГ сегмент и лучше его индексирует. Это позволяет получать более релевантные результаты при решении многих локальных задач. Далее разберём основыные операторы и синтаксис Яндекс поиска.

*

В Яндексе символ "*" выполняет функцию подстановочного знака (маски). Он используется для замены одного или нескольких символов в поисковом запросе.

В Google также можно использовать "*" вместо недостающих слов.

Когда символ "*" включен в поисковый запрос, Яндекс будет искать все возможные комбинации символов на его месте. Это может быть полезно, когда вы не уверены в конкретном слове или фразе, или когда вам нужно найти варианты слов с различными окончаниями:

"" - + |

Все эти знаки выполняют те же фунциии, что и в Google

site:

Выполняет те же задачи, что и в Google

url:

Позволяет искать информацию по определенному url также ограничевая поиск определенной директорией, например в случае википедии это будет директория со статьями "/wiki":

rhost:

Данная команда позволяет вести поиск на субдоменах. Это может быть полезно в случае если вы работаете с дашбордами или блоговыми ситемами, такими как Livejournal. Например, вам вздумалалось зайти в livejournal (что уже странно:) и найти там блог про вязание:

Данный запрос важно строить в следующем порядке: имя хоста в формате домен верхнего уровня.домен второго уровня.www

Если вы укажите вместо "*" домен "www", то тогда вы будете находить подборки с блогами, а не сами статьи на блогах:

domain:

Позволяет искать по определенному домену .ru, .com, .net, .ua и др...

mime:

То же, что и "filetype:" в google. Подердживает поиск следующих файлов:pdf|xls|ods|rtf|ppt|odp|swf|odt|odg|doc

Пример: site:sis.gov.uk mime:pdf

lang:

Фильтр по языкам de / en / fr / ru и др...

Заключение

Таким образом мы разобрали основные операторы и синтаксис Google и Yandex доркинга. Это правда очень полезные инструменты, которые могут сильно упростить повседневный поиск информации в сети. Вообще в любой непонятной ситуации, когда вы не знаете с чего вам начать поиск информации об интересующем объекте, рекомендую начать именно с доркинга, так как он может дать положительный результат всего за несколько запросов.

Удачных поисков, Юзернейм!