August 23, 2022

Лучше меньше, да лучше: расширенный поиск в Google

Перевод оригинальной статьи специально для канала "Времени нет"

Результаты поиска Google часто непредсказуемы и непонятны. Для тех, кому хватает первых пяти ссылок, это не проблема. Но для исследователей всё по-другому. Несмотря на то, что поисковая система Google никогда не создавалась для исследователей, она по-прежнему остается одним из инструментов первого выбора благодаря огромной базе индексируемой информации. Но как нам получить более релевантные результаты из этого индекса? В этой статье я расскажу, как неочевидное использование поисковых операторов улучшит результаты поиска.

Поиск человека

Предположим, что мы ищем конкретного человека по имени в Google. Запишем точный запрос, т.е. используя кавычки. Если повезет, мы найдем несколько тысяч результатов. В качестве примера приведу поиск по собственному имени.

Выдача в 7 860 результатов в Google, конечно, потешит моё эго. Но это будет мимолётное чувство, потому что я не смогу увидеть самый последний результат, как бы ни старался. Обычно на 10-15 (в данном случае на 9-й) странице мы увидим конец поисковой выдачи и что осталось совсем немного результатов:

То же и с другими именами. Посмотрите на результаты выдачи по запросу на самое распространенное голландское имя «Ян Янсен»:

Мы получили 606 000 результатов, но когда пытаемся добраться до последней страницы, то застреваем на странице 16 с «всего» 153 результатами:

Очевидно, что это не вся возможная выдача. Я знаю, что Google проиндексировал намного больше 77 страниц, на которых фигурирует моё имя, и уж точно больше 153 страниц, где фигурирует имя Ян Янсен. Таким образом, мы можем сделать вывод, что Google отбирает результаты в соответствии с тем, что, по их мнению, ищут «нормальные» люди. Как же нам увидеть эти скрытые результаты?

Первым шагом может быть «повторение поиска с включением пропущенных результатов», как предлагает нам Google внизу страницы:

Итак, давайте попробуем снова. На этот раз мы видим 8 060 результатов всего и, в конечном итоге, 228 результатов на 23 страницах:

228 результатов выглядит лучше, но всё ещё не 8 060 результатов. Кроме того, наверняка какие-то из этих 228 результатов дублируются. Наконец я нашел способ как найти страницы в индексе Google, где есть моё имя, но они не отображаются среди найденных ранее 228 результатов.

А теперь давайте «взломаем» Google

Для этого используем поисковые операторы контринтуитивно. Если добавим поисковый запрос, логично, что количество результатов уменьшится. Поиск «Ludo Block» должен показать больше результатов, чем поиск «Ludo Block» И [ключевое слово]. Следуя булевой логике, результаты последнего поиска должны быть подмножеством результатов первого поиска.

И действительно, если мы ищем «Ludo Block» И терроризм, а также повторяем поиск с включенными пропущенными результатами, начальное общее количество результатов, которые возвращает Google, меньше, около 25% от общего числа 7 860 результатов при поиске без добавленных ключевых слов:

Однако, если мы сейчас попытаемся добраться до последней страницы, увидим кое-что интересное:

Что же? Количество доступных результатов выше, чем при поиске без добавленного ключевого слова!

Очевидно, согласно булевой логике этот результат не может быть правильным, и это подтверждает, что Google показывает лишь небольшую часть общих фактических результатов в своем индексе. И на самом деле, в результатах, показанных после поиска по «Ludo Block» И «терроризм», я увидел довольно много результатов, которые не отображались при первичном поиске по запросу «Ludo Block».

Другими словами, если мы добавим к запросу оператор И (а не ИЛИ, хотя казалось бы, это логичное решение), то в результатах увидим разные подмножества общего множества результатов поиска Google. Следовательно, несколько поисков с меньшими потенциальными результатами (из-за добавленного ключевого слова) в итоге дают более уникальные результаты, чем один более широкий поиск. Здесь действительно можно сказать, что less-is-more.

Какие ключевые слова добавить?

Вы можете спросить: какие ключевые слова добавить, чтобы получить доступ к «скрытой» части индекса Google? Те, что имеют какое-то отношение к предмету поиска. Если же нет, Google возьмёт дело в свои руки. Например, посмотрите на это:

Очевидно, что у меня нет ничего общего с оффшорными платформами (честное слово, нет), но Google не любит показывать результаты «0», поэтому он исправит запрос и покажет то, что, по его мнению, вы могли иметь в виду. Для исследователя это (почти) всегда ложные срабатывания.

В заключение отмечу, что ключевое слово должно быть выбрано вдумчиво и может быть получено, например, из уже известных фактов из жизни объекта вашего интереса. Конечно, это путь проб и ошибок, но самое важное — это то, что вы знаете способ, как получить более релевантные результаты.

Автор статьи: Ludo Block

Автор перевода: Наталья Перевалова