Лучше меньше, да лучше: расширенный поиск в Google
Перевод оригинальной статьи специально для канала "Времени нет"
Результаты поиска Google часто непредсказуемы и непонятны. Для тех, кому хватает первых пяти ссылок, это не проблема. Но для исследователей всё по-другому. Несмотря на то, что поисковая система Google никогда не создавалась для исследователей, она по-прежнему остается одним из инструментов первого выбора благодаря огромной базе индексируемой информации. Но как нам получить более релевантные результаты из этого индекса? В этой статье я расскажу, как неочевидное использование поисковых операторов улучшит результаты поиска.
Поиск человека
Предположим, что мы ищем конкретного человека по имени в Google. Запишем точный запрос, т.е. используя кавычки. Если повезет, мы найдем несколько тысяч результатов. В качестве примера приведу поиск по собственному имени.
Выдача в 7 860 результатов в Google, конечно, потешит моё эго. Но это будет мимолётное чувство, потому что я не смогу увидеть самый последний результат, как бы ни старался. Обычно на 10-15 (в данном случае на 9-й) странице мы увидим конец поисковой выдачи и что осталось совсем немного результатов:
То же и с другими именами. Посмотрите на результаты выдачи по запросу на самое распространенное голландское имя «Ян Янсен»:
Мы получили 606 000 результатов, но когда пытаемся добраться до последней страницы, то застреваем на странице 16 с «всего» 153 результатами:
Очевидно, что это не вся возможная выдача. Я знаю, что Google проиндексировал намного больше 77 страниц, на которых фигурирует моё имя, и уж точно больше 153 страниц, где фигурирует имя Ян Янсен. Таким образом, мы можем сделать вывод, что Google отбирает результаты в соответствии с тем, что, по их мнению, ищут «нормальные» люди. Как же нам увидеть эти скрытые результаты?
Первым шагом может быть «повторение поиска с включением пропущенных результатов», как предлагает нам Google внизу страницы:
Итак, давайте попробуем снова. На этот раз мы видим 8 060 результатов всего и, в конечном итоге, 228 результатов на 23 страницах:
228 результатов выглядит лучше, но всё ещё не 8 060 результатов. Кроме того, наверняка какие-то из этих 228 результатов дублируются. Наконец я нашел способ как найти страницы в индексе Google, где есть моё имя, но они не отображаются среди найденных ранее 228 результатов.
А теперь давайте «взломаем» Google
Для этого используем поисковые операторы контринтуитивно. Если добавим поисковый запрос, логично, что количество результатов уменьшится. Поиск «Ludo Block» должен показать больше результатов, чем поиск «Ludo Block» И [ключевое слово]. Следуя булевой логике, результаты последнего поиска должны быть подмножеством результатов первого поиска.
И действительно, если мы ищем «Ludo Block» И терроризм, а также повторяем поиск с включенными пропущенными результатами, начальное общее количество результатов, которые возвращает Google, меньше, около 25% от общего числа 7 860 результатов при поиске без добавленных ключевых слов:
Однако, если мы сейчас попытаемся добраться до последней страницы, увидим кое-что интересное:
Что же? Количество доступных результатов выше, чем при поиске без добавленного ключевого слова!
Очевидно, согласно булевой логике этот результат не может быть правильным, и это подтверждает, что Google показывает лишь небольшую часть общих фактических результатов в своем индексе. И на самом деле, в результатах, показанных после поиска по «Ludo Block» И «терроризм», я увидел довольно много результатов, которые не отображались при первичном поиске по запросу «Ludo Block».
Другими словами, если мы добавим к запросу оператор И (а не ИЛИ, хотя казалось бы, это логичное решение), то в результатах увидим разные подмножества общего множества результатов поиска Google. Следовательно, несколько поисков с меньшими потенциальными результатами (из-за добавленного ключевого слова) в итоге дают более уникальные результаты, чем один более широкий поиск. Здесь действительно можно сказать, что less-is-more.
Какие ключевые слова добавить?
Вы можете спросить: какие ключевые слова добавить, чтобы получить доступ к «скрытой» части индекса Google? Те, что имеют какое-то отношение к предмету поиска. Если же нет, Google возьмёт дело в свои руки. Например, посмотрите на это:
Очевидно, что у меня нет ничего общего с оффшорными платформами (честное слово, нет), но Google не любит показывать результаты «0», поэтому он исправит запрос и покажет то, что, по его мнению, вы могли иметь в виду. Для исследователя это (почти) всегда ложные срабатывания.
В заключение отмечу, что ключевое слово должно быть выбрано вдумчиво и может быть получено, например, из уже известных фактов из жизни объекта вашего интереса. Конечно, это путь проб и ошибок, но самое важное — это то, что вы знаете способ, как получить более релевантные результаты.
Автор статьи: Ludo Block
Автор перевода: Наталья Перевалова