Как найти местоположение на фотографии за 10 минут
Снова поговорим про геопространственную разведку, но на этот раз мы опишем фреймворк, который позволит вам находить местоположение на изображениях за 10 минут. В конце статьи мы поделимся ссылкой на собственную GPT — «GeoVision», которая умеет делать всё то же самое, но автоматически.
Корни метода
Если вы увлекаетесь поиском, то не проходите мимо работы «Искусство поиска», которую написал Франческо Вианелло, известный в хакерских кругах под ником «+Fravia». Из этой работы мы выделили одну мысль, которая стала фундаментом метода. Мысль довольно простая, но её всё равно нужно обдумать:
Объём слов в поисковом запросе обратно пропорционален объёму результатов выдачи.
Другими словами, чем больше вы работаете над созданием и описанием самого поискового запроса, тем меньше вариантов поисковой выдачи вам придётся разгребать чтобы найти то, что вы ищете.
Если вы хотите найти в интернете информацию о картине Билла Стоунхема — «Руки противятся ему» и потратить на это минимум времени, как будет выглядеть ваш поисковой запрос? Сравните два варианта ниже и запомните их, они нам ещё пригодятся.
- Билл Стоунхем (Bill Stoneham), "руки противятся ему" (The Hands Resist Him), история картины
- Картина с руками
Но как это связано с геопространственной разведкой (GEOINT)?
Логика Фравии работает и с визуальным поиском — чем точнее ваш запрос, тем меньше вариантов выдачи вам перебирать, помните? А как выглядит точный запрос для визуального поиска? К примеру, вот изображение. Нам нужно максимально быстро найти его местоположение с точностью до 10 метров.
Разумеется, мы прибегнем к обратному поиску по изображениям. Сперва выбираем инструмент: фотография не выглядит сделанной в России или другой стране СНГ, поэтому мы выбираем Google Image Search*
*Почему? Читайте наш предыдущий материал, посвящённый обратному поиску: https://teletype.in/@inquisitortoday/9DhDrZbhOSS
Но если мы будем искать это изображение целиком, поиск может сильно затянуться, ведь Google будет просто показывать нам похожие сцены. Помните пример с поиском картины художника? Если сравнивать эти запросы, то картинка ниже — это запрос уровня: «найди картину художника про руки» — в принципе, вы найдёте то что ищите, но это будет не быстро.
Если мы хотим сделать максимально точный запрос а-ля «Билл Стоунхем (Bill Stoneham), "руки противятся ему" (The Hands Resist Him), история картины», но в контексте визуального поиска, нам стоит уделить внимание самой уникальной сцене внутри изображения. Посмотрите на первую фотографию. Как её можно обрезать, чтобы осталась только самая уникальная её сцена?
В этом кадрировании важно всё: зелёные крыши одинаковых домов, холмы над ними, парковка рядом и бежевое здание слева. Это и есть тот «самый уникальный запрос». Зелёные крыши домов существуют в большем количестве, чем зелёные крыши домов в низине холмов, рядом с парковкой и бежевым зданием. Мы просто делаем максимально точный запрос по методу Фравии, только используем для этого не слова, а визуальные объекты.
После кадрирования изображения мы находим уже ту сцену, которую и искали. Второй вариант, на японском языке, кажется максимально подходящим: через него вы можете найти название города, если переведёте иероглифы на русский язык, но в таком случае вам всё равно придётся искать точное место. Всегда в первую очередь обращайте внимание на первый вариант, ведь поисковики сортируют выдачу по релевантности. В самом первом варианте написан точный адрес, который мы далее можем подтвердить через Google Maps.
Окей, какой порядок поиска?
Предположим, у вас есть изображение и вам нужно его геолоцировать. Вы проверили метаданные* и не нашли их, остался только визуальный поиск.
- Определите инструмент визуального поиска. Если изображение похоже на страну СНГ или Восточной Европы, используйте Yandex Image Search, в остальных случаях лучше справится Google.
- Найдите самый уникальную сцену изображения. В некоторых случаях это может быть сцена, а-ля «одинаковые дома с зелёной крышей в низине холмов в стране с правосторонним движением», а в некоторых — вывеска с номером телефона. Начинайте поиск с самой уникальной сцены.
- Если не получилось со вторым пунктом, выпишите все объекты, которые вам кажутся важными для поиска: от вывесок домов и номеров машин, до растений. Постепенно сужайте рамки поиска вашего запроса.
* Любое геолоцирование изображения или видео должно начинаться с поиска метаданных.
Собственно, по этой логике мы и тренировали нашу GPT. Если у вас есть подписка на ChatGPT Plus, вы можете протестировать нашу модель по этой ссылке: https://chat.openai.com/g/g-hzJ79auxE-geovision