Не одним GeoSpy сыт геоинтер. Сервисы геолокации по фотографии 2025
Эту статью я решил написать в связи с тем, что два популярных сервиса для геолокации по фотографии стали доступны только по приглашению. Я говорю о GeoSpy и GeoEstimation.
Думаю, каждый геоинтер пользовался подобными сервисами для первичного анализа изображения, когда не понятно, в каком регионе начинать поиски.
Я не буду останавливаться на сервисах EarthKit и Picarta, которые и так уже по 10 раз перепостили разные тематические каналы. Их всё ещё можно использовать бесплатно, но неизвестно надолго ли это, учитывая последнюю тенденцию.
За последние годы придумали немало методов обучения нейросетевых моделей для геолокации. На arxiv.org можно найти научные статьи по этой теме. К сожалению, не все авторы статей делятся обученными моделями и сервисами на основе них. Я расскажу о малоизвестных сервисах геолокации, которые мне удалось отыскать.
Location Predictor
https://huggingface.co/spaces/yunusserhat/Location_Predictor
В этом сервисе можно использовать 3 разных модели: StreetCLIP, GeoCLIP и OSV-5M Baseline. Загружаем фотографию, получаем результат. Покажу, что мы получаем при использовании каждой модели.
Только две модели показывают координаты, StreetCLIP в этой реализации выдаёт только страну.
Нанесём на карту найденные координаты. У обоих моделей ошибка около 100км, что вполне нормально для них.
У того же автора есть еще один сервис на основе модели OSV-5M Baseline.
https://huggingface.co/spaces/yunusserhat/guesstimatelocation
Ему можно скормить не только картинку, но и страницу сайта, с которой он возьмёт текст, выкачает картинки и предложит выбрать фото для анализа. Так как используется та же самая модель, что и в предыдущем сервисе, то и результаты отличаться не будут.
Plonk
https://huggingface.co/spaces/nicolas-dufour/Plonk
Сервис Plonk также предлагает для поиска 3 модели. Отличаются они набором данных, на котором были обучены. PLONK_iNaturalist обучена на наборе iNat-21, который содержит 2.7 миллиона снимков животных, растений и других форм жизни. PLONK_YFCC обучена на наборе YFCC-100M, в котором около 100 миллионов фотографий из разных источников. PLONK_OSV_5M обучена на наборе OSV-5M, содержащем 5.1 миллиона фотографий улиц от сервиса Mapillary. Как можно догадаться, модель OSV-5M Baseline, которая используется в предыдущем сервисе, была создана авторами этого набора. Но здесь другая модель, и хоть она и использует тот же набор данных для обучения, результаты работы могут отличаться.
Очевидно, модель PLONK_iNaturalist нам не особо полезна, поэтому проверим работу двух оставшихся моделях.
В этом сервисе можно задать параметр Number of samples - количество результатов, которые выдаёт модель , а также параметр Guidance scale, который по сути задаёт строгость при прогнозировании этих результатов. Чем больше этот параметр, тем кучнее получаются точки. Мне понравилась выдача при значении 0.5.
Обе модели попали в радиус 50км от места фото, что довольно хорошо. Но не факт, что такие же результаты будут на других исходных данных.
ChatGPT
ChatGPT позволяет создавать свои надстройки, которые называются GPTs. По сути это дополнительные инструкции для бота, что выдать юзеру на его запрос. Для использования нужна регистрация, платная версия не нужна. Всем им я послал ту же самую фотографию, что использовал до этого. Ниже привожу ответы этих GPTs для сравнения.
Image Locator
https://chatgpt.com/g/g-wx1eLTbGL-image-locator
This image depicts a sunny street scene with notable elements such as a pedestrian area, trees, a painted curb, and some residential or commercial buildings in the background. Based on visual clues, here is an analysis of the possible location:
- Curb and Road Design:
- The yellow and black curb painting is typical in many parts of India, often used for pedestrian safety and demarcation.
- The road looks newly paved, which could suggest urban development.
- People and Clothing:
- The attire, particularly the sari worn by one of the pedestrians, is traditional Indian clothing, confirming this is likely in India.
- Background Details:
- The gated area appears to be a public space, such as a park or community center, with open red fencing and orange accents, a common aesthetic for public areas in smaller Indian cities.
- The multi-story buildings in the background are typical of Indian suburban or semi-urban residential architecture.
- Vegetation:
- The trees and landscaping reflect a tropical or subtropical climate, consistent with much of India's geography.
- Signage:
Based on these clues, the most probable locations are urban or semi-urban areas in India with growing infrastructure:
- Pune, Maharashtra:
- The combination of greenery, modern infrastructure, and semi-urban architecture fits well with areas on Pune's outskirts.
- Navi Mumbai, Maharashtra:
- A planned urban area with a mix of modern and traditional Indian design. The organized road and park setup align with Navi Mumbai's development style.
- Bangalore, Karnataka:
- Bangalore's suburban areas often have similar community parks and a mix of modern roads with traditional influences.
- Hyderabad, Telangana:
- Similar architectural and urban designs can be seen in Hyderabad's growing residential neighborhoods.
- Nagpur, Maharashtra:
This scene is most likely in a semi-urban or suburban area of Maharashtra or South India. Without further signage or distinct landmarks, Pune or Navi Mumbai are top guesses due to their blend of traditional and modern elements.
Photo Locator
https://chatgpt.com/g/g-TOADOq5ud-photo-locator
This photo seems to depict a typical urban street scene in an Indian city. Here are some details about the location:
- Surroundings: There’s a paved road in the foreground with black-and-yellow safety markings, commonly seen on Indian streets to demarcate edges or medians. The area appears clean and organized.
- Landmarks: On the opposite side of the road, there’s a red gate and a small park or open area surrounded by trees. The park has seating areas with decorative railings, which suggest it’s a public space meant for community use or relaxation.
- Buildings: In the background, there are multi-story residential apartments with a simple design, typical of mid-tier urban housing in India. The layout suggests a neighborhood setting.
- Activity: Pedestrians walking, including a woman in a pink saree and others in casual attire, indicate everyday movement. A white car parked along the road suggests light traffic.
- Climate: The sunlight and clear skies suggest a warm day, possibly in late morning or afternoon.
This scene feels like it could be from a quieter neighborhood or suburban area in a city like Pune, Hyderabad, or Bengaluru. If you’re familiar with the area or need help pinpointing it further, feel free to share more details! 😊
GeoGuessr GPT
https://chatgpt.com/g/g-brlHi7t2R-geoguessr-gpt
This image provides some clear geographical and infrastructural clues. Here's my reasoning:
- Road Markings: The black-and-yellow curb painting is characteristic of Indian roads, often used in urban or suburban areas for delineating medians or roadside barriers.
- Vehicles and Infrastructure: The white hatchback and general traffic patterns resemble common vehicles in India. The license plate appears to be in the format typically used in the country, although the text is not legible.
- Environment: The trees, weather, and light suggest a warm, tropical climate, likely in southern or central India.
- Buildings and People: The buildings in the background appear as mid-rise apartments common in urbanized Indian areas. Additionally, the woman in traditional attire (a sari) points towards India.
- Urban Landscaping: The red-and-yellow painted public park area, along with the surrounding cleanliness and planning, is common in medium-sized cities or well-maintained urban neighborhoods in India.
This location is likely Pune, Maharashtra, India, near a suburban or residential park. Approximate coordinates: 18.5204° N, 73.8567° E.
Ожидаемо они выдали одинаковый результат, причём он практически совпал с результатом модели OSV-5M Baseline. Только Image Locator предложил несколько вариантов, а второй вариант оказался ближе к искомому месту.
Бенчмарки
https://paperswithcode.com/task/photo-geolocation-estimation
По ссылке можно найти результаты тестов моделей на различных датасетах. А также научные статьи и исходники для некоторых моделей. Здесь я приведу таблицу сравнения моделей на датасете Im2GPS3k, который содержит 3000 фотографий из разных мест. Модели base и ISNs относятся к работе создателей GeoEstimation.
Можно видеть, что топовые модели могут попасть в окрестности города только в 35% случаев, а регион определяют в 50%. Примерно таких показателей стоит ожидать от всех подобных сервисов на текущий момент. Так что геоинтерский хлеб пока что в безопасности.