Кейсы применения AI
June 24

Урок 6 «Litmaps для научного поиска» | AI для науки

👨‍💻 Автор урока: Александр Капитонов, кандидат технических наук, доцент, специалист в области робототехники и машинного обучения

📌 В этом уроке вы познакомитесь с еще одним инструментом для поиска литературы, который позволяет не только найти конкретный источник или статью и получить по ней небольшую выжимку, но и соотнести эту статью с другими публикациями, которые были сделаны раньше или позже.

Содержание:

Обзор сервиса Litmaps

📌 Базово, это интерфейс, который позволяет нам увидеть карту с публикациями и их расположение во времени с количеством цитирований и ссылок внутри статьи.

Давайте разбираться по порядку.

Шаг 1: Перейдите на сайт https://www.litmaps.com/

Нас приветствует окно, в котором можно начать поиск.

И давайте попробуем это сделать – найдем первую статью по ключевым словам.

Шаг 2: Создайте промпт

В качестве промпта вы можете использовать тему вашего исследования, просто отправив её в поисковую строку.

📌 Напоминание: лучше создавать запрос на английском языке, потому что основной корпус научных текстов создается и публикуется на английском языке.

Например, модели искусственного интеллекта для научного поиска, или Scientific Search AI Models.

Пример ответа:

Мы видим, что нам предложили одну из последних статей, которая вышла в 2024 году. Давайте выберем её и посмотрим как работает Litmaps дальше.

Шаг 3: Изучите связанныe статьи

Мы видим какие-то статьи, связанные с основной, цитированием или общими авторами.

Сервис Litmaps предоставляет результаты выдачи в виде динамической карты связанных статей.

Разброс в 7 лет — между 2017 и 2024 годами

📌 Изначально статьи располагаются на временной линии: от самых ранних публикаций до самых поздних.

В данном случае, здесь у нас есть разброс в 7 лет – между 2017 и 2024 годами.

Мы также видим, что размер точек соотносится с количеством цитирований, но мы можем менять оси на данной карте.

Варианты осей:

  • Количество ссылок
  • Дата
  • Релевантность и другие

Также оси могут быть линейными или логарифмическими.

Дополнительные функции

1. Вы можете создать свою библиотеку для конкретного исследования.

Для этого нужно зайти в раздел «ваша библиотека», сделать новую коллекцию и добавить туда статьи по любым параметрам: по названию, индексу, ссылке – как вам удобнее.

2. Дальше вы можете из этих статей собрать карту и выбрать формат связи по критерию из предложенного списка.

В основном связи показывают цитирования.

📌 Так, самые связанные статьи — это те, которые цитируют и упоминают друг друга больше всего (либо по соавторству, либо по семантическому смыслу).

3. Мы также можем добавить фильтры.

Это доступно в платной версии приложения, но даже бесплатного функционала вам будет достаточно для того, чтобы провести качественный поиск литературы.

Давайте посмотрим, что нам выдаст поисковик по запросу на поиск статей, связанных по соавторам.

Мы видим, что:

  1. У нас есть люди, которые публикуются в статьях и входят в нашу базовую коллекцию.
  2. Есть один соавтор, который написал две статьи из нашей библиотеки (предлагается посмотреть его статьи за 2014, 2015, 2016 годы).
  3. Мы можем изменить параметры, по которым располагаются статьи на этой карте.
  4. Мы можем изменить размер точек (например, по количеству источников в каждой статье).

Теперь давайте вернемся на шаг назад и попробуем сделать семантический поиск.

📌 Семантический поиск работает по принципу похожести контента = насколько содержание статей близко к тому, что вы использовали в ядре своей библиотеки.

Так, система должна выдать статьи, наиболее подходящие к данному набору публикаций и к вашей библиотеке, которую вы загрузили в качестве начальных исходных данных.

Это позволяет:

  • найти новые источники для исследования
  • посмотреть на новых авторов
  • найти какие-то неочевидные связи.

Здесь вы тоже можете определить, как на карте располагаются точки, какие у статей есть общие авторы и так далее.

📌 Итак, мы рассмотрели весьма полезный инструмент, который может предлагать гораздо больше литературы и более точечно предоставлять актуальную информацию. 😎

Успехов и увидимся в следующем уроке!

Словарь урока

📌 Семантический поиск – это метод поиска информации, который учитывает ключевые слова, контекст, значение и взаимосвязи между словами в поисковом запросе, а также между содержимым различных публикаций.

📌Связанные статьи – статьи и публикации, связанные с текущей просматриваемой статьей

Задание

В качестве тренировки, попробуйте перейти на сайт Litmaps и составить свою карту связанных статей, а также протестировать разные настройки по визуализации карты.

Дополнительные материалы

Сайт: Litmaps