Кейсы применения AI
June 24

Урок 4 «Perplexity для поиска исходных данных и датасетов для анализа» | AI для науки

👨‍💻 Автор урока: Александр Капитонов, кандидат технических наук, доцент, специалист в области робототехники и машинного обучения

📌 В этом уроке вы узнаете, как использовать Perplexity AI для поиска исходных данных и датасетов, которые можно анализировать при помощи алгоритмов и инструментов искусственного интеллекта.

Содержание:

Как находить первичные данные с помощью AI?

📌 Данные служат фундаментом и позволяют ученым изучать реальные явления, находить закономерности, проверять гипотезы и делать выводы на основе фактических наблюдений.

Давайте обратимся к Perplexity и напишем следующий запрос:

Где можно найти исходные данные и датасеты для исследования в области [тема / область исследования]

Пример ответа:

Давайте попробуем сформулировать то же самое на английском языке и посмотрим на результат:

Where can I find the data sources and datasets for [тема / область исследования]?

Пример ответа:

Мы видим ссылки на конкретные источники, где можно найти данные для исследований.

📌 Далее стоит попробовать найти датасеты на конкретном ресурсе. И один из самых популярных, которым я пользуюсь, это Kaggle.

Давайте воспользуемся предыдущим промптом, но попросим Perplexity изучить конкретно Kaggle.

Пример промпта:

Where can I find the data sources and datasets for [тема / область исследования]?Check Kaggle.

Пример ответа:

Так мы получаем ссылки на конкретные датасеты, на Kaggle, которые можно использовать для того, чтобы скачать датасеты и уже исследовать их на своем компьютере.

📌 В этом уроке мы с вами научились формулировать запросы в Perplexity для поиска ресурсов, которые агрегируют датасеты и тулзы для обработки этих данных. 😎

Увидимся в следующем уроке!

Словарь урока

📌 Промпт – это текстовая инструкция, которая дается модели искусственного интеллекта для того, чтобы задать требования к результату.

📌 Датасет – это набор данных, который содержит информацию об определенной теме или предмете и используется для анализа, исследования и создания моделей в различных областях, таких как наука, бизнес и образование.

Задание

В качестве тренировки, попробуйте перейти на сайт Perplexity и найти с его помощью несколько датасетов.

Дополнительные материалы

Сайт Kaggle: https://www.kaggle.com/