Урок 4 «Perplexity для поиска исходных данных и датасетов для анализа» | AI для науки
👨💻 Автор урока: Александр Капитонов, кандидат технических наук, доцент, специалист в области робототехники и машинного обучения
📌 В этом уроке вы узнаете, как использовать Perplexity AI для поиска исходных данных и датасетов, которые можно анализировать при помощи алгоритмов и инструментов искусственного интеллекта.
Содержание:
Как находить первичные данные с помощью AI?
📌 Данные служат фундаментом и позволяют ученым изучать реальные явления, находить закономерности, проверять гипотезы и делать выводы на основе фактических наблюдений.
Давайте обратимся к Perplexity и напишем следующий запрос:
Где можно найти исходные данные и датасеты для исследования в области [тема / область исследования]
Давайте попробуем сформулировать то же самое на английском языке и посмотрим на результат:
Where can I find the data sources and datasets for [тема / область исследования]?
Мы видим ссылки на конкретные источники, где можно найти данные для исследований.
📌 Далее стоит попробовать найти датасеты на конкретном ресурсе. И один из самых популярных, которым я пользуюсь, это Kaggle.
Давайте воспользуемся предыдущим промптом, но попросим Perplexity изучить конкретно Kaggle.
Where can I find the data sources and datasets for [тема / область исследования]?Check Kaggle.
Так мы получаем ссылки на конкретные датасеты, на Kaggle, которые можно использовать для того, чтобы скачать датасеты и уже исследовать их на своем компьютере.
📌 В этом уроке мы с вами научились формулировать запросы в Perplexity для поиска ресурсов, которые агрегируют датасеты и тулзы для обработки этих данных. 😎
Словарь урока
📌 Промпт – это текстовая инструкция, которая дается модели искусственного интеллекта для того, чтобы задать требования к результату.
📌 Датасет – это набор данных, который содержит информацию об определенной теме или предмете и используется для анализа, исследования и создания моделей в различных областях, таких как наука, бизнес и образование.
Задание
В качестве тренировки, попробуйте перейти на сайт Perplexity и найти с его помощью несколько датасетов.
Дополнительные материалы
Сайт Kaggle: https://www.kaggle.com/