Встреча 1 — [2024-03-05]
Видео
Презентация
Конспект лекции AI Mindset #1
1/ Введение
Обзор целей лаборатории и интерактивного формата
Цель: создать пространство для работы над задачами с использованием AI-инструментов, предоставить набор инструментов для настройки под свои задачи
Интерактивный формат: упор на практику, работа в группах для обсуждения задач, сложностей и опасений, обмен опытом, формирование групп по интересам для микропроектов
Принципы лаборатории: важность практики для интеграции AI-инструментов в жизнь, ориентация на количество времени практики, соблюдение тайминга сессий
Фасилитация: возможность записаться на индивидуальные сессии с Алисой Кузнецовой для прояснения целей, задач и сложностей в контексте лаборатории, помощь в организации процесса работы над проектами
2/ AI-революция
Экспоненциальный рост: ускорение развития AI-технологий, появление новых прорывов каждую неделю
Научные публикации: увеличение количества исследований, связанных с AI, индикатор серьезности развития области
Инвестиции: большие суммы, вкладываемые в AI-компании и исследования, например, попытка openAI привлечь $7 трлн
Последние достижения: языковые модели (Gemini, Claude), генерация видео (Sora), мультимодальность (GPT-4), открытые модели (Mistral, LLaMA)
Направления развития: мультимодальность (работа с различными типами данных), персонализация (адаптация под конкретного пользователя), надежность (выбор лучшего ответа), возможность мышления
3/ AI-инструменты
Краткий обзор ключевых AI-инструментов для изучения и использования
- ChatGPT (OpenAI): лучшая в своем классе, мультимодальная, Dall-E, плагины
- Claude (Anthropic): большое окно контекста, работа с файлами
- Mistral 7B: локальная модель с открытым исходным кодом
- Gemini / Bard (Google): мультимодальная, быстрая, ранний доступ, 3 версии (ultra/pro/light)
- LLaMA (Meta): открытые веса, легко модифицировать
- Pi (Inflection): персональный эмпатичный AI
Интерфейсы: ChatGPT, Poe (доступ к различным моделям в одном интерфейсе), телеграм-боты, Anthropic Claude, Perplexity AI
Инструменты для работы с изображениями: DALL-E, Midjourney
Инструменты для создания персональных ассистентов: Repl.it, GitHub Codespaces
4/ Декомпозиция AI: промпты
Основы составления промптов и технологии нейронных сетей
Компоненты промпта: роль (цель и контекст), инструкция (конкретная задача), стиль (тон и манера изложения), формат (структура вывода), примеры (образцы желаемого результата)
Итеративный подход к созданию промптов: уточнение и дополнение промпта на основе полученных результатов
Примеры промптов и результатов: составление промптов для summarization подкастов, генерации идей, перевода и улучшения текстов
Файн-тюнинг моделей под конкретные задачи с помощью обучения на примерах
5/ Кейсы использования персональных ассистентов
Примеры ботов и персональных ассистентов, разработанных в рамках предыдущих лабораторий
- Подкаст-саммаризатор: бот, который принимает ссылку на YouTube-видео и файл с транскриптом, и генерирует структурированное саммари подкаста в формате Markdown с ключевыми концепциями и идеями
- Интерактивный ассистент по философии: бот, обученный на транскриптах лекций по философии, способный отвечать на вопросы и вести дискуссии по темам, затронутым в лекциях
- Генератор ювелирных дизайнов: ассистент, который создает дизайны ювелирных изделий на основе текстовых описаний и скетчей, используя генеративные модели, такие как DALL-E и Midjourney
- Персональный помощник для изучения английского: бот, который помогает улучшить письменные навыки на английском языке, переводя и корректируя тексты, написанные пользователем
- Интерактивная книга с визуализациями: ассистент, который создает интерактивный опыт чтения книги, генерируя визуальные образы и концепции на основе текста книги
6/ Подведение итогов и дальнейшие шаги
Домашнее задание и личные проекты
- Обмен опытом и обратной связью в группе: обсуждение результатов, решений
- Планирование следующих шагов в освоении AI-технологий: изучения и развития навыков
- Подготовка к следующему занятию: изучение дополнительных материалов, работа над личными проектами
- Возможность презентации своих проектов и получения обратной связи
- Получить доступ к AI-инструментам: бесплатные (Mistral, LLaMA) и платные (GPT-4, Claude)
- Подумать над проектом для реализации в рамках лаборатории: применение AI в любых сферах (анализ данных, генерация контента, оптимизация процессов и т.д.)
- Делиться вопросами, сложностями и успехами в чате
- Примеры проектов: чат-бот на основе лекций или книг, генерация изображений по текстовому описанию, анализ и categorization текстов
- Возможность объединения в группы для совместной работы над проектами
Глоссарий
- AI - искусственный интеллект
- LLM (Large Language Model): большая языковая модель, обученная на огромных объемах текстовых данных
- GPT - модель нейронной сети для генерации текста
- Мультимодальность - способность нейросети работать с данными разных типов (текст, изображения, речь)
- Промпт (Prompt): текстовая инструкция или вопрос, подаваемый на вход языковой модели для получения ответа или генерации текста
- Файн-тюнинг (Fine-tuning): процесс дообучения предварительно обученной модели на специфических данных для улучшения производительности в конкретной задаче
- Мультимодальность (Multimodality): способность модели работать с различными типами данных (текст, изображения, аудио, видео)
- Окно контекста (Context window): максимальное количество токенов (слов или фрагментов слов), которое модель может обработать за один раз
- Токен (Token): минимальная значимая единица текста, используемая при обработке естественного языка, обычно слово или часть слова
- Машинное обучение - наука об алгоритмах, которые улучшают свои показатели при решении задач на основе данных
- Трансформер - архитектура нейросетей, основанная на механизме внимания
- Датасет - набор данных, используемых для обучения нейросетей
- API - интерфейс для взаимодействия программ друг с другом
- Alignment - выравнивание, согласование цели нейросети с человеческими ценностями
Links
- OpenAI – ChatGPT
- POE - интерфейс для доступа к разным моделям
- Anthropic – Claude
- Pi (Inflection)
- LlaMA (Meta)
- Google Colab
- MacWhisper – text-to-audio tool
- Aiko – text-to-audio tool
- Midjourney
- DALL-E
- Obsidian
- AI Explained
- THERE'S AN AI FOR THAT