March 20
Встреча 5 — [2024-03-19]
Презентация
Философские идеи встречи
- Нуминозность ИИ: Переживание контакта с ИИ может восприниматься как столкновение с чем-то божественным, непостижимым разумом. Это вызывает спектр эмоций от страха перед неведомым до восхищения открывающимися возможностями.
- ИИ как инструмент творца: Современные ИИ-системы становятся полноценными инструментами для реализации творческих замыслов человека. Генеративные модели применяются на всех этапах создания произведений - от текста до видео и звука.
- Коллаборация человека и ИИ: Внедрение ИИ в креативные индустрии не вытесняет человека, а напротив, усиливает его возможности. ИИ берет на себя рутину и помогает воплотить задумки, которые были бы слишком сложны для человека. Однако итоговый контроль и видение остаются за человеком.
- Снижение порога входа в творческие профессии: Благодаря развитию ИИ-инструментов, многие креативные задачи становятся доступны людям без специальных технических навыков. Это открывает дорогу в творческие индустрии новым талантам.
- Этика и ответственность при использовании ИИ: Genплиенение мощных генеративных моделей несет в себе риски создания фейков, дезинформации, авторского права. Необходимы механизмы контроля и регулирования, чтобы ИИ не использовался во вред.
- Новая эстетика: ИИ-генерированные изображения, тексты, музыка и видео начинают формировать новую эстетику, отличающиеся от привычных человеческих канонов. Это может привести к трансформации самого понятия искусства.
- Экономика внимания в эпоху ИИ: В условиях, когда генерация контента становится все более автоматизированной и доступной, на первый план выходит умение привлекать и удерживать внимание аудитории. Востребованными становятся курирование, интерпретация, понимание культурного контекста.
Конспект
1/ Text gen & writing
2/ Visual gen
- Обзор закрытых (Midjourney) и открытых (Stable Diffusion) моделей для генерации изображений
- Экосистема Stable Diffusion - разные сборки моделей под конкретные задачи, возможность дообучения
- Создание фотореалистичных изображений людей и объектов
- Интерфейсы: встроенный Midjourney и альтернативные GUI
- Работа с промптами, референсами по контенту и стилю, ремиксы изображений
- Новые функции: 3D-генерация в Stable Diffusion, Prompt Tuner в Midjourney
- DALL-E как модель, обученная на смыслах, а не только на изображениях
3/ Video gen
- Обзор моделей: DALL-E 2 (генерация из текста), Runway (полноценные метражные AI-видео)
- Pika.art - быстрая генерация коротких видео по текстовому описанию
- Другие модели: Stable Diffusion Video, Phenaki, Imagen Video от Google
- Прогресс в фотореалистичности видео и понимании физики мира моделями
4/ Audio gen
- Преимущества аудио интерфейсов для продуктивности
- Сервисы генерации песен по тексту (StableAudio), MIDI-файлов, озвучки
- Клонирование голоса через сервис У
- Stable Audio - генерация музыки по текстовому описанию
5/ homework + Другие применения AI для творчества
- Визуализация данных и дата-арт через библиотеки p5 с помощью ChatGPT
- AI-модули в Touch Designer для создания интерактивных перформансов
- Возможности для творческих профессий - AI как инструмент, а не замена
- Важность обмена результатами и идеями в чате курса aim
- Понимание возможностей AI, даже без полной реализации - часть Mindset
- Необходимость адаптивности и гибкости в быстро меняющемся AI-ландшафте
- Рекомендация подкаста Lex Friedman с Altman о будущем AI
Glossary
- Fine-tuning - дообучение модели на специфических данных для улучшения качества генерации в конкретных задачах
- Prompt - текстовое описание желаемого результата генерации (изображения, видео, аудио и т.д.)
- FOMO (Fear of Missing Out) - страх упустить важное событие или возможность, беспокойство по поводу того, что другие получают удовольствие или выгоду, которых лишен ты
- Remix mode - генерация вариаций уже созданного изображения MidJouney
- Generative art - искусство, создаваемое с помощью алгоритмов, в т.ч. нейросетей
- Disruption - кардинальное изменение индустрии или бизнес-модели под влиянием новых технологий
- Data art - художественная интерпретация и визуализация данных
- Voice cloning - создание синтетической копии голоса на базе образца записи речи человека
- Нуминозность - ощущение присутствия чего-то божественного, сверхъестественного, вызывающего благоговение и трепет
Ссылки
- Obsidian - приложение для ведения заметок и управления знаниями
- AI Dungeon - текстовая ролевая игра с ИИ
- Raycast - продуктивность для macOS
- Hemingway - приложение для писателей с AI-функциями
- Raycast - командная строка с AI-функциями
- Midjourney - сервис генерации изображений по текстовому описанию
- Stable Diffusion - открытая модель генерации изображений
- DALL-E - генерация изображений от OpenAI
- Pika - сервис для быстрой генерации коротких видео
- Runway - платформа для создания AI-видео
- ElevenLabs – создание и клонирование голоса
- Descript - сервис редактуры подкастов с AI
- Soundraw - генерация музыки из текста
- Stable Audio - генерация музыки из текста на базе Stable Diffusion
- p5.js - библиотека для визуализации данных и генеративного искусства
- TouchDesigner - среда для создания интерактивных визуальных эффектов