March 20

Встреча 5 — [2024-03-19]  

Презентация

Философские идеи встречи

  • Нуминозность ИИ: Переживание контакта с ИИ может восприниматься как столкновение с чем-то божественным, непостижимым разумом. Это вызывает спектр эмоций от страха перед неведомым до восхищения открывающимися возможностями.
  • ИИ как инструмент творца: Современные ИИ-системы становятся полноценными инструментами для реализации творческих замыслов человека. Генеративные модели применяются на всех этапах создания произведений - от текста до видео и звука.
  • Коллаборация человека и ИИ: Внедрение ИИ в креативные индустрии не вытесняет человека, а напротив, усиливает его возможности. ИИ берет на себя рутину и помогает воплотить задумки, которые были бы слишком сложны для человека. Однако итоговый контроль и видение остаются за человеком.
  • Снижение порога входа в творческие профессии: Благодаря развитию ИИ-инструментов, многие креативные задачи становятся доступны людям без специальных технических навыков. Это открывает дорогу в творческие индустрии новым талантам.
  • Этика и ответственность при использовании ИИ: Genплиенение мощных генеративных моделей несет в себе риски создания фейков, дезинформации, авторского права. Необходимы механизмы контроля и регулирования, чтобы ИИ не использовался во вред.
  • Новая эстетика: ИИ-генерированные изображения, тексты, музыка и видео начинают формировать новую эстетику, отличающиеся от привычных человеческих канонов. Это может привести к трансформации самого понятия искусства.
  • Экономика внимания в эпоху ИИ: В условиях, когда генерация контента становится все более автоматизированной и доступной, на первый план выходит умение привлекать и удерживать внимание аудитории. Востребованными становятся курирование, интерпретация, понимание культурного контекста.

Конспект

1/ Text gen & writing

  • AI для написания текстов и создания сценариев
  • Инструменты:
    • Hemingway: приложение для писателей с элементами AI (выделение конструкций, распознавание текстов и образов)
    • Obsidian с AI плагинами для написания книг и развития персонажей
    • Приложения для упрощения письма - браузерные командные строки (Raycast) для работы с текстом

2/ Visual gen

  • Обзор закрытых (Midjourney) и открытых (Stable Diffusion) моделей для генерации изображений
  • Экосистема Stable Diffusion - разные сборки моделей под конкретные задачи, возможность дообучения
  • Создание фотореалистичных изображений людей и объектов
  • Интерфейсы: встроенный Midjourney и альтернативные GUI
  • Работа с промптами, референсами по контенту и стилю, ремиксы изображений
  • Новые функции: 3D-генерация в Stable Diffusion, Prompt Tuner в Midjourney
  • DALL-E как модель, обученная на смыслах, а не только на изображениях

3/ Video gen

  • Обзор моделей: DALL-E 2 (генерация из текста), Runway (полноценные метражные AI-видео)
  • Pika.art - быстрая генерация коротких видео по текстовому описанию
  • Другие модели: Stable Diffusion Video, Phenaki, Imagen Video от Google
  • Прогресс в фотореалистичности видео и понимании физики мира моделями

4/ Audio gen

  • Преимущества аудио интерфейсов для продуктивности
  • Сервисы генерации песен по тексту (StableAudio), MIDI-файлов, озвучки
  • Клонирование голоса через сервис У
  • Stable Audio - генерация музыки по текстовому описанию

5/ homework + Другие применения AI для творчества

  • Визуализация данных и дата-арт через библиотеки p5 с помощью ChatGPT
  • AI-модули в Touch Designer для создания интерактивных перформансов
  • Возможности для творческих профессий - AI как инструмент, а не замена
  • Важность обмена результатами и идеями в чате курса aim
  • Понимание возможностей AI, даже без полной реализации - часть Mindset
  • Необходимость адаптивности и гибкости в быстро меняющемся AI-ландшафте
  • Рекомендация подкаста Lex Friedman с Altman о будущем AI

Glossary

  • Fine-tuning - дообучение модели на специфических данных для улучшения качества генерации в конкретных задачах
  • Prompt - текстовое описание желаемого результата генерации (изображения, видео, аудио и т.д.)
  • FOMO (Fear of Missing Out) - страх упустить важное событие или возможность, беспокойство по поводу того, что другие получают удовольствие или выгоду, которых лишен ты
  • Remix mode - генерация вариаций уже созданного изображения MidJouney
  • Generative art - искусство, создаваемое с помощью алгоритмов, в т.ч. нейросетей
  • Disruption - кардинальное изменение индустрии или бизнес-модели под влиянием новых технологий
  • Data art - художественная интерпретация и визуализация данных
  • Voice cloning - создание синтетической копии голоса на базе образца записи речи человека
  • Нуминозность - ощущение присутствия чего-то божественного, сверхъестественного, вызывающего благоговение и трепет

Ссылки

  • Obsidian - приложение для ведения заметок и управления знаниями
  • AI Dungeon - текстовая ролевая игра с ИИ
  • Raycast - продуктивность для macOS
  • Hemingway - приложение для писателей с AI-функциями
  • Raycast - командная строка с AI-функциями
  • Midjourney - сервис генерации изображений по текстовому описанию
  • Stable Diffusion - открытая модель генерации изображений
  • DALL-E - генерация изображений от OpenAI
  • Pika - сервис для быстрой генерации коротких видео
  • Runway - платформа для создания AI-видео
  • ElevenLabs – создание и клонирование голоса
  • Descript - сервис редактуры подкастов с AI
  • Soundraw - генерация музыки из текста
  • Stable Audio - генерация музыки из текста на базе Stable Diffusion
  • p5.js - библиотека для визуализации данных и генеративного искусства
  • TouchDesigner - среда для создания интерактивных визуальных эффектов