March 27
Встреча 6 — office hours 2024-03-23
Видео
key concepts: Artificial Intelligence, Transcription, Context, Machine Learning, Automation, Debugging, Programming, API, Visual Interface
Ключевые идеи встречи
- Современные модели ИИ, такие как Claude и GPT-4, пока еще недостаточно понимают контекст, чтобы давать релевантные ответы на сложные вопросы. Для полноценного "понимания" им требуется очень много дополнительного контекста.
- Скорость прогресса генеративных моделей ИИ впечатляет - появляются новые возможности буквально каждую неделю. Пример - интеграция Anthropic Claude в приложение yac.com для создания голосовых ботов.
- Для эффективного применения ИИ важно экспериментировать, итеративно дорабатывать промпты и искать оптимальный формат взаимодействия с моделью под конкретную задачу. "Из коробки" результат часто неидеален.
- Оперативность внедрения новых моделей ИИ в существующие продукты (например, процессора Cerebras в Anthropic API) показывает высокий спрос и готовность рынка быстро подхватывать инновации в этой сфере.
- Обсуждается важный вопрос о том, какой минимальный набор навыков программирования и работы с данными нужен не-техническим специалистам для продуктивного использования существующих ИИ-инструментов.
1/ Интеграция моделей ИИ в приложения
- Демонстрация интеграции модели Anthropic Claude в сервис yac.com для создания телефонных голосовых ботов
- Высокая скорость работы благодаря использованию процессора Cerebras вместо GPU
- Возможность получения расшифровки звонка и передачи в другие сервисы (Zapier, ноушн, телеграм-бот)
- Ограничения: модель не поддерживает функцию "function calling", при больших объемах данных для достижения качества все равно придется использовать более медленный Claude API
2/ Дискуссия по использованию ИИ для долгосрочных расчетов и хранения данных
- Нативный интерфейс ChatGPT не подходит для сценариев, где требуется долгосрочная память и хранение промежуточных данных между сессиями
- Возможное решение - выгружать данные во внешние таблицы/базы данных и передавать боту вместе с запросом
- Для подобных кейсов больше подходят платформы автоматизации (Zapier, Make, n8n), позволяющие связать ИИ-модели с внешними хранилищами данных
3/ Генерация саммари коллекции через ChatGPT
- Демонстрация автоматической генерации саммари коллекции по загруженному файлу с транскриптом
- Итеративная работа над промптом, добавление инструкций по форматированию и языку
- Дообучение модели на истории диалогов в конкретном чате для лучшего понимания контекста
- Ограничения: саммари по полному тексту лекции (~1.5 часа) некачественные из-за потери контекста
4/ Генерация иллюстрированных книг через ChatGPT
- Эксперимент по созданию интерактивной версии книги с текстом и сгенерированными иллюстрациями
- Важность детального описания визуального стиля персонажей и сцен в промпте
- Дообучение модели на содержании конкретной книги, чтобы она не "додумывала" сюжет
- Формат "текстовой игры" с возможностями перехода по главам, анализа текста, генерации иллюстраций
5/ Обсуждение развития Low-code/No-code генеративных ИИ-инструментов
- В ближайшие годы потребуется базовое понимание принципов работы API, форматов данных, HTTP-запросов. Но порог входа будет снижаться.
- Примеры демократизации разработки игр благодаря визуальным конструкторам вроде Unreal Engine и Unity. Аналогичные процессы ожидаются в генеративном ИИ.
- Совет изучать ровно столько, сколько нужно для решения своих задач. Возможность в любой момент задать вопрос ChatGPT и получить объяснение.
- Обучение на практике, через просмотр туториалов и демок на YouTube, копирование работающих решений.