March 27

Встреча 6 — office hours 2024-03-23 

Видео

video

key concepts: Artificial Intelligence, Transcription, Context, Machine Learning, Automation, Debugging, Programming, API, Visual Interface

Ключевые идеи встречи

  • Современные модели ИИ, такие как Claude и GPT-4, пока еще недостаточно понимают контекст, чтобы давать релевантные ответы на сложные вопросы. Для полноценного "понимания" им требуется очень много дополнительного контекста.
  • Скорость прогресса генеративных моделей ИИ впечатляет - появляются новые возможности буквально каждую неделю. Пример - интеграция Anthropic Claude в приложение yac.com для создания голосовых ботов.
  • Для эффективного применения ИИ важно экспериментировать, итеративно дорабатывать промпты и искать оптимальный формат взаимодействия с моделью под конкретную задачу. "Из коробки" результат часто неидеален.
  • Оперативность внедрения новых моделей ИИ в существующие продукты (например, процессора Cerebras в Anthropic API) показывает высокий спрос и готовность рынка быстро подхватывать инновации в этой сфере.
  • Обсуждается важный вопрос о том, какой минимальный набор навыков программирования и работы с данными нужен не-техническим специалистам для продуктивного использования существующих ИИ-инструментов.

1/ Интеграция моделей ИИ в приложения

  • Демонстрация интеграции модели Anthropic Claude в сервис yac.com для создания телефонных голосовых ботов
  • Высокая скорость работы благодаря использованию процессора Cerebras вместо GPU
  • Возможность получения расшифровки звонка и передачи в другие сервисы (Zapier, ноушн, телеграм-бот)
  • Ограничения: модель не поддерживает функцию "function calling", при больших объемах данных для достижения качества все равно придется использовать более медленный Claude API

2/ Дискуссия по использованию ИИ для долгосрочных расчетов и хранения данных

  • Нативный интерфейс ChatGPT не подходит для сценариев, где требуется долгосрочная память и хранение промежуточных данных между сессиями
  • Возможное решение - выгружать данные во внешние таблицы/базы данных и передавать боту вместе с запросом
  • Для подобных кейсов больше подходят платформы автоматизации (Zapier, Make, n8n), позволяющие связать ИИ-модели с внешними хранилищами данных

3/ Генерация саммари коллекции через ChatGPT

  • Демонстрация автоматической генерации саммари коллекции по загруженному файлу с транскриптом
  • Итеративная работа над промптом, добавление инструкций по форматированию и языку
  • Дообучение модели на истории диалогов в конкретном чате для лучшего понимания контекста
  • Ограничения: саммари по полному тексту лекции (~1.5 часа) некачественные из-за потери контекста

4/ Генерация иллюстрированных книг через ChatGPT

  • Эксперимент по созданию интерактивной версии книги с текстом и сгенерированными иллюстрациями
  • Важность детального описания визуального стиля персонажей и сцен в промпте
  • Дообучение модели на содержании конкретной книги, чтобы она не "додумывала" сюжет
  • Формат "текстовой игры" с возможностями перехода по главам, анализа текста, генерации иллюстраций

5/ Обсуждение развития Low-code/No-code генеративных ИИ-инструментов

  • В ближайшие годы потребуется базовое понимание принципов работы API, форматов данных, HTTP-запросов. Но порог входа будет снижаться.
  • Примеры демократизации разработки игр благодаря визуальным конструкторам вроде Unreal Engine и Unity. Аналогичные процессы ожидаются в генеративном ИИ.
  • Совет изучать ровно столько, сколько нужно для решения своих задач. Возможность в любой момент задать вопрос ChatGPT и получить объяснение.
  • Обучение на практике, через просмотр туториалов и демок на YouTube, копирование работающих решений.