June 10

Когда RAG — это лишнее: простой чат-бот без векторной базы


🛑 Когда RAG — это лишнее: простой чат-бот без векторной базы

Если ты только начинаешь строить AI-ботов и думаешь, что без RAG-архитектуры никуда — это заблуждение. В этом гайде покажу, как на реальном кейсе сделать бота-консультанта без единой векторной базы, просто с использованием памяти, контекста и кэша.


💬 Когда RAG не нужен?

  • У тебя небольшой бизнес.
  • База знаний простая: 30–100 FAQ.
  • У бота одна функция — ответить на типовые вопросы.
  • Не нужно делать сложные выборки, фильтрацию, динамический поиск.
  • Задачи бота: консультация 24/7, ответы по услугам, помощь по продукту.

Пример: бот для онлайн-курса или малого бизнеса — логистики, стоматологии, автосервиса.


⚙️ Как это реализуется: Архитектура флоу

🛠️ Собираем чат-бота на N8n + ChatGPT, только:

  • Простая Google-таблица с базой знаний в виде вопрос-ответ
  • Форматирование массива в строку
  • Подключение к OpenAI


📐 Структура флоу в N8n


🧾 Подготовка базы знаний

  • Google Sheet с колонками Вопрос и Ответ.
  • Пример:

Как восстановить пароль на сайте?

Перейдите на страницу входа, нажмите «Забыли пароль?», введите свою почту, и следуйте инструкциям из письма.

В какие часы работает поддержка?

Служба поддержки работает с понедельника по пятницу, с 09:00 до 18:00 по МСК.

📌 Важно: таких пар может быть 30–100


📦 Форматирование данных для OpenAI

  • Считываем таблицу.
  • Собираем массив строк в формат: Q: [вопрос] A: [ответ] нодой Aggregate. Аггрегируете оба поля: Вопрос-ответ
  • Потом передаем агрегированные данные в ChatGPT
ПРОМПТ ДОЛЖЕН БЫТЬ ПОЛНЫМ И НАСТРОЕННЫМ ПОД ВАШ СЛУЧАЙ.

🤖 Промпт для ChatGPT

Обычный системный промпт:

Ты ассистент, отвечающий на вопросы по [название продукта/услуги].
Используй приведённые ниже Вопросы и ответы как источник знаний.
Если не знаешь ответ — скажи честно.

И далее подаём строки со всеми вопросами-ответами.


🧠 Контекст и память

  • История сообщений поднимается с помощью Memory Manager.
  • Сохраняем и сообщения пользователя, и ответы бота.
  • На следующем шаге они снова попадают в prompt → бот контекстуален.

⚠️ Важно: убедись, что сохраняются оба участника диалога. Иначе контекст будет неполным.

Если вы используете просто LLM ноду, то историю сообщений можно передать прямо в User message вашей ноды LLM, где она ищет ответ на вопрос.


✅ Преимущества такого подхода

  • 🟢 Быстрое развертывание: на весь флоу — 5–10 нод.
  • 🟢 Низкие издержки: нет базы, индексации, эмбеддингов.
  • 🟢 Высокая точность: при правильно написанных вопрос-ответах бот почти не ошибается.
  • 🟢 Простота для клиентов: продавай как low-code/AI решение без сложных настроек.

🧩 Кому это подойдёт?

  • Продюсерам онлайн-курсов → бот-помощник 24/7.
  • Студиям и агентствам → FAQ по услугам.
  • Микробизнесу → не надо тратить время и деньги на векторные БД.
  • Разработчикам → как MVP перед полноценной системой.

🏁 Заключение: не строй RAG, если он не нужен

Не нужно автоматизировать то, что можно просто организовать.
  • У тебя 30–50 вопросов? Используй CAG - это то что мы сейчас делали
  • Нет сложных сценариев — не усложняй.
  • Чем проще система, тем надёжнее она работает.