🛑 Когда RAG — это лишнее: простой чат-бот без векторной базы

Если ты только начинаешь строить AI-ботов и думаешь, что без RAG-архитектуры никуда — это заблуждение. В этом гайде покажу, как на реальном кейсе сделать бота-консультанта без единой векторной базы, просто с использованием памяти, контекста и кэша.

💬 Когда RAG не нужен?

У тебя небольшой бизнес.
База знаний простая: 30–100 FAQ.

У бота одна функция — ответить на типовые вопросы.
Не нужно делать сложные выборки, фильтрацию, динамический поиск.
Задачи бота: консультация 24/7, ответы по услугам, помощь по продукту.

Пример: бот для онлайн-курса или малого бизнеса — логистики, стоматологии, автосервиса.

⚙️ Как это реализуется: Архитектура флоу

🛠️ Собираем чат-бота на N8n + ChatGPT, только:

Простая Google-таблица с базой знаний в виде вопрос-ответ
Форматирование массива в строку
Подключение к OpenAI

📐 Структура флоу в N8n

🧾 Подготовка базы знаний

Google Sheet с колонками Вопрос и Ответ.
Пример:

Как восстановить пароль на сайте?

Перейдите на страницу входа, нажмите «Забыли пароль?», введите свою почту, и следуйте инструкциям из письма.

В какие часы работает поддержка?

Служба поддержки работает с понедельника по пятницу, с 09:00 до 18:00 по МСК.

📌 Важно: таких пар может быть 30–100

📦 Форматирование данных для OpenAI

Считываем таблицу.
Собираем массив строк в формат: Q: [вопрос] A: [ответ] нодой Aggregate. Аггрегируете оба поля: Вопрос-ответ
Потом передаем агрегированные данные в ChatGPT

ПРОМПТ ДОЛЖЕН БЫТЬ ПОЛНЫМ И НАСТРОЕННЫМ ПОД ВАШ СЛУЧАЙ.

🤖 Промпт для ChatGPT

Обычный системный промпт:

Ты ассистент, отвечающий на вопросы по [название продукта/услуги].
Используй приведённые ниже Вопросы и ответы как источник знаний.
Если не знаешь ответ — скажи честно.

И далее подаём строки со всеми вопросами-ответами.

🧠 Контекст и память

История сообщений поднимается с помощью Memory Manager.
Сохраняем и сообщения пользователя, и ответы бота.
На следующем шаге они снова попадают в prompt → бот контекстуален.

⚠️ Важно: убедись, что сохраняются оба участника диалога. Иначе контекст будет неполным.

Если вы используете просто LLM ноду, то историю сообщений можно передать прямо в User message вашей ноды LLM, где она ищет ответ на вопрос.

✅ Преимущества такого подхода

🟢 Быстрое развертывание: на весь флоу — 5–10 нод.
🟢 Низкие издержки: нет базы, индексации, эмбеддингов.
🟢 Высокая точность: при правильно написанных вопрос-ответах бот почти не ошибается.

🟢 Простота для клиентов: продавай как low-code/AI решение без сложных настроек.

🧩 Кому это подойдёт?

Продюсерам онлайн-курсов → бот-помощник 24/7.
Студиям и агентствам → FAQ по услугам.
Микробизнесу → не надо тратить время и деньги на векторные БД.
Разработчикам → как MVP перед полноценной системой.

🏁 Заключение: не строй RAG, если он не нужен

Не нужно автоматизировать то, что можно просто организовать.

У тебя 30–50 вопросов? Используй CAG - это то что мы сейчас делали
Нет сложных сценариев — не усложняй.
Чем проще система, тем надёжнее она работает.