Когда RAG — это лишнее: простой чат-бот без векторной базы
🛑 Когда RAG — это лишнее: простой чат-бот без векторной базы
Если ты только начинаешь строить AI-ботов и думаешь, что без RAG-архитектуры никуда — это заблуждение. В этом гайде покажу, как на реальном кейсе сделать бота-консультанта без единой векторной базы, просто с использованием памяти, контекста и кэша.
💬 Когда RAG не нужен?
- У бота одна функция — ответить на типовые вопросы.
- Не нужно делать сложные выборки, фильтрацию, динамический поиск.
- Задачи бота: консультация 24/7, ответы по услугам, помощь по продукту.
Пример: бот для онлайн-курса или малого бизнеса — логистики, стоматологии, автосервиса.
⚙️ Как это реализуется: Архитектура флоу
🛠️ Собираем чат-бота на N8n + ChatGPT, только:
- Простая Google-таблица с базой знаний в виде вопрос-ответ
- Форматирование массива в строку
- Подключение к OpenAI
📐 Структура флоу в N8n
🧾 Подготовка базы знаний
Как восстановить пароль на сайте?
Перейдите на страницу входа, нажмите «Забыли пароль?», введите свою почту, и следуйте инструкциям из письма.
В какие часы работает поддержка?
Служба поддержки работает с понедельника по пятницу, с 09:00 до 18:00 по МСК.
📌 Важно: таких пар может быть 30–100
📦 Форматирование данных для OpenAI
- Считываем таблицу.
- Собираем массив строк в формат:
Q: [вопрос] A: [ответ] нодой Aggregate. Аггрегируете оба поля: Вопрос-ответ - Потом передаем агрегированные данные в ChatGPT
🤖 Промпт для ChatGPT
Ты ассистент, отвечающий на вопросы по [название продукта/услуги]. Используй приведённые ниже Вопросы и ответы как источник знаний. Если не знаешь ответ — скажи честно.
И далее подаём строки со всеми вопросами-ответами.
🧠 Контекст и память
- История сообщений поднимается с помощью Memory Manager.
- Сохраняем и сообщения пользователя, и ответы бота.
- На следующем шаге они снова попадают в prompt → бот контекстуален.
⚠️ Важно: убедись, что сохраняются оба участника диалога. Иначе контекст будет неполным.
Если вы используете просто LLM ноду, то историю сообщений можно передать прямо в User message вашей ноды LLM, где она ищет ответ на вопрос.
✅ Преимущества такого подхода
- 🟢 Быстрое развертывание: на весь флоу — 5–10 нод.
- 🟢 Низкие издержки: нет базы, индексации, эмбеддингов.
- 🟢 Высокая точность: при правильно написанных вопрос-ответах бот почти не ошибается.
🧩 Кому это подойдёт?
- Продюсерам онлайн-курсов → бот-помощник 24/7.
- Студиям и агентствам → FAQ по услугам.
- Микробизнесу → не надо тратить время и деньги на векторные БД.
- Разработчикам → как MVP перед полноценной системой.
🏁 Заключение: не строй RAG, если он не нужен
Не нужно автоматизировать то, что можно просто организовать.
- У тебя 30–50 вопросов? Используй CAG - это то что мы сейчас делали
- Нет сложных сценариев — не усложняй.
- Чем проще система, тем надёжнее она работает.