RAG vs простой бот: когда нужна векторная база
RAG (Retrieval-Augmented Generation) — модное слово, но не волшебная пилюля. Для половины задач достаточно сценарного бота. Разберём, как понять, что вам нужно именно RAG.
Когда хватит сценарного бота
- У вас 5–10 типовых сценариев, каждый с понятным деревом ветвлений.
- Клиенты задают одни и те же вопросы — их легко покрыть FAQ-блоками.
- Услуги стандартные, цены не меняются часто.
- Объём базы знаний — до 5 страниц текста.
Когда нужен RAG
- База знаний — десятки страниц: услуги, мастера, правила, FAQ, политики.
- Клиенты задают вопросы по-разному, синонимами и в разном порядке слов.
- Цены и услуги меняются часто — переписывать сценарии каждый раз дорого.
- Хочется, чтобы ассистент звучал как живой человек, а не как анкета.
- Есть сложные «обходные» сценарии: «вы делаете X для случая Y?» — сценарный бот тут провалится.
Сколько это стоит
В NovaLead RAG включён в платные тарифы — отдельной платы за вектор-БД нет. Стоимость зависит от количества сообщений: каждый ответ AI потребляет токены LLM (1500–4000 на сообщение) + 1 запрос к Qdrant. На реальном потоке малого бизнеса это обычно укладывается в тарифы 1 990–7 990 ₽/мес.
Не все «AI-ассистенты на рынке» используют RAG. Некоторые засовывают всю базу знаний в системный промпт каждым запросом — это в 5–10 раз дороже и быстро упирается в лимит контекста LLM.
Что читать дальше
Если вы разбираетесь в теме глубже, продолжите с материалами: Knowledge Base для LLM-агента, Как обучить нейросеть на своих данных, Как написать промпт для AI-ассистента.
Попробовать NovaLead
7 дней бесплатно, без карты
AI-ассистент, NovaClients и все мессенджеры в одном аккаунте.
Начать бесплатно