Инструкция по настройке Knowledge Base для LLM-агента
Если AI-ассистент путается, выдумывает цены и не знает, как зовут вашего директора, — почти наверняка дело в базе знаний. Конкретно: как она структурирована и что в неё попало.
Эта статья — практический гайд для тех, кто настраивает RAG (Retrieval-Augmented Generation) в NovaLead или похожих системах.
Что такое RAG и почему он нужен
RAG — это связка «векторный поиск + LLM». Перед каждым ответом система ищет в вашей базе знаний релевантные фрагменты и передаёт их модели как контекст. Без RAG модель отвечает только из общих знаний — и неизбежно врёт о специфике вашего бизнеса.
В NovaLead RAG работает на Qdrant (векторная БД) + YandexGPT Lite (эмбеддинги). Под капотом база знаний делится на чанки 200–400 токенов, каждому считается вектор, и при запросе берутся top-K самых похожих.
Что класть в базу знаний
- Прайс-лист с описанием услуг (не просто «стрижка — 2000 ₽», а «стрижка мужская — 30 минут, включает мытьё и укладку, 2000 ₽»).
- Адреса, часы работы, как до вас доехать, парковка.
- Политики: оплата, возврат, перенос, опоздание.
- FAQ — вопросы, которые часто задают клиенты, с готовыми ответами.
- Информация о мастерах: специализация, опыт, дни работы.
- Промо и текущие акции — но с датами окончания, иначе AI будет рекламировать прошлогодние скидки.
Что НЕ класть
- Длинные PDF — модель захлебнётся в контексте. Разбивайте на смысловые блоки.
- Внутренние инструкции для сотрудников — клиенту не интересно, как мастер пробивает чек.
- Конфиденциальные данные клиентов — это вообще не место для них.
- Устаревшие документы — лучше удалить, чем «потом перепишу».
Как структурировать чанки
Идеальный чанк — 200–400 токенов одной мысли. Несколько правил, которые работают:
- Один чанк = одна тема. «Возврат денег» и «опоздание клиента» — это разные чанки, не один параграф «политики».
- Заголовок в начале — модель использует его как ключ при поиске.
- Числа и даты — явно. «Возврат за 24 часа» лучше, чем «возврат заранее».
- Метаданные: тег услуги, тег категории, дата актуальности — помогают фильтровать.
Если AI стабильно не находит нужный ответ — добавьте в чанк синонимы и формулировки клиентов («сколько стоит», «цена», «прайс»). Векторный поиск ловит смысл, но яркие ключевые слова усиливают сигнал.
Как тестировать
- Соберите 30–50 реальных вопросов клиентов из истории чатов.
- Прогоните через тест AI в админке NovaLead.
- Помечайте плохие ответы — почти всегда дело в чанке: либо его нет, либо он сформулирован неоднозначно.
- Итерируйте 1 раз в 2 недели — база знаний живая, не «настроил один раз».
Что читать дальше
Если вы разбираетесь в теме глубже, продолжите с материалами: Как обучить нейросеть на своих данных, RAG vs простой бот, Как написать промпт для AI-ассистента.
Попробовать NovaLead
7 дней бесплатно, без карты
AI-ассистент, NovaClients и все мессенджеры в одном аккаунте.
Начать бесплатно