NovaLead
Тарифы
ВойтиНачать
Тарифы
ВойтиНачать бесплатно
Все статьи
AIRAGKnowledge Base

Инструкция по настройке Knowledge Base для LLM-агента

15 апреля 2026 г.14 мин чтения

Если AI-ассистент путается, выдумывает цены и не знает, как зовут вашего директора, — почти наверняка дело в базе знаний. Конкретно: как она структурирована и что в неё попало.

Эта статья — практический гайд для тех, кто настраивает RAG (Retrieval-Augmented Generation) в NovaLead или похожих системах.

Что такое RAG и почему он нужен

RAG — это связка «векторный поиск + LLM». Перед каждым ответом система ищет в вашей базе знаний релевантные фрагменты и передаёт их модели как контекст. Без RAG модель отвечает только из общих знаний — и неизбежно врёт о специфике вашего бизнеса.

В NovaLead RAG работает на Qdrant (векторная БД) + YandexGPT Lite (эмбеддинги). Под капотом база знаний делится на чанки 200–400 токенов, каждому считается вектор, и при запросе берутся top-K самых похожих.

Что класть в базу знаний

  • Прайс-лист с описанием услуг (не просто «стрижка — 2000 ₽», а «стрижка мужская — 30 минут, включает мытьё и укладку, 2000 ₽»).
  • Адреса, часы работы, как до вас доехать, парковка.
  • Политики: оплата, возврат, перенос, опоздание.
  • FAQ — вопросы, которые часто задают клиенты, с готовыми ответами.
  • Информация о мастерах: специализация, опыт, дни работы.
  • Промо и текущие акции — но с датами окончания, иначе AI будет рекламировать прошлогодние скидки.

Что НЕ класть

  • Длинные PDF — модель захлебнётся в контексте. Разбивайте на смысловые блоки.
  • Внутренние инструкции для сотрудников — клиенту не интересно, как мастер пробивает чек.
  • Конфиденциальные данные клиентов — это вообще не место для них.
  • Устаревшие документы — лучше удалить, чем «потом перепишу».

Как структурировать чанки

Идеальный чанк — 200–400 токенов одной мысли. Несколько правил, которые работают:

  • Один чанк = одна тема. «Возврат денег» и «опоздание клиента» — это разные чанки, не один параграф «политики».
  • Заголовок в начале — модель использует его как ключ при поиске.
  • Числа и даты — явно. «Возврат за 24 часа» лучше, чем «возврат заранее».
  • Метаданные: тег услуги, тег категории, дата актуальности — помогают фильтровать.
Лайфхак

Если AI стабильно не находит нужный ответ — добавьте в чанк синонимы и формулировки клиентов («сколько стоит», «цена», «прайс»). Векторный поиск ловит смысл, но яркие ключевые слова усиливают сигнал.

Как тестировать

  • Соберите 30–50 реальных вопросов клиентов из истории чатов.
  • Прогоните через тест AI в админке NovaLead.
  • Помечайте плохие ответы — почти всегда дело в чанке: либо его нет, либо он сформулирован неоднозначно.
  • Итерируйте 1 раз в 2 недели — база знаний живая, не «настроил один раз».

Что читать дальше

Если вы разбираетесь в теме глубже, продолжите с материалами: Как обучить нейросеть на своих данных, RAG vs простой бот, Как написать промпт для AI-ассистента.

Попробовать NovaLead

7 дней бесплатно, без карты

AI-ассистент, NovaClients и все мессенджеры в одном аккаунте.

Начать бесплатно

Подпишитесь на блог

Раз в две недели — статьи о AI и продажах

Без спама и продающих писем. Только разборы кейсов, гайды и выжимки из практики.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности. Отписаться можно в один клик из любого письма.

По теме

  • Как обучить нейросеть на своих данных
  • RAG vs простой бот
  • Как написать промпт для AI-ассистента

Популярное

  • ИИ-бот vs менеджер по продажам: честное сравнение 2026
  • Как обучить нейросеть на своих данных: гайд по RAG для малого бизнеса
  • Бот для Авито в 2026: какие есть варианты и что выбрать
  • Сколько стоит чат-бот для бизнеса в 2026: полный разбор цен

Темы

AIBookingCRMKnowledge BaseMAXManyChatNovaClientsRAGTelegramАвитоАвтоматизацияАналитикаАрхитектураБаза знанийБезопасностьВиджетВнедрениеГайдКаналыКейсКлиникаКонверсияМессенджерыМетрикиОнлайн-записьПродажиПромптСалон красотыСравнениеТарифыТрендыФЗ-152

Читать дальше

Как обучить нейросеть на своих данных: гайд по RAG для малого бизнеса

Что такое RAG (Retrieval-Augmented Generation), почему вашему боту не нужен fine-tuning, и как загрузить прайс, FAQ и регламент за 15 минут.

RAG vs простой бот: когда нужна векторная база

Когда сценарный бот достаточен, а когда без RAG не обойтись. Реальные кейсы, ограничения, и сколько это стоит.

ИИ-бот vs менеджер по продажам: честное сравнение 2026

Где AI-ассистент закрывает заявки лучше живого менеджера, а где без человека не обойтись. Сравнение по скорости, конверсии, стоимости и масштабируемости.

Перестаньте терять клиентов, которые пишут вам в нерабочее время

Начните бесплатно — без карты и долгого внедрения.

Начать бесплатно

Карта не требуется • Триал после подтверждения email

NovaLead

Цифровой куратор для совершенства в продажах. Мы автоматизируем рутину, чтобы вы фокусировались на отношениях.

Возможности

  • ИИ-агент
  • AI-продавец
  • AI-поддержка
  • Чат-виджет
  • Онлайн-запись
  • Мультиканалы
  • CRM
  • Аналитика
  • Уведомления

Компания

  • О сервисе
  • Команда
  • Тарифы
  • Кейсы
  • Сравнение
  • vs ManyChat
  • vs Битрикс24
  • vs Intercom
  • vs YClients
  • vs Jivosite
  • vs Salebot
  • vs Botmother
  • vs Chat2Desk
  • vs Aimylogic
  • Безопасность
  • Блог
  • Telegram-канал
  • Все интеграции
  • → YClients
  • → AmoCRM
  • → Битрикс24
  • → Google Calendar
  • → Яндекс.Календарь
  • Релизы

Для кого

  • Для салонов красоты
  • Для стоматологий
  • Для тату-студий
  • Для автосервисов
  • Для интернет-магазинов
  • Для досуга и развлечений
  • Для бытовых услуг
  • Для образования
  • Для фитнес-клубов
  • Для спорта
  • Для инфобизнеса
  • Для недвижимости
  • Для сервисных центров
  • Для ресторанов
  • Для частных специалистов

Поддержка

  • Telegram-чат
  • База знаний
  • support@novalead.ru

Правовые документы

  • Публичная оферта
  • Тарифы (Приложение №1)
  • SLA
  • DPA — Обработка ПДн
  • Политика ПДн
  • Cookie
  • Использование AI
  • Согласие пользователя ЛК
  • Источники данных
© 2026 NovaLead AI. The Digital Curator for Sales Excellence.ИП Карзаков Дмитрий Евгеньевич · ОГРНИП 323210000003205 · ИНН 213011377800
ОфертаПолитика ПДнDPACookieТарифы