Как обучить нейросеть на своих данных: гайд по RAG для малого бизнеса
Фраза «обучить нейросеть на своих данных» в 2026 году звучит во всех маркетинговых текстах. Чаще всего за ней стоит не обучение, а другая технология — RAG. И это хорошо: настоящее обучение модели для малого бизнеса избыточно дорого и почти всегда не нужно.
В этой статье — что такое RAG, почему он подходит салону, клинике или магазину лучше, чем «дообучение», и как загрузить свои документы за 15 минут.
Fine-tuning vs RAG: что чем отличается
Fine-tuning — это процесс, при котором веса нейросети частично переучиваются на ваших примерах. Стоит десятки и сотни тысяч рублей, требует датасета из 1 000+ пар «вопрос-ответ» и каждый раз должен повторяться при изменении данных.
RAG (Retrieval-Augmented Generation) — это поиск по вашим документам перед генерацией ответа. Модель остаётся общей, но в момент ответа подтягивает релевантные куски из вашей базы. Обновление — это просто загрузить новый файл.
Как работает RAG в простых словах
Когда вы загружаете документ, система разрезает его на короткие фрагменты по 200–500 слов и переводит каждый в вектор — числовое представление смысла. Векторы хранятся в специальной базе (например, Qdrant).
Когда клиент пишет вопрос, его тоже переводят в вектор и ищут ближайшие фрагменты по смыслу. Найденные 3–5 кусков подкладываются модели как контекст: «Вот тебе вопрос клиента, вот выдержки из документации компании, ответь на их основе».
Какие документы реально работают как KB
Не каждый файл из вашего гугл-диска полезен боту. Полезное и проверенное на практике:
- Прайс с описанием услуг — клиент чаще всего спрашивает «сколько стоит X».
- FAQ с ответами на вопросы, которые задают чаще всего (10–30 пунктов).
- Регламент работы — часы, адреса, парковка, документы, оплата.
- Скрипты продаж — как отвечаем на возражения, как описываем популярные услуги.
- Описание команды — кто что делает, к кому какой вопрос.
Чего НЕ нужно загружать
- Личную переписку с клиентами — нарушение ФЗ-152, плюс лишний шум в выдаче.
- Внутренние финансовые отчёты, ставки сотрудников, маржу — AI может процитировать.
- Большие PDF без структуры (отсканированные книги, старые регламенты на 200 страниц) — качество поиска падает.
- Дубликаты одного документа в разных версиях — модель начнёт путаться, какая актуальна.
Качество ответов = качество источников
Если в прайсе написано «маникюр — от 1500 ₽», бот так и ответит. Если в FAQ нет ответа на «можно ли с собакой» — бот честно скажет «уточню у администратора».
Типичная ошибка: «загрузили всё что было, бот несёт чепуху». Решение — почистить источники до состояния, в котором их прочитал бы новый сотрудник в первый день. Чем понятнее формулировка человеку — тем точнее ответ AI.
Что делать, когда AI всё равно «придумывает»
Даже с хорошим RAG модель иногда даёт уверенный ответ на вопрос, на который ответа в базе нет. Это называется галлюцинация — и её лечат двумя приёмами.
- Guardrail в системном промпте: «Если ответа нет в источниках — скажи «уточню у администратора», а не придумывай».
- Эскалация на оператора по сигнальным словам — «гарантия», «возврат», «скидка», «договор».
- Логирование: смотрите топ-20 диалогов в неделю, где AI отвечал без источника — обычно это пробелы в базе, которые быстро закрываются.
Загружаете PDF, DOCX, Markdown или просто пишете FAQ прямо в редакторе — система автоматически разрезает на чанки и индексирует в Qdrant. Обновление документа = одно действие, никаких пересчётов модели.
Что читать дальше
Если вы разбираетесь в теме глубже, продолжите с материалами: Knowledge Base для LLM-агента, RAG vs простой бот, Как написать промпт для AI-ассистента.
Попробовать NovaLead
7 дней бесплатно, без карты
AI-ассистент, NovaClients и все мессенджеры в одном аккаунте.
Начать бесплатно