Перейти к содержимому

База знаний и RAG

База знаний — это основа вашего ИИ-бота. Загружайте реальные документы вашей организации — бот обучается на этих данных и отвечает на вопросы с помощью умного конвейера RAG (Retrieval-Augmented Generation, генерация с расширенным поиском).

База знаний — Список документов

  1. Перейдите в раздел База знаний в левом меню.

  2. Нажмите Загрузить документ и выберите файл (PDF, DOCX или TXT).

  3. Дождитесь обработки и индексирования документа системой. Когда процесс завершится, статус изменится на Готово.

  4. Проверьте работу бота в панели Тестировать бота справа — убедитесь, что бот может отвечать на вопросы по загруженному документу.

Диалог загрузки документа

Помимо загрузки файлов, вы можете создавать записи в базе знаний непосредственно из текста:

  1. Нажмите Создать из текста
  2. Введите Заголовок для удобного поиска
  3. Вставьте или введите содержимое в текстовом редакторе
  4. Нажмите Сохранить — система выполнит индексирование немедленно

Это удобно для FAQ, регламентов или любого контента, который вы хотите написать напрямую без файла.

Когда пользователь задаёт вопрос, система обрабатывает его через 4-шаговый конвейер RAG:

  1. Гибридный поиск — Поиск по всем документам с одновременным использованием ключевых слов и семантического векторного поиска, что гарантирует обнаружение всего релевантного контента.

  2. Переформулировка запроса — Вопрос пользователя переформулируется для большей точности и удобства поиска, что улучшает качество извлечения информации даже при расплывчатых формулировках.

  3. Ранжирование — Извлечённые фрагменты документов оцениваются и ранжируются по релевантности, чтобы наиболее подходящий контент передавался ИИ-модели в первую очередь.

  4. Генерация ответа — ИИ-модель генерирует ответ на естественном языке, основанный на извлечённом контенте, со ссылками на источники.

ФункцияОписание
Гибридный поискСочетает поиск по ключевым словам и семантический векторный поиск для более полного охвата
Переформулировка запросаАвтоматически переформулирует вопросы пользователей для повышения точности поиска
РанжированиеРанжирование с кросс-энкодером для выдачи наиболее релевантных фрагментов
Умная маршрутизация моделиНаправляет запросы к подходящей модели с учётом сложности и стоимости

Управляйте тем, насколько строго бот придерживается базы знаний:

РежимПоведение
СтрогийБот отвечает только на основе загруженных документов. Отказывается отвечать, если релевантный контент не найден.
ГибридныйБот в первую очередь использует базу знаний, но при необходимости может дополнять ответы общими знаниями.
ОткрытыйБот использует базу знаний как контекст, но может свободно отвечать на основе своих обучающих данных.

Используйте панель Тестировать бота, чтобы проверить базу знаний перед запуском:

Страница тестирования бота

  • Вводите вопросы так, как их задавал бы пользователь
  • Проверяйте, что ответы основаны на ваших документах
  • Используйте вид Источник, чтобы увидеть, какие фрагменты документов были извлечены ботом
  • При необходимости измените режим ограничений и повторите тестирование

Изменения в базе знаний немедленно вступают в силу в тестовом боте — повторное развёртывание не требуется.

v1.6.0

Авто-подсказки для базы знаний

Функция автоматических подсказок анализирует неотвеченные вопросы из панели Аналитика и автоматически формирует черновики статей для базы знаний, чтобы заполнить пробелы в контенте:

  1. Система выявляет темы из неотвеченных вопросов, для которых нет соответствующего документа
  2. Создаётся черновик документа с предложенным содержимым на основе паттернов вопросов
  3. Черновики отображаются в разделе Аналитика → Без ответа с меткой «Предложенный черновик»
  4. Просматривайте, редактируйте и публикуйте черновики, чтобы немедленно улучшить покрытие ботом