Сводки по датасетам
Автоматические обзоры информации по темам для улучшения качества ответов чат-ботов
Введение
Сводки по датасетам — это автоматически генерируемые обзоры информации по конкретным темам из всех документов датасета. Они используются для улучшения качества ответов чат-ботов, предоставляя структурированный контекст по заданным темам.
Например, если в датасете есть документы о продукте, можно создать сводку по теме "Цены и тарифы", и система автоматически извлечет и объединит всю информацию о ценах из всех документов.
Сводки автоматически включаются в контекст всех чат-ботов, использующих датасет, что позволяет ботам давать более полные и структурированные ответы.
Создание сводки
Чтобы создать сводку по датасету:
- Откройте страницу датасета
- В разделе "Сводки по датасету" нажмите "Создать сводку"
- Выберите готовый вариант темы или введите свою тему
- Система автоматически создаст сводку в фоновом режиме
Готовые варианты тем:
- Цены и тарифы
- Функции и возможности
- Технические характеристики
- Поддержка и обслуживание
- Безопасность и конфиденциальность
- Интеграции и API
- Ограничения и лимиты
- Требования и совместимость
- Процедуры и процессы
- FAQ и часто задаваемые вопросы
Важно: Тема может быть подробной и содержать несколько предложений для более точной сводки. Например, "Цены на корпоративные тарифы и условия оплаты" будет более точной, чем просто "Цены".
Формат сводки
Выбор формата
При создании сводки вы можете выбрать формат:
- Объединить в единый обзор (по умолчанию) — информация из всех документов объединяется в связный обзор. Подходит для тем, где нужен единый контекст, например "Цены и тарифы" или "Технические характеристики".
- Структурированный список — информация представляется в виде списка по документам, сохраняя структуру исходных документов. Подходит для тем, где важна структура, например "FAQ" или "Функции и возможности", когда нужно видеть, из какого документа какая информация.
Выбор формата влияет на то, как сводка будет использоваться в контексте чат-ботов. Синтезированный обзор лучше подходит для общих вопросов, а структурированный список — когда важна привязка к конкретным документам.
Статусы сводок
- Ожидает — сводка поставлена в очередь на обработку
- Обрабатывается — сводка генерируется в данный момент
- Актуальна — сводка успешно создана и актуальна
- Устарела — сводка устарела из-за обновления документов в датасете
- Ошибка — произошла ошибка при создании сводки
Автоматическое устаревание
Сводки автоматически помечаются как устаревшие, если в датасете были обновлены или добавлены документы после создания сводки. Устаревшие сводки можно обновить, нажав кнопку "Обновить".
Использование в чат-ботах
Сводки автоматически включаются в контекст RAG для всех чат-ботов, использующих датасет:
- При обработке запроса пользователя система сначала добавляет все активные сводки по датасету
- Затем добавляются релевантные фрагменты документов из поиска
- Бот получает полный контекст: сводки + найденные фрагменты
Это позволяет боту давать более полные и структурированные ответы, особенно по темам, для которых созданы сводки.
Рекомендации
- Создавайте сводки по ключевым темам, которые часто упоминаются в вопросах пользователей
- Используйте подробные темы для более точных сводок (например, "Цены на корпоративные тарифы и условия оплаты" вместо просто "Цены")
- Регулярно проверяйте статус сводок и обновляйте устаревшие
- Создавайте несколько сводок по разным темам для комплексного покрытия информации в датасете
Связанные темы
- Датасеты — общие сведения о датасетах
- Датасеты для ботов — подключение датасетов к ботам
- Ингестия — загрузка документов в датасеты