Сводки по датасетам

Автоматические обзоры информации по темам для улучшения качества ответов чат-ботов

Введение

Сводки по датасетам — это автоматически генерируемые обзоры информации по конкретным темам из всех документов датасета. Они используются для улучшения качества ответов чат-ботов, предоставляя структурированный контекст по заданным темам.

Например, если в датасете есть документы о продукте, можно создать сводку по теме "Цены и тарифы", и система автоматически извлечет и объединит всю информацию о ценах из всех документов.

Сводки автоматически включаются в контекст всех чат-ботов, использующих датасет, что позволяет ботам давать более полные и структурированные ответы.

Создание сводки

Чтобы создать сводку по датасету:

  1. Откройте страницу датасета
  2. В разделе "Сводки по датасету" нажмите "Создать сводку"
  3. Выберите готовый вариант темы или введите свою тему
  4. Система автоматически создаст сводку в фоновом режиме

Готовые варианты тем:

  • Цены и тарифы
  • Функции и возможности
  • Технические характеристики
  • Поддержка и обслуживание
  • Безопасность и конфиденциальность
  • Интеграции и API
  • Ограничения и лимиты
  • Требования и совместимость
  • Процедуры и процессы
  • FAQ и часто задаваемые вопросы

Важно: Тема может быть подробной и содержать несколько предложений для более точной сводки. Например, "Цены на корпоративные тарифы и условия оплаты" будет более точной, чем просто "Цены".

Формат сводки

Выбор формата

При создании сводки вы можете выбрать формат:

  • Объединить в единый обзор (по умолчанию) — информация из всех документов объединяется в связный обзор. Подходит для тем, где нужен единый контекст, например "Цены и тарифы" или "Технические характеристики".
  • Структурированный список — информация представляется в виде списка по документам, сохраняя структуру исходных документов. Подходит для тем, где важна структура, например "FAQ" или "Функции и возможности", когда нужно видеть, из какого документа какая информация.

Выбор формата влияет на то, как сводка будет использоваться в контексте чат-ботов. Синтезированный обзор лучше подходит для общих вопросов, а структурированный список — когда важна привязка к конкретным документам.

Статусы сводок

  • Ожидает — сводка поставлена в очередь на обработку
  • Обрабатывается — сводка генерируется в данный момент
  • Актуальна — сводка успешно создана и актуальна
  • Устарела — сводка устарела из-за обновления документов в датасете
  • Ошибка — произошла ошибка при создании сводки

Автоматическое устаревание

Сводки автоматически помечаются как устаревшие, если в датасете были обновлены или добавлены документы после создания сводки. Устаревшие сводки можно обновить, нажав кнопку "Обновить".

Использование в чат-ботах

Сводки автоматически включаются в контекст RAG для всех чат-ботов, использующих датасет:

  1. При обработке запроса пользователя система сначала добавляет все активные сводки по датасету
  2. Затем добавляются релевантные фрагменты документов из поиска
  3. Бот получает полный контекст: сводки + найденные фрагменты

Это позволяет боту давать более полные и структурированные ответы, особенно по темам, для которых созданы сводки.

Рекомендации

  • Создавайте сводки по ключевым темам, которые часто упоминаются в вопросах пользователей
  • Используйте подробные темы для более точных сводок (например, "Цены на корпоративные тарифы и условия оплаты" вместо просто "Цены")
  • Регулярно проверяйте статус сводок и обновляйте устаревшие
  • Создавайте несколько сводок по разным темам для комплексного покрытия информации в датасете

Связанные темы

Мы используем cookies для улучшения работы сайта. Продолжая пользоваться сайтом, вы соглашаетесь с политикой использования cookies.