Docqa 如何使用文檔問答

如何使用文檔問答

2025-04-04
2025-12-01
3 分鐘閱讀

快速上手:DMflow 文檔問答

想要讓 AI 迅速學會您的企業知識嗎?請跟著以下步驟,前往「領域」並點擊您新創建的文檔問答項目。

進入介面後,您將看到支援的上傳類型,主要分為三類:

類型 限制與說明
File (文件) 單檔限制 5MB 以內。支援格式:PDF, CSV, JSON, HTML, DOCX。
Audio (語音) 單檔限制 5MB 以內。支援格式:mp3, m4a, wav。
Dialog (對話) 專用於上傳 Q&A 對答紀錄的 CSV 檔。

進階配置

在開始上傳前,您還可以設定以下參數:

  • 過期時間: 設定知識的有效期限,避免 AI 引用過時資訊。
  • 分類 (Category): 透過分類標籤,幫助大型語言模型(LLM)更精確地歸納問題群簇,提升檢索準確度。

檔案上傳詳解 (File)

  • 字數限制: 基本上不受限。
  • CSV: 支援選擇多個欄位作為一個群組(Group),系統會將它們一起進行分塊(Chunking)處理。
  • JSON: 同樣支援多欄位群組,並可使用 JSON Pointer 指定路徑。
  • HTML:
    • 您可以直接上傳 HTML 檔案。
    • 也可以提供網址連結,系統支援 XML 格式(如 sitemap, rss, atom)。
    • 過濾功能: 針對 XML 匯入,您可以根據連結、標題或簡介進行過濾。注意:這只會過濾 XML 檔案中存在的項目,而非爬取網站後的內文。

語音上傳詳解 (Audio)

  • 支援 5MB 以內的音訊檔案(mp3, m4a, wav)。系統會自動轉錄為文字後進行索引。

對話上下文 (Dialog Context)

這是提升問答品質的秘密武器。您可以直接上傳整理好的 Q&A 對答紀錄(CSV 格式)。

CSV 欄位規範:

  • type: 填寫 Q (問題) 或 A (答案)。
  • sentence: 對應的文字內容。
  • session_id: 會話 ID。
    • 重要技巧: 擁有相同 session_id 的 Q 和 A,系統會盡量將它們保存在同一個分塊(Chunk)內。這能幫助 AI 理解上下文關係,對於連續性問答的訓練非常有幫助。

訂閱DMflow.chat電子報

了解對話式AI產品新訊及科技、DMflow.chat更新等趨勢

訂閱代表您瞭解了我們的隱私權政策

Contact

[email protected]
拓遠資訊有限公司
統編: 96194102
Copyright © DMflow.chat
註冊 登入