快速上手:DMflow 文檔問答
想要讓 AI 迅速學會您的企業知識嗎?請跟著以下步驟,前往「領域」並點擊您新創建的文檔問答項目。

進入介面後,您將看到支援的上傳類型,主要分為三類:
| 類型 | 限制與說明 |
|---|---|
| File (文件) | 單檔限制 5MB 以內。支援格式:PDF, CSV, JSON, HTML, DOCX。 |
| Audio (語音) | 單檔限制 5MB 以內。支援格式:mp3, m4a, wav。 |
| Dialog (對話) | 專用於上傳 Q&A 對答紀錄的 CSV 檔。 |
進階配置
在開始上傳前,您還可以設定以下參數:
- 過期時間: 設定知識的有效期限,避免 AI 引用過時資訊。
- 分類 (Category): 透過分類標籤,幫助大型語言模型(LLM)更精確地歸納問題群簇,提升檢索準確度。
檔案上傳詳解 (File)
- 字數限制: 基本上不受限。
- CSV: 支援選擇多個欄位作為一個群組(Group),系統會將它們一起進行分塊(Chunking)處理。
- JSON: 同樣支援多欄位群組,並可使用 JSON Pointer 指定路徑。
- HTML:
- 您可以直接上傳 HTML 檔案。
- 也可以提供網址連結,系統支援 XML 格式(如 sitemap, rss, atom)。
- 過濾功能: 針對 XML 匯入,您可以根據連結、標題或簡介進行過濾。注意:這只會過濾 XML 檔案中存在的項目,而非爬取網站後的內文。
語音上傳詳解 (Audio)
- 支援 5MB 以內的音訊檔案(mp3, m4a, wav)。系統會自動轉錄為文字後進行索引。
對話上下文 (Dialog Context)
這是提升問答品質的秘密武器。您可以直接上傳整理好的 Q&A 對答紀錄(CSV 格式)。
CSV 欄位規範:
- type: 填寫
Q(問題) 或A(答案)。 - sentence: 對應的文字內容。
- session_id: 會話 ID。
- 重要技巧: 擁有相同
session_id的 Q 和 A,系統會盡量將它們保存在同一個分塊(Chunk)內。這能幫助 AI 理解上下文關係,對於連續性問答的訓練非常有幫助。
- 重要技巧: 擁有相同