通用大模型- FineBI帮助文档 FineBI帮助文档

1. 概述

1.1 版本

版本	功能變動
FineChatBI	支援連結 Azure 雲上大模型

1.2 應用場景

通用大模型用於支撐 FineChatBI 的以下功能：問數（智慧模式下語意理解與轉寫）、問思路、一鍵配置同義詞。

提示:

為保障 ChatBI 功能效果，建議使用不低於 80B 規格的大模型；低於該規格的模型，不承諾效果達標。

2. 選用滿足要求的通用大模型

通用大模型可選用本地大模型或雲上大模型。

2.1 推薦模型

免責宣告：帆軟僅提供大模型的推薦參考及對接方式，不對大模型本身的問題承擔責任。
本地大模型部署：推薦使用vLLM；不推薦用 Ollama （存在 system prompt 丟失問題，影響模型回應準確性）。
大模型上下文長度要求：需支援 ≥16k tokens 上下文視窗。

類型	推薦模型	顯卡要求&費用評估
本地大模型	通義千問2.5-72B-Instruct（下載連結）	4*H100
	通義千問2.5-72B-Instruct-GPTQ-Int4量化（下載連結）	1*H100（效果比非量化有所下降）
	DeepSeek-V3 滿血版	16*H100 起
雲上大模型	通義千問-Max（32K）	token 費用 = (N x X + M x Y) x U x V N：使用者每次查詢平均消耗 input token 數，經驗值 20000 M：使用者每次查詢平均消耗 output token 數，經驗值 1000 X：大模型雲服務 input token 收費標準，以實際為準 Y：大模型雲服務 output token 收費標準，以實際為準 U：月活使用者數 V：單使用者平均月普通查詢次數，經驗值 20
	DeepSeek-V3/DeepSeek-V3-0324
	GPT-4o

2.2 大模型能力檢查

FineChatBI 要求大模型必須嚴格按照指定格式匯出結果，否則無法正常使用。

使用者在連結本地大模型前，需要提前驗證模型是否滿足 FineChatBI 的要求，詳情請參見：判斷大模型是否滿足 FineChatBI 能力要求。

2.3 大模型API相容性檢查

本地大模型需檢查API相容，雲上大模型可跨越此步驟。

使用者需要確認自己的本地大模型是否相容 OpenAI API：

情況一：相容 OpenAI API

大模型相容 OpenAI API，則無需任何改造，大模型可以直接連結 FineAI 服務。

情況二：不相容 OpenAI API

大模型若不相容 OpenAI API，推薦使用 vLLM 框架將本地大模型重新部署為相容 OpenAI API的服務，詳情請參考 vLLM 官方文檔。

情況三：不相容 OpenAI API且無法重新部署大模型

API改造。常駐一個API轉發服務，作為 FineAI 服務和大模型服務之間溝通的橋樑。

API轉發服務需要將 FineAI 的請求體轉換成大模型服務支援的格式，發給大模型；並解析大模型的傳回，轉換成 FineAI 的傳回體格式。

FineAI 的請求體和傳回體都符合 OpenAI Chat API規範，詳情見：

請求 URL 規範

大模型的請求 URL 需要以 /chat/completions 結尾。

請求體規範

請求體需要包含以下參數：

參數	說明
model	即問答 BI 配置介面的部署名
messages	對話歷史記錄，包括角色和歷史。類型為 List[dict(str,str)]
temperature	調節模型匯出結果的隨機性，值越大隨機性越強
max_tokens	控制生成匯出 token 的數量
stream	是否流式匯出，bool 類型。必須將 FineAI 傳送的 stream 傳遞給大模型；必須根據 stream 的值判斷傳回體格式是否為流式格式。

請求體範例：

{
    "model": "gpt-3.5-turbo",
    "messages": [
        {
            "role": "system",
            "content": "你是算術專家"
        },
        {
            "role": "user",
            "content": "圓週率怎麼計算"
        }
    ],
    "temperature": 0.95,
    "max_tokens": 8192,
    "stream": false
}

傳回體規範

>當 FineAI 請求體中 stream 為 false 時，傳回非流式傳回體。

非流式傳回體範例：

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "圓週率的計算方式有以下幾種……"
      },
      "finish_reason": "stop"
    }
  ]
}

>當 FineAI 請求體中 stream 為 true 時，傳迴流式傳回體。

提示:

流式傳回體必須遵循 SSE 標準。
除JSON結構符合下述要求之外，每個傳回體必須以「data:」開頭，以兩個回車符結尾，傳回體 header 設定「Content-Type: text/event-stream」。詳情見 SSE 標準。

流式傳回體JSON部分範例：

生成過程中：每個 token 透過 content 傳回，且 finish_reason 為 null
流式傳回結束：傳回了最後一個 token 後，須要有一個額外的傳回體，其中 content 為 null，而 finish_reason 為 "stop"

{
    "choices": [
        {
            "finish_reason": null,
            "delta": {
                "content": "好的"
            }
        }
    ]
}

3. 配置白名單

為確定 FineBI/FineAI 能存取到大模型，需要將大模型地址新增至 FineBI/FineAI 伺服器的白名單中。

4. FineChatBI 配置大模型

4.1 連結本地大模型

進入「智慧問答配置>其他配置>大模型配置」，配置本地服務資訊，再點選儲存。如下圖所示：

填寫項	描述
ApiKey	用於身分驗證的唯一字串，通常由服務提供商生成（若API不需要鑑權，可不填寫）
endPoint	大模型的具體的服務地址，可以透過該地址與模型進行交互填入基礎URL，即不包含 /chat/completions 後綴
部署模型名稱	填入要接入模型的模型名（model name）

填寫項

描述

ApiKey

用於身分驗證的唯一字串，通常由服務提供商生成

（若API不需要鑑權，可不填寫）

endPoint

大模型的具體的服務地址，可以透過該地址與模型進行交互

填入基礎URL，即不包含 /chat/completions 後綴

部署模型名稱

填入要接入模型的模型名（model name）

4.2 連結雲上大模型

1）開放 FineAI 和 FineBI 伺服器對外存取權限，將大模型服務的地址新增到FineBI 和 FineAI 伺服器的白名單中。

2）進入「智慧問答配置>其他配置>大模型」，輸入大模型服務的相關資訊。

配置項	描述
服務商名稱	從 Azure、OpenAI、deepseek 這三個已支援的大模型服務商中，選擇一個要連結的大模型
ApiKey	用於身分驗證的唯一字串，通常由服務提供商生成（若API不需要鑑權，可不填寫）
endpoint	大模型的具體的服務地址，可以透過該地址與模型進行交互
部署模型名稱	填入要接入模型的模型名（model name）

以 DeepSeek 為例，當使用者希望連結 DeepSeek 的官方 API 時，需填寫以下內容：

1）選擇服務商名稱為 deepseek；

2）輸入自己的 ApiKey

3）endPoint 填寫 https://api.deepseek.com

4）部署模型名稱填寫 deepseek-chat（推薦）或 deepseek-reasoner

已经是第一篇

已经是最后一篇

有帮助
没帮助
只是浏览
圖片不清晰
用語看不懂
功能說明看不懂
操作說明太簡單
內容有錯誤

中文（简体） English 日本語

中文（繁體）

通用大模型

1. 概述

1.1 版本

1.2 應用場景

2. 選用滿足要求的通用大模型

2.1 推薦模型

2.2 大模型能力檢查

2.3 大模型API相容性檢查

請求 URL 規範

請求體規範

傳回體規範

3. 配置白名單

4. FineChatBI 配置大模型

4.1 連結本地大模型

4.2 連結雲上大模型

附件列表