通用大模型用於支撐 FineChatBI 的以下功能:問數(智慧模式下語意理解與轉寫)、問思路、一鍵配置同義詞。
通用大模型可選用本地大模型或雲上大模型。
免責宣告:帆軟僅提供大模型的推薦參考及對接方式,不對大模型本身的問題承擔責任。
本地大模型部署:推薦使用vLLM;不推薦用 Ollama (存在 system prompt 丟失問題,影響模型回應準確性)。
大模型上下文長度要求:需支援 ≥16k tokens 上下文視窗。
N:使用者每次查詢平均消耗 input token 數,經驗值 20000
M:使用者每次查詢平均消耗 output token 數,經驗值 1000
X:大模型雲服務 input token 收費標準,以實際為準
Y:大模型雲服務 output token 收費標準,以實際為準
U:月活使用者數
V:單使用者平均月普通查詢次數,經驗值 20
FineChatBI 要求大模型必須嚴格按照指定格式匯出結果,否則無法正常使用。
使用者在連結本地大模型前,需要提前驗證模型是否滿足 FineChatBI 的要求,詳情請參見:判斷大模型是否滿足 FineChatBI 能力要求。
本地大模型需檢查API相容,雲上大模型可跨越此步驟。
使用者需要確認自己的本地大模型是否相容 OpenAI API:
情況一:相容 OpenAI API
大模型相容 OpenAI API,則無需任何改造,大模型可以直接連結 FineAI 服務。
情況二:不相容 OpenAI API
大模型若不相容 OpenAI API,推薦使用 vLLM 框架將本地大模型重新部署為相容 OpenAI API的服務,詳情請參考 vLLM 官方文檔。
情況三:不相容 OpenAI API且無法重新部署大模型
API改造。常駐一個API轉發服務,作為 FineAI 服務和大模型服務之間溝通的橋樑。
API轉發服務需要將 FineAI 的請求體轉換成大模型服務支援的格式,發給大模型;並解析大模型的傳回,轉換成 FineAI 的傳回體格式。
FineAI 的請求體和傳回體都符合 OpenAI Chat API規範,詳情見:
大模型的請求 URL 需要以 /chat/completions 結尾。
請求體需要包含以下參數:
對話歷史記錄,包括角色和歷史。類型為 List[dict(str,str)]
是否流式匯出,bool 類型。
必須將 FineAI 傳送的 stream 傳遞給大模型;
必須根據 stream 的值判斷傳回體格式是否為流式格式。
請求體範例:
{ "model": "gpt-3.5-turbo", "messages": [ { "role": "system", "content": "你是算術專家" }, { "role": "user", "content": "圓週率怎麼計算" } ], "temperature": 0.95, "max_tokens": 8192, "stream": false}
>當 FineAI 請求體中 stream 為 false 時,傳回非流式傳回體。
非流式傳回體範例:
{ "choices": [ { "message": { "role": "assistant", "content": "圓週率的計算方式有以下幾種……" }, "finish_reason": "stop" } ]}
>當 FineAI 請求體中 stream 為 true 時,傳迴流式傳回體。
流式傳回體JSON部分範例:
生成過程中:每個 token 透過 content 傳回,且 finish_reason 為 null
流式傳回結束:傳回了最後一個 token 後,須要有一個額外的傳回體,其中 content 為 null,而 finish_reason 為 "stop"
{ "choices": [ { "finish_reason": null, "delta": { "content": "好的" } } ]}
為確定 FineBI/FineAI 能存取到大模型,需要將大模型地址新增至 FineBI/FineAI 伺服器的白名單中。
進入「智慧問答配置>其他配置>大模型配置」,配置本地服務資訊,再點選儲存。如下圖所示:
(若API不需要鑑權,可不填寫)
大模型的具體的服務地址,可以透過該地址與模型進行交互
填入基礎URL,即不包含 /chat/completions 後綴
填入要接入模型的模型名(model name)
1)開放 FineAI 和 FineBI 伺服器對外存取權限,將大模型服務的地址 新增到FineBI 和 FineAI 伺服器的白名單中。
2)進入「智慧問答配置>其他配置>大模型」,輸入大模型服務的相關資訊。
用於身分驗證的唯一字串,通常由服務提供商生成
以 DeepSeek 為例,當使用者希望連結 DeepSeek 的官方 API 時,需填寫以下內容:
1)選擇服務商名稱為 deepseek;
2)輸入自己的 ApiKey
3)endPoint 填寫 https://api.deepseek.com
4)部署模型名稱填寫 deepseek-chat(推薦)或 deepseek-reasoner
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙