問答BI 以自然語言對話的方式簡化資料分析流程,使得使用者能夠以自然語言提問並獲取資料洞察,本文以IT部門的視角,提供了一系列正式使用問答BI的最佳實踐:
使用前調研:瞭解業務使用者對問答AI的實際需求,以便準備合適的資料和制定推廣/賦能內容
業務資料梳理:資料的規範對於 AI 理解使用者提問的語意至關重要,需要保證資料規範
問答配置:透過配置同義詞、推薦問題、近似問題等,提升問答相關性和準確性
使用者培訓:教授業務使用者如何有效使用問答BI工具
問答優化:針對問答效果不好的點調整資料和系統配置,持續進行優化
瞭解業務使用者對問答AI的實際需求,以便準備合適的資料和制定推廣/賦能內容。
可以參考下表設計調研問題:
您在 FineBI 上最近半年經常存取的頁面是哪些?
這些頁面一般提供了怎樣的資訊,與您的目標有何聯動?
您通常會關注哪些具體指標?您對這些指標的關注有何原因?
它們在您的工作中扮演了怎樣的角色?
對於未來可能嵌入的 AI 問答功能,您期望它提供哪些服務和幫助?
您認為它能夠怎樣提高您的工作效率和成果?
如果意願按照1到10分打分 這些問題你給幾分?
(低於5分的重點標註一下和討論)
瞭解到使用者的實際需求後,就可以為業務人員準備問答BI需要使用的資料了。
建立分析主題,IT使用者 將業務資料表新增到主題中,如下圖所示:
資料的規範對於 AI 理解使用者提問的語意至關重要,接下來,將詳細介紹資料表規範。IT 人員可以使用 FineBI 中的資料編輯功能對資料進行處理。
需要避免資料表中有業務資料冗餘。多表分析時,比起使用 左右合併 製作寬表,更推薦直接使用 主題模型 建立模型關係。
比如,「銷售額表」與「銷售目標表」透過左右合併後獲得的寬表如下圖所示,當使用者問“銷售總目標是多少”時:
問答 BI 答覆銷售總目標:1600
實際銷售總目標:1100
解決方案:將「銷售額表」與「銷售目標表」拆分在兩張表中,使用 主題模型 建立多表之間的模型關係可避免出現資料冗餘。
新增到 FineBI 中的欄位類型系統會自動進行判斷,IT 人員需檢查欄位是否都調整成了正確的欄位類型。例如:
銷售額欄位若為正文類型,則無法順利進行相加統計
銷售日期若為正文類型,則不能順利計算同比環比
在同一個資料表或同一個模型,應避免表頭之間的語意重疊或混淆。例如:
有一個員工資訊表格,原始表頭可能包含“員工職位”和“員工級別”。使用者查詢“進階職位的員工有哪些”時,由於者兩個表頭語意混淆,系統就無法準確召回對應的表頭。為了避免這種情況,可以將表頭重新命名為“職位名稱”和“職位等級”,這樣就能清晰的區分員工等級高低。
1)若表頭或表值需要參與到使用者的提問,則長度應該儘量短和簡潔明瞭(少於10個字),有助於提高系統的試別能力。
2)並且表值內容需要規整,例如:
對於「支付方式」表頭,可能列出“銀行轉賬(工商銀行等)”、“信用卡線上支付”、“行動支付(如支付寶)”,這種表述方式包含了不必要的細節。可以統一為“轉賬”、“信用卡”、“行動支付”,以提高篩選和報表生成的效率。
對於「省份」表頭,可能列出“廣東省(粵)”、“江蘇省(蘇)”、“遼寧省(遼)”,這種表述方式混合了省份的全稱和簡稱,可能導致檢索時混餚。統一格式,僅顯示標準名稱:“廣東省”、“江蘇省”、“遼寧省”,幫助系統準確識別資訊。
若缺失使用者需要使用的分析欄位,而缺失的欄位可以透過已有欄位計算獲得:
在編輯資料中新增欄位補充
在組件中新增計算欄位補充
IT人員可以提前為業務人員配置同義詞、推薦問題、近似問題等,可以優化業務使用者的提問體驗。
注:IT 人員需要有智慧問答配置的使用權限
新增分析主題,可以對主題中的資料表進行「表別名配置」和「近義詞配置」。當使用者的查詢包含這些同義詞時,系統能夠智慧地將查詢請求映射到正確的資料表頭。如下圖所示:
對業務業務調研,確定哪些問題是業務使用者經常查詢的。基於常見查詢和業務需求,可以在「推薦問題配置」中建立推薦問題列表。如下圖所示:
將準備好的問答資料,透過「主題協作」的編輯權限分享給業務使用者,接下來使用者就可以對你準備的資料進行提問了。
參考 FineChatBI 使用說明 對使用者進行培訓。
去年每個月每個城市的銷售額累計值
今年所有門店銷售額的平均值
門店日均銷售額
今年所有門店的銷售額標準差是多少
支援求和、最大值、最小值、平均值、方差、標準差、標準差、環比、同比、佔比
之前三個月的銷售額中位數/方差/平均值/累計值/佔比/排名
普透過濾:
銷售額大於40萬的門店
退貨渠道為"空"的產品有哪些(空建議新增引號,識別會更準確)
過濾+計數:
銷售額大於100萬的門店有多少
今年的單據編碼有多少
銷售額大於 50 萬且小於 100 萬的門店有多少
過濾+佔比:
今年的銷售額佔比
上海市的銷售額佔全國比例
明細過濾:
成本額大於銷售額的單據編碼有多少
指標的過濾條件:大於、小於、大於等於、小於等於、前X、後X
維度的過濾條件:為空、不為空、開頭是、開頭不是、結尾是、結尾不是、包含、不包含
明年四川省每月的日均銷售額,用折線圖展示
去年第三季度之前每個商品類別的銷售額,按照柱形圖展示
2023年每個月的銷售額和成本額
上海銷售額同比
每個門店銷售額同比增長了多少
去年和今年上海市的銷售額對比
上海市vs北京市的銷售額
銷售額趨勢
上海銷售額趨勢
上個季度上海銷售額趨勢
這個月銷售額前十的品牌
2023年銷售額排名第一的門店
銷售額排行榜
我想看看今天的銷售額
預測未來1年的銷售額趨勢
去年銷售額倒數的十個城市
今年所有門店銷售額最高的店鋪
23年冰箱的銷售數量+洗衣機的銷售數量
冰箱的銷售數量*單價
今年的銷售額 → 去年的呢 → 去年3月的呢
今年所有門店的銷售額 → 降冪排列/升冪排列
今年所有門店的銷售額平均值 → 最大的五個是什麼
今年所有門店的銷售額 → top10的呢
去年銷售額最高的5個商品名稱是什麼→倒數5個呢
今年所有門店的銷售額 → 環比多少/同比多少/佔比是多少
今年每個門店的銷售額 → 佔比分別是多少
2023年利潤最高的5個門店名稱 → 商品名稱呢
今年上海市的門店銷售額是多少 → 蘇州市是多少
去年銷售額 Top3 的商品名稱 → 這些商品名稱在北京市的銷售額是多少
今年每個月的平均銷售額top10的月份 → 這些月份的銷售額-成本額差值是多少
不同商品類別的成本額 → 用餅圖展示
今年上半年的銷售額怎麼樣 → 加上成本額呢 →加一個數量
今年上半年的銷售額怎麼樣 → 加上環比呢
2023年9月銷售額為什麼這麼高
2023年1月到8月銷售額為什麼連續下降
零食的銷售額為什麼這麼高
1階段:環境準備+調研
2階段:資料準備
篩選各業務線看板Top 存取使用者
確認調研問題
約 Top 存取使用者進行調研
基於前期調研進行場景聚焦,並準備資料和進行問答配置
IT人員內部進行測試
開放首批業務使用者進行測試,同步收集使用者反饋;
根據反饋進行問答優化
對業務人員進行宣傳與賦能:
現場能力示範
線上宣傳推播
為確定問答 BI 工具能持續提供高品質的服務,IT 人員需積極監視並優化系統。若問答效果不好,可提供一下兩個關鍵措施優化:
資料表優化:檢查資料表是否符合規範並優化,規範的資料表更有利於AI理解,進而提升問答效果。操作步驟參考本文第 3 節。
調整問答配置:調整問答配置中的同義詞、推薦問題、近似問題的配置,提升問答相關性和準確性。
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙