本文將為使用者介紹「抽取資料」和「直連資料」是什麼,以及它們之間有什麼差別,如何去選擇等等。
抽取資料
透過快取資料/構建資料複本的方式,支撐較大數據量的OLAP深度自助分析,加速查詢的效能,保障其分析體驗,同時儘可能避免對業務資料庫的影響,滿足使用者複雜業務環境下的深度分析需求。
使用的是直連資料集時,FineBI 直接使用用戶的資料庫中的資料計算, FineBl 中的資料與資料庫中的資料保持同步。藉助客戶大數據平台/數倉,滿足客戶高併發、大數據量前提下的簡單自助分析。
伺服器效能滿足要求:工程部署推薦環境及配置
直連資料
自有大數據平台,自身資料庫可靠性高,效能好
不同資料庫類型,分別依照建議的使用模式進行自助分析
可用 Web 叢集對接資料庫來支撐高併發量
有一定的資料庫維運能力
對資料分析無深入分析需求
適用於幾乎所有場景
更快:基於帆軟自研引擎,無論大數據還是輕量分析,都能顯著提升查詢速度
更穩:中大客戶可作為資料加速層,減少實時計算壓力;中小客戶可一體化部署,相容主流BI工具,確定系統穩定
更省:無需額外部署,降低硬體與維運成本
需進行資料同步,實時性稍遜
實時查詢資料,延遲低
無需資料同步,資料一致強
受數倉效能影響,查詢慢時難優化
大量複雜查詢可能加大數倉負擔
客戶畫像
現有數倉查詢效能較差,BI查詢回應慢
業務對查詢速度敏感,例如營運資料分析、銷售分析等場景
需要降低數倉壓力,避免影響其他業務系統的穩定性
沒有複雜的交易管理要求,實時性要求不高,可以定期同步資料
需同時滿足以下幾點:
1)已有大數據平台、專門的計算引擎,自身資料庫可靠性高、效能好,如StarRocks、Doris(SelectDB)、Hologres 、Vertica、GaussDB200等
2)資料量超過10億
3)沒有複雜分析場景,僅有簡單自助分析場景:
自助資料集複雜計算步驟數(左右合併、從其他表新增列、新增匯總列、新增公式欄-DEF函式、列轉欄、欄轉列的總步驟數)≤2
限制直連資料集血緣分析上限為3層
如使用主題模型,自助資料集中就不能有複雜計算步驟
4)需要實時查詢最新資料,例如金融、實時監視類業務
5)具備強大的數倉管理能力,能夠優化複雜查詢效能
6)IT團隊對BI查詢優化較為熟悉,能夠自行排查SQL效能問題
結果集資料量是小資料量(千萬級及以下),用 抽取資料
結果集資料量是大數據量(億級及以下),優先推薦 抽取資料
結果集資料量在億級以上,且時效性要求高(小時級的更新),推薦使用 直連資料
注:本節描述的資料量均指結果集資料量,即儀表板中使用的直接表的資料量,而不是指基礎表。
依據資料庫的邏輯進行過濾
若資料庫邏輯是空過濾空,null 過濾 null ,則結果與抽取不同
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙