FineBI 作為一款自助式資料分析產品,提供豐富強大的功能讓企業資料分析者,透過高效自助分析,進行資料決策。
本文按照各個模組,對 FineBI 產品的特有概念進行解譯說明,以便使用者進行使用。
「分組 - 業務包 -資料集 -欄位」是資料準備配置的基本層級結構。
定義
「資料集」是使用者拿來做分析的表。
分類
「資料集」是一個資料表實體,根據來源不同,分為四類:
資料庫 DB 表、SQL資料集、Excel 資料集、自助資料集
但儘管來源不同,他們本質是一樣的,都是用於使用和分析的資料表。
目的
表(資料集)是資料分析的依據和基礎,資料分析就是對錶內資料進行分析。
「業務包」是一種資料管理概念,是存放表(資料集)的容器,可以理解為存放資料集的資料夾。
「業務包」是為了實現對錶(資料集)管控而存在,因此,在「業務包」中只能放置表(資料集)。
詳情參見:業務包管理 、業務包分組
「分組」是一種資料管理概念。透過新增不同的分組,將業務包按照需求分類存放,方便資料尋找。
「分組」相當於「業務包」的上層資料夾,「分組」是為了實現對「業務包」管控而存在的資料夾。因此,在「分組」下只能新增「業務包」及下一級分組。
詳情參見:分組管理
「欄位」是「資料集」中的列,每個資料集都是由多個欄位組成。
按照形式分類分為數值、正文和日期型別的三種欄位,透過欄位前的標籤可以識別不同種類。
欄位型別介紹參見:FineBI 資料型別簡介
方便使用者以資料的一欄作為最小單位進行資料分析。
資料處理時,可以在自助資料集中新增指定欄位(列);儀表板進行資料分析時,可以選擇所需要的欄位(列)進行分析。
基礎表中欄位操作參見:編輯基礎表
自助資料集中欄位操作參見:欄位設定
儀表板中選欄位參見:構建視覺化組件概述
「基礎表」是未經過使用者深度加工過的表(資料集)。
自助資料集是深度加工的表。因此,「基礎表」代表「資料集」中的三類:資料庫 DB 表、SQL資料集、Excel 資料集。
注:DB表 和 SQL資料集支援 自循環列 和 行列轉換 也是一種加工,但都是符合 SQL 模式的一種簡單加工,步驟一般不多。
作用
基礎表往往是管理者提供好的原始表( Excel 資料集使用者可以自己上傳)。
無基礎不分析,所有的分析向回追溯,都能找到一個基礎表作為根基。所以可以理解為——基礎表是分析的源頭,是上層分析的基石,是分析枝繁葉茂之根本。
新增基礎表詳情參見:新增資料庫表、新增 SQL 資料集、新增 EXCEL資料集
「我的自助資料集」相當於一個只屬於使用者自己的特殊分組。可以在其中建立新的業務包和分組,滿足個性化、私人化的資料分析需求。
如果只是 因為個人需求 做資料分析,可以將這些表(Excel 資料集及自助資料集)存放在「我的自助資料集」下進行查看和分析。管理者無法透過權限設定,查看並公開我的自助資料集裏面的內容。
特徵
「我的自助資料集」中的表,是資料分析性質的自助資料集。
詳情參見:分析性質自助資料集
「自助資料集」是資料集中的深度資料加工過的表。
自助資料集是為了實現普通使用者可以自己進行資料處理實現需求存在的表,而非統一由管理者代勞。
自助資料集可以實現對資料進行深入加工,深層次分析的效果。
自助資料集不區分其底層表來源,無論是「基礎表」或是另一個「自助資料集」,都可以再次透過自助資料集進行資料處理,因此其可以實現較為深入的分析要求,相對複雜的分析過程。
一個做好的自助資料集,可以作為後續視覺化分析的基礎,也可以再被其他自助資料集繼續呼叫。
詳情參見:自助資料集概述
「資料處理使用者」在普通業務包(非「我的自助資料集分組」)下建立的自助資料集是「處理性質資料集」。
「處理性質資料集」主要是基於「基礎表」建立的出來的表(自助資料集)。是可以處理大數據量的自助資料集,以及對其設定權限。
為了給其他人作為資料分析的基礎。
「處理性質資料集」一般是用來給更廣大的「資料分析使用者」提供能夠進行資料分析的表(自助資料集)。對於一些有深入分析需求的「資料分析使用者」,可以基於「處理性質資料集」進行個性化的資料處理,再進行視覺化分析。
「處理性質資料集」作為比「基礎表」更復雜,比做視覺化分析表簡單的中間表。可以滿足大部分資料分析使用者的通用類需求。
詳情參見:自助資料集(資料處理使用者)
「資料分析使用者」建立的資料集是「分析性質資料集」;
另外,「資料處理使用者」在「我的自助資料集」下建立的資料集也是「分析性質資料集」。
注:在「我的自助資料集」下建立的,不是給其他人分析的基礎,因此都是資料分析性質的自助資料集。
「分析性質資料集」是為了實現更流暢的資料分析體驗而存在,但是不能對其分配行列權限,且能處理的資料量相對比較小。
詳情參見:自助資料集(資料分析使用者)
在組件製作中,欄位按分析資料的角度分類,分為「維度」和「指標」欄位。從不同的「維度」去分析「指標」,用「指標」對分析的「維度」進行量化,進而得出資料分析結果。
正文和日期型別欄位預設為「維度」欄位,數值型別預設為「指標」欄位。
欄位是資料集中的列,具體可參見「第 2 節」下欄位的定義。
在視覺化組件中資料集中的欄位,通常被劃分為「維度」和「指標」兩類。
維度欄位包含:日期型別欄位、正文型別欄位、指標名稱
指標欄位包含:數值型別欄位、計算指標欄位(是在儀表板中新增計算指標獲得的欄位)、記錄數
視覺化組件製作就是將資料集中的欄位拖入分析區域進行分析。因此,欄位是實現視覺化分析的基礎。
維度指我們分析資料的角度。
維度欄位包含:日期型別欄位、正文型別欄位、指標名稱(製作視覺化組件時自動產生的欄位)
從不同的維度去分析資料,可以讓我們對資料有更全面的認識和了解,也能讓我們更好的制定計劃和決策。
「指標」是對維度的量化,維度講究的是從不同的角度出發去分析資料,而指標就是不同維度分析出來的結果,這個結果可以是數值,也可以是比值。
指標欄位包含:數值型別欄位、計算指標欄位(是在儀表板中新增計算指標獲得的欄位)、記錄數(製作視覺化組件自動產生的欄位)
透過指標的量化,可以讓我們精準的看到業務產出,進而更好的衡量目標達成的結果。
聚合是若干行按照一定的標準變成一行,彙總到更高類別的行級別資料。
指標聚合:指標聚合表示所有指標顯示在同一值軸上。
聚合函式:對一組資料進行彙總。一般都是使用聚合函式彙總後的值進行再計算。
指標聚合:方便使用者在同一個維度對比不同指標的大小和趨勢。詳情參見:圖表指標聚合/並列
聚合函式:不同的聚合函式對應不同的彙總方式,彙總方式包括「求和,平均,中位數,最大值,最小值,標準差,方差,去重計數,計數」。滿足使用者不同的需求。且隨着使用者分析維度的切換,計算欄位會自動跟隨維度動態調整。詳情參見:聚合函式概述
指標名稱是圖表內指標欄位的欄位名稱。
「指標名稱」欄位拖入對應的「圖表屬性」中(例如,顏色框),即可產生圖例,顯示當前分析的圖表型別對應的指標欄位的名稱。
詳情請參見文檔:指標名稱
定义
直连就是直接连接数据库取数据,使用的是直连引擎。直连不能支持多个不同数据源相互关联,一旦关联就需要进入 spider 引擎,即本地模式。
1)避免数据资源冗余:目前很多企业有较为专业的大数据平台,通过直连引擎取数,可以在保障数据分析性能的同时避免数据资源冗余。
2)满足实时数据需求:直连引擎实时取数,最高实现毫秒级数据刷新,满足用户对数据实时性的要求。
详情参见:新直连介绍 、直连与抽数独立说明
本地模式的資料需要抽取並儲存到 FineBI 的 Spider 引擎中,使用的是 Spider 引擎。後續的分析需是從引擎來提取離線資料進行。
1)節約成本:使用本地數倉支援跨庫取數,多表合併等功能,節約企業的資料儲倉成本。
2)提升效能:抽取資料的計算效能較快,能夠滿足大數據量的快速分析,幫助客戶很好的解決資料效能問題,支撐自助分析,提升使用者的分析和查看體驗。
詳情參見:直連與抽數獨立說明
實時資料是直連模式下,使用直連引擎直接連結資料庫,獲取即時資料(最新的資料)。
特性
隨資料庫變化,實時變化。
詳情參見:實時資料&抽取資料簡介
抽取資料是本地模式下,使用 Spider 引擎將資料庫的資料抽取並儲存,可支援離線使用的資料。
資料上傳到 FineBI 中後,就不會再隨資料庫更新而發生變化。上傳資料後,需要進行 資料更新 才能使用。
目前是和「資料分析性質資料集」相互綁定的。
資料分析使用者的 FineBI 使用權限:
1)查看「目錄」中有權限的儀表板;
2)進入「儀表板」,並建立儀表板;
3)進入「資料準備」下,
可以在「我的自助資料集」建立「自助資料集」和「EXCEL資料集」;
在有 編輯權限 的「業務包」下,也能新增「自助資料集」和「EXCEL資料集」;
建立的「自助資料集」預設「繼承權限」,即與使用的基礎表權限一致,且只有自助資料集建立者和超級管理者有權限繼承的配置權限,權限繼承配置具體請參見 權限繼承 。
詳情參見:BI設計使用者
目前是和「資料處理性質資料集」相互綁定的。
資料處理使用者的 FineBI 使用權限:
在有 編輯權限 的「業務包」下,也能新增「自助資料集」和「基礎表」。包含基礎表的所有型別:資料庫表、SQL資料集和EXCEL資料集;
資料處理使用者建立的自助資料集性質參見:自助資料集(資料處理使用者)