1. 概述
1.1 應用場景
統計在一定條件下,某個維度欄位去除重複資料後的計數。
例如,某商場各個品牌下有若干種商品,每天很可能出現,統一品牌下有多條銷售記錄。求每日銷售的商品品牌數量統計。如下圖所示:
1.2 實現思路
本文提供了 4 種去重計數統計的實現思路及其對應優缺點,如下表所示:
序號 | 實現方式 | 優點 | 缺點 |
---|---|---|---|
1 | 資料集中透過「分組匯總>去重計數」實現。 | 展示速度快,效能最優,靈活度高。(推薦方案) | 1)實時資料不能使用。 2)匯總值無法求資料整體的去重計數的結果,而是單純的依據維度得到的去重結果相加 |
2 | 組件中透過記錄數「新增統計依賴欄位」(依賴於某個欄位)實現。 | 展示速度較快,效能較好,可展示實時資料。(推薦方案) | 靈活度低 |
3 | 組件中透過聚合函式 COUNTD_AGG 實現。 | 靈活性高,去重統計結果可參與計算。 | 很可能導致效能問題 |
4 | 組件中透過維度轉指標(去重計數)實現。 | 去重統計結果可參與計算和進行明細過濾。 | 很可能導致效能問題 |
注:由於資料集直接使用處理後的資料做儀表板展示,因此效能最優。使用記錄數實現因為統計的合計列預設求和,計算簡單,因此避免大部分效能問題。而函式和維度轉指標合計列預設還是自動,很可能出現資料載入不出等效能問題。
2. 方案一、透過資料集實現
依據「門店銷售資料統計表」,統計每天銷售的品牌種類數量。
2.1 建立分析主題
在資料集中處理資料,實現去重計數統計。
使用公共資料集零售行業下的資料「門店銷售資料統計」表建立分析主題,預設勾選資料集中的所有欄位,如下圖所示:
2.2 選欄位
新增「欄位設定」,取消全部選擇,再選擇「銷售日期」和「品牌描述」欄位,如下圖所示:
2.3 分組匯總
使用分組匯總,按「銷售日期」對「品牌描述」進行分組,並選擇「去重計數」作為匯總方式,得出每天銷售商品的品牌數量。
1)新增好欄位後,選擇「分組匯總」,將「銷售日期」欄位拖入分組欄,「品牌描述」拖入匯總欄,設定好後點選「儲存並更新」,如下圖所示:
2.5 製作分組表
使用分組表展示資料集的分析結果。
1)更新資料後,點選「建立組件」,可根據編輯後的資料集建立組件,如下圖所示:
2)選擇「分組表」展示資料。將「銷售日期」點選拖曳至維度欄位,「品牌描述」點選拖曳至指標欄位,該欄位展示的即是每天銷售的品牌種類數量。如下圖所示:
3. 方案二、透過記錄數實現
依據「門店銷售資料統計表」,統計每天銷售的品牌種類數量。
在組件中,透過為記錄數「新增統計依賴欄位」實現去重計數統計。為了查看清晰,範例設定圖表類型為分組表。
3.1 建立分析主題
使用公共資料集零售行業下「的資料門店銷售資料統計」表建立分析主題,預設勾選資料集中的所有欄位,如下圖所示:
3.2 新增組件
點選左下角的「組件」按鈕新增組件,如下圖所示:
3.3 製作分組表
新增組件後,在左側待分析區域指標下會出現「記錄數」欄位;在分析區域的維度和指標中拖入「銷售日期」和「記錄數」欄位,如下圖所示:
注:明細表不支援記錄數功能。
3.4 新增統計依賴欄位
為「記錄數」新增統計依賴欄位「品牌描述」,則記錄數將根據同一日期維度下統計對應的品牌數量實現去重計數,求得每天銷售的品牌種類數量。如下圖所示:
4. 方案三、透過聚合函式實現
以「零售行業」業務包下的「門店銷售資料統計表」為例,統計每天銷售的品牌種類數量,在組件中使用 COUNTD_AGG 函式實現。
4.1 建立分析主題
使用公共資料集零售行業下「的資料門店銷售資料統計」表建立分析主題,步驟同上,詳情請參見本文 3.1節。
4.2 新增組件
使用「門店銷售資料統計表」新增組件,步驟同上,詳情請參見本文 3.2 節。
4.3 新增計算指標
使用「COUNTD_AGG」函式實現「品牌描述」欄位的去重計數統計。
1)在待分析指標區域點選「+」新增計算指標,如下圖所示:
2)輸入公式:COUNTD_AGG(品牌描述),得出「品牌描述」在對應維度下去重計數的統計值。設定好指標名稱之後,點選「確定」,如下圖所示:
COUNTD_AGG(array):根據當前分析維度,動態傳回某欄位的去重計數,生成結果為一動態資料欄,列數與當前分析維度列數一致。詳情參見:聚合函式 。
4.4 製作分組表
在分析區域的維度和指標中拖入「銷售日期」和新增的「品牌數量」欄位,則新增的「品牌數量」欄位即展示的是每天銷售的品牌數量的去重計數統計值。如下圖所示:
5. 方案四、透過維度轉指標實現
以「零售行業」業務包下的「門店銷售資料統計表」為例,統計每天銷售的品牌種類數量,透過維度轉指標實現。
5.1 建立分析主題
使用公共資料集零售行業下「的資料門店銷售資料統計」表建立分析主題,步驟同上,詳情請參見本文 3.1節。
5.2 新增組件
使用「門店銷售資料統計表」新增組件,步驟同上,詳情請參見本文 3.2 節。
5.3 維度欄位轉指標
將「品牌描述」欄位,從維度「轉化為指標」,實現去重計數。如下圖所示:
5.4 製作分組表
使用「分組表」展示資料。並在分析區域的的維度指標欄拖入對應欄位。「品牌描述」欄位即展示的是每天銷售的品牌數量。如下圖所示: