涉及到多個指標分析時,如對採購價格進行分析,箱型圖可分析最高價,最低價等各個價格計算指標。
當需要了解資料分佈特徵或需要查看資料中的異常值時,可以使用箱形圖進行資料分析。箱形圖最常見用於質量管理、人事測評、探索性資料分析等統計分析活動。
優點:用於顯示一組連續型資料分佈情況的統計圖。
缺點:不適用批量較大的資料;不適用於表示趨勢或者百分比的資料。
1)箱型圖介紹:
箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組資料分散情況資料的統計圖,因形狀如箱子而得名。在各種領域也經常被使用,常見於品質管理。它主要用於反映原始資料分佈的特徵,還可以進行多組資料分佈特徵的比較。透過箱形圖我們可以觀察資料是否有偏向性、是否對稱、資料是否有異常值、資料分佈是否太過密集等。
圖表效果如下圖所示:
2)箱型圖構成:
箱子的中間有一條線,代表了資料的中位數( Q2 )。箱子的上下底,分別是資料的上四分位數(Q3)和下四分位數(Q1),這意味着箱體包含了 50% 的資料。
有關箱形圖 Q1、Q2、Q3 這三個指標的介紹和計算方法,詳情參見統計學概念 四分位數
因此,箱子的高度在一定程度上反映了資料的波動程度。上下邊緣則代表了該組資料的最大值和最小值。超出最大值和低於最小值的點,可以理解為資料中的“異常值”。
最大值和最小值不是直接取資料中的最大值和最小值,是要利用其他指標進行計算,計算公式如下:
最大值:Q3+1.5*IQR( IQR 為 Q3-Q1)
最小值:Q1 - 1.5*IQR
1)管理者進入系統,點選「我的分析」,選中某個資料夾,點選「建立分析主題」。如下圖所示:
2)點選「本地Excel檔案>上傳資料」,上傳表資料。如下圖所示:
範例資料:銷量表.xlsx
3)上傳後,點選「確定」按鈕。如下圖所示:
1)點選左下角「組件」按鈕。如下圖所示:
2)在圖表型別下選擇「箱形圖」,將「省份」欄位拖入到橫軸中,「銷量」欄位拖入到縱軸中,「城市」欄位拖入到細粒度中。如下圖所示:
將「省份」欄位拖入到顏色欄中。如下圖所示:
支援 PC 端和行動端。
效果如下圖所示:
步驟參考本文 3.1 節內容。
範例資料:合同事實表.xlsx
2)圖表型別下選擇「自訂圖表」,將「合同型別」欄位拖入橫軸,「購買的產品」欄位拖進縱軸兩次。圖形屬性下,兩個指標欄位,圖表型別分別選擇「箱形圖」和「點」。如下圖所示:
3)圖形屬性下,點開「全部」,將「客戶ID」欄位拖入細粒度中。如下圖所示:
在圖形屬性下,點開對應點型別的指標欄位,調整點大小。如下圖所示:
設定縱軸最大值為 60 ,如下圖所示:
可看出,購買合同和長期協定訂單,存在異常點。
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙