涉及到多个指标分析时,如对采购价格进行分析,箱型图可分析最高价,最低价等各个价格计算指标。
当需要了解数据分布特征或需要查看数据中的异常值时,可以使用箱形图进行数据分析。箱形图最常见用于质量管理、人事测评、探索性数据分析等统计分析活动。
优点:用于显示一组连续型数据分布情况的统计图。
缺点:不适用批量较大的数据;不适用于表示趋势或者百分比的数据。
1)箱型图介绍:
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图,因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。通过箱形图我们可以观察数据是否有偏向性、是否对称、数据是否有异常值、数据分布是否太过密集等。
图表效果如下图所示:
2)箱型图构成:
箱子的中间有一条线,代表了数据的中位数( Q2 )。箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1),这意味着箱体包含了 50% 的数据。
有关箱形图 Q1、Q2、Q3 这三个指标的介绍和计算方法,详情参见统计学概念 四分位数
因此,箱子的高度在一定程度上反映了数据的波动程度。上下边缘则代表了该组数据的最大值和最小值。超出最大值和低于最小值的点,可以理解为数据中的“异常值”。
最大值和最小值不是直接取数据中的最大值和最小值,是要利用其他指标进行计算,计算公式如下:
最大值:Q3+1.5*IQR( IQR 为 Q3-Q1)
最小值:Q1 - 1.5*IQR
1)管理员进入系统,点击「我的分析」,选中某个文件夹,点击「新建分析主题」。如下图所示:
2)点击「本地Excel文件>上传数据」,上传表数据。如下图所示:
示例数据:销量表.xlsx
3)上传后,点击「确定」按钮。如下图所示:
1)点击左下角「组件」按钮。如下图所示:
2)在图表类型下选择「箱形图」,将「省份」字段拖入到横轴中,「销量」字段拖入到纵轴中,「城市」字段拖入到细粒度中。如下图所示:
将「省份」字段拖入到颜色栏中。如下图所示:
支持 PC 端和移动端。
效果如下图所示:
步骤参考本文 3.1 节内容。
示例数据:合同事实表.xlsx
2)图表类型下选择「自定义图表」,将「合同类型」字段拖入横轴,「购买的产品」字段拖进纵轴两次。图形属性下,两个指标字段,图表类型分别选择「箱形图」和「点」。如下图所示:
3)图形属性下,点开「全部」,将「客户ID」字段拖入细粒度中。如下图所示:
在图形属性下,点开对应点类型的指标字段,调整点大小。如下图所示:
设置纵轴最大值为 60 ,如下图所示:
可看出,购买合同和长期协议订单,存在异常点。
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
Submitted successfully
Network busy