最新历史版本 :箱形图 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

[helpvideo]5656[/helpvideo]

1.1 版本

FineBI 版本功能变更
6.0新增箱形图

1.2 应用场景

箱形图(Box Plot),也称为盒须图或盒尾图,是一种用于描述一组数据分布特征的统计图表。

它能够展示数据的最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)和最大值,还可以包括异常值。

箱形图因其形状像个箱子和两条“须”而得名,箱子代表数据的中间50%,须则代表最小值到Q1和Q3到最大值的范围。

箱形图特别适用于比较不同数据集的分布情况,以及识别数据中的异常值。最常见用于质量管理、人事测评、探索性数据分析等统计分析活动。

例如,上图用箱形图展示了不同省份下城市的销量数据,下图用箱形图和点图展示了不同的合同类型客户购买的产品数量情况:

1.3 基本要求

图表效果  维度字段    指标字段
箱形图  >=1  =1

1.4 图表特点

1)优点

  • 直观性:箱形图直观地展示了数据的中心趋势、离散程度和分布形状,便于快速识别数据的关键统计特征

  • 异常值检测:通过箱形图的“须”和单独的点,可以容易地识别数据中的异常值或离群点

2)缺点

  • 信息有限:箱形图不提供数据的实际分布形状,无法展示数据的密度或具体分布情况

  • 不精确性:箱形图无法展示数据集中的具体数值,对于精确的数据点位置提供的信息有限

2. 箱形图构成编辑

箱子的中间有一条线,代表了数据的中位数( Q2 )。箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1),这意味着箱体包含了 50% 的数据。有关箱形图 Q1、Q2、Q3 这三个指标的介绍和计算方法,详情参见统计学概念 四分位数 

因此,箱子的高度在一定程度上反映了数据的波动程度。上下边缘则代表了该组数据的最大值和最小值。超出最大值和低于最小值的点,可以理解为数据中的“异常值”。

各值的计算方法如下:

  • 中位数:一组数据按照大小分布后位于中间位置的数。

原始序列长度n指的是当前分类和系列下所有数值的个数。

如果原始序列长度n是奇数,那么中位数所在位置是(n+1)/2;

如果原始序列长度n是偶数,那么中位数所在位置是n/2,n/2+1,此时中位数的值等于这两个位置的数的算数平均数。

  • 上下四分位数:上四分位数的位置计算有争议,我们采用最通行的计算方法——把数列分成四等份的数值。

把所有数值从小到大排列得到一个数列,把数列分割成四等份,在"分割点"位置的数值就是四分位数。

  • 最大值:Q3+1.5*IQR( IQR 为 Q3-Q1)

  • 最小值:Q1 - 1.5*IQR

  • 异常值:最大最小值之外的数据即为异常值

'最大值'和'最小值'并非我们直观理解中的数组中最大最小值,而是去除了异常值之后剩余数据中的最大最小值。

3. 示例一:不显示异常点编辑

3.1 准备数据

1)用户登录 FineBI 系统,点击「我的分析」,选中某个文件夹,点击「新建分析主题」,如下图所示:

2)点击「本地Excel文件>上传数据」,上传表数据。如下图所示:

示例数据:销量表.xlsx


3)上传后,点击「确定」按钮。如下图所示:

4)点击「保存并更新」、「退出并预览」,数据准备成功,如下图所示:

3.2 创建组件

1)点击左下角「组件」按钮。

2)图表类型下选择「箱形图」。

3)将左侧待分析区域的「省份」拖入分析区域的横轴,「销量」拖入纵轴,「城市」拖入「图形属性」下的细粒度栏,如下图所示:

3.3 美化组件

将左侧待分析区域的「省份」拖入「图形属性」下的颜色栏,不同省份则显示为不同的颜色,如下图所示:

3.4 创建仪表板

1)点击分析主题编辑界面下方添加仪表板。

2)进入仪表板编辑界面,将组件拖入至仪表板中,如下图所示:

3)下拉选择「编辑标题」,样式选择「自定义」,设置标题为「箱形图-不显示异常点」,点击「确定」。如下图所示:

3.5 效果查看

1)PC端

2)移动端

4. 示例二:显示异常点编辑

4.1 准备数据

参照本文3.1节内容,此处不再赘述。

示例数据:合同事实表.xlsx

4.2 创建组件

1)点击左下角「组件」按钮。

2)图表类型下选择「自定义图表」,将左侧待分析区域的「合同类型」字段拖入分析区域的横轴,「购买的产品」字段拖进纵轴两次,如下图所示:

3)「图形属性」下,两个相同的指标字段,形状分别选择「箱形图」和「点」,如下图所示:

4)将左侧待分析区域的「客户ID」字段拖入「图形属性>全部」下的细粒度栏中,如下图所示:

4.3 美化组件

4.3.1 调整点大小

在图形属性下,点开形状为点类型的指标字段,点击大小设置按钮,在弹出的设置框中调整点的半径大小,如下图所示:

4.3.2 调整纵轴最大值

点击分析区域纵轴第一个或第二个「购买的产品」字段的下拉按钮,选择「设置值轴」,在弹出的设置框中显示范围勾选「自定义」,最大值设置为60,点击「确定」,如下图所示:

4.4 创建仪表板

参照本文3.4节内容,唯一不同在于设置标题为「箱形图-显示异常点」,此处不再赘述。

4.5 效果查看

1)PC端

2)移动端