1. 概述
1.1 应用场景
数据分布分析:查看数据是否呈正态分布、偏态分布(左偏 / 右偏),比如学生考试成绩、产品使用寿命的分布情况。
异常值识别:通过数据集中程度判断是否存在极端值,例如某地区居民收入中是否有异常高 / 低收入数据。
数据对比参考:不同群体的分布对比,比如不同年龄段用户的消费金额分布差异。

1.2 基本要求
基本要求:
| 图表效果 | 横轴字段 | 纵轴字段 | 大小 |
|---|---|---|---|
| 直方图 | >=1 | >=1 | =1 |
1.3 图表特点
优点:
分布可视化清晰:能快速呈现数据的集中趋势、离散程度和分布形态,让非专业人士也能轻松理解数据规律。
数据对比高效:支持多组数据叠加展示,能直观对比不同群体、不同时期的分布差异,辅助决策制定。
缺点:
依赖区间划分:组距和区间数量的设定会影响图表呈现效果,划分不当可能掩盖真实数据分布(如过宽导致细节丢失,过窄导致噪声干扰)。
丢失个体数据:仅展示区间频数,无法体现单个数据点的具体数值和顺序关系,不适合精准查询个体信息。
不适配离散数据:仅能处理连续型数据,若用于离散数据(如类别、计数),会导致解读混淆,需与条形图严格区分。
2. 示例
示例数据:消费明细表.xlsx
2.1 准备数据
下载示例数据并 上传 至产品中,并将数据添加至项目中。如下图所示:

在来源表下添加新的分析步骤「分类赋值」,如下图所示:

将消费金额划分为 7 个分类,并命名为消费区间,如下图所示:

2.2 制作图表
1)在来源表下点击添加图表,如下图所示:

2)在图表类型下选择「探索式图表」,如下图所示:

3)将「消费区间」字段拖入横轴,将「消费金额」字段拖入纵轴,如下图所示:

2.3 图表设置
可以对图表进行一些设置,比如设置图例显示位置、颜色等等,对图表进行美化。
点击大小,调整柱宽,使得两个消费区间分类之间没有间隙,如下图所示:

