1. 为什么要使用图表
当我们确定了业务需求、确定了数据之后,就要开始考虑将数据转化为合适的图表了。
图表能帮我们对数据的无感转化为对图像的有感,例如下表:看一、二、三、四组数据的时候,普通人是看不出他们的差别的,但是转化为图表后,我们就可以发现这些数据的规律。
数字 | 转化为图表 |
---|---|
从以上可以看出,我们通过图表让数据最直观的展现,从而帮助洞察数据背后的业务问题。
可见数据转化为图表是数据可视化环节非常重要的一环。
2. 图表设计的痛点
当你开始将数据转化为图表,开始制作图表的时候,不管你用何种工具,都会遇到一个问题,我该选用哪种图表形式?
折线图、柱状图、饼图、雷达图......
如下图所示,同样的数据柱状图显然是杂乱的,看不到任务有用信息,转化成折线图后,就能明确的看到每个产品的销量趋势。
即使选对了图表,做出来的图表能不能令人满意呢,是不是能帮助我们洞察业务问题呢,不正确的设计是不是反而增加了用户的理解成本呢?这些都是选择图表所产生的问题。
那接下来我们先来解决如何选择和使用图表的问题?
3. 如何选择正确的图表
选择前,我们首先要想清楚,解决的问题是什么,我的数据是什么,需要用图表做什么?而不是图表长什么样子。
在《用图表说话:麦肯锡商务沟通完全工具箱》这一经典著作中,作者阐述了他经典的方法论,也就是以下3 步:
步骤 1:确定表达的信息
步骤 2:确定对比关系
步骤 3:选择图表形式
确定表达的信息其实也就是解决的问题是什么,我们的数据是什么,需要用图表做什么,这个在我们选用图表之前就应该心里有数。
当确定表达的信息后,接下来我们就要看相对关系,相对关系需要根据数据特征和业务需求来确定,如:
要从多个类中看出谁的份额多,那就是占比构成
要看多个部分谁的销量高,那就是排序比较
要看在商铺全国分布的情况如何,那就可以使用位置分布
一般常用的相对关系有结构占比、排序比较、联系相关性、频率分布等,我们可以根据变量的多少、是否有分类、是否有时间参与等来区别,如下图:
当我们确定了相对关系之后,就可以根据相对关系来选择合适的图表了,如下表:
对比关系 | 定义 | 示例 | 图表形式 |
---|---|---|---|
单个值 | 只关心某一个数值 | 实时交易额、销售额 | 指标卡、仪表盘 |
占比 | 个体在整体中占有的比例 | A 类业务的收入在整个公司中占据了 50% | 饼图、环形图、玫瑰图、百分比堆积柱形图、百分比堆积条形图、树状图、百分比瀑布图、矩形树图 |
比较与排序 |
| A 区域在 8 月的销售额远超其他 5 个区域 | 柱形图、条形图、子弹图、雷达图、词云图、哑铃图、棒棒糖图 |
时间趋势 | 业务指标随着时间的推移而变化 | 销售额在 5 年内的增长情况 | 折线图、面积图 |
频率分布 | 同一指标的不同维度分析 | 某公司人员的年龄段分布、收入分布 | 直方图、箱线图、人口金字塔 |
根据地理位置数据,通过地图展示不同分布特征 | 某公司在全国各省份的销售额、人口密度 | 地图、流向地图、点地图、热力地图 | |
相关性 | 某A、B和C之间的关系 | 通胀与失业率、收入与平均寿命 | 散点图、气泡图、流程图、甘特图、组织结构图 |