1. 什么是好的洞察
在探索性数据分析领域,一般将数据分析划分为四类:描述型、诊断型、预测型和指导型。这就像医生的工作内容一样:
描述型分析是体检,先客观地检查身体健康指标情况,判断是否偏离正常值范围并陈述观点;
诊断型分析即通过进一步的询问和信息挖掘诊断出问题是什么,病根在哪里;
预测型分析即结合对病人的了解分析病情目前处于哪个阶段,预测病情会怎样发展;
指导型分析即最后开出针对性的药方和治疗建议。
1.1 描述型:观察当前数据发生了什么?
数据分析的第一步,我们需要观察当前数据发生了什么。在企业中,这通常可以使用一些固定报表来做日常的即时数据监控。
例如在某一制造企业刚投入一个新设备,那么则可以通过观察设备诸如良品率等一系列运行数据来观察当前设备的运行状态。
再比如互联网企业新上线了一个产品,我们可以观察这个产品在投入前期的注册人数、热度等一系列数据来知道当前产品的状态。
1.2 诊断型:理解为什么会发生?
在观察当前数据状态之后,如果发现数据出现异常情况,我们就需要对数据的背后进行深层次挖掘与诊断。
例如上面说的制造企业在投入新设备之后,发现设备产出的良品率较低,那么我们则需要进一步去分析是由于对设备不正当操作导致,还是设备是超负荷运转,亦或是新设备本身在设计时存在固有缺陷等等原因。
1.3 预测型:预测未来会发生什么?
当我们通过对数据的一系列深层分析之后,发现了设备良品率较低的真实原因是设备本身在设计时存在固有缺陷,那么如果此时还让它继续生产,那么未来良品率自然长期会得不到保障。
1.4 指导型:怎样达到更好地商业决策
最后一步,也是所有数据分析工作中最有意义的一步,我们则需要去思考未来应该如何进行业务决策,通过数据分析的结果指导业务决策,精细化运营,以发挥更好的商业价值。
阶段 | 案例 |
---|---|
描述型分析 | |
诊断型分析 | |
预测型分析 | https://bbs.fanruan.com/thread-135854-1-1.html 其中的补货预测 |
指导型分析 | https://bbs.fanruan.com/thread-135735-1-1.html |
2. 什么是好的数据
判断一张图表是否用了「好」数据,其实就是看它的数据类别和度量指标的使用是否恰当。
2.1 类别是否恰当
在「金字塔原理」一书中,我们学到 MECE 原则,简单解释就是不重叠、无遗漏。
2.2 指标是否恰当
有两种常见的度量指标使用不当的案例:
2.2.1 绝对值指标与相对值指标的混淆
这里使用绝对值——采购量指标来统计,回答的问题是整体采购量的变化如何。但是无法直接回答采购工作质量如何,是变好还是变差呢?
使用相对值百分比统计指标来监控问题的占比更恰当,如下图:
2.2.2 时间段指标与时间点指标的混淆
「待补充案例」