1. 概述
在分析数据过程中,你是不是经常遇到很多异常数据问题。
比如:
某商店近一周成交量环比突然下降了10%
某APP日活相比昨天下降了15%
那遇到这些数据异常我们要怎么进行分析呢?怎样能准确快速的定位到异常原因?
本文为你提供了异常问题排查的一些思路。
2. 数据准确性
首先在面对异常信息的时候,你需要先确认数据的准确性,也就是这个异常是否是真的「异常」。
2.1 确认数据埋点正确
数据埋点是我们取数的基础,确保埋点数据的正确性是数据分析首要做的事情。
例如某APP日活相比昨天下降15%,数据分析师Alice首先应该确认数据库中的埋点数据是否异常。
比如,是否是数据没有同步更新到最新、数据库数据字段类型是否正确、数据是否出现bug显示为空等等。
2.2 确认数据口径
出现异常数据的另一个可能性是你进行计算使用的数据表或者字段并不是目标计算需求应该使用的数据,因此了解数据埋点的含义并确认对你有用的数据字段也是非常重要的。
2.3 确认计算是否正确
理清楚计算的逻辑,错误的计算逻辑或者计算方式也可能是出现异常数据的原因。
3. 同期事件评估
在确认不是数据源层面的问题,也就是你发现的数据异常真的就是异常,这时候就对这个异常发生的时间节点下相关的一些时间进行分析,看是否是它们造成了异常。
以下是你可以考虑的一些同期事件角度:
角度 | 说明 |
---|---|
运营策略 | 例如某门店的销售量有一个月出现异常上涨,这个月可能是由于该门店发起了某店庆活动,因此吸引了更多的客户购买 |
推广渠道 | 例如某商品在淘宝的销售额下降了,可能原因可以考虑该商品在其他销售渠道是否上涨了,是否是在其他渠道有更优惠的推广。 |
季节性变化 | 某些商品可能会受到季节的影响。比如雪糕在夏天的销量一定是比冬天好的 |
节假日 | 例如,某tob类办公工具在节假日的使用情况一定会低于工作日 比如呈现这种周六周末数据下降的趋势: |
社会热点相关 | 阶段性的数据异常可能也会受到社会热点的影响 |
竞品 | 竞品的产品策略也会影响到你关注的产品 |
国家政策 | 某些国家政策的改变 |
产品迭代 | 产品的迭代更新 |
4. 维度拆分分析
如果你发现同期事件并不是数据异常的原因,那么可以通过对数据展示的维度进行拆分来进一步分析。
例如:某 APP 日活相比昨天下降了15%
将日活人群进行拆分,根据「新用户」「老用户」或者用户生命周期阶段、用户地域、用户来源渠道、用户使用手机型号等等进行拆分,查看不同人群的日活情况。
从时间维度,相比于昨天、上周下降了多少?同比、环比数据如何。