1. 概述编辑
1.1 概念
通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。
1.2 解决的问题
找出顾客购买行为的模式:
比如用户买了A商品,是否会对B商品产生什么影响?
不同的用户是否具有不同的购买模式?
哪些产品应该放在一起进行捆绑销售?
1.3 预期效果
1.4 实现思路
关联分析由以下指标进行衡量。
支持度计算公式:同时购买A和B订单数/总购买订单数
置信度计算公式:同时购买A和B订单数/购买A的订单数
提升度计算公式:支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))
2. 示例编辑
2.1 上传数据
示例数据:购物篮分析原始数据.xlsx
2.2 计算需要的指标
由 1.4 节的公式可知需要的指标有:同时购买A和B的订单数、购买A的订单数、购买B的订单数、总购买订单数
2.2.1 计算「A商品的订单数」
1)选择「购物篮分析原始数据」数据,点击创建「分析表」,如下图所示:
2)将「分析表」重命名为「A商品的订单数」,选择「单据编码」和「商品名称」字段,如下图所示:
3)新增「分类汇总」,将「单据编码」字段拖入汇总,重命名为「A商品的订单数」;将「商品名称」字段拖入分类,重命名为「A商品名称」,如下图所示:
2.2.2 计算「B商品订单数」
1)选择「购物篮分析原始数据」,点击创建「B商品订单数」分析表,选择「单据编码」和「商品名称」字段,如下图所示:
2)新增「分类汇总」,将「单据编码」拖入汇总,重命名为「B商品订单数」;将「商品名称」拖入分类,重命名为「B商品订单数」,如下图所示:
2.2.3 计算「总购买订单数」
1)选择「购物篮分析原始数据」,点击创建「B商品订单数」分析表,如下图所示:
2)新增「分类汇总」,将「单据编码」拖入汇总,并重命名为「总订单数」,选择「合并上一步数据」,如下图所示:
3)选择「单据编码」和「商品名称」字段,点击「确定」,如下图所示:
2.2.4 计算「同时购买A和B订单数」
1)添加「左右合并」,合并「购物篮原始数据」中的「单据编码」和「商品名称」字段,如下图所示:
2)选择「并集合并」,合并依据为「单据编码」,如下图所示:
3)将「单据编码」 、「总订单数」、「商品名称」以及「商品名称1」拖入汇总,将「商品名称」重命名为「A商品名称」,「商品名称1」重命名为「B商品名称」 ,如下图所示:
4)当「A商品名称」和「B商品名称」相同时,它们是同一个产品,计算支持度、置信度、提升度没有意义。我们可以过滤掉这部分的商品组合,如下图所示:
5)将「A商品名称」和「B商品名称」字段拖入分类,将「单据编码」拖入汇总,并重命名为「同时购买A和B的订单数」,如下图所示:
6)点击 「合并上一步数据」,合并「总订单数」字段,如下图所示:
2.4 左右合并求商品组合
1)添加「左右合并」,选择之前我们创建的「A商品的订单数」,选择「A商品名称」和「A商品订单数」字段,如下图所示:
2)选择「左合并」,合并依据为「单据编码」,如下图所示:
3)添加「左右合并」,选择之前我们创建的「B商品的订单数」,选择「B商品名称」和「B商品订单数」字段,如下图所示:
2)选择「左合并」,合并依据为「单据编码」,如下图所示:
2.5 计算支持度、置信度、提升度
2.5.1 求「支持度」
支持度=同时购买A和B订单数/总购买订单数,新增字段,如下图所示:
2.5.2 求「置信度」
置信度=同时购买A和B订单数/购买A的订单数,新增字段,如下图所示:
2.5.3 求「提升度」
提升度=支持度/((购买A次数/总购买数)*(购买B次数/总购买数)),新增字段,如下图所示:
2.5.4 计算平均
新增「分类汇总」,将字段拖入分类汇总,其中「支持度、置信度、提升度」由于多订单会合并求和,所以它们的汇总方式要改为「平均」,如下图所示:
2.6 制作图表
点击图表,将「支持度、置信度、提升度」的「数值格式」改为百分比,如下图所示:
2.7 效果展示
详情参见本文 1.3 节