1. 概述
1.1 概述
通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。
1.2 解决的问题
找出顾客购买行为的模式:
比如用户买了 A 商品,是否会对 B 商品产生什么影响?
不同的用户是否具有不同的购买模式?
哪些产品应该放在一起进行捆绑销售?
1.3 预期效果
以热力图的形式展示两种产品之间的关联度,颜色的深浅表示关联度的高低,如下图所示:
1.4 实现思路
关联分析由以下指标进行衡量。
支持度计算公式:同时购买 A 和 B 订单数/总购买订单数
置信度计算公式:同时购买 A 和 B 订单数/购买 A 的订单数
提升度计算公式:支持度/((购买 A 次数/总购买订单数)*(购买 B 次数/总购买订单数))
2. 示例
2.1 上传数据
示例数据:购物篮分析数据.xlsx
2.2 计算需要的指标
由 1.4 节的公式可知需要的指标有:同时购买 A 和 B 的订单数、购买 A 的订单数、购买 B 的订单数、总购买订单数
2.2.1 计算「A商品的订单数」
1)选择「购物篮分析数据」数据,点击「创建分析表」,创建空白分析表,如下图所示:
2)将「分析表」重命名为「A商品的订单数」,点击「+>选字段」添加选字段步骤,选择「单据编码」和「商品名称」字段,如下图所示:
3)新增「分类汇总」,将「单据编码」字段拖入汇总,重命名为「A商品的订单数」;将「商品名称」字段拖入分类,重命名为「A商品名称」,如下图所示:
2.2.2 计算「B商品订单数」
1)选择「购物篮分析数据」,点击创建「B商品订单数」分析表,点击「+>选字段」添加选字段步骤,选择「单据编码」和「商品名称」字段,如下图所示:
2)新增「分类汇总」,将「单据编码」拖入汇总,重命名为「B商品订单数」;将「商品名称」拖入分类,重命名为「B商品订单数」,如下图所示:
2.2.3 计算「总购买订单数」
1)选择「购物篮分析数据」,点击创建「购物篮分析」分析表,点击「+>选字段」添加选字段步骤,选择「单据编码」和「商品名称」字段,如下图所示:
2)新增「分类汇总」,将「单据编码」拖入汇总,并重命名为「总订单数」,选择「合并上一步数据」,如下图所示:
3)选择「单据编码」和「商品名称」字段,点击「确定」,如下图所示:
2.2.4 计算「同时购买A和B订单数」
1)添加「左右合并」,合并「购物篮分析数据」中的「单据编码」和「商品名称」字段,如下图所示:
2)选择「并集合并」,合并依据为「单据编码」,如下图所示:
3)添加「分类汇总」步骤,将「单据编码」 、「总订单数」、「商品名称」以及「商品名称1」拖入分类,将「商品名称」重命名为「A商品名称」,「商品名称1」重命名为「B商品名称」 ,如下图所示:
4)当「A商品名称」和「B商品名称」相同时,它们是同一个产品,计算支持度、置信度、提升度没有意义,我们可以过滤掉这部分的商品组合。
新增「筛选」步骤,添加公式条件:A商品名称!=B商品名称,如下图所示:
5)将「A商品名称」和「B商品名称」字段拖入分类,将「单据编码」拖入汇总,并重命名为「同时购买A和B的订单数」,点击 「合并上一步数据」,如下图所示:
6)合并「总订单数」字段,如下图所示:
2.3 左右合并求商品组合
1)添加「左右合并」,选择之前我们创建的「A商品的订单数」,选择「A商品名称」和「A商品的订单数」字段,如下图所示:
2)选择「左合并」,合并依据为「A商品名称」,如下图所示:
3)添加「左右合并」,选择之前我们创建的「B商品订单数」,选择「B商品名称」和「B商品订单数」字段,如下图所示:
2)选择「左合并」,合并依据为「B商品名称」,如下图所示:
2.4 计算支持度、置信度、提升度
2.4.1 求「支持度」
支持度=同时购买A和B订单数/总订单数,选择「新增字段>公式」,新增「支持度」字段,如下图所示:
2.4.2 求「置信度」
置信度=同时购买A和B订单数/A商品的订单数,选择「新增字段>公式」,新增「置信度」字段,如下图所示:
2.4.3 求「提升度」
提升度=支持度/((A商品的订单数/总订单数)*(B商品订单数/总订单数)),选择「新增字段>公式」,新增「提升度」字段,如下图所示:
2.4.4 删除重复值
1)前面的计算会导致数据中出现多条重复数据,可以使用「删除重复数据」功能进行去重。点击「」
2)勾选去重的字段:B商品名称、A商品名称、支持度、置信度、提升度,如下图所示:
3)这样就将重复数据去除了,效果如下图所示:
2.5 制作图表
点击「添加图表」,选择「热力图」进行展示,将字段拖入对应额区域。在热力图中,如果两种商品的提升度高,证明两中国商品的关联度高,组合方式有效,可以考虑放在一起售卖。如下图所示:
2.6 效果展示
详情参见本文 1.3 节