反馈已提交

网络繁忙

购物篮分析

  • 文档创建者:Roxy
  • 编辑次数:9次
  • 最近更新:Lily.Wang 于 2021-09-26
  • 1. 概述

    注:本文仅适用于 FineBI 5.1.15 及以上的版本

    1.1 概念

    通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。

    1.2 解决的问题

    找出顾客购买行为的模式:

    比如用户买了A商品,是否会对B商品产生什么影响?

    不同的用户是否具有不同的购买模式?

    哪些产品应该放在一起进行捆绑销售?

    1.3 预期效果

    详情仪表板链接请参见:购物篮分析

    32.png

    1.4 实现思路

    关联分析由以下指标进行衡量。


    定义概率描述举例说明
    支持度

    支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。

    支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。

    物品集A对物品集B的支持度support(A==>B)=P(A n B)今天共有10笔订单,其中同时购买牛奶和面包的次数是6次,那么牛奶+面包组合的支持度就是6/10=60%
    置信度置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率物品集A对物品集B的置信度confidence(A==>B)=P(A|B)今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75%
    提升度先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。L= P(A n B)  /[P(A)*P(B)]今天共有10笔订单,购买A的次数是8,购买B的次数是6,购买A+B的次数是6,那么提升度是0.6/(0.8*0.6)>1,因此A+B的组合方式是有效的。

    支持度计算公式:同时购买A和B订单数/总购买订单数

    置信度计算公式:同时购买A和B订单数/购买A的订单数

    提升度计算公式:支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))

    2. 示例

    示例数据:「功能数据>第一张仪表板>集团商品销售总表」

    2.1 左右合并求商品组合

    以「单据编码」为合并依据,可以得到所有订单中产生的商品组合。

    1)使用「集团商品销售总表」新建自助数据集:购物篮分析。勾选「单据编码」和「商品名称」。如下图所示:

    47.png

    2)添加「左右合并」,合并数据集为「集团商品销售总表」下的「单据编码」和「商品名称」,如下图所示:

    48.png

    3)选择「左合并」,合并依据为「单据编码」,如下图所示:

    49.png

    4)将「商品名称」作为 A 商品,「集团商品总表-商品名称」作为 B 商品。添加字段设置更改名字,如下图所示:

    2021-09-26_11-32-12.png

    2.2 计算需要的指标

    由 1.4 节的公式可知需要的指标有:同时购买A和B的订单数购买A的订单数购买B的订单数总购买订单数

    2.2.1 求「购买A的订单数」

    新增一列,按「A商品名称」进行分组,对分组后的单据编码进行去重计数,可以得到购买A的订单数。如下图所示:

    50.png

    2.2.2 求「购买B的订单数」

    再添加一个新增列,按「B商品名称」进行分组,对分组后的单据编码进行去重计数,可以得到购买A的订单数,如下图所示:

    51.png

    2.2.3 求「同时购买A和B的订单数」

    添加一个新增列,按「A商品名称」和「B商品名称」进行分组,对分组后的单据编码进行去重计数,可以得到同时购买A和B的订单数,如下图所示:

    52.png

    2.2.4 求「总购买订单数」

    添加一个新增列,对所有的单据编码进行去重计数,可以得到一共有多少订单,如下图所示:

    53.png

    以上所有的基础指标「同时购买A和B的订单数」、「购买A的次数」、「购买B的次数」、「总购买订单数」都已经计算得出了。接下来只需要计算支持度、置信度、提升度就可以了。

    2.3 计算支持度、置信度、提升度

    2.3.1 求「支持度」

    支持度=同时购买A和B订单数/总购买订单数,新增列,如下图所示:

    54.png

    2.3.2 求「置信度」

    置信度=同时购买A和B订单数/购买A的订单数,新增列,如下图所示:

    55.png

    2.3.3 求「提升度」

    提升度=支持度/((购买A次数/总购买数)*(购买B次数/总购买数)),新增列,如下图所示:

    56.png

    2.4 去除AB相同的商品组合

    当 A商品名称 和 B商品名称 相同时,它们是同一个产品,计算支持度、置信度、提升度没有意义。我们可以过滤掉这部分的商品组合,如下图所示:

    57.png

    完成以上步骤后,保存并更新该自助数据集。

    2.5 创建仪表板

    1)使用刚刚保存的「购物篮分析」创建仪表板。选择「自定义图标」,将「A产品名称」和「B产品名称」分别拖入横轴和纵轴。

    在图形属性设置矩形快,将「支持度」拖入颜色栏。由于作图会导致多订单的值相加,所以支持度的汇总方式需要选择平均。如下图所示:

    2)再新建一个组件,展示「支持度」、「置信度」、「提升度」的明细数据。如下图所示:

    其中「支持度、置信度、提升度」由于多订单会合并求和,所以它们的汇总方式要改为「平均」。数值格式设置为百分比,如下图所示:

    30.png

    2.6 效果展示

    详情参见本文 1.3 节。

    附件列表


    主题: 数据分析进阶
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526

    文 档反 馈

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭