1. 概述
适用人群:过滤器进阶用户
先了解 过滤层级的概念 ,再继续本文档的学习,将有助于您更好的学习和理解「def 新增列过滤」
1.1 版本
版本 | 功能变动 |
---|---|
6.1 | - |
1.2 应用场景
新增列过滤是对跨行计算后结果进行过滤。
例如:只想对复购用户进行数据分析,先用 def 函数计算出每个用户购买的次数「客户购买的订单数」。在过滤器中执行:「客户购买的订单数」≥2 ,即可筛选出复购用户的订单数据。如下图所示:
1.3 功能简介
新增列过滤就是对 def 函数输出的计算字段进行明细过滤:
【①明细过滤】与【②新增列过滤】都是明细级别的过滤,有什么区别呢?
新增列过滤是进行了跨行计算后再进行的明细过滤,所以不会对你跨行计算的结果值产生影响
明细过滤则是在跨行计算前进行的过滤,可能会影响跨行计算的结果值。例如明细过滤销售额>50,最终北京销售额的def计算结果为60
2. 示例-对DEF新增列过滤
背景:你是一家商场的数据分析师,想要对复购用户进行分析,即将复购用户的数据要筛选出来。
示例数据下载:办公用品数据.xlsx
1)新建分析主题,并上传示例数据,进入组件。如下图所示:
2)新建计算字段「客户购买的订单数」,如下图所示:
3)将「客户购买的订单数」拖入过滤器,并设置过滤条件为 ≥2 。如下图所示:
4)新建计算字段「客户数」,对客户 ID 去重计数。将「产品、客户数、销售额」拖入到组件中,分析各个产品的复购人数及对应销售额。
「客户数」的计算公式:COUNTD_AGG(客户)
如此我们通过对 def 新增列 的过滤,筛选出了复购用户的购买数据直接进行分析。
回忆一下在「新建列过滤」功能出现之前,我们想获得产品复购的用户数以及对应的销售额,在组件需要如何实现的呢:
用户数:def(countd_agg(客户),[产品名称],[客户购买的订单数≥2])
销售额:def(sum_agg(销售额),[产品名称],[客户购买的订单数≥2])
我们需要写以上函数获得两个新的计算字段。对比之后,更加感受到新增列过滤给我们计算带来的便捷性。