1. 概述
1.1 预期效果
商家想将所有消费的用户名单统计出来,但是原始数据中,每个用户可能消费了多次,有多条数据。但我们只需要保留一条就可以了,此时就可以使用「分组汇总」对数据进行「相同值为一组」实现效果。
1.2 实现思路
分组汇总除了它最基本的功能——分组后对数据进行汇总,使用「相同值为一组」的汇总方式完成去重。
2. 方法一:分组汇总
2.1 上传数据
1)下载示例数据:订单数据.xlsx
2)新建分析主题,上传下载的示例数据。如下图所示:
2.2 使用分组汇总去重
1)添加分组汇总,将需要的客户信息拖入到「分组栏」中,如下图所示:
2)保存并更新该分析主题。
操作后相同的用户只保留一条信息,如此便可以获得一个客户列表了。
3. 方法二:删除重复行
如果需要分组前进行去重操作,可以直接使用「删除重复行」功能。
从该表的数据中,可以看到有订单计入了两次数据,且数据是重复的,只有订单 ID 不同。
1)添加「删除重复行」,如下图所示:
2)系统按照所选的去重字段判断是否有重复行。若订单日期相同、客户名称相同、订单金额相同,我们基本可以确定这是同一个订单了。
所以选择「订单日期、客户名称、销售额」三个字段作为判断是否重复的依据,如下图所示:
注:判断重复后,系统默认保留第一行的数据。例如 A1000005 与 A1000006 重复,只保留第一个 A1000005 的数据。
3)去重结果如下图所示:
注:更多操作和注意事项可参考:删除重复行