1. 概述
视频教学使用的是 IF 找出重复数据后赋值。也可以用 EXACT 来判断是否重复再用 IF 赋值,详情参考文档。
在线预览:查找不同列字段中的重复数据
用户可点击「另存为主题」,自己操作一遍或查看内部编辑步骤。
1.1 问题描述
有时用户在进行数据处理清洗的时候,会出现需要找到不同列字段中相同的数据,即重复的值出现在不同的列中。
例如找出某网站中的流失用户,假设「注册时间」和「最后一次登录时间」相同,视为流失用户,否则视为正常用户,如下图所示:
1.2 解决思路
使用 EXACT 函数检测两组文本是否相同。
配合使用 IF 函数返回需要的值。
2. 操作步骤
示例数据:用户登录注册信息表.xlsx
1)新建分析主题,上传下载的示例数据「用户登录注册信息表」,默认勾选所有字段,如下图所示:
2)添加「新增公式列」,命名新增列为「用户类型」,并输入公式:IF(EXACT(注册时间,最后一次访问时间),"流失用户","正常用户"),如下图所示:
公式说明:
公式 | 说明 |
---|---|
EXACT(注册时间,最后一次访问时间) | 如果两个时间完全相同,则返回 TRUE,否则返回 FALSE |
IF(EXACT(注册时间,最后一次访问时间),"流失用户","正常用户") | 需要将 TRUE、FALSE 转换为中文 则需要结合 IF 函数使用 如果为 TRUE 则返回"流失用户",否则返回"正常用户" |
得到的结果如下图所示:
3. 注意事项
EXACT 函数可以区分大小写。