當前為5.1版本文檔,更多實例內容將在最新幫助文檔中展現,點選跳轉至 最新版幫助文檔

查找不同列字段中的重复数据

1. 概述

1.1 问题描述

有时用户在进行数据处理清洗的时候,会出现需要找到不同列字段中相同的数据,即重复的值出现在不同的列中。

例如找出某网站中的流失用户,假设「注册时间」和「最后一次登录时间」相同,视为流失用户,否则视为正常用户,如下图所示:

1.2 解决思路

使用 EXACT 函数检测两组文本是否相同。

配合使用 IF 函数返回需要的值。

2. 操作步骤


示例数据:用户登录注册信息表.xlsx

上传 数据至 FineBI 中,新建自助数据集,选择「用户登录注册信息表」中的所有字段,并创建新增列,如下图所示:

命名新增列为「用户类型」,并输入公式:IF(EXACT(注册时间,最后一次访问时间),"流失用户","正常用户"),如下图所示:

公式说明:

公式
说明
EXACT(注册时间,最后一次访问时间)如果两个时间完全相同,则返回 TRUE,否则返回 FALSE
IF(EXACT(注册时间,最后一次访问时间),"流失用户","正常用户")

需要将 TRUE、FALSE 转换为中文

则需要结合 IF 函数使用 如果为 TRUE 则返回"流失用户",否则返回"正常用户"

得到的结果如下图所示:

3. 注意事项

EXACT 函数可以区分大小写。


附件列表


主題: 数据分析进阶
已經是第一篇
已經是最後一篇
  • 有幫助
  • 沒幫助
  • 只是瀏覽
  • 评价文档,奖励 1 ~ 100 随机 F 豆!