1. 概述
1.1 应用场景
在日常业务数据录入过程中,业务员可能因手动输入习惯或操作失误等原因,对同一公司多次填写了不完全一致的名称,导致数据表中出现重复记录。为保证数据的准确性与唯一性,最终数据中每个公司仅保留一条有效信息。
1.2 功能简介
1)若字段数量较少,可通过分类汇总实现去重效果。
2)若字段数量较多,可使用「删除重复数据」功能,实现一键去重效果。支持自定义勾选需要去重的字段:
勾选的字段放在「分类栏」;
未勾选字段拖入汇总栏,且默认汇总方式选择为第一项;
「删除重复数据」本质上是通过快速分类汇总实现去重效果的。
2. 删除重复数据
1)进入需要去重的分析表,添加一个「删除重复数据」步骤,如下图所示:
2)想根据 ID 和负责人的信息,一个公司只留下一条信息即可。勾选「ID」和「负责人」两个字段作为去重的字段,如下图所示:
3)需要去重的字段放在分类栏,未勾选字段放在汇总栏,默认汇总放置为「第一项」。就可以实现根据「ID+负责人」,一个公司只保留一条有效信息。如下图所示:
3. 说明
未勾选字段拖入汇总栏,且默认汇总方式选择为第一项,即分类字段相同的数据中选择第一条数据。
例如 ID 为 A1101、负责人为 jack 的数据有两条,两者的公司信息其实是一个,只保留一条数据即可,默认保留第一条数据。