1. 概述
1.1 预期效果
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。
例如对电话号码和银行名称进行脱敏处理,如下图所示:
1.2 实现思路
在自助数据集中处理数据,使用 Replace 函数进行字段替换。
2. 对相同字符长度字段脱敏
例如对电话号码进行脱敏处理,示例使用 Demo 数据「供应商信息表」。
2.1 添加自助数据集
添加「脱敏处理」自助数据集,选择字段,如下图所示:
2.2 新增列
新增列「电话脱敏」,使用公式 REPLACE 函数进行字段替换,输入公式REPLACE(电话,3,7,"xxxx"),如下图所示:
2.3 效果查看
使用 REPLACE 函数进行字段替换后效果如下图所示:
3. 对不同字符长度字段脱敏
示例数据:更换字符.xlsx
3.1 添加自助数据集
添加「脱敏」自助数据集,选择字段,如下图所示:
3.2 新增列
新增列「银行脱敏」,使用公式 REPLACE 函数进行字段替换,输入公式REPLACE(银行,LEFT(银行,FIND("银",银行)-1),"xx"),点击「确定」,如下图所示:
注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。
公式说明:
公式 | 说明 |
---|---|
LEFT(银行,FIND("银",银行)-1) | 截取银字之前的所有字符 详情参见:获取某个字符之前的所有的字符 3.1节 |
REPLACE(银行,LEFT(银行,FIND("银",银行)-1),"xx") | 替换银字之前的所有字符为xx |
3.3 效果查看
使用 REPLACE 函数进行字段替换后效果如下图所示:
4. 其他数据处理方法
方法 | 实例 | 文档 |
截取固定位数的字符 | 截取字段中的指定字符 | |
截取某个字符前的所有字符 | 截取某个字符前的所有字符 | |
截取某个字符后的所有字符 | 截取某个字符前的所有字符 | |
从某个字符开始截取不固定长度的字符 | 从某个字符开始截取不固定长度的字符 | |
去掉字段前后固定数目的字符 | 去掉字段前后固定数目的字符 | |
正则表达式 | 正则表达式 | |
去除字符串里面的某些字符 | 去除字符串里面的某些字符 | |
拼接不同列数据 | 拼接不同列数据 | |
按时间区间分组 | 按时间区间分组 | |
多条件赋值 | 多条件赋值 | |
截取多次出现的指定字符后的内容 | 截取最后一个指定字符后的字符 | 截取最后一个指定字符后的字符 |
截取A|B|C 字段中 B 列的值 | 截取A|B|C 字段中 B 列的值 |