反馈已提交

网络繁忙

数据脱敏处理

  • 文档创建者:Lily.Wang
  • 编辑次数:12次
  • 最近更新:Naya 于 2022-05-16
  • 1. 概述

    1.1 预期效果

    数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。

    例如对电话号码和银行名称进行脱敏处理,如下图所示:

    image.png

    1602754512661913.png

    1.2 实现思路

    在自助数据集中处理数据,使用 Replace 函数进行字段替换。

    2. 对相同字符长度字段脱敏

    例如对电话号码进行脱敏处理,示例使用 Demo 数据「供应商信息表」。

    2.1 添加自助数据集

    添加「脱敏处理」自助数据集,选择字段,如下图所示:

    image.png

    2.2 新增列

    新增列「电话脱敏」,使用公式 REPLACE 函数进行字段替换,输入公式REPLACE(电话,3,7,"xxxx"),如下图所示:

    image.png

    2.3 效果查看

    使用 REPLACE 函数进行字段替换后效果如下图所示:

    image.png

    3. 对不同字符长度字段脱敏

    示例数据:更换字符.xlsx

    3.1 添加自助数据集

    添加「脱敏」自助数据集,选择字段,如下图所示:

    1602754616775248.png

    3.2 新增列

    新增列「银行脱敏」,使用公式 REPLACE 函数进行字段替换,输入公式REPLACE(银行,LEFT(银行,FIND("银",银行)-1),"xx"),点击「确定」,如下图所示:

    1602754659541118.png

    注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

    公式说明:

    公式
    说明
    LEFT(银行,FIND("银",银行)-1)

    截取银字之前的所有字符

    详情参见:获取某个字符之前的所有的字符 3.1节

    REPLACE(银行,LEFT(银行,FIND("银",银行)-1),"xx")替换银字之前的所有字符为xx

    3.3 效果查看

    使用 REPLACE 函数进行字段替换后效果如下图所示:

    1602754789545640.png

    4. 其他数据处理方法

    方法实例文档
    截取固定位数的字符18.png截取字段中的指定字符
    截取某个字符前的所有字符12.png截取某个字符前的所有字符
    截取某个字符后的所有字符
    11.png截取某个字符前的所有字符
    从某个字符开始截取不固定长度的字符1599027023523880.png从某个字符开始截取不固定长度的字符
    去掉字段前后固定数目的字符1608015302411586.png去掉字段前后固定数目的字符
    正则表达式19.png正则表达式
    去除字符串里面的某些字符20.png去除字符串里面的某些字符
    拼接不同列数据14.png拼接不同列数据
    按时间区间分组

    21.png

    15.png

    按时间区间分组
    多条件赋值多条件赋值
    截取多次出现的指定字符后的内容截取最后一个指定字符后的字符16.png截取最后一个指定字符后的字符

    截取A|B|C 字段中 B 列的值

    17.png

    截取A|B|C 字段中 B 列的值


    附件列表


    主题: 数据分析进阶
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526

    文 档反 馈

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭