1. 概述编辑
1.1 预期效果
用户有时需要截取字段中多次出现的某个字符指定位置的字符。
例如用户有字段长度不同的字符,需要截取最后一个_后的字符,如下图所示:
或者用户需要截取 A|B|C 字段中 B 列的值,例如用户需要截取所有学历信息,如下图所示:
1.2 实现思路
使用 INDEXOF 、FIND、MID、SUBSTITUTE、RIGHT 等函数组合实现截取字段。
2. 截取最后一个指定字符后的字符编辑
示例数据:截取多次出现的字符后的内容.xlsx
上传示例数据至 FineBI 中,如下图所示:
2.1 创建自助数据集
创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:
2.2 截取指定字符
点击「+」,添加「新增列」,如下图所示:
2.2.1 方法一
命名为「截取最后一个_后的字符」,输入公式INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1),点击「确定」,如下图所示:
注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。
公式说明:
公式 | 说明 | 结果 |
---|---|---|
SPLIT(字段,"_") | 将字段按照_分割成数组 | 分割前:a_b_c 分割后:a,b,c |
LEN(SPLIT(字段,"_"))-1 | 计算字段按照_分割后的数组数-1 | 例如 a_b_c 的计算结果为 2 |
INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1) | 返回SPLIT()分割后数组在最后一个_后的字符 | 例如 a_b_c 的计算结果为 c |
2.2.2 方法二
新增列,计算「计算字段按照_分割后的字符数」,输入公式:LEN(SPLIT(字段,"_")),例如 a_b_c 的计算结果为 3 ,如下图所示:
新增列,将最后一个_替换为-,输入公式:SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),如下图所示:
新增列,从第一个字符开始查找-所在的位置,输入公式:FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),
新增列,计算最后一个_后的字符数,输入公式:LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),如下图所示:
新增列,提取字段中最后一个_后的字符,输入公式RIGHT(字段,LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1)),,点击「确定」,如下图所示:
2.3 效果展示
详情参见本文 1.1 节。3. 截取A|B|C 字段中 B 列的值编辑
注:B 列每条数据字段长度不一致。
示例数据:招聘信息.xlsx
上传示例数据至 FineBI 中,如下图所示:
3.1 创建自助数据集
创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:
3.2 截取指定字符
点击「+」,添加「新增列」,如下图所示:
命名为「第一个|出现的位置」,并输入公式:FIND("|",地区学历人数),如下图所示:
计算「第二个|出现的位置」,添加「新增列」,输入公式:FIND("|",地区学历人数,第一个|出现的位置+1),如下图所示:
计算「截取两个|之间的字符」,添加「新增列」,输入公式:为「截取学历信息」,输入公式MID(地区学历人数,第一个|出现的位置+1,第二个|出现的位置-第一个|出现的位置-1),点击「确定」,如下图所示:
其中「第二个|出现的位置-第一个|出现的位置-1」,即为需要截取的中间字符的长度。
3.2 效果展示
详情参见本文 1.1 节。