用户有时需要截取字段中多次出现的某个字符指定位置的字符。
例如用户有字段长度不同的字符,需要截取最后一个_后的字符,如下图所示:
或者用户需要截取 A|B|C 字段中 B 列的值,例如用户需要截取所有学历信息,如下图所示:
使用 INDEXOF 、FIND、MID、SUBSTITUTE、RIGHT 等函数组合实现截取字段。
示例数据:截取多次出现的字符后的内容.xlsx
上传示例数据至 FineBI 中,如下图所示:
创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:
点击「+」,添加「新增列」,如下图所示:
命名为「截取最后一个_后的字符」,输入公式INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1),点击「确定」,如下图所示:
注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。
公式说明:
分割前:a_b_c
分割后:a,b,c
计算字段按照_分割后的数组数-1
例如 a_b_c 的计算结果为 2
新增列,计算「计算字段按照_分割后的字符数」,输入公式:LEN(SPLIT(字段,"_")),例如 a_b_c 的计算结果为 3 ,如下图所示:
新增列,将最后一个_替换为-,输入公式:SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),如下图所示:
新增列,从第一个字符开始查找-所在的位置,输入公式:FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),
新增列,计算最后一个_后的字符数,输入公式:LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),如下图所示:
新增列,提取字段中最后一个_后的字符,输入公式RIGHT(字段,LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1)),,点击「确定」,如下图所示:
详情参见本文 1.1 节。
注:B 列每条数据字段长度不一致。
示例数据:招聘信息.xlsx
命名并输入公式:INDEXOF(SPLIT(地区学历人数,"\\|"),1) ,点击「确定」,如下图所示:
将地区学历人数字段根据 | 字符进行划分
例如:「深圳|本科|招5人」变成「深圳,本科,招5人」
返回划分结果字符串第二个位置上的内容
例如:「深圳,本科,招5人」返回「本科」
注:由于原始字段中 | 是正则表达式里的一个关键字,如果没有经过转义 SPLIT 会把它当作一个正则表达式来处理的,所以要改成SPLIT(字符串,"\\|"),详情参见:使用时需处理的特殊字符
更多截取字段内容详情参见:字段分列