當前為5.1版本文檔,更多實例內容將在最新幫助文檔中展現,點選跳轉至 最新版幫助文檔

截取多次出现的指定字符后的内容

1. 概述

1.1 预期效果

用户有时需要截取字段中多次出现的某个字符指定位置的字符。

例如用户有字段长度不同的字符,需要截取最后一个_后的字符,如下图所示:

1602733394888418.png

或者用户需要截取 A|B|C 字段中 B 列的值,例如用户需要截取所有学历信息,如下图所示:

1602744500644043.png

1.2 实现思路

使用 INDEXOFFINDMIDSUBSTITUTERIGHT 等函数组合实现截取字段。

2. 截取最后一个指定字符后的字符

示例数据:截取多次出现的字符后的内容.xlsx

上传示例数据至 FineBI 中,如下图所示:

1602744884131115.png

2.1 创建自助数据集

创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:

1602744945890259.png

2.2 截取指定字符

点击「+」,添加「新增列」,如下图所示:

1602745175124846.png

2.2.1 方法一

命名为「截取最后一个_后的字符」,输入公式INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1),点击「确定」,如下图所示:

1602745271456908.png

注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

公式说明:

公式
说明结果
SPLIT(字段,"_")将字段按照_分割成数组

分割前:a_b_c

分割后:a,b,c

 LEN(SPLIT(字段,"_"))-1

计算字段按照_分割后的数组数-1


例如 a_b_c 的计算结果为 2

INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1)返回SPLIT()分割后数组在最后一个_后的字符例如 a_b_c 的计算结果为 c

2.2.2 方法二

新增列,计算「计算字段按照_分割后的字符数」,输入公式:LEN(SPLIT(字段,"_")),例如 a_b_c 的计算结果为 3 ,如下图所示:

1607946232462466.png

新增列,将最后一个_替换为-,输入公式:SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),如下图所示:

1607946384241627.png

新增列,从第一个字符开始查找-所在的位置,输入公式:FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),

1607946624464227.png

新增列,计算最后一个_后的字符数,输入公式:LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),如下图所示:

1607946759237921.png

新增列,提取字段中最后一个_后的字符,输入公式RIGHT(字段,LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1)),,点击「确定」,如下图所示:

1602746705461467.png

2.3 效果展示

详情参见本文 1.1 节。

3. 截取A|B|C 字段中 B 列的值

注:B 列每条数据字段长度不一致。

示例数据:招聘信息.xlsx

上传示例数据至 FineBI 中,如下图所示:

1602749607785407.png

3.1 创建自助数据集

创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:

1602749652621220.png

3.2 截取指定字符

点击「+」,添加「新增列」,如下图所示:

1602749686425252.png

命名并输入公式:INDEXOF(SPLIT(地区学历人数,"\\|"),1) ,点击「确定」,如下图所示:

注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

公式说明:

公式
说明
SPLIT(地区学历人数,"\\|")

将地区学历人数字段根据 | 字符进行划分

例如:「深圳|本科|招5人」变成「深圳,本科,招5人」

INDEXOF(SPLIT(地区学历人数,"\\|"),1)

返回划分结果字符串第二个位置上的内容

例如:「深圳,本科,招5人」返回「本科」

注:由于原始字段中 | 是正则表达式里的一个关键字,如果没有经过转义  SPLIT 会把它当作一个正则表达式来处理的,所以要改成SPLIT(字符串,"\\|"),详情参见:使用时需处理的特殊字符

3.2 效果展示

详情参见本文 1.1 节。

更多截取字段内容详情参见:字段分列

附件列表


主題: 数据分析进阶
已經是第一篇
已經是最後一篇
  • 有幫助
  • 沒幫助
  • 只是瀏覽
  • 评价文档,奖励 1 ~ 100 随机 F 豆!