反馈已提交

网络繁忙

截取多次出现的指定字符后的内容

  • 文档创建者:Roxy
  • 编辑次数:10次
  • 最近更新:Roxy 于 2021-09-13
  • 1. 概述

    1.1 预期效果

    用户有时需要截取字段中多次出现的某个字符指定位置的字符。

    例如用户有字段长度不同的字符,需要截取最后一个_后的字符,如下图所示:

    1602733394888418.png

    或者用户需要截取 A|B|C 字段中 B 列的值,例如用户需要截取所有学历信息,如下图所示:

    1602744500644043.png

    1.2 实现思路

    使用 INDEXOFFINDMIDSUBSTITUTERIGHT 等函数组合实现截取字段。

    2. 截取最后一个指定字符后的字符

    示例数据:截取多次出现的字符后的内容.xlsx

    上传示例数据至 FineBI 中,如下图所示:

    1602744884131115.png

    2.1 创建自助数据集

    创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:

    1602744945890259.png

    2.2 截取指定字符

    点击「+」,添加「新增列」,如下图所示:

    1602745175124846.png

    2.2.1 方法一

    命名为「截取最后一个_后的字符」,输入公式INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1),点击「确定」,如下图所示:

    1602745271456908.png

    注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

    公式说明:

    公式
    说明结果
    SPLIT(字段,"_")将字段按照_分割成数组

    分割前:a_b_c

    分割后:a,b,c

     LEN(SPLIT(字段,"_"))-1

    计算字段按照_分割后的数组数-1


    例如 a_b_c 的计算结果为 2

    INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1)返回SPLIT()分割后数组在最后一个_后的字符例如 a_b_c 的计算结果为 c

    2.2.2 方法二

    新增列,计算「计算字段按照_分割后的字符数」,输入公式:LEN(SPLIT(字段,"_")),例如 a_b_c 的计算结果为 3 ,如下图所示:

    1607946232462466.png

    新增列,将最后一个_替换为-,输入公式:SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),如下图所示:

    1607946384241627.png

    新增列,从第一个字符开始查找-所在的位置,输入公式:FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),

    1607946624464227.png

    新增列,计算最后一个_后的字符数,输入公式:LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1),如下图所示:

    1607946759237921.png

    新增列,提取字段中最后一个_后的字符,输入公式RIGHT(字段,LEN(字段)-FIND("-",SUBSTITUTE(字段,"_","-",LEN(SPLIT(字段,"_"))-1),1)),,点击「确定」,如下图所示:

    1602746705461467.png

    2.3 效果展示

    详情参见本文 1.1 节。

    3. 截取A|B|C 字段中 B 列的值

    注:B 列每条数据字段长度不一致。

    示例数据:招聘信息.xlsx

    上传示例数据至 FineBI 中,如下图所示:

    1602749607785407.png

    3.1 创建自助数据集

    创建自助数据集,选择上传的 Excel 数据集,并勾选示例字段,如下图所示:

    1602749652621220.png

    3.2 截取指定字符

    点击「+」,添加「新增列」,如下图所示:

    1602749686425252.png

    命名并输入公式:INDEXOF(SPLIT(地区学历人数,"\\|"),1) ,点击「确定」,如下图所示:

    注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

    公式说明:


    公式
    说明
    SPLIT(地区学历人数,"\\|")

    将地区学历人数字段根据 | 字符进行划分

    例如:「深圳|本科|招5人」变成「深圳,本科,招5人」

    INDEXOF(SPLIT(地区学历人数,"\\|"),1)

    返回划分结果字符串第二个位置上的内容

    例如:「深圳,本科,招5人」返回「本科」

    注:由于原始字段中 | 是正则表达式里的一个关键字,如果没有经过转义  SPLIT 会把它当作一个正则表达式来处理的,所以要改成SPLIT(字符串,"\\|")。


    3.2 效果展示

    详情参见本文 1.1 节。

    更多截取字段内容详情参见:字段分列

    附件列表


    主题: 数据分析进阶
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526

    文 档反 馈

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭