数据合并、截取、分列

  • 文档创建者:Roxy
  • 编辑次数:4次
  • 最近更新:Roxy 于 2021-05-06
  • 1. 概述

    在进行数据整合时,字段的拼接合并、分列必不可少。

    数据集中有时候需要合并部分需求字段。

    数据集中有字段结构为用某些分隔符连接起来的字符串,使用时需要拆分开只提取固定位置的字符串,或者整体拆分为多列。

    2. 字段合并

    5.1.12 之后的版本,文本字段的合并是通过「+」实现的,当然也可以使用函数 CONCATENATE 。

    注:类似于 Excel 中的 & 。

    例如需要将姓和名拼接成一个字段「姓名」,如下图所示:

    输入公式:姓+名,则将字段进行了拼接,如下图所示:

    1619680510163671.png

    同样也可以使用 CONCATENATE 函数,如下图所示:

    3. 字段分列

    根据字段内的字符,将字段拆分成多列。

    需求公式
    字符只在字段里出现一次截取固定位数的字符

    RIGHTLEFTMID

    示例:RIGHT(电话,8)

    取「字符前」的字段内容

    LEFT(字段名,FIND("字符",字段名)-1)

    示例:LEFT(用户账号和密码,FIND(":",用户账号和密码)-1)

    取「字符后」的字段内容

    RIGHT(字段名,LEN(字段名)-FIND("字符",字段名))

    示例:RIGHT(用户账号和密码,LEN(用户账号和密码)-FIND(":",用户账号和密码))

    去掉字段后固定数目的字符

    LEFT(字段名,LEN(字段名)-需要去掉的字符长度)

    示例:

    去掉字段前固定数目的字符

    RIGHT(字段,LEN(字段)-需要去掉的字符长度)

    字符在字段中多次出现取字段中最后一个字符后的内容

    INDEXOF(SPLIT(字段名,"_"),LEN(SPLIT(字段名,"_"))-1)

    示例:INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-1)

    取字段中倒数第二个字符后的内容

    INDEXOF(SPLIT(字段名,"_"),LEN(SPLIT(字段名,"_"))-2)

    示例:INDEXOF(SPLIT(字段,"_"),LEN(SPLIT(字段,"_"))-2)

    以此类推即可实现字段分列...

    在进行分列后可能需要将分开的多个字段合并在一列中,此时可以使用上下合并功能,详情参见:逆透视

    附件列表


    主题: 数据分析进阶
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-127-81526