历史版本5 :字段拆列 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

FineDataLink 版本功能变动
4.1.2新增「字段拆列」算子,字段值按照特定规则(分隔符或字符数)拆分,拆分后的结果形成新的多列字段和值

1.2 功能简介

新增「字段拆列」算子,字段值按照特定规则(分隔符或字符数)拆分,拆分后的结果形成新的多列字段和值。如下图所示:

1699928994517698.png

2. 使用限制编辑

仅支持拆分文本类型的字段。

3. 示例编辑

3.1 场景模拟

示例表:address.xls

数据表中 address 字段由省市区三部分组成,现在需要拆分成单独的三列,拆分间隔符为-。如下图所示:

1699929366227216.png

3.2 读取表数据

1)新建定时任务,拖入「数据转换」节点,进入数据转换节点。

2)拖入DB表输入算子,读取要处理的表数据。如下图所示:

15.png

3.3 address 字段拆列

1)拖入「字段拆列算子,将 address 字段拆分成多列。如下图所示:

16.png

各设置项介绍如下表所示:

设置项
说明
选取字段从上游的输出中,选择字段进行拆分,仅限文本类型的字段
拆分方式

1)按字符数

输入任意正整数,按正整数的位数进行分割

2)按分隔符

可选择的分割符号:英文分号,英文逗号,空格,英文冒号,自定义

其中「自定义」中可以输入任意字符,输入内容当作整个字符,该字符作为分割符进行分割


分隔符拆分逻辑:

  • 从左到右匹配分隔符进行分割

  • 拆分以分隔符为分界线,左右两边拆分无字符以 null 值代替

字段值
分隔符
拆分列
A
A空 空
AAAA空 空 空
AAAAA空 A
拆分结果拆分后新增列数:
  • 用户手动输入选择保留的列数,列数是从第一个拆分值开始计算的

  • 「拆分后新增列数」的值只支持 1-100 正整数

  • 拆分示例是以前 5000 条数据计算可得;若拆分后新增列数的值超过实际拆分值数量,将该生成列示例值为 null 值,数据预览也为 null 值

  • 拆分出的新列命名为:字段名_n,n 代表第几个字段。 如果重名则加“1” 直到不重名

  • 生成的新列,字段类型默认都是文本类型

若列拆分时配置了 x 列,实际拆分时,数据超出了配置的列数,那么超出的数据,都放在最后一列中,避免数据丢失

2)点击「数据预览」,如下图所示:

数据预览页面:默认预览前 1000 条数据,每页默认 20 条数据。

1699927904625485.png

3.4 修改字段名

拖入「字段设置」算子,修改 address_1、address_2、address_3 字段名。如下图所示:

1699928527186345.png

3.5 输出数据

1)拖入「DB表输出」算子,将处理好的数据输出。如下图所示:

19.png

2)点击右上角「保存」按钮。

3.6 效果查看

1)点击保存并运行按钮,任务执行成功后。如下图所示:

20.png

2)数据库表数据如下图所示:

1699928914590834.png