历史版本2 :上下合并 返回文檔
編輯時間:
內容長度:图片数:目录数:
修改原因:
1. 概述编辑
1.1 版本
| FineDataLink 版本 | 功能变更 |
|---|---|
| 4.1.0 | 新增「上下合并」算子,可对多张表进行上下行合并,输出一张合并表 |
1.2 应用场景
用户存在多个业务系统的表数据,这些表数据中存在相同字段或相同含义的字段,需要将不同的来源数据上下合并到一个表输出。用户目前使用「Spark SQL」算子实现,比较繁琐,希望能无代码实现。
1.3 功能简介
新增「上下合并」算子,可对多张表进行上下行合并,输出一张合并表。如下图所示:
注:「上下合并」算子可手动匹配相同含义的字段进行拼接,并不要求匹配字段完全一致。

2. 示例编辑
2.1 准备数据
示例表数据下载:签约表示例数据.zip
某公司存在两张签约数据表,希望能将数据合并到一张表中方便后续分析。

2.2 读取要合并的数据
1)新建定时任务,拖入「数据转换」节点,进入「数据转换」节点。

2)拖入「DB表输入」算子,读取「签约表-北京」数据。如下图所示:

2)再拖入一个「DB表输入」算子,读取「签约表-上海」数据。如下图所示:

2.3 上下合并表数据
1)拖入「上下合并」算子,与两个「DB表输入」连接。如下图所示:

2)此时「上下合并」算子设置界面如下图所示:

合并方式选择「合并去重」,不保留不同合并表中的重复记录。
FDL 会自动匹配一致的字段,字段若不一致,需要将相同含义的字段进行手动匹配。第三行中,合同总价列,选择合同总价(人民币)字段;销售地区列,选择签约地区。最后效果如下图所示:

3)点击「数据预览」,如下图所示:

2.4 输出数据
1)拖入「DB表输出」算子,将合并后的数据输出。如下图所示:

2)点击右上角「保存」按钮。
2.5 效果查看
点击「保存并运行」按钮,运行成功后,如下图所示:

数据库表数据如下图所示:




