反馈已提交

网络繁忙

数据转换概述

  • 文档创建者:Wendy123456
  • 历史版本:49
  • 最近更新:Wendy123456 于 2024-03-29
  • 1. 概述

    1.1 版本说明

    FineDataLink 版本功能变动
    3.1新增节点「数据转换」
    4.1.2新增「字段拆列」「字段拆行」「分组汇总」算子
    4.1.3

    DB表输入算子,数据源类型选择「DB表输入」类型时

    • 支持直接选表同步数据;直接选表同步数据时,支持并发读取数据

    • 数据源是 MySQL、Oracle、SQLServer 时支持调用数据库存储过程

    4.1.6.4新增MongoDB输出算子,可将数据输出到 MongoDB


    查看历史版本更新
    FineDataLink 版本
    功能变动
    3.5                       「数据转换」节点新增算子「行列转换
    3.5.1「数据转换」节点新增算子「JSON解析
    3.6.2「数据转换」节点新增算子「Spark SQL」
    3.7
    • 「数据转换」节点新增算子「字段设置

    • 「DB表输出」算子的「数据去向」Tab中若选择「自动建表」,「字段映射」Tab下可删除表字段、修改表字段展示顺序、修改表字段长度、修改字段类型

    4.0.1「DB表输出」算子的「数据去向」Tab中若选择「自动建表」,「字段映射」Tab下修改表字段展示顺序的方式,从点击调整字段顺序调整为拖拽调整字段顺序,详情请参见:字段映射
    4.0.2数据转换有内容更改,点击取消时,给出浮窗确认
    4.0.2.1「数据转换」节点新增算子「简道云输入
    4.0.4.2「数据转换」节点新增算子「MongoDB输入算子
    4.0.7优化数据转换与其他节点的层级关系:编辑「数据转换」时显示当前所在任务名称,同时支持返回任务配置界面
    4.0.13新增「参数输出」功能
    4.0.18「数据转换」节点移除「比对删除」算子,新增「数据比对」算子
    4.0.19「数据转换」节点新增「数据过滤」算子
    4.0.20
    • 「数据转换」节点新增「简道云输出」算子

    • 「数据转换」节点中,用户可根据业务需要,对不同字段给予加工处理后再流向不同表。详情请参见:数据分发

    4.0.23新增「新增计算列」算子,可利用原有字段通过引用或计算获得一个新的字段
    4.0.26新增「文件输出」算子,可将数据输出为文件形式
    4.0.29新增「Python 算子」,可调用 Python 脚本进行复杂数据处理
    4.1.0新增「上下合并」算子,可对多张表进行上下行合并,输出一张合并表

    1.2 应用场景

    数据同步节点 支持将数据进行跨数据库的同步,但是如果用户希望将数据进行比较复杂的处理(JSON 解析、多表关联等)后再同步至数据库中,则需要使用数据转换功能。如下图所示:

    注:若用户希望将大量的数据直接抽取同步写入数据库中,且想要同步的数据不需要非常复杂的处理步骤,则可以使用 数据同步节点

    34.png

    1.3 功能简介

    「数据转换」提供输入、输出、转换等类型的算子,可在抽数过程中实现复杂的数据处理。

    注:数据转换和数据同步的区别详情参见:数据同步与数据转换的区别

    2. 功能列表

    进入「数据转换」节点,界面如下图所示:

    35.png

    「数据转换」节点中包含的算子介绍如下表所示:

    分类
    算子说明
    数据输入DB表输入

    读取关系型数据库表中的数据

    具体请参见:FineDataLink支持的数据源

    4.1.3 及之后版本,数据源类型选择「DB表输入」类型时

    • 支持直接选表同步数据;直接选表同步数据时,支持并发读取数据

    • 数据源是 MySQL、Oracle、SQLServer 时支持调用数据库存储过程

    API输入从 API 中读取数据,支持 RESTful API 和 WebService API
    文件输入从 FineDataLink 服务器本地和 FTP/SFTP 服务器上读取 Excel、CSV、Txt 文件数据
    简道云输入读取简道云表单中的数据
    MongoDB输入读取 MongoDB 中指定集合的数据
    SAP RFC输入支持通过 RFC 接口调用 SAP 系统内已经开发好的函数,并将数据取出
    数据集输入支持读取文件数据集(Excel、TXT、XML、CSV)、树数据集、存储过程、程序数据集、内置数据集、关联数据集。其中存储过程、程序数据集、内置数据集、关联数据集仅在FineReport设计器可定义
    数据输出DB表输出将数据输出到关系型数据库表
    参数输出将取到的数据输出为参数,供下游节点使用
    API输出将数据输出到API
    简道云输出将数据输出到简道云表单
    文件输出可将数据输出为文件形式
    MongoDB输出将数据输出到 MongoDB
    连接数据关联用户两张数据表在不同的数据库中,希望能够将两张不同来源库的表进行关联生成新表。连接方式如下:
    • 左连接(LEFT JOIN):左合并

    • 右连接(RIGHT JOIN):右合并

    • 内连接(INNER JOIN):取交集

    • 全外连接(FULL OUTER JOIN):取并集

    数据比对将 2 个输入的数据进行比较,筛选出新增、删除、相同、更新的数据
    上下合并可对多张表进行上下行合并,输出一张合并表
    转换列转行实现数据表行列结构的改变,列转行
    行转列实现数据表行列结构的改变,行转列
    JSON解析解析 JSON 结构的数据,输出行列格式的数据
    XML解析将 XML 格式数据解析为行列格式数据
    字段设置可实现数据流字段的选择、重命名、数据类型转换操作
    新增计算列在不影响原有字段的情况下,可利用原有字段通过引用或计算获得一个新的字段
    数据过滤过滤符合条件的数据记录
    JSON生成选择字段,将表单数据,转换为生成多个 JSON 对象,用户可以在其中配置多层 JSON 嵌套
    字段拆列字段值按照特定规则(分隔符或字符数)拆分,拆分后的结果形成新的多列字段和值
    字段拆行字段值按照特定规则(分隔符)拆分,拆分后的结果形成新的一列字段和值
    分组汇总对原始数据根据条件将相同的数据先合并到一组,然后按照分组后的数据进行汇总计算
    实验室Spark SQLSpark SQL 基于内置的 Spark 计算引擎,满足用户查询数据、处理数据的需求,支持使用参数、函数
    Python 算子
    可调用 Python 脚本进行复杂数据处理
    其他备注说明可帮助用户为任务、节点增加备注




    附件列表


    主题: 数据开发
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持