資料同步與資料轉換的差別 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本2 :資料同步與資料轉換的差別返回文檔

編輯時間:10-20 14:42 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 內容長度:4736 图片数:6目录数:3 修改原因:调整页面

1. 概述编辑

FineDataLink 提供了包含数据开发、任务运维等功能，满足用户对数据进行同步、处理、清洗等一系列的需求。

ETL 是指将数据从来源端经过抽取（extract）、转换（transform）、加载（load）至目的端，在 FIneDataLink 中可以通过「数据同步」和「数据转换」两种功能实现。

本文为你说明「数据同步」和「数据转换」在使用上的区别，帮助你更好的应用产品。

注：步骤流和数据流概念详情参见FineDatalink特有名词

功能	模式	属性	定义	优势	劣势	应用场景
数据转换	ETL	数据流	从数据来源端抽取数据，进行数据处理，利用FineDataLink完成数据处理，再加载入数据目标端。	数据处理场景覆盖范围广	1）针对数据量较大场景时，抽数速度低于数据同步 2）消耗硬件资源配置，内存消耗高	当数据需要利用FDL完成复杂场景处理时，推荐使用数据转换
数据同步	步骤流	从数据来源端抽取数据直接加载入数据目标端，然后利用数据库完成数据处理。	抽数性能佳节点个数少，抽数任务更加轻量化	无法进行复杂场景的数据处理	1）适用于较大数据量的同步场景，当单表数据量超过1kw时，推荐使用数据同步 2）适用于没有复杂处理逻辑的数据同步场景

功能

模式

属性

定义

优势

劣势

应用场景

数据转换

ETL

数据流

从数据来源端抽取数据，进行数据处理，利用FineDataLink完成数据处理，再加载入数据目标端。

数据处理场景覆盖范围广

1）针对数据量较大场景时，抽数速度低于数据同步

2）消耗硬件资源配置，内存消耗高

当数据需要利用FDL完成复杂场景处理时，推荐使用数据转换

数据同步

步骤流

从数据来源端抽取数据直接加载入数据目标端，然后利用数据库完成数据处理。

抽数性能佳

节点个数少，抽数任务更加轻量化

无法进行复杂场景的数据处理

1）适用于较大数据量的同步场景，当单表数据量超过1kw时，推荐使用数据同步

2）适用于没有复杂处理逻辑的数据同步场景

「数据转换」节点属于数据流：即从输入（Input）到输出（Output）之间的数据流动，针对的是在数据流动过程中的每一行记录、每一列数据的处理。数据流里可以完成数据的输入、转换、等操作，如下图所示：

用户希望将数据进行处理后在同步至数据库中。

首先进入数据转换节点中，根据数据源类型进行数据输入，如下图所示：

使用「连接」「转换」等步骤对输入的数据进行处理，如下图所示：

处理好数据后使用输出步骤将数据输出至数据库中，如下图所示：

「数据同步」节点属于步骤流：步骤流也叫工作流，是对步骤进行编排，每个步骤都是相对独立的，只有执行的先后顺序区别，不会存在数据行的流动，如下图所示：

注：数据转换也是一个步骤流。

用户希望将数据直接抽取同步写入数据库中。

通过「设置需要抽取的数据」>「设置需要写入的数据表」>「调整数据表字段」将数据直接抽取并写入数据库中。