配置管道任务 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本17 :配置管道任务返回文档

编辑时间:11-03 13:39 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:10421 图片数:12目录数:4 修改原因:调整页面

[helpvideo]4648[/helpvideo]

1.概述编辑

FineDataLink 版本	功能变动
4.0.5	-
4.0.7	管道任务列表交界面优化

企业在在构建数仓和中间库时，由于业务数据量级较大，如果使用数据同步批量定时同步数据很难做到高性能的增量同步，若使用清空目标表再写入数据的方式时，还会面临目标表一段时间不可用、抽取耗时长等问题。

因此希望能在数据库数据量大或表结构规范的情况下，实现高性能的「实时数据同步」。

FineDataLink 支持对数据源进行单表、多表、整库数据的实时全量和增量同步，可以根据数据源适配情况，配置实时同步任务。

支持的数据源详情参见：数据管道支持的数据源

数据源环境已准备完成：基于需要设置数据管道任务的数据源，授予数据源配置的账号在数据库进行相应操作的权限。详情请参见：数据源环境准备。
已完成数据源配置。需要在使用数据管道进行实时同步任务配置前，配置好需要同步的源端和目标端数据库，以便在同步任务配置过程中，通过选择数据源名称来控制同步任务，详情参见：配置数据连接

示例以 MySQL 为例

将 test_1 数据库中的 S订单数据表实时同步至 test_2 数据库中。

配置传输队列，其实就是配置暂存来源库数据，方便目标库写入数据的「数据管道」，目前是通过 Kafka 实现的。

首先选择需要数据同步的来源数据。

点击「数据管道>新建任务」，进入任务设置界面，选择来源数据库以及需要进行数据同步的数据表，当然也可以选择多个数据库下的数据表，默认读取方式为 Binlog，默认先对所有存量数据同步，然后持续同步新增变化，如下图所示：

注1：单个任务限制最多选取 5000 张表，达到限制时不允许新增选择。

注2：读取对象只支持选择数据库表，不支持选择视图。

注3：当前只支持数据变化（DML）同步，不考虑支持结构变化（DDL）同步。

将已经存在的「S订单」数据表选到「要同步的表」中，如下图所示：

然后选定需要同步至的目标数据库位置。

点击下一步进入「选择去向」界面，选定目标数据库，如下图所示：

若目标数据表数据结构和来源表一致：首次数据同步会清空目标数据表数据，然后全量同步数据，此后增量同步。

若目标数据库没有和来源表一样的数据表，则直接在目标数据库新建数据表。

注：当前版本不支持DDL同步，若目标数据表数据结构和来源表不一致，写入目标数据库中的策略如下所示：