配置实时管道任务 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本12 :配置实时管道任务返回文档

编辑时间:08-17 21:04 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:10158 图片数:14目录数:4 修改原因:调整页面

1. 概述编辑

FineDataLink 版本
4.0.5

企业在在构建数仓和中间库时，由于业务数据量级较大，如果使用数据同步批量定时同步数据很难做到高性能的增量同步，若使用清空目标表再写入数据的方式时，还会面临目标表一段时间不可用、抽取耗时长等问题。

因此希望能在数据库数据量大或表结构规范的情况下，实现高性能的实时数据同步。

FineDataLink 支持对数据源进行单表、多表、整库数据的实时全量和增量同步，可以根据数据源适配情况，配置实时同步任务。

当前仅支持 MYSQL 5.6及以上的非只读数据库。

进入 etc 文件中，编辑my.cnf 文件，如下图所示：

修改 my.conf 文件，增加如下内容：

注：server_id=2，其中2可写任意数值。

server_id=2
log_bin=mysql-bin
binlog_format=ROW
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock

然后保存文件即可。

已完成数据源配置。需要在使用数据管道进行实时同步任务配置前，配置好需要同步的源端和目标端数据库，以便在同步任务配置过程中，通过选择数据源名称来控制同步任务，详情参见：配置数据连接

示例将 test_1 数据库中的 S订单数据表实时同步至 test_2 数据库中。

配置传输队列，其实就是配置暂存来源库数据，方便目标库写入数据的「数据管道」，目前是通过 Kafka 实现的。

首先选择需要数据同步的来源数据。

点击「数据管道>新建任务」，进入任务设置界面，选择来源数据库以及需要进行数据同步的数据表，当然也可以选择多个数据库下的数据表，默认读取方式为 Binlog，默认先对所有存量数据同步，然后持续同步新增变化，如下图所示：

注1：单个任务限制最多选取 5000 张表，达到限制时不允许新增选择。

注2：读取对象只支持选择数据库表，不支持选择视图。

注3：当前只支持数据变化（DML）同步，不考虑支持结构变化（DDL）同步。

将已经存在的「S订单」数据表选到「要同步的表」中，如下图所示：

然后选定需要同步至的目标数据库位置。

点击下一步进入「选择去向」界面，选定目标数据库，如下图所示：

若目标数据表数据结构和来源表一致：首次数据同步会清空目标数据表数据，然后全量同步数据，此后增量同步。

若目标数据库没有和来源表一样的数据标，则直接在目标数据库新建数据表。

注：当前版本不支持DDL同步，若目标数据表数据结构和来源表不一致，写入目标数据库中的策略如下所示：