实时管道任务概述 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本56 :实时管道任务概述返回文档

编辑时间:05-29 17:27 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:8172 图片数:3目录数:3 修改原因:调整页面

1. 概述
2. 功能概述
3. 功能使用

1. 概述编辑

1.1 应用场景

企业在构建数仓和中间库时，由于业务数据量级较大，如果使用数据同步批量定时同步数据很难做到高性能的增量同步，若使用清空目标表再写入数据的方式时，还会面临目标表一段时间不可用、抽取耗时长等问题。

因此希望能在数据库数据量大或表结构规范的情况下，实现高性能的实时数据同步。

1.2 功能说明

支持对数据源进行单表、多表、整库数据的实时全量和增量同步，可以根据数据源适配情况，配置实时同步任务。如下图所示：

1.3 实现原理

FDL 监听数据管道来源端的数据库日志变化，利用 Kafka 作为数据同步中间件，暂存来源数据库的增量部分，进而实现向目标端实时写入数据的效果。

1.4 断点续传功能说明

若管道任务失败，支持断点续传：若全量同步未完成，会从头全量同步；若全量同步已完成，会从断点开始。

断点续传示例：

管道任务在 03-21 日读取了数据，03-23 日停掉，03-27 日启动，03-23 到 03-27 日的数据会同步过去。

1.5 数据管道与数据开发的区别

详情请参见：数据管道与数据开发区别

1.6 数据管道并发数说明

请参见：数据管道运维指导

2. 功能概述编辑

功能	描述
多种数据源间的数据同步	实时同步支持多种数据源，可以将多种来源端及目标端数据源搭配组成同步链路进行数据实时同步数据管道支持的数据源请参见：数据管道支持的数据源类型
数据同步场景	1）支持对数据源进行单表、多表、整库数据的实时全量和增量同步：单表数据实时同步：支持单表实时同步。整库数据实时同步：支持一次性配置一个实例下多个库的多个表单个任务限制最多选取 5000 张表，达到限制时不允许新增选择 2）同步类型为：存量+增量同步：先对所有存量数据完成同步，随后持续同步新增的变化数据（增/删/改）增量：任务仅包含增量阶段，任务初次运行时，将按照配置的起始时间开始进行增量同步
实时数据同步任务配置	实时同步任务配置无需编写代码，通过简单的任务配置即可实现单表、整库实时数据的同步详情请参见：配置数据管道任务 1）设置目标端：支持在目标端自动新建同步数据表、同时也可以选择目标端数据库已有数据表进行数据同步来源数据源会包含许多DDL操作，进行实时同步时，开启相关选项后，在源库发生DDL（删除表、新增字段、删除字段、修改字段名称、修改字段类型（长度修改 & 兼容类型修改））时，管道任务可以自动同步这些来源端变化至目标端，不需人为介入修改目标表结构。关于实时同步各目标端支持的DDL操作详情请参见：同步源表结构变化支持逻辑删除数据和显示数据存储入库时间戳支持断点续传 2）设置字段映射：支持调整字段映射方式以及目标数据库数据表的字段类型和字段顺序，默认同名映射支持批量修改目标表表名 3）设置管道控制：支持设置脏数据阈值，当异常或脏数据导致的任务中止会进行通知支持设置失败重试，当管道任务由于当时的网络波动或者其他原因，运行中断，设置失败重试后可自动重新运行任务当任务异常时可进行通知，通知渠道支持：短信、邮件、平台消息、钉钉群机器人、飞书群机器人、企业微信群机器人可设置管道任务的日志等级，满足用户按需查看日志、调试和排错的需求；可以在更细粒度的日志等级里，打印详细的日志，供用户查看
实时同步任务运维	支持对同步任务进行监控，详情请参见：管道任务运维支持查看管道任务运行情况支持对脏数据进行处理支持批量启动/暂停管道任务 4.1.6.3 及之后版本，管道任务禁止被多人同时编辑。详情请参见：任务禁止被多人同时编辑

3. 功能使用编辑

请参见：数据管道使用说明