实时管道任务使用说明- FineDataLink帮助文档

文档创建者：Wendy123456

历史版本：35

最近更新：Wendy123456 于 2026-01-07

1. 概述

本文讲述如何使用数据管道功能。

2. 准备工作

准备工作	说明
步骤一（必做）：准备 FDL 工程	参考 FineDataLink部署方案选择文档，部署 FDL 工程
步骤二（必做）：注册功能点	若需要使用数据管道功能，则需要参考文档注册相关功能点：注册简介
步骤三（必做）：数据源准备	管道任务支持的数据源请参见：数据管道支持的数据源类型需要拥有数据连接的使用权限，参考配置数据连接文档新建数据连接，或者联系管理员分配数据连接的使用权限：数据连接权限概述

准备工作

说明

步骤一（必做）：准备 FDL 工程

参考 FineDataLink部署方案选择文档，部署 FDL 工程

步骤二（必做）：注册功能点

若需要使用数据管道功能，则需要参考文档注册相关功能点：注册简介

步骤三（必做）：数据源准备

管道任务支持的数据源请参见：数据管道支持的数据源类型

需要拥有数据连接的使用权限，参考配置数据连接文档新建数据连接，或者联系管理员分配数据连接的使用权限：数据连接权限概述

注：4.2.1.1 之前版本，若使用 SQL Server 数据库作为管道任务的来源库，配置数据连接时不建议使用自定义驱动；且管道任务的日志等级不建议为 DEBUG （可设置为 INFO）。否则管道任务中会出现大量 SQL Server cdc 日志打印。

3. 配置流程

注1：配置管道任务完整示例请参见：管道任务示例

注2：管道任务的来源端若为 MySQL、SQLServer、Oracle，若同一个库中的多张表都需要实时同步，建议在一个管道任务中实现；若同一个库中的多张表，每张表单独配置一个管道任务，数据库将承受较大压力。

步骤
步骤一：准备数据库环境（必做）基于需要设置数据管道任务的数据源，授予数据源配置的账号在数据库进行相应操作的权限。详情请参见：数据库环境准备概述
步骤二：管道任务环境准备（必做）部署 Kafka 开源流处理平台作为中间件。详情请参见：部署Kafka、配置传输队列（只有 FDL 工程的超管才能配置传输队列）注1：Kafka 建议部署在 Linux 系统中（Kafka 也支持安装在 Windows 中，但性能会受到限制，仅做演示使用，不建议用于生产环境）；Kafka 与 FDL 可以不在一个服务器上注2：重启 Kafka 前，需要先手动暂停管道任务，重启 Kafka 后，需要重启下 FineDataLink 工程，再手动重启管道任务，否则管道任务会有异常。注3：数据管道需要使用 Kafka 作为中间件完成实时同步，若来源表有 1000 张，kafka 中会生成 1000 个 topic，即一张表对应一个
步骤三：分配管道任务权限（选做）若需要使用数据管道的用户不是超级管理员，则需要为对应用户分配数据管道功能的使用权限若需要在某个文件夹下新建管道任务，则需要分配该文件夹的管理权限详情请参见：管道任务管理权限
步骤四：配置数据管道任务（必做）按照顺序参考以下文档： 1）配置实时管道任务-数据来源&数据去向注1：不建议用户使用数据管道同步 longtext 类型的字段，否则 Kafka 会有问题，运行效率也会有问题注2：不建议来源表字段名称中包含空格，否则任务启动将会报错 2）配置管道任务-高级设置 3）配置管道任务-同步配置 4）配置管道任务-任务控制表脏数据阈值注意事项：在 4.2.1.1 之前的版本中，支持设置任务级别的脏数据阈值，用户通常设置较大数值，4.2.1.1 及之后版本，调整为表脏数据阈值；所以，升级至 4.2.1.1 及后续版本后，建议适当调小该阈值设置，以有效控制脏数据量

步骤

步骤一：准备数据库环境（必做）

基于需要设置数据管道任务的数据源，授予数据源配置的账号在数据库进行相应操作的权限。详情请参见：数据库环境准备概述

步骤二：管道任务环境准备（必做）

部署 Kafka 开源流处理平台作为中间件。详情请参见：部署Kafka、配置传输队列（只有 FDL 工程的超管才能配置传输队列）

注1：Kafka 建议部署在 Linux 系统中（Kafka 也支持安装在 Windows 中，但性能会受到限制，仅做演示使用，不建议用于生产环境）；Kafka 与 FDL 可以不在一个服务器上

注2：重启 Kafka 前，需要先手动暂停管道任务，重启 Kafka 后，需要重启下 FineDataLink 工程，再手动重启管道任务，否则管道任务会有异常。

注3：数据管道需要使用 Kafka 作为中间件完成实时同步，若来源表有 1000 张，kafka 中会生成 1000 个 topic，即一张表对应一个

步骤三：分配管道任务权限（选做）

若需要使用数据管道的用户不是超级管理员，则需要为对应用户分配数据管道功能的使用权限

若需要在某个文件夹下新建管道任务，则需要分配该文件夹的管理权限

详情请参见：管道任务管理权限

步骤四：配置数据管道任务（必做）

按照顺序参考以下文档：

1）配置实时管道任务-数据来源&数据去向

注1：不建议用户使用数据管道同步 longtext 类型的字段，否则 Kafka 会有问题，运行效率也会有问题

注2：不建议来源表字段名称中包含空格，否则任务启动将会报错

2）配置管道任务-高级设置

3）配置管道任务-同步配置

4）配置管道任务-任务控制

表脏数据阈值注意事项：

在 4.2.1.1 之前的版本中，支持设置任务级别的脏数据阈值，用户通常设置较大数值，4.2.1.1 及之后版本，调整为表脏数据阈值；所以，升级至 4.2.1.1 及后续版本后，建议适当调小该阈值设置，以有效控制脏数据量

4. 不同场景下同步逻辑说明

新建管道任务、复制管道任务场景：

1）配置管道任务-选择数据来源步骤中：

若选择「存量+增量同步」类型：先对所有存量数据同步，然后持续同步新增变化。

任务初次运行时，将完整运行全量同步+增量同步；任务中断或暂停后，再次运行时，如果所有表的全量同步都已完成，则将从增量的断点开始，直接运行增量同步。

若选择仅增量同步类型，具体说明参见文档：配置管道任务-选择数据来源

2）目标表若选择已存在表，目标表结构（表名和字段名）和来源表一致：首次数据同步会清空目标数据表数据，然后全量同步数据，此后增量同步。

编辑实时管道任务：

详情请参见：管理实时管道任务

处理脏数据 （具体详情点击左侧链接）：

1）重试脏数据：对单表和指定多表，重试功能会将缓存的脏数据进行再次提交，并更新数据量统计。

2）重新同步：会将目标端表清空并重新执行全量同步、在全量同步结束后转入增量同步。

开启同步源表结构按钮、选择逻辑删除：

数据管道-同步源表结构变化、数据管道逻辑删除说明

开启失败重试：

「失败重试」逻辑说明：

若全量同步未完成，会从头全量同步；若全量同步已完成，会从断点开始；即全量阶段没有断点，只有增量阶段有断点同步。
管道任务只要重新运行了，都是按第一次开始重新计算。

5. 管道任务运维

注1：若工程中包含管道任务，关闭工程不建议使用 kill -9 pid 语句，会导致管道任务异常，建议使用 kill pid 语句。详情请参见：关闭或重启FineDataLink工程

注2：4.1.6.3 及之后版本，管道任务禁止被多人同时编辑。详情请参见：任务禁止被多人同时编辑

操作	参考文档
重命名、移动、复制、导出、删除管道任务	任务列表
管道任务迁移	管道任务导入导出
查看任务运行状况、查看日志、处理脏数据 4.2.11.3 之前版本，编辑管道任务：注：修改范围有限，若某些设置项无法修改，可复制管道任务添加表、删除表、修改数据连接重新设置同步表结构变化按钮、脏数据阈值、失败重试、结果通知等 4.2.11.3 及之后版本，编辑管道任务：实时管道运行中时，支持添加同步对象支持删除同步对象、修改同步对象（修改同步类型、映射关系、写入方式等所有同步对象的配置）支持修改任务控制、高级配置支持重置实时管道任务	单个管道任务管理
想对所有管道任务进行统一的管理，比如停止任务、删除任务、检查任务运行状态、同步性能、对异常情况进行监控和处理、批量暂停任务等	管道任务运维
管道任务并发数说明管道任务运行后，新增/删除表原任务无法运行，需要重新配置任务，进入编辑任务界面，发现某设置项不能修改怎么办	数据管道运维指导
记录数据管道相关信息的 FineDB 数据库表	数据管道
管道任务的查看、编辑、授权权限	管道任务管理权限管道任务授权权限
数据管道问题合集	数据管道FAQ 数据管道问题排查
用户想了解某个管道任务是谁编辑的、编辑时间、断点相关信息等，FDL 工程内的管道任务运维无法满足需求	BI仪表板展示管道任务信息
用户的管道任务实现上百张表的实时同步，且存在部分来源表和目标表的表名不同、多张来源表同步到一张目标表等情况，导致用户在管理来源表和目标表的对应关系时（例如重构任务）较为困难管道任务的来源表在 FineDB 的 fine_dp_pipeline_task 表中记录	导出管道任务中来源表及对应的目标表信息

上一篇：实时管道任务概述

下一篇：实时管道任务示例

有帮助
没帮助
只是浏览

English

中文（简体）

实时管道任务使用说明

1. 概述

2. 准备工作

3. 配置流程

4. 不同场景下同步逻辑说明

5. 管道任务运维

附件列表