反馈已提交

网络繁忙

数据管道使用说明

  • 文档创建者:Wendy123456
  • 历史版本:8
  • 最近更新:Wendy123456 于 2024-06-03
  • 1. 概述

    本文讲述如何使用数据管道功能。

    2. 准备工作

    准备工作说明
    步骤一(必做):准备 FDL 独立部署工程

    管道任务仅支持在 独立部署 环境下使用

    参考 FineDataLink部署方案选择 文档,部署 FDL 工程

    步骤二(必做):注册功能点
    若需要使用数据管道功能,则需要参考文档注册相关功能点:注册简介
    步骤三(必做):数据源准备

    管道任务支持的数据源请参见:数据管道支持的数据源类型

    需要拥有数据连接的使用权限,参考配置数据连接 文档新建数据连接,或者联系管理员分配数据连接的使用权限:数据连接权限概述

    3. 配置流程

    注:配置管道任务完整示例请参见:管道任务示例

    步骤
    步骤一:准备数据库环境(必做)

    基于需要设置数据管道任务的数据源,授予数据源配置的账号在数据库进行相应操作的权限。详情请参见:数据库环境准备概述

    步骤二:管道任务环境准备(必做)

    部署 Kafka 开源流处理平台作为中间件。详情请参见:部署Kafka配置传输队列

    注:Kafka 必须部署且建议部署在 Linux 系统中。

    步骤三:分配管道任务权限(选做)

    若需要使用数据管道的用户不是超级管理员,则需要为对应用户分配数据管道功能的使用权限

    若需要在某个文件夹下新建管道任务,则需要分配该文件夹的管理权限

    详情请参见:管道任务管理权限

    步骤四:配置数据管道任务(必做)

    按照顺序参考以下文档:

    配置管道任务-选择数据来源

    配置管道任务-选择数据去向

    配置管道任务-表字段映射

    配置管道任务-管道控制

    4. 不同场景下同步逻辑说明

    新建管道任务、复制管道任务场景:

    1)配置管道任务-选择数据来源 步骤中:

    • 若选择「存量+增量同步」类型先对所有存量数据同步,然后持续同步新增变化。

    任务初次运行时,将完整运行全量同步+增量同步;任务中断或暂停后,再次运行时,如果所有表的全量同步都已完成,则将从增量的断点开始,直接运行增量同步。

    2)目标表若选择已存在表,目标表结构(表名和字段名)和来源表一致:首次数据同步会清空目标数据表数据,然后全量同步数据,此后增量同步。

    暂停管道任务,进入编辑界面:

    1)新增来源表:新增的表将按照所选的同步类型进行同步。

    • 同步类型为存量+增量:新增的表需要进行存量同步,那么增量同步将在后台挂起,等新增的表存量跑完,再继续开始增量

    • 同步类型为仅增量:

      • 修改了增量起点:所有表(包含新增的表)按照指定增量起点进行同步

      • 没有修改增量起点:新增表,按照任务内置的断点进行同步

    2)删除来源表:删除同步对象并保存时,将同时删除此对象相关的所有关联信息,任务启动时,将不再同步对应表。

    处理脏数据 (具体详情点击左侧链接):

    1)重试脏数据对单表和指定多表,重试功能会将缓存的脏数据进行再次提交,并更新数据量统计。

    2)重新同步会将目标端表清空并重新执行全量同步、在全量同步结束后转入增量同步。

    开启同步源表结构按钮、选择逻辑删除:

    数据管道-同步源表结构变化数据管道逻辑删除说明

    开启失败重试:

    「失败重试」逻辑说明:

    • 若全量同步未完成,会从头全量同步;若全量同步已完成,会从断点开始;即全量阶段没有断点,只有增量阶段有断点同步。

    • 管道任务只要重新运行了,都是按第一次开始重新计算。

    5. 管道任务运维

    注1:若工程中包含管道任务,关闭工程不建议使用 kill -9 pid 语句,会导致管道任务异常,建议使用 kill pid 语句。详情请参见:关闭或重启FineDataLink工程

    注2:4.1.6.3 及之后版本,管道任务禁止被多人同时编辑。详情请参见:任务禁止被多人同时编辑

    操作
    参考文档
    重命名、移动、复制、导出、删除管道任务

    任务列表

    管道任务导入导出

    修改管道任务:暂停管道任务后,可修改管道任务

    注:修改范围有限,若某些设置项无法修改,可复制管道任务

    任务运行状况
    查看任务运行状况、查看日志、处理脏数据
    单个管道任务管理
    想对所有管道任务进行统一的管理,比如停止任务、删除任务、检查任务运行状态、同步性能、对异常情况进行监控和处理、批量暂停任务等管道任务运维
    • 管道任务并发数说明

    • 管道任务运行后,新增/删除表

    • 原任务无法运行,需要重新配置任务,进入编辑任务界面,发现某设置项不能修改怎么办

    数据管道运维指导
    记录数据管道相关信息的 FineDB 数据库表
    数据管道
    管道任务的查看、编辑、授权权限

    管道任务管理权限

    管道任务授权权限

    数据管道问题合集

    数据管道FAQ

    数据管道问题排查



    附件列表


    主题: 数据管道
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持