反馈已提交

网络繁忙

数据管道与定时任务区别

  • 文档创建者:Wendy123456
  • 历史版本:10
  • 最近更新:Roxy 于 2024-09-19
  • 1. 概述

    本文为你说明「数据开发」和「数据管道」的区别,帮助您更快地了解这两个模块。

    2. 数据开发与数据管道的区别

    区别项
    定时任务
    数据管道
    应用场景

    可视化多源异构数据整合,高效搭建数仓,消除数据孤岛、数据口径等问题

    16.png

    在数据库数据量大或表结构规范的情况下,实现高性能的「实时数据同步」

    17.png

    同步能力

    单表的定时同步

    支持全量+增量同步

    单表、多表整库、多对一实时同步

    支持全量+增量同步

    对数据的处理可使用节点、算子对数据进行清

    示例参考:最佳实践合集

    表数据原样同步到目标表中,不支持对数据进行计算处理

    示例参考:管道任务示例

    支持的数据源

    定时任务支持的数据源

    支持同步的数据类型如下:

    • 数据库数据

    • 接口类型数据:支持 RestAPI、简道云等多种形式的API数据接口

    • 文本数据:Excel 文件、txt 文件等

    数据管道支持的数据源

    支持同步的数据类型:数据库数据

    环境准备不需要特别准备环境需要准备 数据库环境安装 Kafka(Kafka建议安装在 Linux 中)
    来源端表结构发生变化

    定时任务DDL同步

    当进行定时任务开发时,能够提示来源端数据表的 DDL 变化,并且将变化通知给指定用户,用户需手动进行任务调整


    数据管道-同步源表结构变化

    来源端结构可能因业务调整等原因发生变动,如增删表、增删字段、修改字段名称、修改字段类型等,此时,目标端可以自动同步这些来源端的调整,不需要人为的进行数据表的调整

    来源端表数据发生变化(增/删/改)

    根据实际场景配置方案,定时同步数据变化

    数据同步方案概述


    实时同步到目标表
    任务中断后处理机制
    不支持断点续传

    若管道任务失败,支持断点续传:若全量同步未完成,会从头全量同步;若全量同步已完成,会从断点开始

    断点续传示例:

    管道任务在03-21日读取了数据,03-23日停掉,03-27日启动,03-23到03-27日的数据会同步过去

    注:数据管道和数据开发结合使用的最佳实践请参见:业务系统数据定期归档




    附件列表


    主题: 数据管道
    已经是第一篇
    已经是最后一篇
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭



    AI

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持