历史版本2 :配置管道任务-选择数据来源 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

FineDataLink 版本功能变动
4.0.6支持Mysql 作为读取数据源
4.1.4SAP HANA、DB2支持作为读取端
点击展开更多
FineDataLink 版本
功能变动
4.0.7

支持 SQL Server 作为读取数据

支持 Oracle 作为读取数据源

4.0.18支持 Oracle18c、19c、Oracle RAC集群作为读取数据源
4.0.20.1支持0.10.2到3.4的Kafka版本作为读取数据源
4.0.27

支持快速批量选择需要同步的数据表

4.0.29
  • 支持在设置数据来源时,检测数据源是否有日志读取权限

  • 自动屏蔽 Oracle 数据源 BLOB、CLOB、NCLOB、LONG、RAW、LONGRAW、BFILE 字段同步

4.0.30
  • MySQL、Oracle、SQL Server、PostgreSQL 支持仅增量同步

  • 当「选择来源」选择「仅增量同步」时,去向表默认选择「已存在表」,会自动执行一次同名匹配,且用户仍可以手动切换为「自动建表」

1.2 功能简介

「选择来源」步骤中,需要设置进行实时同步的数据表/库、同步类型等。如下图所示:

20.png

2. 前提条件编辑

用户需已做以下准备工作:

步骤

步骤一:数据源配置

根据实际情况选择源端和目标端数据库,数据管道支持的数据库请参见:数据管道支持的数据源类型

在数据连接管理中配置源端和目标端的数据连接,便于在管道任务配置过程中,通过选择数据源名称来控制同步任务的读取和写入数据库。详情请参见:配置数据连接

步骤二:准备数据库环境

基于需要设置数据管道任务的数据源,授予数据源配置的账号在数据库进行相应操作的权限。详情请参见:数据库环境准备概述

步骤三:管道任务环境准备

部署 Kafka 开源流处理平台作为中间件。详情请参见:部署Kafka配置传输队列

步骤四:分配管道任务权限

若需要使用数据管道的用户不是超级管理员,则需要为对应用户分配数据管道的使用权限。详情请参见:管道任务管理权限

步骤五:创建管道任务

创建管道任务,详情请参见:

3. 操作步骤编辑

20.png

3.1 选择数据源

管道任务支持的来源端请参见:数据管道支持的数据源类型

点击「数据源权限检测」按钮,可以查看数据源是否有日志读取权限。如下图所示:

21.png

3.2 读取方式

根据来源端数据库不同而变化。

3.3 同步类型

注:对于历史数据量很大的情况,历史数据往往要通过特定的高速装载方式或者分多次多批导入。管道任务仅使用在在全量同步完成后,接续开始增量同步,此时用户可以使用仅增量同步类型。

3.3.1 存量+增量同步

先对所有存量数据同步,然后持续同步新增变化。
任务初次运行时,将完整运行全量同步+增量同步;任务中断或暂停后,再次运行时,如果所有表的全量同步都已完成,则将从增量的断点开始,直接运行增量同步。

3.3.2 仅增量同步

1705568136259634.png

增量同步起点
说明
选择「任务启动时间」作为起点时,将以任务启动时间作为解析开始时间

对于使用目标数据源推荐方式导入历史数据时,没有筛选条件的历史全量数据导入,可以设置增量同步起点为任务执行开始时间

任务仅包含增量阶段,任务初次运行时,将按照配置的起始时间开始进行增量同步。

支持数据源:MySQL、Oracle、SQLServer、PostgreSQL

配置后生效时间点精度为:yyyy-MM-dd HH:mm:ss.000,精确到毫秒,时区以数据库的时区为准。

注1:对于PostgreSQL 数据源,仅支持任务启动时间作为起点

注2:SAP HANA 仅支持任务启动时间作为起点

选择「自定义时间」作为起点时,可指定增量起始时间,默认为空,必填,允许指定到秒。

可选时间的起点是检测用户数据库日志最早的时间。

对于使用目标数据源推荐方式导入历史数据时,基于时间筛选的历史数据导入,可以设置增量同步起点为最早的筛选时间

3.4 同步对象

可选择要实时同步的数据表、数据库。

其中,「快速选表」按钮可批量选择多表,帮助用户更快选择来源表。如下图所示:

1705568599350472.png

4. 后续步骤编辑