1. 概述
1.1 版本
FineDataLink 版本 | 功能变动 |
---|---|
4.2.1.4 | 针对星环 ArgoDB 数据源:
|
1.2 功能简介
FineDataLink 支持连接星环 ArgoDB 数据源,适配功能:
定时任务的读取和写入。
管道任务写入。
库表管理功能。
数据服务功能。
2. 使用限制
数据管道写入 ArgoDB 时,需使用 ArgoDB 6.0 及以上版本;数据管道写入 ArgoDB 时,仅支持表类型:Holodesk 表。
定时任务和管道任务中,不支持同步 ArgoDB 的 BLOB、CLOB 类型的字段。
ArgoDB 作为目标端时,源端数据库表不支持修改字段类型,否则任务执行时会报错。
3. 准备工作
3.1 前提条件
详情请参见:前提条件
3.2 版本和驱动
下载对应的驱动包,如何上传驱动包可参见:驱动管理
支持的数据库版本 | 驱动 | 备注 |
---|---|---|
V5.2 及以上版本 | 左侧驱动文件需要解压后再上传 驱动管理中,文件选择如下图标注: |
3.3 收集连接信息
在连接数据库之前,请收集以下信息:
数据库所在服务器的 IP 和端口号。
数据库的用户名和密码。
数据库的名称。
4. 操作步骤
1)管理员登录 FDL 工程,点击「管理系统>数据连接>数据连接管理」,选中某个文件夹后,新建数据连接。如下图所示:
2)设置数据连接名称(可同时修改数据连接所在目录)。如下图所示:
3)可根据数据源分类、支持形式、适配模块、数据源名称筛选数据库。如下图所示:
4)驱动选择 3.2 节上传的驱动,输入 3.3 节的信息。如下图所示:
部分设置项说明如下表所示:
注1:该数据源作为写入端时,必须配置 HDFS 。
注2:Kerberos 认证说明请参见:数据连接 Kerberos 认证
设置项 | 说明 |
---|---|
HDFS地址 | 支持配置多个 HDFS 地址;多个 HDFS 地址使用逗号隔开,例如:hdfs://ip1:port1,hdfs://ip2:port2,hdfs://ip3:port3 |
HDFS认证方式 | 可选择无认证、Kerberos |
HDFS用户名 | 当 HDFS 的认证方式选择「无认证」时,支持配置用户名 填写后,使用配置的用户名作为连接 HDFS 的用户;如果留空,默认使用启动 Tomcat 时的服务器用户,连接 HDFS 进行读写 |
扩展参数项 | 对 HDFS 做自定义配置 此处做配置,相当于配置客户端的 hdfs-site.xml 的内容 |
5)点击「测试连接」,若连接成功则「保存」该连接。
5. 使用数据源
定时任务和管道任务中,不支持同步 ArgoDB 的 BLOB、CLOB 类型的字段。
5.1 定时任务
5.1.1 读取
定时任务读取暂不支持并行取数、分区分桶、存储过程。
5.1.2 写入
目标表表类型、RowKey说明:
1)写入 ArgoDB 数据库时:
若目标表为自动建表,支持的表类型:「ORC」、「HOLODESK」、「PARQUET」。
若目标表为已存在表,不限制表类型。
2)写入 ArgoDB 数据库时,若目标表类型为「HOLODESK」:
支持配置 RowKey。
被设置 RowKey 的字段是唯一且非空的列或列组合。
NUMBER、DECIMAL、TIMESTAMP、VARCHAR、VARCHAR2、FLOAT、TIME、DOUBLE 类型字段,不支持设置为 RowKey。
3)已存在表不支持修改表 Rowkey。
分区说明:
1)定时任务支持选择分区表作为数据去向;定时任务自动建表支持指定分区键。详情请参见:读取、创建、写入分区表
2)当选择的目标表是分区表(包含分区键),或自动建表时定义了分区键,写入方式新增「分区写入」设置项。
分区级别、分区键均为自动获取,无法自定义;用户可配置写入方式、分区值。
写入方式:可选择静态分区、动态分区。
分区值:静态分区写入时,需要为分区键配置分区值。
3)RowKey 不支持设置为分区键。
写入方式配置:
表类型 | 写入方式 | 说明 |
---|---|---|
HOLODESK | 直接将数据写入目标表 | 1)目标表无 Rowkey 键:直接追加写入数据 2)目标表有 Rowkey 键映射:基于 Rowkey 键比对数据行的差异:Rowkey键相同、Rowkey键不同
|
清空目标表,再写入数据 | 直接先把目标表清空掉,然后再写入数据;有无主键均可以选择 | |
基于标识字段,新增/修改/删除字段 | 1)目标表无 Rowkey 键,不支持选择该写入方式 2)不支持「只对标识值为NULL的数据行进行逻辑删除」的功能 | |
非HOLODESK | 仅支持:直接将数据写入目标表、清空目标表,再写入数据 |
5.2 数据管道
数据管道写入 ArgoDB 时,需使用 ArgoDB 6.0 及以上版本。
数据管道写入 ArgoDB 时,仅支持表类型:Holodesk 表。
管道任务写入该数据源时:目标表支持自动建表。
5.3 库表管理
详情请参见:库表管理
5.4 数据服务
详情请参见:数据服务概述