历史版本32 :数据开发概述 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

FineDataLink 版本功能变动
1.9-
4.0.14新增对节点使用用法提示,详情参见本文第二章

1.2 功能简介

数据开发模块支持在可视化界面使用各个节点和算子进行数据的抽取、转换和装载,并通过定义周期调度任务实现数据定时同步,帮助您轻松构建离线数仓,保证数据生产的高效稳定。

2. 功能概述编辑

注:数据开发部分相关概念说明详情参见:数据开发概念

功能
描述
多种数据源间的ETL、ELT 处理数据开发支持多种数据源,可以将多种来源数据进行数据处理和集成。

详情请参见:定时任务支持的数据源

定时任务管理

数据开发中通过「定时任务」存放设计好的业务流程。

通过「文件夹」对定时任务进行管理。

任务开发

功能丰富

  • 提供「数据同步」和「数据转换」节点,实现数据高效灵活的 ETL 和 ELT 。

  • 提供「SQL脚本」和「Shell 脚本」节点,实现脚本控制。

  • 提供多种流程节点,可结合「数据同步」和「数据转换」进行复杂逻辑处理。例如条件分支、循环执行、输出结果传递等复杂流程控制。

操作简单

  • 提供业务流程可视化开发机制,可通过拖拽组件方式快速实现数据开发。

  • 提供智能化的SQL编辑器。使用SQL编辑器时,提供复制和格式美化功能。

支持的节点类型,详情请参见节点列表
任务调度

提供了定时调度功能,可以定期自动运行定时任务,以保证数据能够及时更新。

  • 开始时间:设置任务开始执行时间

  • 执行频率:任务执行频率

  • 结束时间:设置任务结束执行时间

  • 结果通知:对调度任务运行后的执行结果,如果执行失败会进行通知

任务运维

通过任务运维,用户可以了解到整体任务的执行情况,也可以对定时任务的资源进行控制。

  • 运行记录:可以通过筛选和搜索的方式查看任务运行状态、运行耗时以及任务运行的历史日志。

  • 任务管理:查看任务调度配置情况。

  • 资源控制:限制「数据平台」占用的内存和带宽,减弱在集成部署下对 FineReport 或 FineBI 服务的影响。同时在独立部署时,可控制数据开发所占用的内存资源。

3. 界面介绍编辑

可通过 数据开发界面介绍 和 快捷键介绍了解了解数据开发操作界面。

通过下文的节点列表,了解各模块功能如何使用

节点是组成定时任务的基本单位,多个节点通过线条连接后可确定执行流程,进而组成一个完整的定时任务。FineDataLink 目前有如下节点:

3.png

节点的基本介绍如下表所示:


节点名称应用场景
通用
数据同步将数据从一个数据库抽取到另一个数据库
数据转换可执行数据关联、同步删除数据等操作
数据同步与数据转换的区别请参见数据同步与数据转换的区别
脚本SQL脚本写 SQL 语句对数据库中的数据进行处理
Shell脚本通过执行 shell 脚本,对接外部的独立数据处理过程,例如调用Kettle任务、调用Python计算任务等
流程参数赋值用参数承载上游节点运行的结果,然后在下游节点中使用该结果
条件分支基于一个来自于上游或者系统的条件,判断是否继续运行下游节点或者运行下游节点里面的哪一个
虚拟节点希望多个节点可以并行运行后再转到下游节点,可借助该节点实现
调用任务可以在当前任务中调用其他任务,这样可以直接设置任务间执行的依赖关系,实现跨任务编排
消息通知可将任务调度结果以企业微信群机器人/邮件/钉钉/短信的形式通知给指定用户
循环容器
可满足循环取数的场景
其他ETL任务和节点添加备注需要为节点或任务添加备注,例如在任务中备注该任务的具体使用场景。

鼠标悬浮至节点列表,会出现节点的用法解释,用户可快速查看当前节点任务用法。如下图所示:

4.png

4. 操作流程编辑

  • 配置定时任务设计时,数据读取和数据写入的数据源,详情参见:[通用]配置数据连接

  • 创建定时任务,并进行定时任务的开发

  • 设置定时任务定时自动执行,详情参见:定时任务调度配置

  • 对已经设置的定时任务进行任务管理和资源控制,详情参见:定时任务运维

5. 注意事项编辑

5.1 SQL 语句注释说明

4.0.17 版本之前,FineDataLink 忽略对 SQL 语句注释的处理;4.0.17 及之后版本,SQL 语句的注释交给数据库执行。

用户需注意 SQL 语句注释的书写规范:单行注释之后要有一个空格;Hive 数据源不支持多行注释。

5.2 Vertica 数据库新建主键

Vertica 数据库 新建主键时,SQL 语句示例如下:

alter table KARA.user_test114 add primary key(CODE1) enabled

SQL 语句中包含 enabled ,FineDataLink 才能识别到主键。

注:vertica8 以下版本不支持主键以及 upsert 语法;vertica8 及 vertica8 以上版本支持主键及 upsert 语法。