1. 概述
在使用 FineDataLink 「数据开发」搭建数仓或者进行数据处理时,经常需要进行数据的清洗、处理、计算等,FineDataLink 提供了多种可视化算子,用户无需编写复杂的 SQL 语句即可快速便捷的进行数据处理,提高开发效率。
本文将全面的介绍使用各种可视化算子,对数据进行快速清洗处理,比 SQL 更快更简便的完成任务开发。
2. 索引
序号 | 应用场景 | 功能说明 | 文档 |
---|---|---|---|
1 | 多个业务系统的表数据中存在相同字段或相同含义的字段,需要将不同的来源数据上下合并到一个表输出 | 「上下合并」算子,可对多张表进行上下行合并,输出一张合并表 | 上下合并 |
2 | 两张数据表在不同的数据库中,希望能够将两张不同来源库的表进行关联生成新表 | 数据关联可实现异构数据关联 | 数据关联 |
3 |
| ||
4 | 数据解析(JSON、XML格式数据) | 解析 JSON 结构的数据,输出行列格式的数据 将 XML 格式数据解析为行列格式数据 | |
5 | 对数据字段类型、名称等进行设置 | 「字段设置」算子可对接入数据的字段做以下操作:
| 字段设置 |
6 | 对数据按照需求进行字段拆分 |
| |
7 | 用户数据存在空值,想过滤掉空值数据 | 过滤指定数据 | 数据过滤 |
8 | 同类数据的汇总计算 | 「分组汇总」对原始数据根据条件将相同的数据先合并到一组,然后按照分组后的数据进行汇总计算。 | 分组汇总 |
9 | 常用时间数据处理 | 可使用 SparkSQL 算子或者新增列算子实现时间字段的处理 | 新增列:常见日期公式 SparkSQL:SparkSQL日期函数 |
10 | 常用文本数据处理 | 可使用 SparkSQL 算子或者新增列算子实现文本字段的处理 | 新增列:字符串清洗 SparkSQL: |
11 | 「编码函数」、「加密函数」、「签名函数」等常用于进行API加密认证取数时的 Token 生成。 | 可使用 SparkSQL 算子实现数据加密解密应用 | 最佳实践: |