Spark SQL FineReport帮助文档|报表开发|报表使用|学习教程

历史版本20 :Spark SQL 返回文档

编辑时间:02-23 09:28 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:13123 图片数:13目录数:2 修改原因:调整了一下换行

1. 概述编辑

FineDataLink 版本	功能变更
3.6.2	数据转换节点新增算子「Spark SQL」算子，可实现较灵活的数据转换功能
4.0.17	「Spark SQL」算子支持使用加密相关函数和变量同时支持作为数据源输入参数或常量

通过使用 Spark SQL 算子，用户可以获取上游输出的数据，使用 Spark SQL 对其进行查询和处理，并输出给下游。

4.0.17 版本 Spark SQL 算子支持作为输入型算子，可以输入参数或常量，便于进行加密认证等，相关示例详情参见：API取数-加密身份验证&按页数取数。

注1：Spark SQL 兼容通用 SQL 。

注2：Spark SQL 常用语法及介绍请参见：Spark SQL语法

如下图所示：

用户想对文件数据源「订单数据」和数据库数据源「客户数据」进行数据关联，并筛选部分数据。

新建任务，将一个「数据转换」节点拖到设计界面。如下图所示：

点击「数据转换」节点，进入编辑界面，参考读取本地数据，将本地 Excel 数据上传到 FineDataLink 系统中，如下图所示：

将一个「DB表输入」算子拖到数据转换的设计界面，SQL 语句取出「S客户」表中所有数据。如下图所示：

设置数据关联，将「订单数据」和「客户数据」根据「客户ID」左连接数据关联，如下图所示：

将 Spark SQL 算子拖到数据转换的设计界面，并使用线条跟它的上游「DB表输入」算子相连。配置 Spark SQL ，语句为：

select * FROM 数据关联 where `传真` is not null and `货主城市` ='北京'。如下图所示：

注：表名为上游节点的名称；语句不能直接复制，「数据关联」需点击生成。

需要注意 SQL 语句的写法，如下图所示：

界面具体设置项介绍如下表所示：

Tab 页	设置项	介绍
配置	输入源	与上游算子相连后，自动获取上游的节点作为输入表，表名即为上游节点的名称可以接入两类算子：流出型算子：DB表输入、API输入、数据集输入等过程型算子：数据关联、行列转换、JSON解析等如果上游算子为空，提示：请接⼊⾄少⼀个节点作为Spark SQL的输⼊源
SQL 语句	由用户自定义输入在输入 SQL 语句时，有联想功能，例如：表名加.就能联想字段名：
数据预览	-	「配置」界面设置好之后，点击「数据预览」Tab，可预览 Spark SQL 转换后的数据

Tab 页

设置项

介绍

配置

输入源

与上游算子相连后，自动获取上游的节点作为输入表，表名即为上游节点的名称

可以接入两类算子：