[平台]SPARK数据连接 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本8 :[平台]SPARK数据连接返回文档

编辑时间:12-06 15:30 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:4962 图片数:5目录数:2 修改原因:步骤梳理、截图更新、纠错

1. 描述编辑

Spark是一种通用的大数据快速处理引擎。Spark 使用 Spark RDD、 Spark SQL、 Spark Streaming、 MLlib、 GraphX 成功解决了大数据领域中离线批处理、交互式查询、实时流计算、机器学习与图计算等最重要的任务和问题。

FineReport 提供了两种数据连接方式：

方式一：在设计器中进行连接，具体方法请参见： [设计器]JDBC连接数据库。

方式二：在数据决策平台进行连接。本文主要介绍此种方式。

驱动	URL	支持数据库版本	驱动下载
org.apache.hive.jdbc.HiveDriver	jdbc:hive2://hostname:port/databasename	1.6.0；	hive-spark1.6 .rar
org.apache.hive.jdbc.HiveDriver	jdbc:hive2://hostname:port/databasename	2.1；2.3	Hadoop Hive.zip

1）从配置信息驱动下载链接中下载 Spark 驱动包，并将该驱动包放置到%FR_HOME%\webapps\webroot\WEB-INF\lib下，重启报表服务器。

2）登录数据决策系统，选择管理系统>数据连接>数据连接管理，点击新建数据连接，在所有选项下选择SPARK，如下图所示：

注：如果非管理员用户想要配置数据连接，需要管理员给其分配管理系统下数据连接节点的权限，具体操作请查看数据连接控制。

3）点击确定进入数据连接配置页面。

若选择 kerberos 认证，则需填入注册过 kdc 的客户端名称、keytab 密钥路径和 Kerberos 认证对应 URL ，具体请参考 [平台]数据连接Kerberos认证，如下图所示：
注：连接前请检查 /etc/hosts 中的机器名对应 IP 是否为局域网 IP；
检查 /etc/hostname 中机器名设置和 /etc/hosts 中是否配置一致；
检查 FineReport 所在机器 hosts 配置的 IP+ 机器名是否正确；
本地连接时需要配置 /etc/hosts 文件，添加远端映射：IP+机器名，例如： 192.168.5.206 centos-phoenix 。
若不选择 kerberos 认证，则跟其他数据库设置一致，按照本文 2.1 章节提供的配置信息，输入数据库的对应信息，可选择填入高级设置信息，具体请参见 [平台]数据连接）。如下图所示：

4）点击测试连接，若弹出「连接成功」提示框，则表示成功连接上数据库，如下图所示：

5）测试连接成功后点击右上角的保存按钮，该数据连接即添加成功。如下图所示：