反馈已提交

网络繁忙

当前为10.0版本文档,只有最新版本的文档支持在线编辑修改,如果想创建/编辑文档,请移步至 最新版帮助文档

[平台]SPARK数据连接

  • 文档创建者:susie
  • 历史版本:8
  • 最近更新:Roxy 于 2019-12-06
  • 1. 描述

    Spark是一种通用的大数据快速处理引擎。Spark 使用 Spark RDD、 Spark SQL、 Spark Streaming、 MLlib、 GraphX 成功解决了大数据领域中离线批处理、交互式查询、实时流计算、机器学习与图计算等最重要的任务和问题。

    FineReport 提供了两种数据连接方式:

    方式一:在设计器中进行连接 ,具体方法请参见: [设计器]JDBC连接数据库 。

    方式二:在数据决策平台进行连接。本文主要介绍此种方式。

    2. 数据连接

    2.1 配置信息

    驱动   URL  支持数据库版本  驱动下载 
        org.apache.hive.jdbc.HiveDriver       jdbc:hive2://hostname:port/databasename      1.6.0; 

    hive-spark1.6 .rar

    2.1;2.3

    Hadoop Hive.zip

    2.2 连接步骤

    1)从配置信息驱动下载链接中下载 Spark 驱动包,并将该驱动包放置到%FR_HOME%\webapps\webroot\WEB-INF\lib下,重启报表服务器 。

    2)登录数据决策系统,选择管理系统>数据连接>数据连接管理,点击新建数据连接,在所有选项下选择SPARK,如下图所示:

    注:如果非管理员用户想要配置数据连接,需要管理员给其分配管理系统下数据连接节点的权限,具体操作请查看 数据连接控制 。

    1575016109113400.png

    3)点击确定进入数据连接配置页面。

    • 若选择 kerberos 认证,则需填入注册过 kdc 的客户端名称、keytab 密钥路径和 Kerberos 认证对应 URL ,具体请参考 [平台]数据连接Kerberos认证 ,如下图所示:

      注:连接前请检查 /etc/hosts 中的机器名对应 IP 是否为局域网 IP;

      检查 /etc/hostname 中机器名设置和 /etc/hosts 中是否配置一致;

      检查 FineReport 所在机器 hosts 配置的 IP+ 机器名是否正确;

      本地连接时需要配置 /etc/hosts 文件,添加远端映射:IP+机器名,例如: 192.168.5.206  centos-phoenix 。1575006000530712.png

    • 若不选择 kerberos 认证,则跟其他数据库设置一致,按照本文 2.1 章节提供的配置信息,输入数据库的对应信息,可选择填入高级设置信息,具体请参见 [平台]数据连接 )。如下图所示:

      1575006117443606.png

    4)点击测试连接,若弹出「连接成功」提示框,则表示成功连接上数据库,如下图所示:

    1575290143427940.png

    5)测试连接成功后点击右上角的保存按钮,该数据连接即添加成功。如下图所示:

    1575006079527769.png


    附件列表


    主题: 数据准备
    已经是第一篇
    已经是最后一篇
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    请前往「服务平台」,选择「在线支持」

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526