历史版本2 :Hadoop Hive数据连接 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1、描述编辑

Hadoop是个很流行的分布式计算解决方案,Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。本章我们将介绍如何在FineBI中连接Hadoop Hive数据库。

2、数据连接编辑

2.1 配置信息

驱动  URL    支持数据库版本
  org.apache.hive.jdbc.HiveDriver  jdbc:hive2://ip:port/dbname  hive_1.1;Hadoop_Hive_1.2;

2.2 连接步骤

下载Hadoop Hive的驱动包,并将该驱动包放置到FineBI文件夹%FineBI%\webapps\webroot\WEB-INF\lib下,重启服务器。

登录FineBI数据决策系统,选择管理系统>数据连接,点击“新建数据连接”选择更多数据连接,并在弹出框中选择Hadoop Hive,如下图:

点击确认进入数据连接配置页面,按照前面提供的配置信息,输入自身数据库的对应信息,可选择勾选kerberos认证。若勾选kerberos认证,则需填入注册过kdc的客户端名称、keytab密钥路径和Kerberos认证对应URL,参考数据连接Kerberos认证,如下图:

若不勾选kerberos认证,则跟其他数据库设置一致,选择填入编码转换和连接池属性信息即可(编码转换和连接池属性介绍可参考配置数据连接),如下图:

点击“测试连接”,若测试连接成功则表示成功连接上数据库。

测试连接成功后点击“保存”该数据连接即添加成功。

3、注意事项编辑

FineBI默认查询出的字段名前会加表名,若不想要加表名,需要在数据库文件hive-site.xml中进行配置,如下图,将value的值由默认的true改成false。