历史版本29 :Hadoop Hive数据连接 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

FineBI 版本
功能变动
5.1-
5.1.19更改上传数据库驱动包的方式:通过「驱动管理」上传,实现热加载

1.2 应用场景

Hadoop 是个很流行的分布式计算解决方案,Hive是建立在 Hadoop 上的数据仓库基础构架。

本文将介绍如何连接 Hadoop Hive 数据源。

2. 准备工作编辑

2.1 版本和驱动

下载驱动,并将其上传至 FineBI,如何上传可参见:驱动管理 2.1 节

注:在上传驱动包时,需要解压下面的「日志jar」文件,和驱动一起上传至 FineBI。

支持的数据库版本驱动包下载 日志jar下载
  hive_1.1

Hive1.1.zip

日志jar.rar

Hadoop_Hive_1.2;hive2.3;
  hive2.1.2;hive2.1.1

Hadoop Hive.rar 

2.2 收集连接信息

在连接数据库之前,请收集以下信息:

  • 数据库所在服务器的 IP 地址和端口号;

  • 数据库的名称;

  • 若是用户名密码认证,需要收集用户名和密码;若是 Kerberos 认证,需要收集客户端 principal 和 keytab 密钥路径;

3. 具体连接步骤编辑

1)以管理员身份登录 FineBI ,点击「管理系统>数据连接>数据连接管理」,点击「新建数据连接」如下图所示:

注:如果非管理员用户想要配置数据连接,需要管理员给其分配管理系统下数据连接节点的权限,具体操作请查看 数据连接权限 

bi新增数据连接.png

2)找到 Hadoop Hive 数据库,如下图所示:

68.png

3)切换驱动为「自定义」选择 2.1 节上传的驱动,并输入 2.2 节收集的连接信息,如下图所示:

Kerberos 认证方式详情可参见:数据连接 kerberos 认证

69.png

使用 Kerberos 认证需要注意以下事项:

  • 连接前请检查 /etc/hosts 中的机器名对应 IP 是否为局域网 IP;

  • 检查 /etc/hostname 中机器名设置和 /etc/hosts 中是否配置一致;

  • 检查 FineBI 所在机器 hosts 配置的 IP+ 机器名是否正确;

  • 本地连接时需要配置 /etc/hosts 文件,添加远端映射:IP+机器名,例如: 192.168.5.206  centos-phoenix 。

4)点击「测试连接」,若连接成功则点击「保存」,如下图所示:

70.png

4. 添加数据库的表至FineBI编辑

有两种方式可以将数据库中的表添加至 FineBI :

5. Hadoop相关报错解决方法编辑

5.1 描述

问题现象:

              在进行Hadoop相关数据库连接时,放入驱动后,FineBI起不来。查看FineBI的日志 %FineBI%/logs/fanruan.log 时,有如下hadoop相关报错:

              Provider org.apache.hadoop.hdfs.DistributedFileSystem could not be instantiated 

报错截图:

20190111152618_8275.png

解决方案:

              去数据连接的驱动处,查看放入的数据库相关驱动中是否有如下hadoop相关jar包,若有的话,将其删除。因为这些hadoop相关驱动与FineBI内置的hadoop驱动冲突,导致FineBI无法启动。删除jar包后,重启FineBI即可。

1547191426FSM7oSuG.png