历史版本13 :Presto数据连接 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:


目录:

1. 概述编辑

Presto 是一个分布式 SQL 查询引擎, 它被设计用来专门进行高速、实时的数据分析。它支持标准的 ANSI SQL,包括复杂查询、聚合(aggregation)、连接(join)和窗口函数(window functions)。Presto 的运行模型和 Hive 或 MapReduce 有着本质的区别。Hive将查询翻译成多阶段的 MapReduce 任务, 一个接着一个地运行。 每一个任务从磁盘上读取输入数据并且将中间结果输出到磁盘上。 然而 Presto 引擎没有使用 MapReduce 。它使用了一个定制的查询和执行引擎和响应的操作符来支持 SQL 的语法。除了改进的调度算法之外, 所有的数据处理都是在内存中进行的。 不同的处理端通过网络组成处理的流水线。 这样会避免不必要的磁盘读写和额外的延迟。 这种流水线式的执行模型会在同一时间运行多个数据处理段, 一旦数据可用的时候就会将数据从一个处理段传入到下一个处理段。 这样的方式会大大的减少各种查询的端到端响应时间。本章我们将介绍如何在 FineBI 中连接 Presto 数据库。

2. 数据连接编辑

2.1 配置信息

数据库版本驱动URL驱动下载
V0.169com.facebook.presto.jdbc.PrestoDriverjdbc:presto://host:port/catalog

presto-jdbc-0.169.jar

2.2 连接步骤

有两种连接方式:

  • 方法一:安装驱动隔离插件后,再连接数据库。

    驱动隔离插件下载安装详情请参见:驱动隔离插件

  • 方法二:不使用驱动隔离插件,直接连接数据库。

    连接方式参见下文。但这种方式可能有 JAR 包之间的冲突从而导致连接失败。推荐用户用第一种方式。

1)将数据库驱动放到对应文件夹下

下载 Presto 驱动包,并将该驱动包放置到%FineBI%\webapps\webroot\WEB-INF\lib下,重启 FineBI 。

2)新建数据连接

登录数据决策系统,选择管理系统>数据连接>数据连接管理,点击新建数据连接,在所有选项下选择Presto,如下图所示:

1575006395204017.png

点击确定进入数据连接配置页面,按照 2.1 节配置信息,输入数据库的对应信息。可选择填入连接池属性信息(连接池属性介绍可参考 配置数据连接 ),如下图所示:

1575007228558492.png

2.3 测试连接

点击测试连接,或者在模式下点击连接数据库,若测试连接成功则表示成功连接上数据库,如下图所示:

1575346176867722.png

测试连接成功后可以选择模式,根据需要选择对应模式,若不进行选择,则默认为第一个模式。如下图所示:

1575006676372328.png

模式选择后点击右上角的保存按钮,该数据连接即添加成功。如下图所示:

1575006700499393.png

3. 注意事项编辑

不支持 Boolean 类型的null值,读取到 FineBI 中将显示 false 。