反馈已提交

网络繁忙

BI/Spider参数

  • 文档创建者:doreen0813
  • 编辑次数:48次
  • 最近更新:Carly 于 2022-11-30
  • 1. 概述

    1.1 版本

    FineBI 版本功能变动
    6.0-
    6.0.2数据类型识别逻辑优化,对数据位数进行更准确的判断
    6.0.3

    新增BI参数「智能数据解释」

    新增BI参数「抽取查询超时时间」

    「Spider参数」更名为「抽取参数」

    6.0.4

    1)新增参数

    新增BI参数「Excel导出剩余磁盘空间」

    新增抽取参数「更新高性能时间区间」

    2)删除参数

    删除抽取参数「Spark Driver端口」

    删除抽取参数「Spark blockManager端口」

    删除抽取参数「Spark动态调节功能」

    3)参数分类优化,调整部分参数的分类

    「明细表导出并发线程数限制」、「多指标计算线程数」调整为BI参数-高级调优参数

    「spark日志输出等级」、「精简模式日期」调整为抽取参数-基础参数

    「spark本地模式临时文件路径」、「增量更新数据块整理计划」调整为抽取参数-高级调优参数

    6.0.5BI参数「智能数据解释」默认关闭

    1.2 功能简介

    FineBI 在系统管理里提供了配置一些 BI 参数和调优参数的功能,方便系统管理和项目实施人员简单快捷的了解当前系统配置,并在界面上进行快速设置。

    管理员登录FineBI系统,进入「管理系统>系统管理>常规」,可以看到 BI参数和抽取参数配置的页面。如下图所示:

    2. BI 参数

    注:BI参数仅作用于FineBI功能,对FineReport无影响。

    2.1 基础参数

    参数定义默认值

    修改后是否

    需要重启工程

    数据类型识别

    1)无论是否开启,有小数位数时字段始终被识别为数值类型

    2)不开启数据类型识别时,超过15位的识别为文本类型,小于等于15位的识别为数值类型

    3)开启数据类型识别后始终识别为数值类型(double),double有效精度为15位(2^52),所以当数值长度超过15位时就可能发生精度丢失的情况

    4)在未开启参数的情况下添加的表(直连和分布式):

    • 如果表没被编辑过,开启参数重启后,进入表编辑界面可以获取为数值字段类型,重新保存即可。

    • 如果表是被编辑过(5.1.5及以后是做过字段类型转换)的,开启参数重启后,进入表编辑界面依然会是文本类型,不会再读取为数值。

    关闭
    SQL参数控件过滤生效

    控件绑定SQL参数功能与过滤功能是否同时生效

    默认关闭,表示不生效

    关闭
    中文排序

    是否使用中文排序

    默认关闭,表示不使用中文排序

    开启后,抽取数据的表需要重新抽数

    详情参见:排序 1.4 节

    关闭
    数据访问量

    数据访问量限制了可读入服务器内存的数据行数。并非所有大数据量计算场景都会将所有数据读入内存,FineBI Spider 引擎具有智能的内存使用策略

    配置过低,将影响数据计算准确性。

    配置过高,系统有宕机风险。

    单位:行

    可配置区间:[0,10000000]

    建议设置区间:[10000,1000000],建议保持默认值

    1000000
    Excel 导出数据量限制

    用户导出 Excel 时可能会超出数据量限制,提供该参数便于用户设置,超过限制导出将直接报错

    单位:单元格(行*列)

    配置范围:0-2000000000

    建议配置范围:0-1000000000

    Excel 导出剩余磁盘空间(G)

    导出Excel时会进行磁盘空间检查,当磁盘空间小于限制值时,将中断导出行为。预防因磁盘占满导致宕机。

    触发该限制后,Excel中报错:当前导出数据量过大,磁盘空间不足。已触发系统保护机制,导出中断。请及时清理磁盘空间,受【Excel导出磁盘空间检查】参数限制,磁盘空间限制:XXG

    配置范围:5~无限制

    5

    直连查询超时时间(秒)

    当仪表板中组件过多,组件查询时间会过长,或者仪表板中某个组件查询时间过长,导致后续 BI 请求被阻塞,容易误认为产品宕机。

    此时可设置直连查询超时时间,所有实时数据查询超时之后将会中止查询,防止异常慢查询阻塞其他正常查询。

    组件返回如下报错: 组件查询时间超过Xmin,查询中断

    单位:秒

    建议配置范围:10-300

    生效范围:BI直连除获取表结构之外的所有查询请求

    180
    智能数据解释

    控制组件在不进行主动配置时,是否能进行智能数据解释,默认开启。

    安装数据解释插件后此配置才生效

    关闭后,手动配置过的数据解释才能触发,以避免数据解释的滥用

    关闭
    抽取查询超时时间(秒)

    当仪表板中组件过多,组件查询时间会过长,或者仪表板中某个组件查询时间过长,导致后续 BI 请求被阻塞,容易误认为产品宕机。

    此时可设置抽取查询超时时间,所有抽取数据查询超时之后将会中止查询,防止异常慢查询阻塞其他正常查询。

    组件返回如下报错: 组件查询时间超过xxx,查询中断

    单位:秒

    建议配置范围:10-300

    45

    2.2 高级调优参数

    参数
    定义默认值

    修改后是否需要重启工程

    明细表导出并发线程数限制

    当多个用户同时导出数据量很大的 Excel 时,可能会超过并发数,影响用户使用,因此提供该参数,可设置同时进行明细表导出的用户数。超过限制导出,业务员需等待。

    配置范围:1-10

    建议配置范围:1-5,建议保持默认值

    3
    多指标计算线程数

    控制多指标计算时的线程数

    配置过低,涉及多指标计算场景时计算速度将会降低

    配置过高,涉及多指标计算场景时可能会影响其他任务的吞吐量

    建议保持默认值 20

    建议设置区间:[10, 20]

    20

    3. 抽取参数

    注:抽取参数仅作用于FineBI的抽取功能,对FineReport、FineBI实时数据无影响。

    3.1 基础参数

    参数定义默认值

    修改后是否需要重启工程

    分析用户自助数据集磁盘占用大小(单元格)

    限制用户制作的自助数据集(分析性质)可更新的最大数据量。可有效保护系统磁盘的健康使用。

    配置过低,会导致大量自助数据集更新失败。配置过高,会引发磁盘占满。重启后生效。

    单位:单元格(行*列)

    建议设置区间:[10,000,000, 100,000,000]

    详情请参见:数据量说明

    注1:分析用户自助数据集磁盘占用大小(单元格)参数只影响 数据存放路径 (默认%FineBI%/bin/ROOT 文件夹)下数据文件夹的磁盘占用空间大小,服务器磁盘空间 1T 以上可考虑修改,1T 以下保持默认配置即可。

    注2:若修改过大会导致磁盘占满,引起宕机。

    50,000,000
    自助数据集默认更新设置

    自助数据集单表更新是否跟随父表更新

    详情请参见:自助数据集单表更新

    跟随父表更新
    Spark日志输出等级

    spark日志输出等级,标准输出流,输出在 Tomcat 的 catalina.out 文件内或者 BI 的 nohup 文件内

    可选项为:INFO、WARN、ERROR、DEBUG。

    • INFO:打印错误类和基本执行日志

    • WARN:打印警告或提示类信息

    • ERROR:只打印错误类日志

    • DEBUG:打印所有日志

    INFO
    更新高性能时间区间

    在配置的时间段内不限制更新资源池核心数占用。

    为不影响用户使用,建议配置到系统无人使用、更新任务频繁的时间段。

    精简模式日期精简模式开启时,日期字段在进行数据抽取时,只提前生成少量分组类型,加快生成速度,减少占用空间

    未生成的分组在进行计算时可能会有性能损失

    关闭是(且需重新更新数据)

    3.2 高级调优参数

    参数
    定义默认值

    修改后是否

    需要重启工程

    抽数压缩线程数

    抽取数据时,分片(压缩&写入)线程的数量

    在内存很小(不超过4G)并且无法扩大内存的情况下,可以调小该线程,减轻内存压力

    配置过低,数据更新速度将会减缓。

    配置过高,数据更新时可能会影响其他任务的吞吐量

    建议保持默认值 8。

    建议设置区间:[4, 16]

    8
    抽数压缩线程队列大小

    抽取数据时,未处理的分片等待队列长度

    在内存很小(不超过4G)并且无法扩大内存的情况下,可以调小队列长度,减轻内存压力

    配置过低,数据更新速度将会减缓

    配置过高,数据更新时可能会影响其他任务的吞吐量

    建议保持默认值 200

    建议设置区间:[100, 200]

    200
    新增数据抽数任务执行线程数新增数据的抽数任务同时执行的线程数

    在内存很小(不超过4G)并且无法扩大内存的情况下,可以调小该线程数,减轻内存压力

    配置过高,数据更新时可能会影响其他任务的吞吐量

    建议保持默认值 5

    建议设置区间:[1, 5]

    5
    Spark本地模式临时文件路径

    Spark写临时文件的目录,需给足一定的空间,修改至SSD挂载路径可提升Spark处理关联、SparkSql查询的性能

    注:集群版该参数无效,需要在服务器端配置。

    null (Linux下实际为/tmp)
    增量更新数据块整理计划在这个时间段内,增量更新任务不会执行合并操作,提升增量更新的速度

    设置格式 hh:mm:ss-hh:mm:ss

    示例 10:10:10-12:12:12

    关闭



    附件列表


    主题: 管理系统
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526

    文 档反 馈

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭