1. 概述
视频学习请点击:添加基础数据表
Excel 数据集属于基础表,基础表概念请参见:基础表
1.1 版本
FineBI 版本 | JAR 包版本 | 功能变动 |
---|---|---|
5.1 | 2020-01-15 | - |
2020-08-04 | 上传 Excel 自动填充名称 | |
5.1.9 | 2021-01-06 | 支持批量上传 Excel |
5.1.10 | 2021-02-05 | 文件名为空的csv、xls、xlsx的文件,上传后自动命名为「Excel数据集+数字」 |
5.1.11 | 2021-04-02 | Excel 不再区分分析性质和处理性质 即所有 Excel 都可以随意创建分析性质或处理性质的自助数据集 |
1.2 应用场景
本文介绍如何将 Excel 添加进 FineBI ,作为后续的数据分析和仪表板展示的数据源。
1.3 功能简介
支持批量上传 Excel 文件。若需对上传的 Excel 数据进行更新,可参见:更新Excel 。
2. 上传前准备工作
2.1 确认支持上传文件类型
FineBI 可上传的表类型为 csv、xls、xlsx 三种格式,支持的字段类型详情参见: 导入Excel支持的字段类型 。
注1:支持上传 2003 和 2007 版本且后缀为 xls、xlsx 的 Excel 文件,不支持上传保存类型为 Excel 5.0/95 的后缀为 xls 的 Excel 文件。
注2:不支持上传加密 Excel 文件。
2.2 关闭文件上传校验
FineBI 2019-07-15 之后的 5.1 版本中,在上传 csv 格式文件前,需要进入「管理系统>安全管理>安全防护 」中,关闭「文件上传校验」,才能上传成功。
2.3 Excel 首行不能有合并单元格
上传前需要确认,添加的 Excel 首行不能有合并单元格,否则会上传失败,如下图所示:
2.4 确认是否有函数计算的内容
上传的 Excel 数据集中不能有 Excel 函数计算的内容,例如:vlookup,sumifs 函数等。
3. 操作步骤
3.1 选择数据表
1)登录 FineBI ,在「数据准备」中选择一个业务包,点击「添加表>Excel 数据集」,如下图所示:
2)选择你要上传到 FineBI 的 Excel,可上传 csv、xls、xlsx 三种格式。用户可以使用ctrl键、shift键或鼠标框选选择多张表,如下图所示:
注:最多选择 100 个 Excel 文件,且每个 Excel 中 sheet 页不能超过 255 张。
3) FineBI 会自动展开 Excel 中的所有 sheet ,用户可以勾选自己所需要表。如下图所示:
注:最多在左侧勾选 100 张表,否则添加失败。
注: FineBI 在读取 Excel 文件时会自动跳过空 sheet 页。
表名默认为「Excel 名-sheet 名」,用户可以手动修改表名。
4)点击「继续上传」,用户可以继续添加 Excel 数据表。
3.2 修改字段类型
上传时用户可能会需要对表的字段类型进行调整,用户可以调整每个单独 Excel 或 sheet页 的字段类型,有两种调整方法:
在表头更改字段类型
点击「表结构展示」调整字段类型,例如调整「表2-sheet1」的字段类型的操作如下图所示:
3.3 选择是否合并字段一致的表
所有表的字段类型调整好后,即可以点击「确定」。
若选中的表中,有「字段名、字段类型和字段顺序完全一致」的表,系统就会出现提示:存在数据表中字段一致,是否合并成一张表。如下图所示:
在该例中,「表1-sheet1」和「表1-sheet2」的字段名、字段类型和字段顺序完全一致。
选择「不合并」,「表1-sheet1」和「表1-sheet2」不会合并,最终上传后的结果如下图所示:
选择「合并」,「表1-sheet1」和「表1-sheet2」进行上下合并,且后面的表合并到前面的表中。即「表1-sheet2」合并到「表1-sheet1」中,上传后的结果如下图所示:
注:添加基础表后可进行基础表的编辑操作,详情参见:编辑基础表
注:被 BI 识别成日期类型的字段都会自动补全「年月日时分秒」,展示成 yyyy-MM-dd HH:mm:ss (示例:2020-10-15 00:00:00 ) 。
4. 注意事项
4.1 上传数据量限制
对于 xls、xlsx 格式的 Excel 文件,建议单个文件数据量不多于 100w 单元格,如超过数据量建议进行多次追加上传。
4.2 上传时字段类型识别规则
4.2.1 抽数版本识别规则
1)优先识别添加字段是否为数字格式( 0 开头的数字不被识别为数字)。
2)其次识别添加字段是否为日期格式 。
3)最后识别添加字段是否为文本格式(超过 15 位的数值默认为文本格式)。
若添加后表的字段类型与添加前不一致,手动修改所需字段类型即可。当添加的 Excel 数据集中有字段值为小数类型(如 double、float 等浮点类型)的值时,使用 分组表 或者 交叉表 进行汇总计算时可能无法精确显示出小数位。
4.2.2 直连版本识别规则
去除空值后,取前 100 行进行字段类型预判:前 100 行有三种字段类型取数量大于 1/3 的作为识别类型,有两种字段类型取数量大于1/2的作为识别类型。若数量相同,则按照「文本>日期>数值>空」规则进行判断。