
1. 概述
问答BI 以自然语言对话的方式简化数据分析流程,使得用户能够以自然语言提问并获取数据洞察,本文以IT部门的视角,提供了一系列正式使用问答BI的最佳实践:
使用前调研:了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容
业务数据梳理:数据的规范对于 AI 理解用户提问的语义至关重要,需要保证数据规范
问答配置:通过配置同义词、推荐问题、近似问题等,提升问答相关性和准确性
用户培训:教授业务用户如何有效使用问答BI工具
问答优化:针对问答效果不好的点调整数据和系统配置,持续进行优化
2. 调研业务用户做准备
了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容。
可以参考下表设计调研问题:
类别 | 描述 |
---|---|
目标 | 您在 FineBI 上最近半年经常访问的页面是哪些? 这些页面一般提供了怎样的信息,与您的目标有何关联? |
现状 | 您通常会关注哪些具体指标?您对这些指标的关注有何原因? 它们在您的工作中扮演了怎样的角色? |
选择 | 对于未来可能嵌入的 AI 问答功能,您期望它提供哪些服务和帮助? 您认为它能够怎样提高您的工作效率和成果? |
意愿 | 如果意愿按照1到10分打分 这些问题你给几分? (低于5分的重点标注一下和讨论) |
了解到用户的实际需求后,就可以为业务人员准备问答BI需要使用的数据了。
3. 准备问答数据
新建分析主题,IT用户 将业务数据表添加到主题中,如下图所示:
数据的规范对于 AI 理解用户提问的语义至关重要,接下来,将详细介绍数据表规范。IT 人员可以使用 FineBI 中的数据编辑功能对数据进行处理。
3.1 表结构规范
3.1.1 避免数据冗余
需要避免数据表中有业务数据冗余。多表分析时,比起使用 左右合并 制作宽表,更推荐直接使用 主题模型 建立模型关系。
比如,「销售额表」与「销售目标表」通过左右合并后获得的宽表如下图所示,当用户问“销售总目标是多少”时:
问答 BI 回复销售总目标:1600
实际销售总目标:1100
解决方案:将「销售额表」与「销售目标表」拆分在两张表中,使用 主题模型 建立多表之间的模型关系可避免出现数据冗余。
3.1.2 调整正确的字段类型
添加到 FineBI 中的字段类型系统会自动进行判断,IT 人员需检查字段是否都调整成了正确的字段类型。例如:
销售额字段若为文本类型,则无法顺利进行相加统计
销售日期若为文本类型,则不能顺利计算同比环比
3.2 表头表值规范
3.2.1 表头应避免语义交叉
在同一个数据表或同一个模型,应避免表头之间的语义重叠或混淆。例如:
有一个员工信息表格,原始表头可能包含“员工职位”和“员工级别”。用户询问“高级职位的员工有哪些”时,由于者两个表头语义混淆,系统就无法准确召回对应的表头。为了避免这种情况,可以将表头重新命名为“职位名称”和“职位等级”,这样就能清晰的区分员工等级高低。
3.2.2 表头表值应规整精炼
1)若表头或表值需要参与到用户的提问,则长度应该尽量短和简洁明了(少于10个字),有助于提高系统的试别能力。
2)并且表值内容需要规整,例如:
对于「支付方式」表头,可能列出“银行转账(工商银行等)”、“信用卡在线支付”、“移动支付(如支付宝)”,这种表述方式包含了不必要的细节。可以统一为“转账”、“信用卡”、“移动支付”,以提高筛选和报告生成的效率。
对于「省份」表头,可能列出“广东省(粤)”、“江苏省(苏)”、“辽宁省(辽)”,这种表述方式混合了省份的全称和简称,可能导致检索时混肴。统一格式,仅显示标准名称:“广东省”、“江苏省”、“辽宁省”,帮助系统准确识别信息。
3.3 新增计算字段
若缺失用户需要使用的分析字段,而缺失的字段可以通过已有字段计算获得:
在编辑数据中添加字段补充
在组件中添加计算字段补充
4. 智能问答配置
IT人员可以提前为业务人员配置同义词、推荐问题、近似问题等,可以优化业务用户的提问体验。
注:IT 人员需要有智能问答配置的使用权限
4.1 设置同义词
添加分析主题,可以对主题中的数据表进行「表别名配置」和「近义词配置」。当用户的查询包含这些同义词时,系统能够智能地将查询请求映射到正确的数据表头。如下图所示:
4.2 推荐问题配置
对业务业务调研,确定哪些问题是业务用户经常询问的。基于常见查询和业务需求,可以在「推荐问题配置」中创建推荐问题列表。如下图所示:
5. 业务人员培训
将准备好的问答数据,通过「主题协作」的编辑权限分享给业务用户,接下来用户就可以对你准备的数据进行提问了。
5.1 如何使用问答 BI
参考 FineChatBI 使用说明 对用户进行培训。
5.2 如何进行提问
场景 | 二级分类 | 用户问法示例 |
---|---|---|
基本数据查询 | 指标查询 |
支持求和、最大值、最小值、平均值、方差、标准差、标准差、环比、同比、占比 |
指标复杂计算查询 |
| |
过滤查询 | 普通过滤:
过滤+计数:
过滤+占比:
明细过滤:
指标的过滤条件:大于、小于、大于等于、小于等于、前X、后X 维度的过滤条件:为空、不为空、开头是、开头不是、结尾是、结尾不是、包含、不包含 | |
可视化询问 | 可视化方式查询 |
|
做对比 | 不同指标对比 |
|
同比、环比查询 |
| |
枚举值对比 |
| |
看趋势变化 | 指标趋势 |
|
维度枚举值趋势 |
| |
时间趋势 |
| |
问排名 | top问法 |
|
排名问法 |
| |
排行榜问法 |
| |
抓典型 | 时间问法 |
|
预测问法 |
| |
头尾问法 |
| |
做计算 | 四则运算 |
|
多轮问答 | 时间切换 |
|
排序 |
| |
limit |
| |
递进的高级计算 |
| |
替换维度 |
| |
替换枚举值 |
| |
递进查询 |
| |
可视化切换 |
| |
增加指标 |
| |
归因分析 | 时间点归因 |
|
时间区间归因 |
| |
非时间归因 |
|
5.3 项目计划表(参考)
1阶段:环境准备+调研 | 2阶段:数据准备 | 3阶段:试用+调整 | 4阶段:上线宣传 | |
---|---|---|---|---|
运维管理人员 | 完成 FineChatBI 部署 | 保证业务数据接入FineBI,提供可测试的环境 | 为首批用户开放使用权限;提供客服资源与响应支持业务用户测试 | 提供客服资源响应 |
IT人员 |
|
| 开放首批业务用户进行测试,同步收集用户反馈; 根据反馈进行问答优化 | 对业务人员进行宣传与赋能:
|
业务分析师 | 参与用户调研,提供分析场景与需求 | - | 参与测试,并提供使用反馈 | 使用问答BI解决业务问题,进行长期反馈 |
6. 问答优化
为确保问答 BI 工具能持续提供高质量的服务,IT 人员需积极监控并优化系统。若问答效果不好,可提供一下两个关键措施优化:
数据表优化:检查数据表是否符合规范并优化,规范的数据表更有利于AI理解,从而提升问答效果。操作步骤参考本文第 3 节。
调整问答配置:调整问答配置中的同义词、推荐问题、近似问题的配置,提升问答相关性和准确性。