历史版本2 :最佳实践 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

问答BI 以自然语言对话的方式简化数据分析流程,使得用户能够以自然语言提问并获取数据洞察,本文以IT部门的视角,提供了一系列正式使用问答BI的最佳实践:

  • 使用前调研:了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容

  • 业务数据梳理:数据的规范对于 AI 理解用户提问的语义至关重要,需要保证数据规范

  • 问答配置:通过配置同义词、推荐问题、近似问题等,提升问答相关性和准确性

  • 用户培训:教授业务用户如何有效使用问答BI工具

  • 问答优化:针对问答效果不好的点调整数据和系统配置,持续进行优化

2. 调研业务用户做准备编辑

了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容。

可以参考下表设计调研问题:

类别
描述
目标

您在 FineBI 上最近半年经常访问的页面是哪些

这些页面一般提供了怎样的信息,与您的目标有何关联?

现状

您通常会关注哪些具体指标?您对这些指标的关注有何原因?

它们在您的工作中扮演了怎样的角色?

选择

对于未来可能嵌入的 AI 问答功能,您期望它提供哪些服务和帮助

您认为它能够怎样提高您的工作效率和成果?

意愿

 如果意愿按照1到10分打分 这些问题你给几分?

 (低于5分的重点标注一下和讨论)

了解到用户的实际需求后,就可以为业务人员准备问答BI需要使用的数据了。

3. 准备问答数据编辑

新建分析主题,IT用户 将业务数据表添加到主题中,如下图所示:

1.png

数据的规范对于 AI 理解用户提问的语义至关重要,接下来,将详细介绍数据表规范。IT 人员可以使用 FineBI 中的数据编辑功能对数据进行处理。

3.1 表结构规范

3.1.1 避免数据冗余

需要避免数据表中有业务数据冗余。多表分析时,比起使用 左右合并 制作宽表,更推荐直接使用 主题模型 建立模型关系。

比如,「销售额表」与「销售目标表」通过左右合并后获得的宽表如下图所示,当用户问“销售总目标是多少”时:

  • 问答 BI 回复销售总目标:1600

  • 实际销售总目标:1100

解决方案:将「销售额表」与「销售目标表」拆分在两张表中,使用 主题模型 建立多表之间的模型关系可避免出现数据冗余。

2.png

3.1.2 调整正确的字段类型

添加到 FineBI 中的字段类型系统会自动进行判断,IT 人员需检查字段是否都调整成了正确的字段类型。例如:

  • 销售额字段若为文本类型,则无法顺利进行相加统计

  • 销售日期若为文本类型,则不能顺利计算同比环比

3.2 表头表值规范

3.2.1 表头应避免语义交叉

在同一个数据表或同一个模型,应避免表头之间的语义重叠或混淆。例如:

  • 有一个员工信息表格,原始表头可能包含“员工职位”和“员工级别”。用户询问“高级职位的员工有哪些”时,由于者两个表头语义混淆,系统就无法准确召回对应的表头。为了避免这种情况,可以将表头重新命名为“职位名称”和“职位等级”,这样就能清晰的区分员工等级高低。

3.2.2 表头表值应规整精炼

1)若表头或表值需要参与到用户的提问,则长度应该尽量短和简洁明了(少于10个字),有助于提高系统的试别能力。

2)并且表值内容需要规整,例如:

  • 对于「支付方式」表头,可能列出“银行转账(工商银行等)”、“信用卡在线支付”、“移动支付(如支付宝)”,这种表述方式包含了不必要的细节。可以统一为“转账”、“信用卡”、“移动支付”,以提高筛选和报告生成的效率。

  • 对于「省份」表头,可能列出“广东省(粤)”、“江苏省(苏)”、“辽宁省(辽)”,这种表述方式混合了省份的全称和简称,可能导致检索时混肴。统一格式,仅显示标准名称:“广东省”、“江苏省”、“辽宁省”,帮助系统准确识别信息。

3.3 新增计算字段

若缺失用户需要使用的分析字段,而缺失的字段可以通过已有字段计算获得:

  • 在编辑数据中添加字段补充

  • 在组件中添加计算字段补充

4. 智能问答配置编辑

IT人员可以提前为业务人员配置同义词、推荐问题、近似问题等,可以优化业务用户的提问体验。

注:IT 人员需要有智能问答配置的使用权限

4.1 设置同义词

添加分析主题,可以对主题中的数据表进行「表别名配置」和「近义词配置」。当用户的查询包含这些同义词时,系统能够智能地将查询请求映射到正确的数据表头。如下图所示:

3.png

4.2 推荐问题配置

对业务业务调研,确定哪些问题是业务用户经常询问的。基于常见查询和业务需求,可以在「推荐问题配置」中创建推荐问题列表。如下图所示:

4.png

5. 业务人员培训编辑

将准备好的问答数据,通过「主题协作」的编辑权限分享给业务用户,接下来用户就可以对你准备的数据进行提问了。

5.png

5.1 如何使用问答 BI

参考 FineChatBI 使用说明 对用户进行培训。

5.2 如何进行提问

场景二级分类用户问法示例
基本数据查询指标查询
  • 去年每个月每个城市的销售额累计值

  • 今年所有门店销售额的平均值

  • 门店日均销售额

  • 今年所有门店的销售额标准差是多

支持求和、最大值、最小值、平均值、方差、标准差、标准差、环比、同比、占比

指标复杂计算查询
  • 之前三个月的销售额中位数/方差/平均值/累计值/占比/排名

过滤查询

普通过滤:

  • 销售额大于40万的门店

  • 退货渠道为"空"的产品有哪些(空建议添加引号,识别会更准确

过滤+计数:

  • 销售额大于100万的门店有多少

  • 今年的单据编码有多少

  • 销售额大于 50 万且小于 100 万的门店有多少

过滤+占比:

  • 今年的销售额占比

  • 上海市的销售额占全国比例

明细过滤:

  • 成本额大于销售额的单据编码有多少

指标的过滤条件:大于、小于、大于等于、小于等于、前X、后X

维度的过滤条件:为空、不为空、开头是、开头不是、结尾是、结尾不是、包含、不包含

可视化询问可视化方式查询
  • 明年四川省每月的日均销售额,用折线图展示

  • 去年第三季度之前每个商品类别的销售额,按照柱形图展示

做对比不同指标对比
  • 2023年每个月的销售额和成本额

同比、环比查询
  • 上海销售额同比

  • 每个门店销售额同比增长了多少

枚举值对比
  • 去年和今年上海市的销售额对

  • 上海市vs北京市的销售额

看趋势变化指标趋势
  • 销售额趋势

维度枚举值趋势
  • 上海销售额趋势

时间趋势
  • 上个季度上海销售额趋势

问排名top问法
  • 这个月销售额前十的品牌

排名问法
  • 2023年销售额排名第一的门店

排行榜问法
  • 销售额排行榜

抓典型时间问法
  • 我想看看今天的销售额

预测问法
  • 预测未来1年的销售额趋势

头尾问法
  • 去年销售额倒数的十个城市

  • 今年所有门店销售额最高的店铺

做计算四则运算
  • 23年冰箱的销售数量+洗衣机的销售数量

  • 冰箱的销售数量*单价

多轮问答时间切换
  • 今年的销售额 → 去年的呢 → 去年3月的呢

排序
  • 今年所有门店的销售额 → 降序排列/升序排列

  • 今年所有门店的销售额平均值 → 最大的五个是什么

limit
  • 今年所有门店的销售额 → top10的呢

  • 去年销售额最高的5个商品名称是什么→倒数5个呢

递进的高级计算
  • 今年所有门店的销售额 → 环比多少/同比多少/占比是多少

  • 今年每个门店的销售额 → 占比分别是多少

替换维度
  • 2023年利润最高的5个门店名称  → 商品名称呢

替换枚举值
  • 今年上海市的门店销售额是多少 → 苏州市是多少

递进查询
  • 去年销售额 Top3 的商品名称 →  这些商品名称在北京市的销售额是多少

  • 今年每个月的平均销售额top10的月份  →  这些月份的销售额-成本额差值是多少

可视化切换
  • 不同商品类别的成本额 → 用饼图展示

增加指标
  • 今年上半年的销售额怎么样 → 加上成本额呢  →加一个数量

  • 今年上半年的销售额怎么样 → 加上环比呢

归因分析时间点归因
  • 2023年9月销售额为什么这么高

时间区间归因
  • 2023年1月到8月销售额为什么连续下降

非时间归因
  • 零食的销售额为什么这么高

5.3 项目计划表(参考)


1阶段:环境准备+调研

2阶段:数据准备

3阶段:试用+调整4阶段:上线宣传
运维管理人员完成 FineChatBI 部署保证业务数据接入FineBI,提供可测试的环境
为首批用户开放使用权限;提供客服资源与响应支持业务用户测试提供客服资源响应
IT人员
  1. 筛选各业务线看板Top 访问用户

  2. 确认调研问题

  3. 约 Top 访问用户进行调研

  1. 基于前期调研进行场景聚焦,并准备数据和进行问答配置

  2. IT人员内部进行测试


开放首批业务用户进行测试,同步收集用户反馈;

根据反馈进行问答优化

对业务人员进行宣传与赋能:

  • 现场能力演示

  • 线上宣传推送

业务分析师参与用户调研,提供分析场景与需求-
参与测试,并提供使用反馈使用问答BI解决业务问题,进行长期反馈

6. 问答优化编辑

为确保问答 BI 工具能持续提供高质量的服务,IT 人员需积极监控并优化系统。若问答效果不好,可提供一下两个关键措施优化:

  • 数据表优化:检查数据表是否符合规范并优化,规范的数据表更有利于AI理解,从而提升问答效果。操作步骤参考本文第 3 节。

  • 调整问答配置:调整问答配置中的同义词、推荐问题、近似问题的配置,提升问答相关性和准确性。