反馈已提交

网络繁忙

您正在浏览的是 FineBI6.1 帮助文档,点击跳转至: FineBI5.1帮助文档

问答BI最佳实践

  • 文档创建者:Lily.Wang
  • 历史版本:14
  • 最近更新:Lily.Wang 于 2024-07-12
  • 1. 概述

    问答BI 以自然语言对话的方式简化数据分析流程,使得用户能够以自然语言提问并获取数据洞察,本文以IT部门的视角,提供了一系列正式使用问答BI的最佳实践:

    • 使用前调研:了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容

    • 业务数据梳理:数据的规范对于 AI 理解用户提问的语义至关重要,需要保证数据规范

    • 问答配置:通过配置同义词、推荐问题、近似问题等,提升问答相关性和准确性

    • 用户培训:教授业务用户如何有效使用问答BI工具

    • 问答优化:针对问答效果不好的点调整数据和系统配置,持续进行优化

    2. 调研业务用户做准备

    了解业务用户对问答AI的实际需求,以便准备合适的数据和制定推广/赋能内容。

    可以参考下表设计调研问题:

    类别
    描述
    目标

    您在 FineBI 上最近半年经常访问的页面是哪些

    这些页面一般提供了怎样的信息,与您的目标有何关联?

    现状

    您通常会关注哪些具体指标?您对这些指标的关注有何原因?

    它们在您的工作中扮演了怎样的角色?

    选择

    对于未来可能嵌入的 AI 问答功能,您期望它提供哪些服务和帮助

    您认为它能够怎样提高您的工作效率和成果?

    意愿

     如果意愿按照1到10分打分 这些问题你给几分?

     (低于5分的重点标注一下和讨论)

    了解到用户的实际需求后,就可以为业务人员准备问答BI需要使用的数据了。

    3. 准备问答数据

    新建分析主题,IT用户 将业务数据表添加到主题中,如下图所示:

    数据的规范对于 AI 理解用户提问的语义至关重要,接下来,将详细介绍数据表规范。IT 人员可以使用 FineBI 中的数据编辑功能对数据进行处理。


    3.1 表结构规范

    3.1.1 避免数据冗余

    需要避免数据表中有业务数据冗余。多表分析时,比起使用 左右合并 制作宽表,更推荐直接使用 主题模型 建立模型关系。

    比如,「销售额表」与「销售目标表」通过左右合并后获得的宽表如下图所示,当用户问“销售总目标是多少”时:

    • 问答 BI 回复销售总目标:1600

    • 实际销售总目标:1100

    解决方案:将「销售额表」与「销售目标表」拆分在两张表中,使用 主题模型 建立多表之间的模型关系可避免出现数据冗余。

    3.1.2 调整正确的字段类型

    添加到 FineBI 中的字段类型系统会自动进行判断,IT 人员需检查字段是否都调整成了正确的字段类型。例如:

    • 销售额字段若为文本类型,则无法顺利进行相加统计

    • 销售日期若为文本类型,则不能顺利计算同比环比

    3.2 表头表值规范

    3.2.1 表头应避免语义交叉

    在同一个数据表或同一个模型,应避免表头之间的语义重叠或混淆。例如:

    • 有一个员工信息表格,原始表头可能包含“员工职位”和“员工级别”。用户询问“高级职位的员工有哪些”时,由于者两个表头语义混淆,系统就无法准确召回对应的表头。为了避免这种情况,可以将表头重新命名为“职位名称”和“职位等级”,这样就能清晰的区分员工等级高低。

    3.2.2 表头表值应规整精炼

    1)若表头或表值需要参与到用户的提问,则长度应该尽量短和简洁明了(少于10个字),有助于提高系统的试别能力。

    2)并且表值内容需要规整,例如:

    • 对于「支付方式」表头,可能列出“银行转账(工商银行等)”、“信用卡在线支付”、“移动支付(如支付宝)”,这种表述方式包含了不必要的细节。可以统一为“转账”、“信用卡”、“移动支付”,以提高筛选和报告生成的效率。

    • 对于「省份」表头,可能列出“广东省(粤)”、“江苏省(苏)”、“辽宁省(辽)”,这种表述方式混合了省份的全称和简称,可能导致检索时混肴。统一格式,仅显示标准名称:“广东省”、“江苏省”、“辽宁省”,帮助系统准确识别信息。

    3.3 新增计算字段

    若缺失用户需要使用的分析字段,而缺失的字段可以通过已有字段计算获得:

    • 在编辑数据中添加字段补充

    • 在组件中添加计算字段补充

    4. 智能问答配置(可选)

    IT人员可以提前为业务人员配置同义词、推荐问题、近似问题等,可以优化业务用户的提问体验。

    注:IT 人员需要有智能问答配置的使用权限

    4.1 设置同义词

    添加分析主题,可以对主题中的数据表进行「表别名配置」和「近义词配置」。当用户的查询包含这些同义词时,系统能够智能地将查询请求映射到正确的数据表头。如下图所示:

    4.2 推荐问题配置

    对业务业务调研,确定哪些问题是业务用户经常询问的。基于常见查询和业务需求,可以在「推荐问题配置」中创建推荐问题列表。如下图所示:

    5. 业务人员培训

    将准备好的问答数据,通过「主题协作」的编辑权限分享给业务用户,接下来用户就可以对你准备的数据进行提问了。

    5.1 如何使用问答 BI

    参考 问答 BI 使用说明 的第 3 节到第 6 节对用户进行培训。

    5.2 如何进行提问

    场景二级分类用户问法示例
    基本数据查询指标查询
    • 去年每个月每个城市的销售额累计值

    • 今年所有门店销售额的平均值

    • 门店日均销售额

    • 今年所有门店的销售额标准差是多

    支持求和、最大值、最小值、平均值、方差、标准差、标准差、环比、同比、占比

    指标复杂计算查询
    • 之前三个月的销售额中位数/方差/平均值/累计值/占比/排名

    过滤查询

    普通过滤:

    • 销售额大于40万的门店

    • 退货渠道为"空"的产品有哪些(空建议添加引号,识别会更准确

    过滤+计数:

    • 销售额大于100万的门店有多少

    • 今年的单据编码有多少

    • 销售额大于 50 万且小于 100 万的门店有多少

    过滤+占比:

    • 今年的销售额占比

    • 上海市的销售额占全国比例

    明细过滤:

    • 成本额大于销售额的单据编码有多少

    指标的过滤条件:大于、小于、大于等于、小于等于、前X、后X

    维度的过滤条件:为空、不为空、开头是、开头不是、结尾是、结尾不是、包含、不包含

    可视化询问可视化方式查询
    • 明年四川省每月的日均销售额,用折线图展示

    • 去年第三季度之前每个商品类别的销售额,按照柱形图展示

    做对比不同指标对比
    • 2023年每个月的销售额和成本额

    同比、环比查询
    • 上海销售额同比

    • 每个门店销售额同比增长了多少

    枚举值对比
    • 去年和今年上海市的销售额对

    • 上海市vs北京市的销售额

    看趋势变化指标趋势
    • 销售额趋势

    维度枚举值趋势
    • 上海销售额趋势

    时间趋势
    • 上个季度上海销售额趋势

    问排名top问法
    • 这个月销售额前十的品牌

    排名问法
    • 2023年销售额排名第一的门店

    排行榜问法
    • 销售额排行榜

    抓典型时间问法
    • 我想看看今天的销售额

    预测问法
    • 预测未来1年的销售额趋势

    头尾问法
    • 去年销售额倒数的十个城市

    • 今年所有门店销售额最高的店铺

    做计算四则运算
    • 23年冰箱的销售数量+洗衣机的销售数量

    • 冰箱的销售数量*单价

    多轮问答时间切换
    • 今年的销售额 → 去年的呢 → 去年3月的呢

    排序
    • 今年所有门店的销售额 → 降序排列/升序排列

    • 今年所有门店的销售额平均值 → 最大的五个是什么

    limit
    • 今年所有门店的销售额 → top10的呢

    • 去年销售额最高的5个商品名称是什么→倒数5个呢

    递进的高级计算
    • 今年所有门店的销售额 → 环比多少/同比多少/占比是多少

    • 今年每个门店的销售额 → 占比分别是多少

    替换维度
    • 2023年利润最高的5个门店名称  → 商品名称呢

    替换枚举值
    • 今年上海市的门店销售额是多少 → 苏州市是多少

    递进查询
    • 去年销售额 Top3 的商品名称 →  这些商品名称在北京市的销售额是多少

    • 今年每个月的平均销售额top10的月份  →  这些月份的销售额-成本额差值是多少

    可视化切换
    • 不同商品类别的成本额 → 用饼图展示

    增加指标
    • 今年上半年的销售额怎么样 → 加上成本额呢  →加一个数量

    • 今年上半年的销售额怎么样 → 加上环比呢

    归因分析时间点归因
    • 2023年9月销售额为什么这么高

    时间区间归因
    • 2023年1月到8月销售额为什么连续下降

    非时间归因
    • 零食的销售额为什么这么高

    5.3 项目计划表(参考)


    1阶段:环境准备+调研

    2阶段:数据准备

    3阶段:试用+调整4阶段:上线宣传
    运维管理人员完成 问答BI部署保证业务数据接入FineBI,提供可测试的环境
    为首批用户开放使用权限;提供客服资源与响应支持业务用户测试提供客服资源响应
    IT人员
    1. 筛选各业务线看板Top 访问用户

    2. 确认调研问题

    3. 约 Top 访问用户进行调研

    1. 基于前期调研进行场景聚焦,并准备数据和进行问答配置

    2. IT人员内部进行测试


    开放首批业务用户进行测试,同步收集用户反馈;

    根据反馈进行问答优化

    对业务人员进行宣传与赋能:

    • 现场能力演示

    • 线上宣传推送

    业务分析师参与用户调研,提供分析场景与需求-
    参与测试,并提供使用反馈使用问答BI解决业务问题,进行长期反馈

    6. 问答优化

    为确保问答 BI 工具能持续提供高质量的服务,IT 人员需积极监控并优化系统。若问答效果不好,可提供一下两个关键措施优化:

    • 数据表优化:检查数据表是否符合规范并优化,规范的数据表更有利于AI理解,从而提升问答效果。操作步骤参考本文第 3 节。

    • 调整问答配置:调整问答配置中的同义词、推荐问题、近似问题的配置,提升问答相关性和准确性。

    附件列表


    主题: FBP:数据中心
    • 有帮助
    • 没帮助
    • 只是浏览
    中文(简体)

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭



    AI

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持