历史版本5 :同义词配置 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:
icon点击返回主目录:【目录】FineChatBI

目录:

1. 概述编辑

1.1 应用场景

在 FineBI 中,同义词配置是提升问答系统精准度的重要手段。

业务人员在使用问答系统时,往往会使用一些内部独有的“黑话”或非标准表述,而这些表述可能与系统中的标准术语不一致。管理员可使用同义词配置为数据表的表名、字段名、维度枚举值以及特定术语或短语设置同义词,从而更好地理解业务人员的口语化提问。

常用场景举例:

场景类型
配置举例【】内为标准词业务提问语句举例
企业黑话
  • 【陆伟】=陆少、陆总

  • 【预算】=水位

  • 【门店名称】=终端、门牌号

“陆总的销售额”

“研发水位是多少”

自定义词
  • 上海市、合肥市、无锡】=重点城市

  • 【方差】=数据波动

  • 员工数量、员工同比增长率、员工工龄、员工职能】=人员情况

“今年重点城市销售额的同比增长率”

“今年人员情况怎么样”

特定计算&具体业务计算
  • 销售额-生产成本-非生产成本】=利润

  • 负债额 ÷ 资产额】=资产负债率

今年8月的利润是多少
系统匹配“我”“我的团队”
  • 【用户名系统参数】=我

  • 【部门系统参数】=我的团队

“今年我的销售排名”

“今年我的团队销售额如何”

1.2 功能简介

配置须知:

  • 当业务人员的提问与系统中的标准术语在语义和文字上毫不相关时,需要进行同义词配置,例如 1.1 节举例的场景。

  • 可以模糊匹配到的情况无需匹配,例如下表:

匹配功能场景举例

结合大模型,可以实现字段名的模糊匹配

注:FineChatBI 需连接大模型

  • 字段名为“FineBI销售额”,可以直接问:“BI业绩”

FineChatBI 内置相似度匹配算法,

相似阈值>1/3可以匹配  

  • 枚举值模糊匹配:
    枚举值为“德芙巧克力”,可以直接问“德芙”

  • 同义词的模糊匹配:
    配置【张进小组】=西南销售二组,可以直接问“西南二组”

2. 配置同义词编辑

1)点击「智能问答配置>同义词配置」进入同义词界面。
2)将要添加同义词配置的分析主题添加到数据列表中,添加后选中该主题。如下图所示:

1.png

3)用户可以对选中主题的数据表、自定义词、参数配置同义词,如下图所示:

2.png

2.1 给数据表配置同义词

支持对数据表的表名称、字段名以及维度枚举值配置同义词。

例如选中「商品销售明细表」,点击添加可以分别对表名、字段名、维度枚举值「添加」同义词。如下图所示:

3.png

原始词业务人员的提问场景添加近义词
字段名-「销售额」

“今年的业绩是多少

“今年收入是多少”

业绩、收入
字段名-「员工」

“职员数量有多少

“雇员数量年趋势”

职员、雇员
维度枚举值-「计算机」

“今年电脑的花费是多少

电脑
维度枚举值-「中国中铁股份有限公司」“中铁销售额年趋势”中铁

1)先点击「一键配置」,利用大模型进行一键智能配置,如下图所示:

注:一键配置功能需使用到大模型,需保证 FineChatBI 连接了大模型且在大模型配置中开启了「一键配置」功能。详情请参见:大模型配置

5.png

2)一键配置后,再依据企业内的用语习惯进行微调,如“门店名称”在企业内习惯被称为终端。如下图所示:

2.2 自定义词配置同义词

通过设置「自定义词」,用户可以为特定术语或短语设置同义词,以提高自然语言处理的准确性和响应能力。

场景一:非标内部语言

给「数据波动」配置标准词「方差」,那么提问 “2015 年月销售额的数据波动”时,系统就会计算“2015 年月销售额的方差”。

6.png

场景二:简单的计算指标

可以配置简单的指标间四则运算。

例如给「利润」配置标准词「销售额-成本额」,那么提问“利润”时,系统就会使用销售额与成本额相减计算获得利润。

7.png

场景三:指定范围内容

提问「xx情况」时,系统会回答相关的维度和指标情况。

例如给「人员情况」配置标准词「员工数量、员工同比增长率、员工工龄、员工职能」,那么提问“员工情况”时,系统就会回答配置好的相关维度和指标。

8.png

场景四:设置偏好维度

若数据存在多个时间字段时,鉴于不同的提问对时间偏好存在差异,可利用自定义词对相应的正确时间进行配置。例如:

  • 「离职人数」偏好离职时间,可配置标准词为「离职记录数、离职时间」

  • 「仓储情况」偏好入库时间,可配置标准词为「入库数量、入库时间」

9.png

案例五:配置企业特定知识

若公司内部有特定口语化指令,可以利用自定义词对特定的词语设置对应的字段。例如:

  • 「超预算」,可配置标准词为「成本额大于十万」

  • 「重点城市」,可配置标准词为「贵阳市、无锡市、合肥市」

10.png

2.3 参数配置同义词

用户可以直接进行「我/我们/我的团队」个性化提问,例如:“我的绩效排名”“我们团队的销售额”。需要将字段与系统参数进行绑定。

例如「医药代表」字段存放的是各位医药代表的工号,而「用户名 fine_username」也是用的医药代表的工号,那么就可以将参数 fine_username 与「医药代表」绑定。完成绑定后,当医药代表A登录系统并询问“我的销售额排名”时,系统便能够自动识别他的身份并提供相应的销售额排名信息。

11.png

系统参数参数含义
$fine_username用户名
$fine_display_name姓名
$fine_role角色
$fine_position部门职务

3. 同义词导入&导出编辑

系统支持将同义词通过 Excel 文件进行导入和导出,以便于用户进行批量管理和编辑。

3.1 同义词导出来修改

已配置的同义词可以导出为 Excel ,便于用户在 Excel 中进行审核、修改和整理。

13.png

修改同义词后再重新导入到系统中,如下图所示:

注:修改后的 Excel 需保证 sheet 页名无修改,若有多个同义词,需使用“,”英文分隔符,否则可能会导入失败。

14.png

3.2 用 Excel 准备同义词再导入

如果字段数量很多,企业也有知识对照表,用户也可以在 Excel 文件中预先准备好的同义词列表再导入到系统中,实现快速的同义词配置。(需下载使用对应的 Excel 模版)

1)下载导入模板,如下图所示:

15.png

2)修改模板文件,在此 Excel 中准备同义词。

  • 将sheet页名改为主题中的数据表名字,若主题中数据表不止 2 个,需要额外添加 sheet 页。

  • 删除每个 sheet 页中的示例数据,填入正确的信息(若有多个同义词,需使用“,”英文分隔符)。

16.png

3)修改后的 Excel 效果如下图所示:

17.png