历史版本3 :同义词配置 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:
icon点击返回主目录:【目录】FineChatBI

目录:

1. 概述编辑

1.1 应用场景

在实际应用场景中,业务人员提问往往带有较多口语化表述,而数据表的字段名是标准名,不一定能匹配成功。

管理员可通过配置同义词的方式,有效提升问答系统的精准度。

场景类型
举例












业务黑话,系统无法识别

维度枚举值配置同义词

“FCBI的销售额是多少”,FCBI是业务黑话,可以配置“FineChatBI”的同义词为“FCBI”














字段名配置同义词

“研发水位是多少”,黑话水位的意思是预算,可以配置标准词“预算”的同义词为“水位”














自定义词配置同义词

“重点城市的销售额”,系统无法识别重点城市是什么。例如我们配置“上海市、合肥市、无锡市”的同义词为「重点城市」

“今年人员情况怎么样”,系统无法识别人员情况要用分析哪些字段。可以配置“员工数量、员工同比增长率、员工工龄、员工职能”的同义词为“人员情况”,那么系统使用这些字段分析出今年的人员情况。














特定计算系统无法识别

比较专业的计算,比如说一些财务计算的指标:

“资产负债率是多少”,可以配置标准词“负债额 ÷ 资产额”的同义词为“资产负债率”














具体业务可能需要进行自定义的计算:

“利润是多少”,在具体业务中利润的计算公式可能不同,若是“利润=销售额-生产成本-非生产成本”,那么就可以自定义“销售额-生产成本-非生产成”的同义词为“利润”














无法识别"我""我的团队"

“今年我的销售排名”“今年我的团队销售额如何”

给用户名、团队配置系统参数,帮助系统识别“我”“我的团队”














1.2 功能简介

  • 支持对数据表的表名、字段名、维度枚举值配置同义词。

  • 支持为特定术语或短语设置同义词,例如为方差配置同义词“数据波动”,以提高自然语言处理的准确性和响应能力。

  • 支持对系统参数配置同义词。

1.3 配置须知

对于同义词,什么情况下必须配置,什么情况下无需配置

原则上只配置必须配的、预计连大模型都不能猜出来的

如:字段名为 FineChatBI ,问 FCBI ,需配置 FineChatBI=FCBI

可以模糊匹配到的,无需配置

场景类型举例
字段名的模糊匹配字段名为FineBI销售额,问BI业绩,答案是:FineBI业绩
维度枚举值的模糊匹配字段值为娃哈哈500ml矿泉水,问娃哈哈,答案是:娃哈哈500ml矿泉水
同义词的模糊匹配字段名为张三小组,同义词为西南销售二组,问西南二组,答案可以正确给出张三小组

2. 配置同义词编辑

1)点击「智能问答配置>同义词配置」进入同义词界面。
2)将要添加同义词配置的分析主题添加到数据列表中,添加后选中该主题。如下图所示:

1.png

3)用户可以对选中主题的数据表、自定义词、参数配置同义词,如下图所示:

2.png

2.1 数据表配置同义词

支持对分析主题内数据表的表名称、字段名称以及维度枚举值配置同义词。

例如选中「商品销售明细表」,点击添加可以分别对表名、字段名、维度枚举值「添加」同义词。如下图所示:

3.png

原始词业务人员的提问场景添加近义词
字段名-「销售额」

“今年的业绩是多少

“今年收入是多少”

业绩、收入
字段名-「员工」

“职员数量有多少

“雇员数量年趋势”

职员、雇员
维度枚举值-「计算机」

“今年电脑的花费是多少

电脑
维度枚举值-「中国中铁股份有限公司」“中铁销售额年趋势”中铁

若用户配置了大模型,可以点击「一键配置」,可以利用大模型自动给字段名添加同义词后,再手动修改。如下图所示:

5.png

2.2 自定义词配置同义词

通过设置「自定义词」,用户可以为特定术语或短语设置同义词,以提高自然语言处理的准确性和响应能力。

案例一:自定义词配置同义词

给「数据波动」配置标准词「方差」,那么提问 “2015 年月销售额的数据波动”时,系统就会计算“2015 年月销售额的方差”。

6.png

案例二:自定义词配置简单计算

可以配置简单的指标间四则运算。

例如给「利润」配置标准词「销售额-成本额」,那么提问“利润”时,系统就会使用销售额与成本额相减计算获得利润。

7.png

案例三:自定义词配置相关情况

提问「xx情况」时,系统会回答相关的维度和指标情况。

例如给「人员情况」配置标准词「员工数量、员工同比增长率、员工工龄、员工职能」,那么提问“员工情况”时,系统就会回答配置好的相关维度和指标。

8.png

案例四:自定义词配置偏好时间

若数据存在多个时间字段时,鉴于不同的提问对时间偏好存在差异,可利用自定义词对相应的正确时间进行配置。例如:

  • 「离职人数」偏好离职时间,可配置标准词为「离职记录数、离职时间」

  • 「仓储情况」偏好入库时间,可配置标准词为「入库数量、入库时间」

9.png

案例五:配置企业特定知识

若公司内部有特定口语化指令,可以利用自定义词对特定的词语设置对应的字段。例如:

  • 「超预算」,可配置标准词为「成本额大于十万」

  • 「重点城市」,可配置标准词为「贵阳市、无锡市、合肥市」

10.png

2.3 参数配置同义词

用户可以直接进行「我/我们/我的团队」个性化提问,例如:“我的绩效排名”“我们团队的销售额”。需要将字段与系统参数进行绑定。

例如「医药代表」字段存放的是各位医药代表的工号,而「用户名 fine_username」也是用的医药代表的工号,那么就可以将参数 fine_username 与「医药代表」绑定。完成绑定后,当医药代表A登录系统并询问“我的销售额排名”时,系统便能够自动识别他的身份并提供相应的销售额排名信息。

11.png

系统参数参数含义
$fine_username用户名
$fine_display_name姓名
$fine_role角色
$fine_position部门职务

3. 同义词导入&导出编辑

系统支持将同义词通过 Excel 文件进行导入和导出,以便于用户进行批量管理和编辑。

3.1 同义词导出来修改

已配置的同义词可以导出为 Excel ,便于用户在 Excel 中进行审核、修改和整理。

13.png

修改同义词后再重新导入到系统中,如下图所示:

注:修改后的 Excel 需保证 sheet 页名无修改,若有多个同义词,需使用“,”英文分隔符,否则可能会导入失败。

14.png

3.2 用 Excel 准备同义词再导入

用户也可以将 Excel 文件中预先准备好的同义词列表导入到系统中,实现快速的同义词配置。(需下载使用对应的 Excel 模版)

1)下载导入模板,如下图所示:

15.png

2)修改模板文件,在此 Excel 中准备同义词。

  • 将sheet页名改为主题中的数据表名字,若主题中数据表不止 2 个,需要额外添加 sheet 页。

  • 删除每个 sheet 页中的示例数据,填入正确的信息(若有多个同义词,需使用“,”英文分隔符)。

16.png

3)修改后的 Excel 效果如下图所示:

17.png