
目录:
1. 概述编辑
1.1 应用场景
在实际应用场景中,业务人员提问往往带有较多口语化表述,而数据表的字段名是标准名,不一定能匹配成功。
管理员可通过配置同义词的方式,有效提升问答系统的精准度。
场景类型 | 举例 | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
业务黑话,系统无法识别 | 维度枚举值配置同义词 “FCBI的销售额是多少”,FCBI是业务黑话,可以配置“FineChatBI”的同义词为“FCBI” | |||||||||||||
字段名配置同义词 “研发水位是多少”,黑话水位的意思是预算,可以配置标准词“预算”的同义词为“水位” | ||||||||||||||
自定义词配置同义词 “重点城市的销售额”,系统无法识别重点城市是什么。例如我们配置“上海市、合肥市、无锡市”的同义词为「重点城市」 “今年人员情况怎么样”,系统无法识别人员情况要用分析哪些字段。可以配置“员工数量、员工同比增长率、员工工龄、员工职能”的同义词为“人员情况”,那么系统使用这些字段分析出今年的人员情况。 | ||||||||||||||
特定计算系统无法识别 | 比较专业的计算,比如说一些财务计算的指标: “资产负债率是多少”,可以配置标准词“负债额 ÷ 资产额”的同义词为“资产负债率” | |||||||||||||
具体业务可能需要进行自定义的计算: “利润是多少”,在具体业务中利润的计算公式可能不同,若是“利润=销售额-生产成本-非生产成本”,那么就可以自定义“销售额-生产成本-非生产成”的同义词为“利润” | ||||||||||||||
无法识别"我""我的团队" | “今年我的销售排名”“今年我的团队销售额如何” 给用户名、团队配置系统参数,帮助系统识别“我”“我的团队” |
1.2 功能简介
支持对数据表的表名、字段名、维度枚举值配置同义词。
支持为特定术语或短语设置同义词,例如为方差配置同义词“数据波动”,以提高自然语言处理的准确性和响应能力。
支持对系统参数配置同义词。
1.3 配置须知
对于同义词,什么情况下必须配置,什么情况下无需配置
原则上只配置必须配的、预计连大模型都不能猜出来的
如:字段名为 FineChatBI ,问 FCBI ,需配置 FineChatBI=FCBI
可以模糊匹配到的,无需配置
场景类型 | 举例 |
---|---|
字段名的模糊匹配 | 字段名为FineBI销售额,问BI业绩,答案是:FineBI业绩 |
维度枚举值的模糊匹配 | 字段值为娃哈哈500ml矿泉水,问娃哈哈,答案是:娃哈哈500ml矿泉水 |
同义词的模糊匹配 | 字段名为张三小组,同义词为西南销售二组,问西南二组,答案可以正确给出张三小组 |
2. 配置同义词编辑
1)点击「智能问答配置>同义词配置」进入同义词界面。
2)将要添加同义词配置的分析主题添加到数据列表中,添加后选中该主题。如下图所示:
3)用户可以对选中主题的数据表、自定义词、参数配置同义词,如下图所示:
2.1 数据表配置同义词
支持对分析主题内数据表的表名称、字段名称以及维度枚举值配置同义词。
例如选中「商品销售明细表」,点击添加可以分别对表名、字段名、维度枚举值「添加」同义词。如下图所示:
原始词 | 业务人员的提问场景 | 添加近义词 |
---|---|---|
字段名-「销售额」 | “今年的业绩是多少” “今年收入是多少” | 业绩、收入 |
字段名-「员工」 | “职员数量有多少” “雇员数量年趋势” | 职员、雇员 |
维度枚举值-「计算机」 | “今年电脑的花费是多少” | 电脑 |
维度枚举值-「中国中铁股份有限公司」 | “中铁销售额年趋势” | 中铁 |
若用户配置了大模型,可以点击「一键配置」,可以利用大模型自动给字段名添加同义词后,再手动修改。如下图所示:
2.2 自定义词配置同义词
通过设置「自定义词」,用户可以为特定术语或短语设置同义词,以提高自然语言处理的准确性和响应能力。
案例一:自定义词配置同义词
给「数据波动」配置标准词「方差」,那么提问 “2015 年月销售额的数据波动”时,系统就会计算“2015 年月销售额的方差”。
案例二:自定义词配置简单计算
可以配置简单的指标间四则运算。
例如给「利润」配置标准词「销售额-成本额」,那么提问“利润”时,系统就会使用销售额与成本额相减计算获得利润。
案例三:自定义词配置相关情况
提问「xx情况」时,系统会回答相关的维度和指标情况。
例如给「人员情况」配置标准词「员工数量、员工同比增长率、员工工龄、员工职能」,那么提问“员工情况”时,系统就会回答配置好的相关维度和指标。
案例四:自定义词配置偏好时间
若数据存在多个时间字段时,鉴于不同的提问对时间偏好存在差异,可利用自定义词对相应的正确时间进行配置。例如:
「离职人数」偏好离职时间,可配置标准词为「离职记录数、离职时间」
「仓储情况」偏好入库时间,可配置标准词为「入库数量、入库时间」
案例五:配置企业特定知识
若公司内部有特定口语化指令,可以利用自定义词对特定的词语设置对应的字段。例如:
「超预算」,可配置标准词为「成本额大于十万」
「重点城市」,可配置标准词为「贵阳市、无锡市、合肥市」
2.3 参数配置同义词
用户可以直接进行「我/我们/我的团队」个性化提问,例如:“我的绩效排名”“我们团队的销售额”。需要将字段与系统参数进行绑定。
例如「医药代表」字段存放的是各位医药代表的工号,而「用户名 fine_username」也是用的医药代表的工号,那么就可以将参数 fine_username 与「医药代表」绑定。完成绑定后,当医药代表A登录系统并询问“我的销售额排名”时,系统便能够自动识别他的身份并提供相应的销售额排名信息。
系统参数 | 参数含义 | |
---|---|---|
$fine_username | 用户名 | ![]() |
$fine_display_name | 姓名 | |
$fine_role | 角色 | |
$fine_position | 部门职务 |
3. 同义词导入&导出编辑
系统支持将同义词通过 Excel 文件进行导入和导出,以便于用户进行批量管理和编辑。
3.1 同义词导出来修改
已配置的同义词可以导出为 Excel ,便于用户在 Excel 中进行审核、修改和整理。
修改同义词后再重新导入到系统中,如下图所示:
注:修改后的 Excel 需保证 sheet 页名无修改,若有多个同义词,需使用“,”英文分隔符,否则可能会导入失败。
3.2 用 Excel 准备同义词再导入
用户也可以将 Excel 文件中预先准备好的同义词列表导入到系统中,实现快速的同义词配置。(需下载使用对应的 Excel 模版)
1)下载导入模板,如下图所示:
2)修改模板文件,在此 Excel 中准备同义词。
将sheet页名改为主题中的数据表名字,若主题中数据表不止 2 个,需要额外添加 sheet 页。
删除每个 sheet 页中的示例数据,填入正确的信息(若有多个同义词,需使用“,”英文分隔符)。
3)修改后的 Excel 效果如下图所示: