
1. 概述
1.1 应用场景
在 FineBI 中,同义词配置是提升问答系统精准度的重要手段。
业务人员在使用问答系统时,往往会使用一些内部独有的“黑话”或非标准表述,而这些表述可能与系统中的标准术语不一致。管理员可使用同义词配置为数据表的表名、字段名、维度枚举值以及特定术语或短语设置同义词,从而更好地理解业务人员的口语化提问。
常用场景举例:
场景类型 | 配置举例【】内为标准词 | 业务提问语句举例 |
---|---|---|
企业黑话 |
| “陆总的销售额” “研发水位是多少” |
自定义词 |
| “今年重点城市销售额的同比增长率” “今年人员情况怎么样” |
特定计算&具体业务计算 |
| “今年8月的利润是多少” |
系统匹配“我”“我的团队” |
| “今年我的销售排名” “今年我的团队销售额如何” |
1.2 功能简介
配置须知:
当业务人员的提问与系统中的标准术语在语义和文字上毫不相关时,需要进行同义词配置,例如 1.1 节举例的场景。
可以模糊匹配到的情况无需配置,例如下表:
功能 | 场景举例 |
---|---|
结合大模型,可以实现字段名的模糊匹配 注:FineChatBI 需连接大模型 |
|
FineChatBI 内置相似度匹配算法, 相似阈值>1/3可以匹配 |
|
2. 配置同义词
1)点击「智能问答配置>同义词配置」进入同义词界面。
2)将要添加同义词配置的分析主题添加到数据列表中,添加后选中该主题。如下图所示:
3)用户可以对选中主题的数据表、自定义词、参数配置同义词,如下图所示:
2.1 给数据表配置同义词
支持对数据表的表名称、字段名以及维度枚举值配置同义词。
例如选中「商品销售明细表」,点击添加可以分别对表名、字段名、维度枚举值「添加」同义词。如下图所示:
标准词 | 业务人员的提问场景 | 添加同义词 |
---|---|---|
字段名-「销售额」 | “今年的业绩是多少” “今年收入是多少” | 业绩、收入 |
字段名-「员工」 | “职员数量有多少” “雇员数量年趋势” | 职员、雇员 |
维度枚举值-「计算机」 | “今年电脑的花费是多少” | 电脑 |
维度枚举值-「中国中铁股份有限公司」 | “中铁销售额年趋势” | 中铁 |
1)先点击「一键配置」,利用大模型进行一键智能配置,如下图所示:
注:一键配置功能需使用到大模型,需保证 FineChatBI 连接了大模型且在大模型配置中开启了「一键配置」功能。详情请参见:大模型配置
2)一键配置后,再依据企业内的用语习惯进行微调,如“门店名称”在企业内习惯被称为终端。如下图所示:
3)点击「保存」。
2.2 自定义词配置同义词
通过设置「自定义词」,用户可以为特定术语或短语设置同义词,以提高自然语言处理的准确性和响应能力。
场景一:非标内部语言
给「数据波动」配置标准词「方差」,那么提问 “2015 年月销售额的数据波动”时,系统就会计算“2015 年月销售额的方差”。
场景二:简单的计算指标
可以配置简单的指标间四则运算。
例如给「利润」配置标准词「销售额-成本额」,那么提问“利润”时,系统就会使用销售额与成本额相减计算获得利润。
场景三:指定范围内容
提问「xx情况」时,系统会回答相关的维度和指标情况。
例如给「人员情况」配置标准词「员工数量、员工同比增长率、员工工龄、员工职能」,那么提问“员工情况”时,系统就会回答配置好的相关维度和指标。
场景四:设置偏好维度
若数据存在多个时间字段时,鉴于不同的提问对时间偏好存在差异,可利用自定义词对相应的正确时间进行配置。例如:
「离职人数」偏好离职时间,可配置标准词为「离职记录数、离职时间」
「仓储情况」偏好入库时间,可配置标准词为「入库数量、入库时间」
案例五:配置企业特定知识
若公司内部有特定口语化指令,可以利用自定义词对特定的词语设置对应的字段。例如:
「超预算」,可配置标准词为「成本额大于十万」
「重点城市」,可配置标准词为「贵阳市、无锡市、合肥市」
2.3 参数配置同义词
用户可以直接进行「我/我们/我的团队」个性化提问,例如:“我的绩效排名”“我们团队的销售额”。需要将字段与系统参数进行绑定。
例如「医药代表」字段存放的是各位医药代表的工号,而「用户名 fine_username」也是用的医药代表的工号,那么就可以将参数 fine_username 与「医药代表」绑定。完成绑定后,当医药代表A登录系统并询问“我的销售额排名”时,系统便能够自动识别他的身份并提供相应的销售额排名信息。
系统参数 | 参数含义 | |
---|---|---|
$fine_username | 用户名 | ![]() |
$fine_display_name | 姓名 | |
$fine_role | 角色 | |
$fine_position | 部门职务 |
3. 同义词导入&导出
系统支持将同义词通过 Excel 文件进行导入和导出,以便于用户进行批量管理和编辑。
3.1 同义词导出来修改
已配置的同义词可以导出为 Excel ,便于用户在 Excel 中进行审核、修改和整理。
修改同义词后再重新导入到系统中,如下图所示:
注:修改后的 Excel 需保证 sheet 页名无修改,若有多个同义词,需使用“,”英文分隔符,否则可能会导入失败。
3.2 用 Excel 准备同义词再导入
如果字段数量很多,企业也有知识对照表,用户也可以在 Excel 文件中预先准备好的同义词列表再导入到系统中,实现快速的同义词配置。(需下载使用对应的 Excel 模版)
1)下载导入模板,如下图所示:
2)修改模板文件,在此 Excel 中准备同义词。
将sheet页名改为主题中的数据表名字,若主题中数据表不止 2 个,需要额外添加 sheet 页。
删除每个 sheet 页中的示例数据,填入正确的信息(若有多个同义词,需使用“,”英文分隔符)。
3)修改后的 Excel 效果如下图所示: