1. 概述
本文主要讲述问答BI在针对用户的提问时解析出的语义成分,有助于用户对问法的理解并进行有效地提问。
1.1 基本概念
1)数据维度:指将数据进行划分的属性或者特征。在数据分析中,通常会将数据按照不同的维度进行归类,例如时间、地点、类别等。
2)数据指标:将某些事情量化形成的数值。例如销售额、成本额等。
3)数值计算:将指标值进行复杂计算。例如:同比、环比等。
3)条件过滤:将维度或数值根据某些具体的条件进行筛选。
1.2 使用说明
1)数据维度+数据指标
2)数据维度+数值计算
3)数据维度+数据指标+数值计算
单个数据指标的计算:支持求和、最大值、最小值、平均值、方差、标准差、标准差、环比、同比、占比
数据指标之间的计算:支持加、减、乘、除
注:当问法为有多少,多少个,总数,数量,去重计数时,计算逻辑为去除重复的数据并求和。
当问法为记录数或总行数时,计算逻辑为不去除重复的数据求和。
4)数据维度+数据指标+条件过滤
数据指标的过滤条件:大于、小于、大于等于、小于等于、前X、后X
数据维度的过滤条件:为空、不为空、开头是、开头不是、结尾是、结尾不是、包含、不包含
5)数据维度+数据指标+数值计算+条件过滤
6)以上5种方式+指定的可视化方式
注:若不加指定的可视化方式,会根据问题自动匹配可视化组件。
柱状图: 柱形图、柱型图、柱状图、条形图、条型图、条状图、柱图
散点图: 散点、散点图
箱形图: 箱形图、箱线图、箱型图、盒图
折线图: 折线图、线型图、线形图、线状图、线性图、走势、趋势、走向、动向
面积图: 面积图、分区图
饼图: 饼图、饼状图
环形图: 环形图、环型图、环状图
指标卡: 指标卡
表格: 表格、二维表、交叉表、报告表、分析表、比较表、对比表、比较表、时序表、汇总表、分布表、关系表、统计表、数据矩阵、分组表
7)支持多轮问答
2. 数据维度
2.1 时间维度
时间作为数据分析的重要维度,此处对时间维度进行说明
2.1.1 当前日期
1)当前日期:
维度 | 当前日期 | 示例 |
---|---|---|
年 | 今年 | 今年的销售额趋势 |
季度 | 本季度 | 本季度的销售额 |
月 | 本月 | 本月的销售额 |
日 | 当天 | 今天的销售额 |
周 | 本周、本周三、周末 | 本周的销售额 |
2)当期日期的过去
维度 | 当前日期的过去 | 示例 |
---|---|---|
年 | 去年、去年上半年 | 去年的销售额 |
季度 | 第一季度、上个季度、近半个季度 | 近半年的销售额 |
月 | 上个月末、上个月初、之前三个月 | 之前三个月的萧瑟 |
日 | 前天、之前三天 | 前三天的销售额 |
周 | 前三周、上周三、上周末 | 上周末的销售额 |
3)当前日期的未来
维度 | 当前日期的未来 | 示例 |
---|---|---|
年 | 明年、明年上半年 | 预测明年的销售额 |
季度 | 下个季度 | 预测下个季度的销售额 |
月 | 下个月、未来两周 | 预测未来两周的销售额 |
日 | 明天、未来两天 | 明天的销售额 |
周 | 下周三、未来两周 | 未来两周的销售额 |
2.1.2 指定日期
1)指定日期
维度 | 指定日期 | 示例 |
---|---|---|
年 | 23年、2023年、23年上半年 | 23年的销售额 截至23年年底的销售额 |
年季度 | 23年1季度 | 23年1季度的销售额 |
年月 | 23年10月、23/10月、2023-10 | 2024年3月的销售额 |
年月日 | 23年10-20日、23年10/20日、23年10月20日 | 2024年3月1日的销售额 |
维度 | 指定日期范围 | 示例 |
---|---|---|
年 | 23年到24年、2023-2024年 | 23年至24年的销售额 |
年季度 | 23年1季度到3季度、23年Q1-Q3的销售额 | 23年Q1-Q3的销售额 |
年月 | 2024年3月 到 2024年4月、2023/10-2023/12 | 23年3月到4月的销售额 |
年月日 | 2024年3月1日 到 2024年3月10日 | 23年3月1日到23年3月10日的销售额 |
维度 | 指定日期的过去 | 示例 |
---|---|---|
年 | 2024年之前 | 2024年之前的销售额 |
年季度 | 23年1季度之前、23年Q3之前 | 23年Q3之前的销售额 |
年月 | 2024年3月之前 | 24年3月之前的销售额 |
年月日 | 2024年3月26日之前 | 24年3月3日之前的销售额 |
2.2 其他维度
数据表中除数据指标、时间维度外的维度。
示例:有哪些商品类别、一共有多少个门店等。
3. 数据指标
数据表中字段类型为数值的字段。
示例:销售额、成本额、数量等。
4. 数值计算
4.1 单个数据指标的计算
数值计算 | 示例 |
---|---|
求和 | 今年所有门店的销售额总和 当问法为记录数或总行数时,计算逻辑为不去除重复的数据求和 当问法为有多少,多少个,总数,数量,去重计数时,计算逻辑为去除重复的数据并求和 |
最大值 | 今年所有门店的销售额最高的店铺 |
最小值 | 今年所有门店的销售额最低的店铺 |
平均值 | 今年所有门店的销售额的平均值 |
日均 | 门店日均销售额 |
方差 | 计算指定范围内数值的方差 |
标准差 | 今年所有门店的销售额标准差是多少 今年所有城市的销售额波动变化 |
环比 | 每个门店销售额同比去年增长了多少 |
同比 | 每个门店销售额同比增长了多少 |
占比 | 去年所有城市中销售额占比最高的是哪个 |
排名 | 销售额排名前三的门店 |
4.2 数据指标之间的计算
数值计算 | 示例 |
---|---|
加 | 23年冰箱的销售数量+洗衣机的销售数量 |
减 | 23年销售额-成本额 |
乘 | 冰箱的销售数量*单价 |
除 | 冰箱的销售总额/数量 |
5. 条件过滤
分类 | 详细说明 | 示例 |
---|---|---|
数值条件过滤 | 大于、小于、大于等于、小于等于、前X、后X | 今年所有城市中销售额大于100万的门店 |
字符串条件过滤 | 为空、不为空、开头是、开头不是、结尾是、结尾不是、包含、不包含 | 退货渠道为"空"的产品有哪些 注:建议添加引号,识别会更准确 |
6. 多轮问答
类型 | 示例 |
---|---|
时间切换 | 今年的销售额 → 去年的呢 → 去年3月的呢? |
递进排序 | 今年所有门店的销售额 → 降序排列 |
递进计算 | 今年所有门店的销售额 → 环比多少 |
替换维度 | 今年所有门店编码的销售额 → 门店名称呢 |
替换枚举值 | 今年上海市的门店销售额是多少 → 苏州市是多少 |
递进查询 | 今年销售额最大的门店是哪个 → 这个门店的成本额是多少 |
可视化转换 | 今年所有门店的销售额 → 用表格展示 |