聚合函数

  • 文档创建者:doreen0813
  • 编辑次数:26次
  • 最近更新:Leo.Tsai 于 2020-11-20
  • 1. 概述

    1.1 版本

              FineBI版本        JAR 包功能变动
    5.1  --
    5.1.72020-11-05函数释义优化&明确函数参数合法性

    1.2 应用范围

    组件编辑界面:添加计算字段

    1.3 功能简介

    • 聚合函数可以对一组数据进行汇总,一般使用聚合函数汇总后的值进行再计算。

    • 不同的聚合函数对应不同的汇总方式,汇总方式包括「求和,平均,中位数,最大值,最小值,标准差,方差,去重计数,计数」。

    • 随着用户分析维度的切换,计算字段会自动跟随维度动态调整。

    求和聚合函数「SUM_AGG」是使用频次最高的聚合函数,下文将以「SUM_AGG」函数举例,详细讲解聚合函数。

    2. SUM_AGG-求和

    2.1 概念

    SUM_AGG(array):根据当前分析维度,返回指标字段的汇总求和值,生成结果为一数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中不支持插入文本和日期。

    若用户横轴维度字段为「日」时,纵轴的计算字段 SUM_AGG(销量) 返回的值为每日的汇总销量。

    若用户横轴维度字段为「月」时,SUM_AGG(销量)返回的值为每月的汇总销量。

    2.2 示例

    用户通过分组表已经获得 2013-2017 年每年的合同金额与购买数量,想要求得每年的平均金额,如下图所示:

    23.png

    2.2.1 使用聚合函数求平均

    • 适用类型:门店毛利率,人均收入,合同平均签单额

    新增计算字段「聚合函数求平均」,操作方式如下图所示:

    24.png

    将「聚合求平均」拖拽到指标栏,效果如下图所示:

    25.png

    公式说明:

    由于当前的分析维度为合同签约时间(年),则公式意义如下所示:

    公式说明
    SUM_AGG(合同金额)返回值是每年的合同金额汇总值
    SUM_AGG(购买数量)返回值为每年的购买数量汇总值
    SUM_AGG(合同金额)/SUM_AGG(购买数量)

    每年的平均金额

    例如:2013年平均金额=3887220/41

    2013 年全年的合同金额为 3887220 ,购买数量为 41 

    2.2.2 不使用聚合函数求平均

    • 适用类型:每个订单包含总价和销售单价的数据,需要计算总的购买数量,直接使用总价/销售单价,汇总时将每单对应的购买数量相加得到总购买数量。

    为了帮助用户更好的理解聚合函数,在同样的场景下不使用聚合函数与 2.1.1 节进行对比,新增计算字段「非聚合求平均值」,直接使用公式合同金额/购买数量,如下图所示:

    26.png

    将「非聚合求平均」拖拽到指标栏,得出的结果如下图所示:

    27.png

    很显然,不使用聚合函数得出的结果是对明细数据做除法后进行求和汇总。

    公式说明:

    由于当前的分析维度为合同签约时间(年),以 2013 年平均金额为例,公式意义如下所示:

    计算顺序
    先对 2013 年「每单合同」依据公式合同金额/购买数量求出「每单合同的平均值」
    再对 2013 年所有合同的平均值进行了「求和汇总」

    3. MIN_AGG-最小值

    MIN_AGG(array):根据当前分析维度,返回指标字段的最小值,生成结果为一数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中array为非数值字段时只支持在fixed内使用。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段MIN_AGG(销量)返回的值为每日的最小值销量。

    当用户横轴为维度字段'月'时,MIN_AGG(销量)返回的值为每月的最小值销量。

    4. COUNT_AGG-计数

    COUNT_AGG(array):根据当前分析维度,返回某字段的计数,生成结果为一数据列,行数与当前分析维度行数一致。

    array必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段COUNT_AGG(销量)返回的值为每日的销量的个数。

    当用户横轴为维度字段'月'时,COUNT_AGG(销量)返回的值为每月的销量的个数。

    5. MAX_AGG-最大值

    MAX_AGG(array):根据当前分析维度,返回指标字段的最大值,生成结果为一数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中array为非数值字段时只支持在fixed内使用。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段MAX_AGG(销量)返回的值为每日的最大值销量。

    当用户横轴为维度字段'月'时,MAX_AGG(销量)返回的值为每月的最大值销量。

    6. MEDIAN_AGG-中位数

    MEDIAN_AGG(array):根据当前分析维度,返回指标字段的中位数,生成结果为一数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中不支持插入文本和日期。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段MEDIAN_AGG(销量)返回的值为每日的中位数销量。

    当用户横轴为维度字段'月'时,MEDIAN_AGG(销量)返回的值为每月的中位数销量。

    7. COUNTD_AGG-去重计数

    COUNTD_AGG(array):根据当前分析维度,返回某字段的去重计数,生成结果为一数据列,行数与当前分析维度行数一致。

    array必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段COUNTD_AGG(销量)返回的值为每日的销量的去重个数。

    当用户横轴为维度字段'月'时,COUNTD_AGG(销量)返回的值为每月的销量的去重个数。

    8. VAR_AGG-方差

    VAR_AGG(array):根据当前分析维度,动态返回指标字段的方差,生成结果为一动态数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中不支持插入文本和日期。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段VAR_AGG(销量)返回的值为每日的销量方差。

    当用户横轴为维度字段'月'时,VAR_AGG(销量)返回的值为每月的销量方差。

    9. AVG_AGG-平均值

    AVG_AGG(array):根据当前分析维度,返回指标字段的汇总平均值,生成结果为一数据列,行数与当前分析维度行数一致。

    array:必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。注:实时数据中不支持插入文本和日期。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段 AVG_AGG(销量) 返回的值为每日的平均销量;

    当用户横轴为维度字段'月'时,AVG_AGG(销量) 返回的值为每月的平均销量。

    10. STDEV_AGG-标准差

    STDEV_AGG(array):根据当前分析维度,返回指标字段的标准差,生成结果为一数据列,行数与当前分析维度行数一致。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。

    注:实时数据不支持插入文本和日期。

    示例:

    用户横轴为维度字段'日'时,纵轴的计算字段STDEV_AGG(销量)返回的值为每日的销量标准差。

    当用户横轴为维度字段'月'时,STDEV_AGG(销量)返回的值为每月的销量标准差。

    11. PERCENTILE_AGG

    PERCENTILE_AGG(array,百分位):根据当前分析维度,从给定表达式返回与指定数字对应的百分位处的值。数字必须介于 0 到 1 之间(含 0 和 1 ),例如 0.66,并且必须是数值常量。

    注:不支持抽取数据时使用。

    array必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。不支持插入文本和日期

    示例:

    用户横轴为维度字段“日”时,纵轴的计算字段PERCENTILE_AGG(销量,0.95)返回的值为每日的95%的销量;

    当用户横轴为维度字段“月”时,PERCENTILE_AGG(销量,0.95)返回的值为每月的95%的销量。

    12. APPROX_COUNTD_AGG

    APPROX_COUNTD_AGG(array):根据当前分析维度,动态返回某字段的近似去重计数,生成结果为一动态数据列,行数与当前分析维度行数一致。

    注:不支持抽取数据中使用。

    array 必须为非聚合函数公式返回的结果,可以是某指标字段、维度或指标字段与普通公式的计算结果。

    示例:

    用户横轴为维度字段"日"时,纵轴的计算字段APPROX_COUNTD_AGG)返回的值为每日的销量的近似去重个数。

    当用户横轴为维度字段"月"时,APPROX_COUNTD_AGG()返回的值为每月的销量的近似去重个数。

    注:本函数仅支持以下数据库系统:CLICKHOUSE、ORACLE(12c r1,12.1.0.2及以上)、SQLSERVER(2019及以上)、PRESTO、REDSHIFT、VERTICA。当数据库系统为REDSHIFT时,由于REDSHIFT的限制,只能同时对同一个字段做需要排序的聚合操作(如求去重计数、中位数、百分位、近似去重计数),同时对2个或以上的字段做此种聚合操作会发生错误。当数据库系统为VERTICA时,由于VERTICA的限制,只能同时使用(精确)去重计数或近似去重计数中的一个。

    13. Fixed类函数

    注:仅支持实时数据中使用。

    EXCLUDE(dim1,dim2,……,aggregate):从分析区域的维度中排除掉指定的维度执行聚合计算。

    FIXED(dim1,dim2,……,aggregate):固定指定的维度执行聚合计算。

    INCLUDE(dim1,dim2,……,aggregate):基于分析区域的维度增加指定的维度执行聚合计算。

    附件列表


    主题: 数据分析进阶
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!