反馈已提交

网络繁忙

多表合并/统计场景

  • 文档创建者:susie
  • 编辑次数:6次
  • 最近更新:April陶 于 2020-10-09
  • 1、概述

    1.1 应用场景

    存在四张表 A,B,C,D,其中,A 表分别与 B,C,D 为 N:1关联。如何将这几张表汇总成一张表,并进行次数统计?

    表间关联,以「单位」为关联依据,建立 A 表和其他表的 1:N 关联。如下图所示:

    2020-09-27_9-33-20.png

    在自助数据集中处理,效果如下图所示:

    2020-09-27_9-44-27.png

    1.2 实现思路

    将数据上传后,通过自助数据集实现多表合并和统计场景:

    1)在自助数据集内通过「选字段」添加 A 表字段。

    3)通过左右合并将 B 表字段合并进数据集。

    3)通过分组汇总对重复的数据进行合并,得到正确的统计结果。

    4)分组汇总前可使用函数,统计合并字段的对应次数。

    5)重复左右合并和分组汇总的组合操作,继续合并 C 表和 D 表,即可实现多表合并。

    2. 上传数据

    示例使用的数据:多表合并示例数据.rar

    1)新建「多表合并」的业务包。打开「数据准备>添加业务包」,添加业务包,并重命名为「多表合并」。如下图所示:

    2020-09-25_10-16-44.png

    2)点开「多表合并」业务包,在下面添加数据表。如下图所示:

    2020-09-25_10-21-09.png

    3)上传「设备信息」表,自动填入表名,展示数据效果,点击「确定」确认上传。如下图所示:

    2020-09-25_10-27-43.png

    4)在「多表合并」业务包下,上传需要合并的几张 EXCEL 表「停运」、「故障」和「离线」,步骤同上。合并后效果如下图所示:

    2020-09-25_10-30-58.png

    3. 添加关联

    为四张表添加关联,设置「设备信息」和其他三张表 1:N 的关联关系。

    1)为「设备信息」添加关联,如下图所示:

    2020-09-25_10-50-58.png

    2)建立「设备信息」表和「停运」表直接的「1:N」关联,完成点击「确定」,如下图所示:

    2020-09-25_10-51-17.png

    3)继续添加「设备信息」表和剩余两张表「1:N」的关联。步骤同上,完成后如下图所示:

    2020-09-25_10-51-36.png

    4. 添加自助数据集

    在自助数据集中,先添加「设备信息」字段,再对三张表中的字段进行汇总合并。

    在「多表合并」业务包下,添加自助数据集。如下图所示:

    2020-09-25_11-10-05.png

    5. 选字段

    自助数据集命名为「多表合并」,添加「设备信息」表的全部字段。如下图所示:

    由于「设备信息」在关联中是 1 端的表,不能选择 N 端表的字段,因此需要左右合并完成操作。

    2020-09-25_11-11-00.png

    6. 合并「停运」表

    自助数据集添加完「设备信息」表字段后,合并「停运」表的字段。

    6.1 左右合并

    1)使用「左右合并」,添加「停运」表的字段。如下图所示:

    2020-09-25_11-30-14.png

    2)选择「数据列表/多表合并/停运」,添加表内全部字段,如下图所示:

    2020-09-25_11-30-27.png

    3)使用「并集合并」保留所有数据。如下图所示:

    2020-09-25_15-46-56.png

    6.2 分组汇总

    合并后出现同一个单位数据同时存在了多条的结果。因此可在「左右合并」后加入「分组汇总」对数据进行单位的汇总,整理出三个单位的对应结果,从而避免多条数据。

    1)在合并「停运时长」字段后,增加「分组汇总」,所示:

    2020-09-25_15-54-49.png

    2)将合并表的合并字段「停运时长」,放入汇总栏求和,其他字段拖入分组栏。则多条数据汇总为一条,展示三个单位的数据信息。如下图所示:

    2020-09-25_15-56-19.png

    6.3 统计次数

    如果要统计「停运」表中的,各个单位停运次数,使用常规方法:重复拖入「停运时长」字段,统计「记录个数」是无法实现的。如下图所示:

    若添加的合并的字段进行分组汇总时不存在空值,可使用此方法求次数。但如果表中的合并字段「停运时长」存在空值,任会记录个数 1 ,不能得出正确的停运次数统计。

    2020-09-25_16-25-42.png


    因此求「停运次数」需要在左右合并和「分组汇总」中间添加步骤,通过 IF 函数对「停运时长」字段进行判断。

    1)在「左右合并」和「分组汇总」中间「新增列」。对「停运时长」字段添加判断条件。如下图所示:

    2020-09-25_16-37-05.png

    2)新增列后,输入公式:IF(停运时长=NULL,0,1)。判断每条记录,当停运时长为空时,显示 0 ,否则 为 1 。新增列名为「停运次数」。如下图所示:

    2020-09-25_16-51-26.png

    添加公式后效果如下图所示:

    2020-09-25_16-54-06.png

    3)返回「分组汇总」,汇总栏添加指标「停运次数」进行汇总求和,得出结果。如下图所示:

    2020-09-25_16-54-41.png

    7. 合并「故障」表

    1)添加「左右合并」,使用「故障」表进行「并集合并」所有数据。步骤同上,参见本文 6.1 节。

    2)对数据进行「分组汇总」,步骤同上,参见本文 6.2 节。效果如下图所示:

    注:若数据量过大,可合并「停运表」后,保存数据集。再新建自助数据集进行合并「故障」表的操作。

    2020-09-25_17-20-16.png

    若要统计故障次数,则步骤可参考本文 6.3 节。

    8. 合并「离线」表

    使用「离线」表,继续重复第 7 节的操作,完成后点击「保存」完成多表合并。效果如下图所示:

    2020-09-25_17-21-15.png

    9. 效果查看

    详情请参见本文 1.1 节。

    附件列表


    主题: 数据加工
    • 有帮助
    • 没帮助
    • 只是浏览

    售前咨询电话

    400-811-8890转1

    在线技术支持

    在线QQ:800049425

    热线电话:400-811-8890转2

    总裁办24H投诉

    热线电话:173-1278-1526

    文 档反 馈

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭