反馈已提交

网络繁忙

③配置检测规则

  • 文档创建者:Wendy123456
  • 历史版本:5
  • 最近更新:Wendy123456 于 2026-03-02
  • 1. 概述

    1.1 版本


    FineDataLink 版本
    功能变动
    5.0.0.1-
    5.0.8.1

    「平台内置规则」中

    • 新增计算方式:表行数准确性检测

    • 删除计算方式:表总行数计数


    历史版本更新
    FineDataLink 版本
    功能变动
    5.0.3.3

    数据检测任务全新升级,5.0.3.3 之前版本请参见:①数据检测任务概述

    1)配置界面优化,将「检测对象」与「规则配置」整合在一个页面里

    2)数据检测任务配置重构,将部分常用规则固定为「平台内置规则」,原有的自定义规则分为「任务自定义规则」和「全局自定义规则」

    5.0.3.4

    「平台内置规则」中新增两种计算方式:

    • 两表字段统计值比对

    • 两表数据明细值比对

    5.0.6.3部分规则新增「记录异常明细」配置项,详情请参见:数据检测任务-异常明细
    5.0.7.3
    • 新增「规则强度」配置项

    • 通知内容新增「检测通过(存在弱规则未通过的表)」

    1.2 功能简介

    本文为大家介绍数据检测任务中的检测规则。

    2. 检测规则概览

    数据检测任务可设置的规则有三种类型:

    规则类型
    说明
    平台内置规则
    • 预设多种规则,最大化提升常用检测的配置体

    • 检测对象支持添加批量表、批量字段

    任务自定义规则
    • 提供灵活的配置项,满足个性化的检测需求

    • 检测对象仅支持添加一张表 

    全局自定义规则
    • 与「任务自定义规则相同,但设置的规则可被多个数据检测任务使用

    • 检测对象仅支持添加一张表 

    具体规则内容概览:

    规则类型
    计算方式
    检测内容示例

    平台内置规则

    唯一性表行唯一性检测(表级)

    正常行数、正常行占比、异常行数、异常行占

    校验主键唯一性
    字段值唯一性检测(字段级)正常值个数、正常值占比、异常值个数、异常值占比校验用户 ID 是否唯一
    完整性字段NULL值/空字符串检测(字段级)NULL值个数、NULL值占比、空字符串个数、空字符串占比校验身份证号是否存在缺失
    有效性字段格式检测(字段级)正则表达式匹配的行数、行占比校验联系人手机号是否合法
    一致性
    两表字段统计值比对(字段级)统计差值、统计差异率使用定时任务完成数据同步后,需要对两表数据一致性进行检测,判断是否存在缺失/冗余等数据不一致的情况
    两表数据明细值比对(表级)差异行数、差异率
    准确性表行数准确性检测(表级)总行数、1天波动率、7天波动率
    对订单表进行日总数监控:当日订单数量与前一日相比,波动率介于±10%内为正常

    任务自定义规则


    -行级筛选逐行判断某字段是否满足条件,再统计行数、行占比校验退款数据是否在订单主表中匹配到有效记录
    -聚合计算多行聚合计算后判断结果统计每月销售额小于 10w 的商品
    全局自定义规则-引用全局自定义规则--

    3. 平台内置规则

    平台内置规则支持以下几种计算方式:

    1772419908330053.jpg

    3.1 表行唯一性检测(表级)

    配置界面如下:

    1772419973857887.jpg

    3.1.1 规则强度

    5.0.7.3 及之后版本,所有规则新增「规则强度」配置项。

    应用场景:强规则适用于核心指标、合规性数据的校验,针对对下游数据影响较大的场景做数据质量监控;弱规则适用于非核心指标监控,此类场景不影响核心业务流程,对异常数据仅做预警通知,预留时间排查优化。

    规则强度说明:

    • 强规则检测不通过,将判定表检测不通过。例如:任务中有强、弱规则,有一个强规则检测不通过,即最终检测不通过。

    • 弱规则检测不通过,不影响表最终检测结果。例如:任务中都为弱规则且都检测不通过,但最终检测通过。

    示例:

    检测任务中有两个弱规则、一个检测通过、一个检测不通过。弱规则不影响最终检测结果,所以最终检测通过,并提示有表存在检测不通过的弱规则。

    6.jpg

    3.1.2 计算结果

    可选择:正常行数、正常行占比、异常行数、异常行占

    • 正常行:唯一行,即不重复的数据行;例如检测「合同ID」的 「正常行占比=1」,即检测是否有重复行。

    • 异常行:所有重复出现的行;例如检测「合同ID」的 「异常行=0」,即检测是否有重复行。

    3.1.3 联合主键

    选择字段作为联合主键计算行数,每张表至少选择1个字段。

    3.1.4 预期范围

    • 指定预期范围,例如「异常行数=0」。

    • 支持添加多个条件,支持切换添加「且/或」条件。

    3.1.5 记录异常明细

    5.0.6.3 及之后版本,新增此配置。

    若勾选,检测不通过时,识别并记录表内重复行。

    详情请参见:数据检测任务-异常明细

    3.2 字段值唯一性校验

    配置界面如下:

    1772420241456529.jpg

    配置项
    说明
    规则强度

    详情请参见本文 3.1.1 节内容

    计算结果

    可选择:正常值个数、正常值占比、异常值个数、异常值占比

    • 正常值:唯一值,即不重复出现的值;例如检测「合同ID」的「正常值占比=1」,即检测该字段是否有重复值

    • 异常值:所有重复出现的值;例如检测「合同ID」的「异常值个数=0」,即检测该字段是否有重复值

    检测字段每张表至少选择 1 个字段
    预期范围

    指定预期范围,例如「异常值个数=0」

    支持添加多个条件,支持切换添加「且/或」条件

    记录异常明细

    5.0.6.3 及之后版本,新增此配置

    若勾选,检测不通过时,识别并记录表内重复

    详情请参见:数据检测任务-异常明细

    3.3 表总行数计数(表级)

    配置界面如下:

    注:5.0.8.1 及之后版本,删除此规则。

    1772420330816178.jpg


    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    计算结果

    -

    预期范围

    指定预期范围,例如「总行数大于等于 500000」

    支持添加多个条件,支持切换添加「且/或」条件

    3.4 字段NULL值/空字符串检测(字段级)

    配置界面如下:

    1772420368772608.jpg

    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    计算结果

    可选择:NULL值个数、NULL值占比、空字符串个数、空字符串占比

    检测字段每张表至少选择 1 个字段
    预期范围

    指定预期范围,例如「空字符串个数=0」

    支持添加多个条件,支持切换添加「且/或」条件

    记录异常明细

    5.0.6.3 及之后版本,新增此配置

    若勾选,检测不通过时,识别并记录字段NULL值所在的完整行

    详情请参见:数据检测任务-异常明细

    3.5 字段格式校验(字段级)

    配置界面如下:

    1772420412151018.jpg

    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    计算方式正则表达式仅对文本型和数值型字段生效
    计算结果

    可选择:匹配行数、匹配行占比

    检测字段每张表至少选择 1 个字段
    预期范围

    指定预期范围,例如「匹配行数=0」

    支持切换添加「且/或」条件

    记录异常明细

    5.0.6.3 及之后版本,新增此配置

    检测不通过时,识别并记录字段格式不匹配的值所在的完整

    详情请参见:数据检测任务-异常明细

    3.6 两表字段统计值比对(字段级)

    5.0.3.4 及之后版本,平台内置规则新增计算方式:两表字段统计值比对。

    配置界面如下:

    1772420455396429.jpg

    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    统计方式

    可选择:

    • 字段值计数(不限制字段类型)

    • 字段唯一值计数(不限制字段类型)

    • 字段值求和(限制类型为数值)

    比对配置

    1)「比对源」支持选择不同数据源下的库,即检测表和比对表在不同类型的数据连接下

    8.png

    2)若有多张比对表,比对表仅支持来源于同一个数据连接下的同一个库/模式

    9.png

    3)若在配置「检测对象」时,同时配置了检测的数据范围,支持在此处查看检测对象的数据范围。此外,支持配置比对表的「数据范围」,配置逻辑与配置检测对象的数据范围一致,详情请参见 ②配置检测对象

    6.png

    4)若统计方式为:字段计数、字段唯一值计数,建议选择主键字段作为比对字段

    计算结果可选择:
    • 统计差值 =|比对表统计值 - 检测表统计值|

    • 统计差异率 = 统计差值 / 检测表统计值

    注:当分母为 0 时,统计差异率为 100%

    预期范围

    指定预期范围,例如「统计差值=0」

    支持切换添加「且/或」条件

    3.7 两表数据明细值比对(表级)

    5.0.3.4 及之后版本,平台内置规则新增计算方式:两表数据明细值比对。

    配置界面如下:

    1772420507243064.jpg

    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    比对配置

    1)「比对源」支持选择不同数据源下的库,即检测表和比对表在不同类型的数据连接下

    10.png

    2)若有多张比对表,比对表仅支持来源于同一个数据连接下的同一个库/模式

    11.png

    3)若在配置「检测对象」时,同时配置了检测的数据范围,支持在此处查看检测对象的数据范围。此外,支持配置比对表的「数据范围」,配置逻辑与配置检测对象的数据范围一致,详情请参见 ②配置检测对象

    5.png

    主键映射:必填。选择字段作为逻辑主键映射确定数据唯一性

    • 两表主键不同:视为不同行,判断缺行/多行

    • 两表主键相同:视为相同行,判断「比对字段」值是否相同

    3.png

    比对字段:

    左表固定检测表,右表固定为比对表,以左表为基准选择比对表字段

    非必选,为空时无法标记出字段内容不一致的行

    计算结果

    可选择:

    • 差异行数:统计差值

    • 差异率:差异行数 / 检测表总行数

    预期范围指定预期范围,例如「差异行数=0」

    支持切换添加「且/或」条件

    记录异常明细

    5.0.6.3 及之后版本,新增此配置

    若勾选,检测不通过时,识别并记录两表不一致的数据

    详情请参见:数据检测任务-异常明细

    3.8 表行数准确性检测

    5.0.8.1 及之后版本,平台内置规则新增计算方式:表行数准确性检测。

    1772420568304781.jpg

    配置项
    说明
    规则强度设置规则强度,详情请参见本文 3.1.1 节
    计算指标表行数,即对表行数进行检测
    计算结果

    计算结果可选择:

    • 总行数:将「检测的表行数」与「设置的表行数进行比较

    • 1天波动率:将检测的表行数与「1 天前采集的表行数结合计算波动率,再与设置值比较

    • 7天波动率:检测的表行数与「7 天前采集的表行数结合计算波动率,再与设置值比较

    注:波动率的计算依赖于基准值,也就是 1/7 天前最后一次检测通过的定时调度采样结果为基准值进行计算。因此 需要配置 定时调度 ,获取基准值,若无检测通过的基准值,默认规则检测通过。

    波动率计算公式:波动率=(样本-基准值)/基准值

    • 样本值:当前采集的指标值(如当天的表行数)

    • 基准值:历史参考值(如 7 天前的表行数)

    预期范围

    指定预期范围,支持添加多个条件,支持切换添加「且/或」条

    对订单表进行日总数监控:当日订单数量与前一日相比,波动率介于±10%内为正常

    4. 任务自定义规则

    4.1 行级筛选

    「行级筛选」:逐行判断某字段是否满足条件,再统计行数/行占比,可用于空值检查、手机号格式校验等场景。

    配置界面如下:

    1772420645148230.jpg


    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    自定义 SQL自定义 SQL,执行结果为明细数据,执行结果的行数会被用于统计行数
    计算结果

    指定如何计算这些明细行,可选择:行数、行占比

    预期范围指定预期范围

    支持添加多个条件,支持切换添加「且/或」条件

    记录异常明细

    5.0.6.3 及之后版本,新增此配置

    支持自定义异常详情 SQL,此 SQL 语句用于检测时查询异常明细数

    允许指定表占位符和字段占位符、允许为空

    详情请参见:数据检测任务-异常明细

    4.2 聚合计算

    「聚合计算」:多行聚合计算后判断结果,依赖聚合函数,例如计算平均销售额是否超过 100 万。

    配置界面如下:

    1772420683904263.jpg

    配置项
    说明
    规则强度

    5.0.7.3 及之后版本新增此配置

    设置规则强度,详情请参见本文 3.1.1 节

    自定义 SQL

    若勾选「使用自定义 SQL 计算」,支持自定义 SQL,执行结果为统计值

    支持自定义统计值的「值类型」,执行结果的行数会被用于统计行

    34.png

    行范围

    未勾选「使用自定义 SQL 计算」,出现此配置

    支持填写 WHERE 语句来筛选要进行统计计算的行

    计算结果未勾选「使用自定义 SQL 计算」,需选择预设的计算类型和计算方式:

    1)日期类计算

    • 最早时间

    • 最晚时间

    2)数值类计算

    • 总和

    • 平均值

    • 中位数

    • 最大值

    • 最小值

    • 标准差

    • 方差

    检测字段

    选择需要检测的字段

    预期范围指定预期范围

    支持添加多个条件,支持切换添加「且/或」条件


    5. 全局自定义规则

    5.1 设置全局自定义规则

    1)点击「全局设置」按钮,添加全局自定义规则,如下图所示:

    2.png

    配置项
    说明
    规则名称配置规则名称

    计算方式

    计算结果

    详情参见 平台内置规则

    自定义 SQL/行范围支持使用@[tableName]、@[column]作为表名、字段名占位符

    表占位符:

    • 执行时将替换为表名

    字段占位符:

    • 执行时将替换为字段名,需要用户选择字段

    • 字段占位符不会联动出字段选择

    其余说明可参见 平台内置规则

    2)支持引用全局自定义规则,需设置检测字段和预期范围。其余配置项不支持修改,若需修改,请在 1)中全局自定义规则修改。如下图所示:

    5.0.6.3 及之后版本,若全局自定义规则使用的是「行级筛选」规则,新增「异常明细记录」配置,详情请参见:数据检测任务-异常明细

    1772420975316719.jpg

    5.2 管理全局自定义规则

    1)在「全局自定义规则」页面中,可以查看当前工程中所有全局自定义规则,包括名称、计算方式、计算结果等信息,同时提供新增、编辑、删除、搜索全局自定义规则操作。如下图所示:

    3.png

    2)展示该全局规则的修改记录,包括创建时间/修改时间,创建者/修改者(仅记录最新操作的15个记录,若超过,最晚记录覆盖最早记录)。如下图所示:

    6.png

    3)在「全局自定义规则管理」页面中,支持查看字段级检测的自定义 SQL、行数。如下图所示:

    7.png






    附件列表


    主题: 数据管理
    • 有帮助
    • 没帮助
    • 只是浏览
    中文(简体)

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭



    AI

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持