数据中心模型为上层指标开发提供数据基础,基于现有的数据模型,开发原子指标时,用户无需调研底层数据关系,直接通过可视化的页面即可配置生成指标,统一了指标数据来源的同时,也降低了指标开发的技术门槛。
在指标平台里,模型提供了最基础的事实表和维表之间的基本关系,方便后续创建指标时,直接基于已经固化好的数据关系进行开发。
下面将具体介绍一下数据模型的相关的原理以及操作方式。
模型分类
围绕着维度建模的核心理论,支持常见的单例模型、星型模型和雪花模型:
单例模型:单张事实表组成的模型;
星型模型:一张事实表,加上一个或多个维度表,事实表和维度表之间通过主键外键相关联,且维度表之间没有关联,从形状上看就像很多星星围着一个星星一样,所以叫星型模型;
雪花模型:将星型模型中的某些维度再进一步进行规范,抽取成更细的维度表,让维度表之间也进行关联,那么这个时候,即为雪花模型;
建设过程中,一般会尽可能地避免雪花模型,更多地采用星型模型。
组成要素
数据模型包括表、关系、度量、维度四大组成要素:
表:主要以一张事实表和一张或者多张维度表的形式存在,不同类型的表后续计算指标时取数的逻辑会有所不同。
关系:不管是星型模型还是雪花模型,都会包含多张表,且表之间通过固定的关系形成一个稳定完整的模型;
指标:一个指标对应一个字段,作为后面原子指标的统计来源;
维度:一个维度对应一个字段,作为后面指标统计的维度来源。

表关联
可选择表建立模型,表之间可设置关联关系、分析方向。 单个表/视图需要设置的具体信息规则如下:
详情请参见:关联
指标管理
指标用于后续指标加工过程中的公式,请至少选择一个指标。
维度管理
维度管理是后续指标加工过程中用到的所有维度的汇总。同一模型下的维度信息设置不可重复。

为了保证后续加工指标可以充分、灵活选择聚合维度,模型定义维度时,一般需要尽可能根据实际的业务场景,把需要分析的维度都考虑进去。