1. 概述编辑
在了解主题模型的原理后,是不是有些 get 到主题模型的优点了?
本文我们来对主题模型的优势进行一个总结。
2. 数据准备更简单编辑
无需要等更新
抽取数据在使用进行左右合并后需要点击「保存并更新」后才可使用,若表格数据量很大,我们等待它更新完成也需要很长时间。
但主题模型直接建立模型关系后,就可以使用,节省了时间。
操作更简单,避免选择困难症
我们在使用左右合并的时候,经常要选择左合并还是右合并。若我们在不了解表的情况下选错了,可能会导致最后的结果错误。
但主题模型无需考虑合并方式,只需建立连线和选择匹配字段即可,系统用更智能的方式保证数据的完整性。
3. 多表分析更高效编辑
解决数据膨胀问题
在多表分析中,使用左右合容易引入冗余数据,导致结果表格中存在重复的数据行,分析时获得的合计值错误。
而使用主题模型时,系统自动先聚合再合并,不会产生数据膨胀的问题。
模型支撑更多的分析场景,无需进行多次数据处理,强化组件之间的关系和联动
举个例子,我们给「产品表、客户表、订单表、销售员表」建立好模型关系:
想要分析每个销售人员的销售绩效。通过模型,直接从「销售员表」获取销售人员的信息,从「订单表」获取每个销售人员的销售订单数据
想要分析客户在不同产品的购买情况。通过模型,从「客户表」获取客户信息,从「产品表」和「订单表」获取订单和产品数据。
以上分析如果使用左右合并,那就需要进行多次左右合并操作。
并且还需要担心是否有数据膨胀问题,若有数据膨胀,直接合并成一张大宽表进行分析可能会给我们带来麻烦。使用先分组汇总再左右合并的方式可以解决,但合并成多个中间表分别服务不同的分析组件,这会带来很多问题:
进行多次分组汇总、左右合并,操作麻烦
破坏表结构,分组汇总会让数据粒度变粗,无法做多层次分析。例如按「月份」汇总后,就会丢失「天」粒度的数据,不方便之后对「天」进行分析。
割裂组件,用了不同中间表作为数据源的组件之间无法自动建立联动。而使用同一个主题模型的组件直接,
5. 性能更优编辑
主题模型是逻辑连接,
减少中间表的产生、减少数据膨胀、原来n:n会产生笛卡尔积
4. 主题模型的衍生功能编辑
支持双向联动过滤
支持计算指标可以复用
计算字段可以绑定过滤控件进行过滤
6. 弊端编辑
1)无法发布
2)虽然设置简单,但有比较深的理解成本。
为避免不当使用,在学会主题模型之前,先使用左右合并