一、事实表分类
1. 以粒度划分
(1) 事务事实表(Transaction Grain Fact Table)
一条记录代表了业务系统中的一个事件。事务出现后,就会在事实中出现一条记录。以订单域举例:下单是一个事实;付款是一个事实;退款是一个事实。
(2) 周期快照事实表(Periodic Snapshot Grain Fact Table)
记录指定周期内一些聚集事务值或者度量状态。如:库存日快照事实表
(3) 累积快照事实表(Accumulating Snapshot Grain Fact Table)
用于研究业务过程中各里程碑事件之间的时间间隔,一般会用一个字段记录最后更新时间。如:订单各种状态的开始结束时间。
2. 以用途划分
(1)原子事实表(Atom Fact Table)
保存最细粒度数据的事实表
(2)聚集事实表(Aggregated Fact Table)
原子事实表上的汇总,也称汇总事实表。通过汇总原始数据来提升下游查询的效率
聚集原则:
不跨越数据域:数据域是对数据分类的高层抽象,如订单域、用户域,不同数据域的数据不要聚集在一起
不跨越事实:对于横向钻取,是针对多个事实基于一致的维度进行分析,即融合表,是一种导出模式而不是聚集模式。