zl程序教程

您现在的位置是:首页 >  工具

当前栏目

离线数仓(4):数仓理论之关系建模和维度建模

建模 关系 理论 离线 数仓 维度
2023-09-14 09:14:56 时间

目录

0. 相关文章链接

1. 关系建模

2. 维度建模

3. 总结


0. 相关文章链接

 离线数仓文章汇总 

1. 关系建模

关系建模将复杂的数据抽象为两个概念——实体和关系,并使用规范化的方式表示出来。关系模型如图所示,从图中可以看出,较为松散、零碎,物理表数量多。

        关系模型严格遵循第三范式(3NF),数据冗余程度低,数据的一致性容易得到保证。由于数据分布于众多的表中,查询会相对复杂,在大数据的场景下,查询效率相对较低。

2. 维度建模

维度模型如图所示,从图中可以看出,模型相对清晰、简洁。 

        维度模型以数据分析作为出发点,不遵循三范式,故数据存在一定的冗余。维度模型面向业务,将业务用事实表和维度表呈现出来。表结构简单,故查询简单,查询效率较高。

3. 总结

        关系建模和维度建模是两种数据仓库的建模技术。关系建模由Bill Inmon所倡导,维度建模由Ralph Kimball所倡导。在数据仓库的早期中,都是使用的关系建模,但随着数据仓库的发展,发现关系建模在使用上有很大的不便,所以又提出了维度建模的概念。维度建模相对关系建模的最大变化就是不遵循三范式,所以数据存在一定冗余,但是为查询大大提高了效率,而数据仓库中又是一次写入多次查询的特点,所以在新的数仓中才一般会使用维度建模。


注:其他 离线数仓 相关文章链接由此进 -> 离线数仓文章汇总