数据仓库的常见模型:星型模型 和雪花模型
模型 常见 数据仓库 雪花
2023-09-27 14:22:13 时间
星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余。如在地域维度表中,存在国家A省B的城市c以及国家A省B的城市D两条记录,那么国家A和省B的信息分别存储了两次,即存在冗余。
当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上,其图解就像多个雪花连接在一起,故称雪花模型。
雪花模型是对星型模型的扩展,它对星型模型的维表进一层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的“层次”区域,这些被分解的表都连接到主维度表而不是事实表。
它的优点是:通过最大限度地减少数据存储量以及联合较小的维度表来改善查询性能。雪花模型去除了数据的冗余性。
星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。
相关文章
- NLP预训练模型 | 按时间线整理10种常见的预训练模型
- Java 异常模型综述
- 回归模型
- Google Earth Engine ——MACAv2-METDATA 月度数据集涵盖美国本土的 20 个全球气候模型(GCM) 的集合1900-2099年
- 基于simulink的Active anti-islanding-AFD主动反孤岛模型仿真
- 基于立体视觉的三维模型重建系统设计
- 机器学习中的常见学习模型
- 《Axure RP8 网站和APP原型制作 从入门到精通》一2.3 角色模型
- 新的 GPT-3 模型:Text-Davinci-003 很棒
- 浏览器绘图模型的解释:renderObject、renderlayer
- 对线性模型进行最小二乘法学习的实例(使用三角多项式基函数 Python实现)
- 常见的访问控制模型 Access Control Policy:RBAC,DAC,MAC,ABAC
- ChatGPT模型采样算法详解
- Coursera在线学习---第一节.梯度下降法与正规方程法求解模型参数比较