您现在的位置是：首页 > 工具

当前栏目

数据仓库建模：定义事实表的粒度

建模定义数据仓库事实

2023-09-27 14:29:21 时间

数据仓库建模：定义事实表的粒度Posted on 2015-08-25 09:03 xuzhengzhu 阅读(28) 评论(0) 编辑收藏

维度建模中一个非常重要的步骤是定义事实表的粒度。定义了事实表的粒度，则事实表能表达数据的详细程度就确定了。定义粒度的例子如下：

1．客户的零售单据上的每个条目。

2．保险单上的每个交易。

定义好事实表的粒度有很大的用处。

第一个用处就是用来确定维度是否与该事实表相关。例如，对于粒度细到医疗单据上条目项的事实表来说，医疗结果是不会作为维度和它进行关联的，因为它们不在同一个粒度上。但是，对于一般的E/R数据模型来说，医疗单据是和医疗结果是进行关联的。通常的规范化建模里没有粒度的概念，它们表示的是实体之间的关系，这也是规范化建模和维度建模中一个较大的不同之处。

定义成原子的事实表粒度后，可以选择较多的维度来对该事实表进行描述。也就是说，事实表的粒度越细，能记载的信息就会越多。原子粒度的事实表对维度建模来说是至关重要的。

前面列举的几个例子中的粒度定义都是最低粒度的，这些事实表的数据是原子的，不能再进行细分了。但是我们可以在这个基础上定义高粒度的聚集事实表。举例如下：

1．一天一个仓库一个产品的销售总量。

2．每月的保险交易总数。

3．每月诊断治疗的交费金额。

这些高粒度的聚集事实表总是具有较少的维度。通常在建立这些聚集事实表的时候，我们会去掉一些维度或者缩减某些维度的范围。也正因为如此，聚集事实表应该和其对应的原子事实表一起使用。当需要更详细信息时，可以访问其对应的原子事实表。

第二个用处是定义好事实表的粒度后，能更清楚的确定哪个事实与该事实表相关。简单的说，事实必须对于该粒度是正确的，不同粒度的事实是不能定义在该事实表中的。

总结来说，我们定义事实表的粒度及维度建模时可以采用如下的步骤：

1．熟悉源数据的情况。

2．定义事实表的粒度，最好定义到原子粒度。

3．将与这个粒度的相关信息都添加为维度。

4．添加与该粒度相关的度量信息为事实。

数据仓库之拉链表拉链表是针对数据仓库设计中表存储数据的方式而定义的，顾名思义，所谓拉链，就是记录历史。记录一个事物从开始，一直到当前状态的所有变化的信息。
@dailidong@ 专注架构外功修行,内功修神 CSDN博客：http://blog.csdn.net/odalidong

猜你喜欢

js清除未知定时器的方法
安全专家公布美国TSA又一套万能钥匙设计
【Unity3D插件】Dialogue System for Unity插件分享《对话系统插件》
Maven实战. 2.8小结
分布式光伏贷款欲破冰多家银行推出相关业务
JUC多线程：Atomic原子类与CAS原理
每年的智能车竞赛赛道是如何产生的？
Jenkins+git
138 python高级 - 正则表达式（贪婪和非贪婪)
flutter上拉抽屉效果 flutter拖动抽屉效果
C# .NET 使用SynchronizationContext访问主线程
C语言实现OOP 版本3 ：简化代码
StopWatch 监控Java代码运行时间和分析性能
手把手 | 用R分析宋词三百首自己动手写个“机器诗人”
在 Linux 中修改 MySQL 或 MariaDB 的 Root 密码

相关主题

建模工具
统计建模
研究生数学建模
数学建模笔记
4.建模主数据
数学建模
数学建模学习

zl程序教程

当前栏目

数据仓库建模：定义事实表的粒度

相关文章