zl程序教程

您现在的位置是:首页 >  大数据

当前栏目

数据仓库之数据冗余规范

数据 规范 数据仓库 冗余
2023-06-13 09:15:03 时间

在数据详细设计阶段设计宽表冗余维度属性时,应该遵循以下几个建议准则:

1.冗余字段与表中其它字段高频率(大于3个下游应用SQL)同时访问。

2.冗余字段的引入不应造成其本身的更新完成时间过多延迟。

3.公共层数据不允许字段重复率大于60%的相同粒度数据表冗余,可以选择原表基础上拓宽或者下游应用通过JOIN方式实现。

4.从一个集合中冗余一部分记录作为另外一张表存在时,可以优先考虑子分区方式,但是多级子分区不超过(5级),只有以下情况才考虑冗余:

       子类型表有较多(大于10)个字段父类型表并不存在。

       子集合的过滤条件被多次(大于5次)应用。