数据仓库的逻辑建模之星型模式
逻辑建模能直接反映出决策者管理者的需求, 同时对系统的物理实施有着重要的指导作用,是数据仓库实施中的重要一环, 目前较常用的包含有星型模式。
星型模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimens ion Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实 (Fact),它们一般都是数值或其他可以进行计算的数据; 而维表大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表的主键的部分或
全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、百分比(percent)的聚集计算,甚至可以做20-80 分析。这样就可以从不同的角度数字来分析业务主题的情况
下面给出一个直观的例子。
图 16-5 是一个典型的银行贷款分析的模型设计,其中加边框的为主关键字(PK, PrimaryKey),其中贷款分析表是一个事实表,其中的贷款授信金额,贷款余额是需要从各角度观察的数据(事实),而观察的角度是有区域、银行、时间,质量这四个方面组合进行,这些分析角度的有机组合,可以对授信金额和贷款余额进行4 ╳ 8 ╳ 4 ╳ 8 种组合的数据统计分析,以此实现对贷款情况的多角度(维)多层次(数据不同的汇总程度)的分析,贷款分析人员既可以宏观地看到贷款业务的整体情况,又可以微观地观察到具体一家银行一天一类贷款的细节信息。多维分析的时候,维度选择越多数据越细节(划分得更细了),维度选择越少数据越汇总越宏观。
这样一个中间一个大表形成主表,周围一组小表与主表相关联的结构,形态上呈星星和雪花的形状,星型模型是数据仓库的数据模型与其他数据库应用相区分的一个重要特征。
关于数据仓库的星型模式就介绍到这里,希望能对您有所帮助。
【编辑推荐】
相关文章
- 从本体论开始说起——运营商关系图谱的构建及应用
- 如何成为一名数据科学家?
- 从未见过的堂兄杀了人,你的DNA是关键证据
- 20个安全可靠的免费数据源,各领域数据任你挑
- 20个安全可靠的免费数据源,各领域数据任你挑
- 阿里云李飞飞:All in Cloud时代,云原生数据库优势明显
- 基于Hadoop生态系统的一高性能数据存储格式CarbonData(性能篇)
- 大数据告诉你:10年漫威,到底有多少角色
- TigerGraph:实时图数据库助力金融风控升级
- Splunk利用Splunk Connected Experiences和Splunk Business Flow 扩大数据访问
- 大数据开发常见的9种数据分析手段
- 以免在景区看人,我爬了5W条全国景点门票数据...
- 【实战解析】基于HBase的大数据存储在京东的应用场景
- 数据科学家告诉你哪些计算机科学书籍是你应该看的
- Kafka作为大数据的核心技术,你了解多少?
- Spring Boot 整合 Redis 实现缓存操作
- 大数据学习必须掌握的五大核心技术有哪些?
- 基于Antlr在Apache Flink中实现监控规则DSL化的探索实践
- 甲骨文再次被Gartner评为分析型数据管理解决方案魔力象限领导者
- 爬取吴亦凡微博102118条转发数据,扒一扒流量的真假