【数据仓库】数据仓库概述
1.RDBMS数据库
随着关系数据库理论的提出,诞生了一系列经典的RDBMS,如Oracle,MySQL,SQL Server等。这些RDBMS被成功推向市场,并为社会信息化的发展做出的重大贡献。然而随着数据库使用范围的不断扩大,它被逐步划分为两大基本类型:
(1)操作型数据库
主要用于业务支撑。一个公司往往会使用并维护若干个数据库,这些数据库保存着公司的日常操作数据,比如商品购买、酒店预订、学生成绩录入等;
(2)分析型数据库
主要用于历史数据分析。这类数据库作为公司的单独数据存储,负责利用历史数据对公司各主题域进行统计分析;
2.操作型数据库 VS 分析型数据库
因为主导功能的不同(面向操作/面向分析),两类数据库就产生了很多细节上的差异:
(1)定位不同(数据以何种目的组织起来)
操作型数据库是为了支撑具体业务的,因此也被称为"面向应用型数据库",使用者是业务环境内的各个角色,如用户,商家,进货商等;
分析型数据库则是针对各特定业务主题域的分析任务创建的,因此也被称为"面向主题型数据库"。使用者只是少量用来做综合性决策的用户。
(2)数据不同
操作型数据库主要是存放90天以内的明细数据,反映的是现实世界的当前状态。
分析型数据库存放的则主要是存放数年内的明细+汇总数据(用户重点关注汇总数据),反映的是当前状态和过去各时刻的快照。
关于汇总数据特别说明:
操作型数据库中自然也有汇总需求,但汇总数据本身不存储而只存储其生成公式。这是因为操作型数据是动态变化的,因此汇总数据会在每次查询时动态生成。
而对于分析型数据库来说,因为汇总数据比较稳定不会发生改变,而且其计算量也比较大(因为时间跨度大),因此它的汇总数据可考虑事先计算好,以避免重复计算。
(3)性能要求不同
操作型数据库操作的数据量少而频率多,系统对于大量用户并发读和写性能要求比较高。
分析型数据库操作则的数据量大而频率少,系统对于大数据量的读性能要求比较高。
3.数据仓库定义
一个企业的、面向主题的、集成的、相对稳定的、反映历史变化的数据集合。
(1)企业范围
数据仓库内的数据是面向公司全局的。比如某个主题域为成本,则全公司和成本有关的信息都会被汇集进来;
(2)面向主题
面向主题特性是数据仓库和操作型数据库的根本区别。操作型数据库是为了支撑各种业务而建立,而分析型数据库则是为了对从各种繁杂业务中抽象出来的分析主题(如用户、成本、商品等)进行分析而建立;
(3)集成性
集成性是指数据仓库会将不同源数据库中的数据汇总到一起;
(4)相对稳定的(时变性)
时变性是指数据仓库包含来自其时间范围不同时间段的数据快照。有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告;
(5)历史性
较之操作型数据库,数据仓库的时间跨度通常比较长。前者通常保存几个月,后者可能几年甚至几十年;
参考文档:
相关文章
- 【刷题】面筋-测开-软件测试概述/对测试的理解
- gecko框架概述
- 【转载】MySQL复制的概述、安装、故障、技巧、工具
- 小白学 Python 数据分析(15):数据可视化概述
- 第1章 1.3计算机网络概述--规划IP地址介绍MAC地址
- 【JAVA】栈和堆,JVM内存概述
- Visual Studio Code Active File in StatusBar 扩展以及 Extension API 概述
- SAP成都研究院廖婧:SAP C4C社交媒体集成概述
- Atitit m4a文件元数据结构 目录 1. 一、基本概念1 2. MP4文件由若干称为Atom(或称为box)的数据对象组成,2 2.1. MP4文件概述2 2.2. M4A没有视频流而已
- Atitit 持久化 之道 attilax 艾龙著 1. 第2章 Java对象持久化技术概述 2 1.1. 2.1 直接通过JDBC API来持久化实体域对象2 1.2. 2.2 ORM简介2
- TCP/IP 协议概述 OSI 参考模型 TCP/IP 协议族 TCP UDP 三次握手协议 socket 概述 sockaddr sockaddr_in 存储优先 地址格式转化 名字地址转化
- 【云服务器 ECS 实战】专有网络 VPC、弹性网卡的概述与配置
- 【DOM】DOM概述及DOM操作之如何查找元素_01
- 【分布式版本控制系统Git】| Git概述、Git安装、Git常用命令
- c#加密:一、加密概述和windows数据保护
- 数据结构和算法 一、数据结构概述