【计算机三级数据库技术】第3章 数据库结构设计完整知识体系--附思维导图
2023-09-14 09:12:40 时间
目录
1 概念设计
1.1 任务和目标
(1)任务
理解和获取应用领域中的数据需求,分析、抽取、描述和表示清楚需要存储和管理什么数据。
主要解决数据需求,理解数据需求,真实地把应用领域中要处理的数据组织、定义描述清楚,以支撑数据库设计后续阶段的工作
(2)目标
- 定义和描述应用领域中涉及的数据范围
- 获取应用领域或问题域的信息模型
- 描述清楚数据的属性特征
- 描述清楚数据之间的关系
- 定义和描述数据的约束
- 说明数据的安全性要求
- 支持用户的各种数据处理需求
- 保证信息模型方便地转换成数据库的逻辑结构,同时也便于用户理解
1.2 过程
明确建模目标
定义实体集
定义联系
建立信息模型
确定实体集属性
对信息模型进行集成与优化
1.3 建模方法
(1)公共特点
- 能够真实客观地描述现实世界中的数据及数据之间的关系
- 组成模型的概念少,语义清楚,容易理解
- 不同概念的语义不重叠,概念无多义性
- 用图形方式描述数据,数据直观易懂,有利于数据库设计者和用户交流
- 这种数据模型容易转换成数据库逻辑设计阶段需要的数据结构
(2)两种方法
- E-R建模(ER(Entity Relationship)实体联系)
相关概念- 实体或实例Instance
- 实体集
- 属性
- 码
- 联系
- IDEF1X建模
侧重于描述系统功能需求,称为功能建模方法
相关概念- 实体集
- 联系
2 逻辑设计
2.1 任务
把数据库概念设计的结果ER模型,转换为具体的数据库管理系统支持的数据模型。
按照具体数据库管理系统支持的数据模型来组织和存储数据,包括定义和描述数据的全局逻辑结构、数据之间的关系、数据的完整性及安全性要求
2.2 ER转关系模型步骤
第一步:标识ER中的联系
第二步:依次转换与每个联系相关联的实体集及联系
3 物理设计
3.1 概述
(1)目的
将数据的逻辑描述转换为实现技术规范
(2)目标
设计数据存储方案,以方便提供足够好的性能并确保数据库的完整性、安全性和可恢复性
(3) 注意
- 数据库的物理设计并不包括文件和数据库的具体实现细节(例如如何创建文件、建立数据库以及如何加载数据)
- 在这个阶段将根据数据库中的存储的数据量、用户对数据库的使用要求和使用方式,选择数据存储方案以加快数据检索速度。因此在物理设计时需要了解不同文件的组织方式、索引技术以及使用方法。
3.2 从数据库物理结构需要解决的问题
文件的组织
文件的结构
文件的存取
索引技术
3.3 索引
是一种快速数据访问技术,它将一个文件的每个记录在某个或某些域上的取值与该记录的物理地址直接联系起来,提供了一种根据记录域的取值快速访问文件记录的机制
(1)建立索引的代价
- 占用一定的存储空间
- 对数据插入、更改和删除操作时,为了使得索引和数据保持一致,还需要对索引进行维护,对索引的维护是需要花费时间的
(2)分类 - 有序索引
- 概念:也称索引文件机制。利用索引文件实现记录域取值到记录物理地址间的映射关系。
- 建立方法:首先选定数据文件中的某个或某些记录域作为查找码,然后建立起数据记录在查找码上的取值与该记录的物理地址间的映射关系,组成索引项。所有索引项作为索引记录存储在索引文件中。索引文件根据某个特定的查找码的值的升序或降序存储索引记录并且也组织为顺序文件
- 分类
- 聚集索引:数据局文件中数据记录的排列顺序与索引文件中索引项的排列顺序相一致
- 非聚集索引:索引文件中排序顺序与数据文件中排列数据局不一致
- 稠密索引:数据文件中的每个查找码在索引文件中都有对应一个索引记录
- 稀疏索引:数据文件中的只是一部分查找码的值有对应的索引记录,即是索引文件中只包含了数据文件中的部分查找码
- 主索引:在数据文件的主码属性集上建立的索引
- 辅索引: 在数据文件的非主属性上建立的索引称为辅索引
- 唯一索引:唯一索引可以确保索引列不包含重复的值,在多列唯一索引的情况下,可以确保索引项中每个值的组合都是唯一的
- 单层索引:也称为线性索引,特点是索引项根据键值在索引文件中顺序排序,组织成一维线性结构,每个索引项直接指向数据文件中的数据记录
- 多层索引:建立多层树形索引结构来快速定位大数据量文件中的数据记录。典型例子B和B+树
- 散列索引:利用散列函数实现记录域取值到记录物理地址间的直接映射关系
3.4 设计环节
(1)数据库逻辑模型描述
- 面向目标数据库描述基本表和视图
- 设计基本表业务规则
(2)文件组织和存储设计
- 事务分析的步骤
- 选择合适的文件结构原则
- 是否为一个表建立索引原则
(3)数据分布设计
- 不同类型数据的物理分布
- 应用数据的划分与分布
- 水平分布:将一张基本表划分为多张具有相同属性、结构完全相同的子表,子表包含的元组是基本表中元组的子集
- 垂直分布:将一张基本表划分为多张子表,每张子表包含的属性是原基本表的子集
- 派生属性数据分布
是指该属性的取值可根据表中其他属性的取值唯一确定 - 关系模型的去规范化
关系模型的规范化过程实质是将一个关系模式分解为一系列子模型,使得子模式可以满足更高一级的范式要求
(4)确定系统配置
(5)物理模式评估
相关文章
- 【华为云技术分享】云原生数据库三驾马车之TaurusDB
- 浅谈数据库的分割技术[转载]
- 是什么让TA蹲5个小时也要听完?--深圳云栖大会数据库技术专场8大爆点
- 把数据库中的数据制作成Excel数据
- 专访平安科技数据库技术专家梁海安:数据库运维未来很大一部分工作会被平台或工具代替
- Windows DOS窗体下Oracle 数据库的导入导出命令
- oracle 判断列是否在数据库中存在
- Atitit 信息化数据采集与分析解析 技术 处理技术 爬虫与http rest json xml h5解析 db数据库 mail协议与处理 数据压缩与解压 数据处理 文本处理
- Atitit.数据库表的物理存储结构原理与架构设计与实践
- MySQL数据库技术与应用:数据查询
- 【华为云技术分享】从自建MongoDB聊聊云数据库MongoDB的蓬勃张力
- 技术生态两手抓,打造面向未来的企业级领先数据库
- Sqlite3数据库单例封装
- 【大数据技术基础系列】列式数据库与基于行的数据库存储数据结构
- 接口连接到数据库
- ES 搜索结果expalain 可以类似数据库性能调优来看排序算法的选择
- 【计算机三级数据库技术】第2章 信息系统需求分析完整知识体系--附思维导图
- Oracle的学习心得和知识总结(十一)|Oracle数据库Real Application Testing之DBMS_SQLPA包技术详解