数据库表分割技术浅析
什么是水平分割?打个比较形象的比喻,在 食堂吃饭的时候,只有一个窗口,排队打饭的队伍太长了,都排成S型了,这时容易让排队的人产生焦虑情绪,容易产生混乱,这时一个管理者站出来,增加多个打 饭窗口,把那条长长的队伍拦腰截断成几队。更形象一点的理解,你拿一把“手术刀”,把一个大表猛的切了几刀,结果这个大表,变成了几个小表.
水平分割根据某些条件将数据放到两个或多 个独立的表中。即按记录进分分割,不同的记录可以分开保存,每个子表的列数相同。水平切割将表分为多个表。每个表包含的列数相同,但是数据行更少。例如, 可以将一个包含十亿行的表水平分区成 12 个表,每个小表表示特定年份内一个月的数据。任何需要特定月份数据的查询只需引用相应月份的表。
通常用来水平分割表的条件有:日期时间维度、地区维度等,当然还有更多的业务维度。下面我举几个例子来解说一下
案例1:某个公司销售记录数据量太大了,我们可以对它按月进行水平分割,每个月的销售记录单独成一张表。
案例2:某个集团在各个地区都有分公司,该集团的订单数据表太大了,我们可以按分公司所在的地区进行水平切割。
案例3:某电信公司的话单按日期、地市水平切割后,发现数据量太大,然后他们又按品牌、号码段进行水平切割
水平分割通常在下面的情况下使用:
(1) 表数据量很大,分割后可以降低在查询时需要读的数据和索引的页数,同时也降低了索引的层数,加快了查询速度。
(2) 表中的数据本来就有独立性,例如表中分别记录各个地区的数据或不同时期的数据,特别是有些数据常用,而另外一些数据不常用。
(3) 需要把数据存放到多个介质上。
(4) 需要把历史数据和当前的数据拆分开。
优点:
1:降低在查询时需要读的数据和索引的页数,同时也降低了索引的层数,加快了查询速度。
缺点:
1:水平分割会给应用增加复杂度,它通常在查询时需要多个表名,查询所有数据需要union操作。在许多数据库应用中,这种复杂性会超过它带来的优点,因为只要索引关键字不大,则在索引用于查询时,表中增加两到三倍数据量,查询时也就增加读一个索引层的磁盘次数。
二.垂直分割
什么是垂直分割呢?打个形象的比喻,一个 小公司通过短短几年发展变成了一个跨国大企业,以前的部门架构明显不能满足现在的业务发展,CEO噼里啪啦的把公司分成了财务部、人事部、生产部、销售部 门.....,一下子成立了多个部门,各司其职。这个还算比较形象吧,有木有?呵呵
你垂直分割表(不破坏第三范式),把主码(主键)和一些列放到一个表,然后把主码(主键)和另外的一些列放到另一个表中。将原始表分成多个只包含较少列的表。如果一个表中某些列常用,而另外一些列不常用,则可以采用垂直分割。
优点:
1:垂直分割可以使得行数据变小,一个数据块(Block)就能存放更多的数据,在查询时就会减少I/O次数(每次查询时读取的Block 就少)。
2:垂直分割表可以达到最大化利用Cache的目的。
缺点:
1:表垂直分割后,主码(主键)出现冗余,需要管理冗余列
2:会引起表连接JOIN操作(增加CPU开销)需要从业务上规避
三. 库表散列
表散列与水平分割相似,但没有水平分割那样的明显分割界限,采用Hash算法把数据分散到各个分表中, 这样IO更加均衡。一般来说,我们会按照业务或者功能模块将数据库进行分离,不同的模块对应不同的数据库或者表,再按照一定的策略对某个页面或者功能进行 更小的数据库散列,比如用户表,按照用户ID进行表散列,散列128张表,则应就能够低成本的提升系统的性能并且有很好的扩展性
PowerDesigner概念模型与物理模型相互转换及导出数据字典 原文:PowerDesigner概念模型与物理模型相互转换及导出数据字典 最近公司项目竣工,验收完成后,把整体平台的所有文档都写清楚,找包发给甲方,由于本人是维护数据库工作,依上面要求,必须编写《数据库设计说明书》里面格式包含三个部分:概念模型、物理模型、数据字典;平时我使用PowerDesi...
潇湘隐者 网名潇湘隐者/潇湘剑客、英文名Kerry,兴趣广泛,广泛涉猎,个性随意,不善言辞。执意做一名会写代码的DBA,混迹于IT行业
相关文章
- 【华为云技术分享】直播回顾丨激发数据裂变新动能,HDC.Cloud云数据库前沿技术解读
- java面向对象高级分层实例_数据库操作类
- YourSQLDba将数据库置于紧急模式的原因浅析
- 中断ORACLE数据库关闭进程导致错误案例
- 压缩备份Mysql数据库
- [数据库设计]使用Graphviz画ER图
- 【基于WinForm+Access局域网共享数据库的项目总结】之篇一:WinForm开发总体概述与技术实现
- 专访平安科技数据库技术专家梁海安:数据库运维未来很大一部分工作会被平台或工具代替
- 查看Android手机数据库
- C#操作SQL Server数据库
- 内存数据库
- 〖Python 数据库开发实战 - Python与MySQL交互篇④〗- 数据库连接池技术
- 华为云GaussDB深耕数字化下半场,持续打造数据库根技术
- 【华为云技术分享】云原生数据库三驾马车之TaurusDB
- 【华为云技术分享】华为云文档数据库服务DDS监控告警全新优化
- 技术生态两手抓,打造面向未来的企业级领先数据库
- java数据库连接池技术简单使用
- nodejs 数据库操作,消息的发送和接收,模拟同步
- 【数据库技术】MySQL索引背后的数据结构及算法原理
- MySQL 数据库闪回工具binlog2sql —— 筑梦之路
- LabVIEW如何修复或重置NI MAX数据库文件
- 对表型数据框进行去冗余 phe 表型信息提取 临床信息提取 自建函数提取 种方法数据框里面进行取子集操作,坐标、列名和逻辑判断每列满足某个要求每行满足某个要求按条件筛选数据库dataframe
- 【计算机三级数据库技术】第4章 数据库应用系统功能设计与实现--附思维导图
- Oracle的学习心得和知识总结(二十)|Oracle数据库Real Application Testing之DBMS_SQLTUNE包技术详解
- Oracle的学习心得和知识总结(八)|Oracle数据库PL/SQL语言顺序控制语句之GOTO和NULL语句技术详解
- Oracle的学习心得和知识总结(五)|Oracle数据库 Connect By 技术详解