深入内核:从Oracle ASM自动备份头块到ASMFD
张乐奕
云和恩墨副总经理 Oracle ACE 总监
ITPUB Oracle数据库管理版版主、Oracle高可用版版主、ACOUG联合创始人
在 Oracle 10.2.0.5 之前,ASM 磁盘的头块并没有自己的备份,因此一旦头块损坏,如果没有以前 kfed read 备份出来的信息,也就没有办法使用 kfed merge来作头块恢复,特别是如果一个磁盘组中所有的磁盘头块都出现问题(比如被人为地创建了 PV ),恢复 ASM 磁盘头块的操作就会非常麻烦。
但是从 Oracle 10.2.0.5 之后,ASM 磁盘的头块会自动备份在另外一个块中,这实际上是 Oracle 11g 出现的功能,不过经过测试,在 Oracle 10.2.0.5 版本中,这个备份也是存在的。
正是因为存在这个备份,所以 Oracle 10.2.0.5 之后的 kfed 程序才有了新的 repair 命令,该命令将备份块直接覆盖到磁盘头块,完成修复工作。
在 Oracle 10.2.0.4 中,如果尝试执行 kfed repair ,则会报错说命令行参数不正确,此报错说明并不存在 repair 命令:
但是在 Oracle 10.2.0.5 中,执行 kfed repair ,则会说无法打开文件空,而这正说明 repair 命令是存在的,报错是因为还需要明确指定要修复哪块磁盘:
那么这个备份块具体存在哪里呢?在 Solaris 下的测试,我们使用truss来进行跟踪。
在 trace 文件中,找到下面这段,可以明确地看到 kfed 程序从第 510 个块中读出 4096 字节,然后再写回到第 0 个块中。
同样如果是在 Linux 下用裸设备作为 ASM 磁盘,并且用 strace 进行 repair 命令的跟踪,也可以得到类似结果。
那么通过 kfed 命令再来验证一下这两个块是否都标志为头块。验证结果表示块类型都为 DISKHEAD 。
那么下一个疑问是,在 11gR2 以后,ASM 磁盘组的 AU Size 可以指定不同的大小,是不是不同的 AU Size 下的磁盘头块备份都是在第 510个 块呢?还是用 truss 来跟踪一下,这里的 vdisk3 属于一个 AU Size=8M 的磁盘组,此时repair命令需要明确指定 aus,否则会报 KFED-00320 错误。
在 trace 文件中,可以发现已经不再是去读第 510 个块,而是改为读第 4094 个块。
用 kfed 验证第 4094 个块,确实标志为 DISKHEAD。
那么也就是 AU 1M 的磁盘组头块备份在第 510 个块上,而 AU 8M 的磁盘组头块备份在第 4094 个块上,备份块的存储位置有规律吗?有的,始终保存在第 2个AU 的倒数第 2 个块上。下面来验证这个观点。
对于默认的磁盘组, AU Size=1M ,每个 AU 中可以存储 256 个块,块号为 0-255 。第 1 个 AU 存储 256 个块,第 2 个 AU 最后 1 个块号为 255,倒数第 2 个块号是 254,也就是整体的第 510 个块(从第 1 个 AU 的第 1 个块往后算起)。
对于 AU Size=8M 的磁盘组,每个 AU 可以存储 2048 个块,块号为 0-2047 。第 1 个 AU 存储 2048 个块,第 2 个 AU 最后 1 个块号为 2047 ,倒数第 2 个块号是 2046 ,也就是整体的第 4094 个块(从第 1 个 AU 的第 1 个块往后算起)。
对于其它 AU Size 磁盘组的验证,看到文章的朋友有兴趣可以自己做一下。
结论:
从 Oracle 10.2.0.5 开始, ASM 磁盘已经开始自动将头块进行备份,备份块的位置在第 2 个 AU 的倒数第 2 个块上(对于默认 1M 的 AU 来说,是第 510 个块),如果头块损坏,可以用 kfed repair 命令来修复。因此对于选用 ASM 存储作为生产环境的用户来说,尽快升级到 10.2.0.5 是明智的选择。
在 Oracle 12c 中,Oracle更是推出了 ASMFD 新特性,防止ASM磁盘收到意外的伤害,具体请参考文章:Oracle 12c ASM 防火防盗新特性揭秘 。
本文出自数据和云公众号,原文链接
Oracle 11g R2 RAC with ASM存储迁移--Rman copy&ASM REBALANCE by acdante Oracle 11g R2 RAC with ASM存储迁移 -----Rman copy&ASM REBALANCE VMware版本:VMware12pro 主机操作系统:RHEL6.5_64 共享存储使用VMWARE创建共享磁盘文件 数据库版本:Oracle11gR2 11.2.0.4.0_RAC Oracle数据库文件部署在ASM磁盘组上,需要在不停机或者尽量短的停机时间完成存储迁移。
相关文章
- SQLServer中 IsNull,Oracle中Nvl 对空字符,NULL值比较的区别
- Oracle数据库:oracle数据表格dmp,sql,pde格式导入与导出,视图、序列、索引等对象的导出,oracle完结,后续开启mysql的学习
- Oracle数据库:oracle嵌套分组函数(聚合函数),组函数的练习题,挺复杂的,用好decode函数,很有趣
- Oracle数据库:oracle组函数,聚合函数,多行函数,avg,sum,min,max,count,group by,having
- Oracle数据库:oracle外连接left/right/full outer join on,oracle扩展的左右外连接展示符号(+)
- Oracle数据库:条件表达式case when then else end,decode函数,oracle单行函数练习示例
- Oracle数据库:oracle函数嵌套,nvl函数,nvl2函数,nullif函数,coalesce合并函数
- Oracle数据库:sql语言结构,数据查询语言DQL,select * from table;算术,别名,连接,去重等操作
- Oracle数据库:oracle字符类型、数字类型、创建表表名的命名规则
- Oracle数据库:oracle启动,oracle客户端工具plsql安装教程和使用方法
- Oracle数据库:啥是oracle数据库?你为啥要学oracle?
- 扒一扒Oracle数据库迁移中的各种坑
- In Memory—Oracle 12C重要新特性IMO详解
- 基于Oracle plsql的多线程编程架构 (附存储过程)
- oracle恢复broken的job,Oracle JOB异常中断原因分析
- oracle 列的归档,Oracle 开启或关闭归档模式
- oracle中的类似BIN$MrkCYT9eTTK+0sStMwn7+Q==$0的表的作用
- Oracle 安装时候的网络相关内核参数
- oracle收缩数据文件大小
- 如何解析oracle执行计划
- Oracle-未能加载文件或程序集“oracle.dataaccess”或它的某一个依赖项。试图加载格式不正确的程序。
- ORA-01034: ORACLE not available问题
- oracle用UNION替换OR (适用于索引列)
- oracle函数 BFILENAME(dir,file)
- Red Hat 6安装Oracle Linux内核头文件
- oracle的sequece的使用(主键自增长)
- Step2:配置Oracle Dataguard
- 【ORACLE】spfile失落的处理
- oracle常规任务
- linux中安装cx_Oracle
- Oracle的层次查询(oracle树查询)
- Oracle密码过期怎么办
- Oracle 基础系列之1.1 oracle的安装
- Mybatis+Oracle搭配insert空值报错之myBatis+mysql驱动+oracle驱动的源码分析
- MyBatis+Oracle时出现的错误: Method oracle/jdbc/driver/OracleResultSetImpl.isClosed()Z is abstract