systemx3650 m5 raid 1 两块硬盘掉线故障回顾
早晨突然发现业务异常无法正常访问,检查发现服务器网络无法访问,机房查看服务器出现以下告警,并且硬盘盘位1 、2 亮黄灯(两块硬盘为raid 1,生产数据无备份!!!)
The following VDs are missing:000 If you proceed (or load the configuration utility ),these VDs will be removed from your configuration. If you wish to use them at a later time,they will have to be imported . If
you belive these VDs should be present ,please power off your system and check your cables to ensure all disks are present. Press any key to continue,or 'C' to load the configuration utility .
Enter Your Input Here:
重启服务器后,仍然无法进入系统,识别不到硬盘
远程登录BMC 查看系统报错日志
BMC 管理地址
默认地址:192.168.70.125
默认用户/密码:USERID/PASSW0RD
BMC 硬盘报错如下:
The Drive 0 has been disabled due to a detected fault
目前大多数控制器的实现是将RAID信息同时记录在控制器与硬盘上,这样当两者中有一出故障,可通过另一份COPY还原。同时可对RAID信息的正确性进行校验,通过控制器上存储的RAID信息为主信息,当RAID里的信息与硬盘里的信息不相同时,需要手工进行判断处理(比如强制上线)。此类情况更换硬盘盘位后,要么自动调整过来,不影响数据,要么需要手工确认一下。只要正确操作,便不会有数据灾难。
修复步骤
由于现场条件有限,没有拍照记录,参考官方文档介绍修复思路
开机后,注意引导界面,按F1键进入BIOS进行设置
进入BIOS后,选择system setting--storage ,进入磁盘阵列配置界面,可以看到M5210阵列卡
一、Lenovo logo机型进入SAS RAID配置界面
启动服务器,在出现Lenovo System x logo的时候按F1键进入UEFI Setup界面;
进入"System Settings";
再进入"Storage";
会出现SAS RAID卡配置项,如下图中的"ServeRAID M5210";
接下来即进入UEFI HII SAS RAID阵列配置界面,下图为Dashboard界面;
旧版本SAS RAID卡固件没有Dashboard界面,会直接进入Main Menu界面;
"Configuration Management"是配置RAID设置
"Controller Management"是对SAS RAID控制器进行设置
"Virtual Drive Management"是查看、调整RAID设置
"Drive Management"是查看、调整硬盘设置
"Hardware Components"是查看、调整RAID卡部件设置
十一、修复掉线的硬盘
本节介绍修复如在服务器运行中因误拔插所致的单一硬盘掉线的操作。
硬盘掉线会在硬盘托架上亮黄灯(不论是正常硬盘因误插拔掉线还是硬盘故障),此时对于非RAID0阵列则会处于"Degrade"状态或者"Partial Degrade"状态。
注意:如果二个及以上的硬盘掉线,导致阵列已经处于"Offline"状态,意味着阵列已崩溃。建议寻求专业数据恢复进行修复,仅当数据没有重要性时可参考本节内容进行操作。
进入"Drive Management"查看,被误插拔的硬盘状态是"Unconfigured Bad"。进入此硬盘。
在"Operation"中选择"Make Unconfigured Good"将此硬盘重置为可用状态。
然后在下一行出现的"Go"上按回车键,"OK"确认。
返回阵列卡配置主界面,再进入"Drive Management",查看此硬盘变为"(Foreign), Unconfigured Good"状态。原因是此硬盘带有了与本机已有阵列不匹配的信息,需要进一步操作。
返回阵列卡配置主界面,进入"Configuration Management",再进入"Manage Foreign Configuration"。
选择"Preview Foreign Configuration"查看并确认信息再进行导入。
确认掉线硬盘中的信息与现有阵列的信息一致,然后选择"Import Foreign Configuration"导入,并确认操作。
再次返回"Drive Management"查看,此硬盘就会处于"Rebuilding"状态进行修复了,修复时间会根据硬盘容量、性能及业务负载等情况不同而有较大差异。
至此,硬盘修复上线,系统正常启动,业务恢复访问,数据无价 谨慎备份!!!
相关文章
- 金融服务领域的大数据:即时分析
- 影响大数据、机器学习和人工智能未来发展的8个因素
- 从0开始构建一个属于你自己的PHP框架
- 如何将Hadoop集成到工作流程中?这6个优秀实践必看
- SEO公司使用大数据优化其模型的5种方法
- 关于Web Workers你需要了解的七件事
- 深入理解HTTPS原理、过程与实践
- 增强分析:数据和分析的未来
- PHP协程实现过程详解
- AI专家:大数据知识图谱——实战经验总结
- 关于PHP的错误机制总结
- 利用数据分析量化协同过滤算法的两大常见难题
- 怎么做大数据工作流调度系统?大厂架构师一语点破!
- 2019大数据处理必备的十大工具,从Linux到架构师必修
- OpenCV中的KMeans算法介绍与应用
- 教大家如果搭建一套phpstorm+wamp+xdebug调试PHP的环境
- CentOS下三种PHP拓展安装方法
- Go语言HTTP Server源码分析
- Go语言HTTP Server源码分析
- 2017年4月编程语言排行榜:Hack首次进入前五十