服务器数据恢复环境&故障:
华为某型号服务器,中有一组由24块硬盘组建的raid5阵列,其中一块盘为热备盘。
服务器raid5阵列中一块硬盘离线,热备盘激活后开始同步数据,在同步数据过程中又有一块硬盘离线,服务器数据丢失,上层应用崩溃。
北亚企安数据恢复工程师拿到故障服务器中所有硬盘后进行检测。经过检测,服务器数据恢复工程师发现除了一块硬盘之外,其他硬盘均不存在物理故障。
服务器数据恢复过程:
1、由于该服务器中的控制器磁盘检测策略比较严格,控制器会将不存在物理故障但性能不稳定的硬盘认定为坏盘并踢出raid阵列。故障服务器中掉线的两块盘中有一块盘就是因为读写不稳定掉线。
2、镜像完所有硬盘后,基于镜像文件分析所有硬盘的底层数据(raid阵列的条带大小、数据走向、硬盘顺序、热备盘、数据库的分布规律等),根据分析获取到的raid信息重组raid。
3、在重组raid过程中发现有一块硬盘内的数据被同步破坏,在恢复数据的过程中需要将这块硬盘排除。数据恢复工程师将所有硬盘底层数据进行对比,发现了其中一块硬盘在相同条带上的数据与其他硬盘明显不同。使用北亚企安自主研发的raid校验程序对该硬盘进行条带校验后确认该硬盘已被同步破坏。
4、服务器数据恢复工程师重组raid后,分析lun在raid中的分配情况及数据块map。只要能够的将map完整提取,即可借助北亚企安数据恢复中心自主开发的程序解析并恢复lun数据。
5、北亚企安数据恢复工程师自主编写了文件系统解析程序解析raid内的文件系统,导出数据库文件后移交给数据库数据恢复工程师进行校验和修复。
6、数据库工程师验证数据库文件后发现部分数据库文件及日志文件异常,表空间内存在大量坏块,所有控制文件被破坏,undotbs02丢失、数据库数据恢复工程师对数据库文件进行修复。

7、经过数据库数据恢复工程师的修复和验证,恢复出数据库数据。服务器数据恢复工程师将修复完成的数据库数据导入验证,验证后确认所有数据正常。交由用户方验证,数据完整有效。本次数据恢复工作完成。