服务器数据恢复环境:
昆腾某型号存储,8个存放数据的存储柜+1个存放元数据的存储柜。
元数据存储:8组RAID1阵列+1组RAID10阵列+4个全局热备硬盘。
数据存储:32组RAID5阵列,划分2个存储系统。
服务器故障:
数据存储的1个存储系统中的一组RAID5阵列中有2块硬盘先后出现故障离线,导致该RAID5阵列失效,整个存储系统崩溃不可用。
本案例存储及文件系统架构如下:
注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)
服务器数据恢复过程:
1、将故障RAID5阵列中的所有成员盘编号后从存储柜中取出,经过初步检测都可以正常读取。以只读方式将所有磁盘进行扇区级全盘镜像,在镜像过程中发现故障RAID5阵列中有1块故障硬盘存在大量的坏道区域,无法完成镜像。硬件工程师对故障硬盘进行开盘并更换固件,使用专业工具进行修复后可以继续镜像,但坏道仍然存在。镜像完成后将所有磁盘按照编号还原到原存储柜中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。针对没有故障的RAID阵列,进行存储层面的备份。
部分镜像文件:
2、基于镜像文件分析故障RAID5阵列中所有磁盘的的底层数据,获取到故障RAID的相关信息,利用获取到的raid信息虚拟重组原RAID5阵列,将RAID中的LUN生成镜像文件。通过分析底层数据,确定那块发现大量坏道的硬盘为后离线的硬盘,由于此硬盘存在大量坏道,可能对恢复结果造成影响。
3、登录该昆腾存储的管理界面,获取到StorNext文件系统中与卷相关的一些基本信息。
4、继续分析StorNext文件系统中的Meta卷和Data卷。StorNext文件系统中包含2个Data卷,每一个Data卷都是由多组RAID中的LUN组成的。分析这些LUN获取到这些LUN之间组合的算法规律,北亚企安数据恢复工程师利用得到的算法规律编写程序虚拟重组完整的Data卷。
5、分析Meta卷中的节点信息和目录项信息,分析Meta卷和Data卷之间的对应关系,针对一个Meta卷管理多个Data卷的情况,分析Meta卷到Data卷的索引算法。
文件节点:
目录块:
6、通过上面的分析&研究,获取到了恢复数据所需要的全部信息。北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,然后通过解析目录项和节点获取完整的文件系统目录结构。解析每一个节点中的指针信息,将这些信息记录在数据库中。
文件信息:
北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法提取数据。
7、对提取出来的数据进行随机抽样检测,没有发现问题。将用户方所需要的文件提取到本地后移交数据。
8、数据移交完成后,经过检测后,用户方认可数据恢复结果。虽然有raid5阵列中的一块硬盘存在大量坏道,但核心数据没有被破坏。本次数据恢复工作完成。