服务器存储故障:
一台EMC某型号存储由于存储中raid5阵列出现故障导致服务器崩溃,由于数据涉密,需要工程师到现场恢复数据。
服务器数据恢复工程师到现场后对数据进行检测,经过检测发现服务器崩溃是由于raid中某些硬盘掉线所导致。将所有磁盘编号后取出,硬件工程师对所有磁盘进行检测后没有发现有硬盘存在物理故障,也没有坏道。数据恢复工程师将所有磁盘以只读方式做扇区级的全盘镜像,镜像完成后将所有磁盘还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
服务器存储数据恢复过程:
1、基于镜像文件分析所有磁盘底层数据,获取重构原始RAID所需要的相关信息(条带大小、条带方向、块大小、硬盘盘序、数据校验方式等)。由于EMC存储上的LUN全部基于RAID,所以要恢复EMC存储上的数据首先需要重组原始RAID。服务器数据恢复工程师根据获取到的raid相关信息重构raid,然后对raid进行分析发现有两块硬盘离线。raid中2块硬盘离线只有一块热备盘启用替换了掉线的一块硬盘,另外一块热备盘由于未知原因未启用,RAID5磁盘阵列中仍然缺失一块硬盘,数据没有同步到激活的热备盘中。
2、分析LUN在RAID中的分配信息,以及LUN分配的数据块MAP,根据这些信息使用北亚企安自主开发程序解释LUN的数据MAP并导出LUN的所有数据。
3、使用使用北亚企安自主开发的ZFS文件系统解释程序对生成的LUN做文件系统解释,解析所有文件节点及目录结构。
部分文件目录截图:
4、由用户方管理员对恢复出来的数据进行验证,经过用户方仔细验证,确认恢复出来的数据完整可用,本次服务器存储数据恢复工作完成。
部分文件验证如下: