服务器数据恢复环境:
emc服务器;
raid5磁盘阵列;
两块热备盘。

故障:
服务器上有两块硬盘出现故障,但是热备盘中只有一块被成功激活,导致了raid阵列瘫痪,服务器的上层应用不可用。管理员联系北亚数据恢复中心进行数据恢复。

北亚数据恢复——ZFS文件系统数据恢复

服务器数据恢复过程:
1、服务器故障检测。首先对两块掉线的硬盘进行物理故障检测,如果发现物理故障,需要对硬盘进行物理修复,然后才能继续下一步数据恢复操作。经过检测,所有硬盘(包括掉线硬盘)不存在物理故障。

2、备份服务器所有硬盘。在数据恢复开始前需要将所有原始硬盘进行镜像备份。服务器硬盘无物理故障可直接备份,由于源磁盘的扇区大小为520字节,因此还需要将所有备份数据做520到512字节的转换。

3、对服务器底层raid组进行数据分析。经过对raid阵列的分析,北亚数据恢复工程师发现原服务器内的两块热备盘内均为空,没有写入任何数据(由此推断:一块热备盘虽然上线,但此时raid组仍然处于缺盘状态,数据并没有开始同步。)。

4、北亚数据恢复工程师依次分析整个raid5阵列上的条带大小,磁盘顺序等基础信息,开始进行raid重组。

5、根据获取到的RAID信息,使用北亚自主开发的RAID虚拟程序将原始的RAID组虚拟出来。但由于整个RAID组中一共掉线两块盘,因此需要搞清楚这两块硬盘掉线的顺序。

6、仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的。通过北亚自主开发的RAID校验程序对这个条带做校验,最终确定最先掉线的硬盘。

7、LUN是基于RAID组的。根据上述分析获取到的信息将RAID组重组出来,然后再分析LUN在RAID组中的分配信息以及LUN分配的数据块MAP。

8、根据获取到的LUN信息,使用北亚自主开发的raid恢复程序解释LUN的数据MAP并导出LUN的所有数据。

9、解释ZFS文件系统并修复。利用ZFS文件系统解释程序对生成的LUN做文件系统解释,发现程序在解释某些文件系统元文件的时候报错。北亚数据恢复工程师立即对程序做debug调试,分析程序报错原因,同时分析ZFS文件系统是否因为版本原因导致程序不支持。经过长达7小时的分析与调试,最终发现ZFS文件系统因存储瘫痪而导致其中某些元文件损坏,从而导致ZFS文件系统解释程序无法正常解释。

10、对损坏的文件系统元文件做修复才能正常解析ZFS文件系统。通过对损坏的元文件分析,北亚数据恢复工程师发现:因当初ZFS文件正在进行IO操作的同时存储瘫痪,导致部分文件系统元文件没有更新或者损坏。北亚数据恢复工程师对这些损坏的元文件进行手工修复,保证ZFS文件系统能够正常解析。

11、对修复后的文件系统进行解析并验证最新数据。经过服务器管理员的亲自验证,确认服务器内所有数据被成功恢复。

更多相关文章

  1. 【北亚服务器数据恢复】raid5硬盘掉线,阵列崩溃,分区不能识别的数
  2. 挂载android只读文件系统为可读写
  3. 【北亚数据恢复】IBM服务器raid5硬盘离线,热备盘未激活导致raid崩
  4. 【北亚数据恢复】IBM DS系列存储服务器硬盘故障、映射出错的数据
  5. android linux 基础知识总结
  6. android linux 最全的基础知识总结
  7. Android根据 uri 获得文件真实路径
  8. 【北亚数据恢复】重装系统后磁盘分区丢失的XFS文件系统服务器数
  9. 【北亚服务器数据恢复】ocfs2被误格式化成为Ext4的ocfs2文件系统

随机推荐

  1. Android Studio 2.0和Android Studio 2.1
  2. Android TextView背景色、圆角、内部填充
  3. android实例
  4. android 如何给图片添加水印
  5. android View的三个构造方法 简单总结
  6. android studio最新sdk更新方法
  7. Android Application - No window title,
  8. android剪切合并MP3音乐
  9. 【Android开发环境安装】
  10. 【066】Android & Java 难点解析