这台服务器是由四块2.5寸希捷1TB SAS盘组的RAID5阵列,硬盘型号是ST91000640SS,有两块盘损坏亮黄灯报警离线,其中0号盘是fail状态,三号盘是offline状态。经过检测,两块故障盘在数据恢复设备里可以直接读取,但都有大量坏块,我们先通过设备尽可能完整的把镜像做出来,然后跟其他两块好盘的镜像一起分析条带大小、走向等参数虚拟重组。
经过分析,这是一个RAID5,左同步,块大小为512的结构,用户一共分了三个区。在最开始的虚拟重组中,第一分区正常,但第二、第三分区展开是乱码状态,MFT及数据区都是错乱的,数据打不开,刚开始以为是被错误的上线了老硬盘,被rebuild同步破坏掉了。
又跟客户沟通磁盘阵列出问题后具体做过什么,客户最开始表示是按着网上的文章做过一些操作,重装过系统,当时我们感觉不乐观,数据应该是被破坏了。后来又联系反馈说当时是想重装系统,但没有成功,没有看到正常分区。于是我们又进一步的分析,最后发现是扇区有偏移导致,我们调整相关参数,第二第三分区正常显示,数据也完整的恢复了出来。
后期在做数据校验时,发现这台服务器的0号盘在几年前就损坏离线了,但由于RAID5支持单盘离线,不影响使用,所以估计没在意,直到三号盘损坏离线后,RAID5就彻底崩溃了,这个故障案例很典型,非常常见,这种情况只要后期不做误操作,数据基本都能恢复,成功率非常高。