故障类型:RAID磁盘阵列损坏,数据丢失。
典型特征:1. RAID存储中有多块物理硬盘指示灯报警;
2. RAID管理中显示多块物理硬盘呈离线或丢失状态;
3. RAID信息丢失,所有物理硬盘不再是ONLINE状态;
4. RAID无法进入RAID管理界面或查看RAID相关信息时死机。
恢复方案
检测流程
a 对故障RAID中的所有硬盘进行物理检测,确定每个硬盘的运行状态;
b 查看没有物理故障的硬盘底层数据流,确定属于故障RAID中参与数据存储的物理硬盘(非热备恢复流程
a 将没有物理故障的非热备硬盘完整备份至带有冗余功能的安全存储中,对于存在物理故障的硬盘须先按照相应故障类型的恢复方案进行恢复,并最大程度地将故障硬盘的扇区同样备份至安全存储;
b 对当前已完整备份的所有硬盘镜像进行分析,确定故障RAID的原结构参数(RAID级别、条带块大小、硬盘盘序、数据校验方式等)同时判断故障RAID中各硬盘离线的先后顺序;
c 依次分析所得RAID参数及离线硬盘,在只读环境中构建RAID数据,并对所构建的虚拟RAID进行基本的逻辑校验,确定文件系统大体结构无误后将RAID生成镜像;
d 对备份生成的RAID镜像进行完整的逻辑分析和校验,若镜像内的文件系统仍存在不一致情况,则依据相应文件系统损坏情况的恢复方案进行修复,直至恢复出客户所需数据。
验收流程
a 对已恢复出来的数据做属性、文件数量和容量等方面进行统计,确定是否与数据丢失前的情况吻合;
b 对已恢复出来的阵列数据做完整性验证,确保文件在目录结构及底层逻辑等方面正确无误;
c 对客户指定的关键数据文件进行针对性校验。
恢复的成功率&时间评估
a 若存储为RAID信息损坏的单一故障(文件系统无损坏),则恢复成功率非常高,时间约为1-2天;
b 若存储内文件系统或数据库出现一定损坏,数据恢复工作难度比较高,但恢复成功率也比较高,时间约为2-4天;
c 若对RAID做过强制ONLINE或REBUILD操作,代表存储内的文件系统和数据已受到不同程度的损害,这将影响数据恢复的成功率和完整性,时间需视实际情况而定。
数据安全科普
RAID模块的重要性:RAID是一种将多块物理硬盘整合成一个虚伪存储的技术,相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写,相对于单独的物理硬盘,RAID可以为用户提供更大的独立存储空间、更快的数据读写速度、更高的数据存储安全及更方便的统一管理模式,RAID模块的正常运转是保障RAID存储中数据正常读写的关键所在。
故障出现的可能原因:
a. RAID存储中的硬盘出现物理故障;
b. RAID数据传输通道不畅或数据传输模块老
c. 系统更新、重启或存储意外断电导致RAID信息丢失或RAID模块损坏
d. RAID模块升级或重装系统导致RAID信息丢失或被重新创建
e. 错误插拔RAID存储中的物理硬盘
RAID存储保护提示:
a 发现硬盘物理故障后,切忌反复加电或受磕碰,存储中的每个硬盘对于数据恢复来讲都非常重要,如果重要硬盘出现片盘划伤等严重的物理损坏,数据恢复工作难度变得非常大,且数据的完整度也难以保证;
b 切忌重新创建RAID或把硬盘强行ONLINE/REBUILD,若存储中有提早离线的硬盘或上线同步选择错误,此情况下,数据恢复工作难度很高,数据的完整度也难以保证;
c 切忌非专业人士对故障存储进行恢复操作,特别是不可逆的操作,不当的操作会对存储内的数据造成严重影响,甚至永久性破坏数据。
选择服务商的标准
数据恢复有别于一般维修行业,目前市场鱼龙混杂,不同服务商的技术水平和职业素质千差万别,数据丢失后交由非专业人员进行各种检测与恢复操作造成盘片划伤、数据完全覆盖,最终数据无法恢复的情况常有发生,用户从寻找低价到不惜代价拯救数据的例子比比皆是。因此,恢复重要数据必须寻求专业、正规的数据恢复公司帮助,切勿贪图便宜造成无法挽回的损失。是否专业考量的因素有:
设备,拥有独立的无尘洁净间,保证开盘操作在百级无尘的洁净环境下进行,市场上很多数据恢复公司都表示有无尘洁净室,但事实上能让客户亲眼所见的只是凤毛麟角,寥寥可数。
技术,就像病重的人手术一样,资深数据恢复工程师对硬件和逻辑结构均有丰富经验,能果断准确地判定该如何抢救数据,机会可能只有一次,有时一次的误操作足以让数据返魂乏术。
效率,一般情况下普通故障当天能完成,即使开盘恢复也只1-3天,需要一段时间才能完成的极有可能是中间商,即接单后转给第三方赚取差价,成功率与数据安全毫无保障。