服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)EMC存儲(chǔ)中數(shù)塊磁盤(pán)組建了一組raid5磁盤(pán)陣列,陣列中有2塊熱備盤(pán);上層采用ZFS文件系統(tǒng),劃分了一個(gè)lun,供sun小機(jī)使用。
服務(wù)器故障&檢測(cè):
存儲(chǔ)在正常運(yùn)行中突然崩潰無(wú)法使用,管理員檢查后發(fā)現(xiàn)raid5陣列中有兩塊磁盤(pán)離線,陣列中有兩塊熱備盤(pán),其中的一塊熱備盤(pán)激活失敗,raid5陣列癱瘓,存儲(chǔ)不可用。
硬件工程師對(duì)raid5陣列中的兩塊離線的磁盤(pán)進(jìn)行物理故障檢測(cè),發(fā)現(xiàn)這2塊離線硬盤(pán)不存在物理故障和壞道。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障存儲(chǔ)中所有磁盤(pán)編號(hào)取出以只讀方式做全盤(pán)鏡像。鏡像完成后將所有磁盤(pán)按照編號(hào)還原到原存儲(chǔ)設(shè)備中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤(pán)數(shù)據(jù)造成二次破壞。
2、鏡像完成后將鏡像數(shù)據(jù)的520字節(jié)扇區(qū)轉(zhuǎn)換為512字節(jié)扇區(qū),方便后續(xù)的數(shù)據(jù)恢復(fù)操作。
3、根據(jù)RAID5磁盤(pán)陣列的工作模式,LUN都是基于RAID的?;謴?fù)數(shù)據(jù)就需要先分析RAID的底層信息,根據(jù)這些信息重構(gòu)原始RAID陣列。數(shù)據(jù)恢復(fù)工程師基于鏡像對(duì)所有磁盤(pán)底層數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)陣列中2塊磁盤(pán)離線,1塊熱備盤(pán)成功激活,另1塊熱備盤(pán)卻沒(méi)有成功激活,數(shù)據(jù)未同步。
繼續(xù)分析數(shù)據(jù)在硬盤(pán)中分布的規(guī)律、RAID條帶的大小、每塊磁盤(pán)的順序等RAID相關(guān)信息。
4、繼續(xù)分析RAID信息,發(fā)現(xiàn)有一塊硬盤(pán)在同一個(gè)條帶上的數(shù)據(jù)和其他硬盤(pán)明顯不一樣,初步判斷此硬盤(pán)最先掉線。數(shù)據(jù)恢復(fù)工程師使用北亞自研RAID校驗(yàn)程序?qū)@個(gè)條帶進(jìn)行校驗(yàn)后,確定最先掉線的硬盤(pán)。
5、通過(guò)分析出來(lái)的RAID信息虛擬重構(gòu)RAID。通過(guò)重構(gòu)出來(lái)的RAID分析lun的分配情況和數(shù)據(jù)塊&導(dǎo)出lun所有數(shù)據(jù)。
6、對(duì)導(dǎo)出的lun做ZFS文件系統(tǒng)解析,但解析時(shí)報(bào)錯(cuò)。數(shù)據(jù)恢復(fù)工程師手動(dòng)檢查文件,發(fā)現(xiàn)部分元文件損壞。
7、北亞企安數(shù)據(jù)恢復(fù)工程師將這些損壞的文件系統(tǒng)元文件進(jìn)行修復(fù)。通過(guò)對(duì)損壞的元文件進(jìn)行分析發(fā)現(xiàn)ZFS正在進(jìn)行IO操作時(shí)存儲(chǔ)癱瘓,部分文件系統(tǒng)元文件沒(méi)有更新或者損壞。對(duì)這些損壞的元文件進(jìn)行人工修復(fù)后,ZFS文件系統(tǒng)就能夠正常解析。
8、對(duì)修復(fù)好的ZFS文件系統(tǒng)做解析,解析所有文件節(jié)點(diǎn)及目錄結(jié)構(gòu)&導(dǎo)出,本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
13文章
9793瀏覽量
87945 -
RAID
+關(guān)注
關(guān)注
0文章
282瀏覽量
36834 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
649瀏覽量
18144 -
磁盤(pán)
+關(guān)注
關(guān)注
1文章
390瀏覽量
25828 -
emc
+關(guān)注
關(guān)注
172文章
4165瀏覽量
186931
發(fā)布評(píng)論請(qǐng)先 登錄
EMC存儲(chǔ)raid5兩塊硬盤(pán)離線的數(shù)據(jù)恢復(fù)方法
【服務(wù)器數(shù)據(jù)恢復(fù)】raid5掉線2塊硬盤(pán)后強(qiáng)制上線失敗的數(shù)據(jù)恢復(fù)案例
【服務(wù)器數(shù)據(jù)恢復(fù)】IBM服務(wù)器5盤(pán)raid5數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)-Linux服務(wù)器RAID5數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)-6盤(pán)RAID5中2塊磁盤(pán)故障離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)raid5故障的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)raid5數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—X3650服務(wù)器raid5磁盤(pán)陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—磁盤(pán)不穩(wěn)定被踢導(dǎo)致raid5陣列崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中雙循環(huán)riad5陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列多塊硬盤(pán)離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤(pán)未完全激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤(pán)未全部成功啟用的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)中RAID5陣列數(shù)據(jù)恢復(fù)案例

評(píng)論