服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
IBM某型號服務(wù)器,5個(gè)SAS硬盤組建RAID5(4個(gè)數(shù)據(jù)盤,1個(gè)熱備盤);
linux redhat操作系統(tǒng);
上層應(yīng)用為oa,數(shù)據(jù)庫為oracle;oracle已經(jīng)不對本案例中的oa提供后續(xù)支持。
服務(wù)器故障&初檢&恢復(fù)方案:
RAID5中有一塊盤離線,但熱備盤由于未知原因未被激活rebuild,直到另外一塊盤離線導(dǎo)致RAID崩潰。用戶聯(lián)系我們數(shù)據(jù)恢復(fù)中心要求恢復(fù)數(shù)據(jù)和操作系統(tǒng)。
經(jīng)過數(shù)據(jù)恢復(fù)工程師檢測,發(fā)現(xiàn)熱備盤完全沒有啟用,沒有發(fā)現(xiàn)有物理故障,也沒有同步的表現(xiàn)。
經(jīng)過北亞數(shù)據(jù)恢復(fù)工程師團(tuán)隊(duì)會診,確定最終的數(shù)據(jù)恢復(fù)方案:
1、關(guān)閉服務(wù)器,將硬盤標(biāo)好序號取出。
2、將硬盤掛載到只讀環(huán)境對所有硬盤做鏡像備份。后續(xù)的數(shù)據(jù)恢復(fù)操作都在鏡像文件上進(jìn)行,避免對原始數(shù)據(jù)造成二次破壞。
3、基于鏡像文件分析故障RAID5的結(jié)構(gòu),獲取RAID級別、條帶規(guī)則、條帶大小、校驗(yàn)方向、META區(qū)域等RAID信息。
4、根據(jù)獲取到的RAID信息搭建虛擬的RAID5環(huán)境。
5、解釋虛擬磁盤及文件系統(tǒng)。
6、檢測虛擬結(jié)構(gòu)是否正確,如不正確,重復(fù)3-5步驟。
7、最終確定數(shù)據(jù)沒有問題后按照用戶要求回遷數(shù)據(jù)。如果仍然使用原盤,需確定已經(jīng)完全對原盤做過備份之后再重建RAID,然后做回遷??梢允褂胠inux livecd回遷操作系統(tǒng),也可以在故障服務(wù)器上用另外的硬盤安裝一個(gè)回遷用的操作系統(tǒng),再進(jìn)行扇區(qū)級別的回遷。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、對故障服務(wù)器中所有硬盤進(jìn)行完整鏡像,鏡像過程中發(fā)現(xiàn)后掉線的那個(gè)硬盤有10-20個(gè)壞扇區(qū),其余磁盤均沒有發(fā)現(xiàn)壞道。
2、分析RAID得到RAID最佳結(jié)構(gòu)、塊大小、校驗(yàn)方向等RAID信息,如下圖:
北亞數(shù)據(jù)恢復(fù)——RAID5數(shù)據(jù)恢復(fù)
3、根據(jù)第2步獲取到的信息虛擬重建RAID后進(jìn)行數(shù)據(jù)驗(yàn)證,200M以上的壓縮包解壓無報(bào)錯(cuò),確定結(jié)構(gòu)正確。
4、直接按此結(jié)構(gòu)生成虛擬RAID到一塊單硬盤上,打開文件系統(tǒng)無明顯報(bào)錯(cuò)。
5、確定備份包安全的前提下經(jīng)用戶同意后利用原盤重建RAID,重建時(shí)已經(jīng)用全新硬盤更換那塊后掉線的已經(jīng)損壞的硬盤。將恢復(fù)好的單盤用USB方式接入故障服務(wù)器,用linux SystemRescueCd啟動(dòng)故障服務(wù)器。
6、通過dd命令進(jìn)行全盤回寫,啟動(dòng)操作系統(tǒng)。
7、dd所有數(shù)據(jù)后,啟動(dòng)操作系統(tǒng)但是無法進(jìn)入,報(bào)錯(cuò):/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。數(shù)據(jù)恢復(fù)工程師懷疑此文件權(quán)限有問題,使用SystemRescueCd重啟后檢查,結(jié)果發(fā)現(xiàn)此文件時(shí)間、權(quán)限、大小均有明顯錯(cuò)誤,這意味著節(jié)點(diǎn)損壞。
8、重新分析重組數(shù)據(jù)中的根分區(qū),定位出錯(cuò)的/sbin/pidof,發(fā)現(xiàn)問題是后掉線的那塊硬盤壞道所引起的。
9、使用其他完好的3個(gè)數(shù)據(jù)盤對后掉線硬盤的損壞區(qū)域進(jìn)行xor補(bǔ)齊。補(bǔ)齊后重新校驗(yàn)文件系統(tǒng)依然報(bào)錯(cuò)誤,再次檢查inode表,發(fā)現(xiàn)后掉線硬盤損壞區(qū)域有部分節(jié)點(diǎn)表現(xiàn)為(下圖中55 55 55部分):
北亞數(shù)據(jù)恢復(fù)——RAID5數(shù)據(jù)恢復(fù)
很明顯,雖然節(jié)點(diǎn)中描述的uid還正常存在,但屬性、大小、最初的分配塊全部是錯(cuò)誤的。確定無法找回此損壞節(jié)點(diǎn)后只能修復(fù)此節(jié)點(diǎn),或復(fù)制一個(gè)相同的文件過來。
10、對所有可能有錯(cuò)的文件通過日志確定原節(jié)點(diǎn)塊的節(jié)點(diǎn)信息,然后由北亞數(shù)據(jù)恢復(fù)工程師修正。
11、修正后重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5命令進(jìn)行檢測,依然報(bào)錯(cuò),如下圖:
北亞數(shù)據(jù)恢復(fù)——RAID5數(shù)據(jù)恢復(fù)
12、根據(jù)報(bào)錯(cuò)提示,在系統(tǒng)中發(fā)現(xiàn)有多個(gè)節(jié)點(diǎn)共用同樣的數(shù)據(jù)塊。通過底層分析發(fā)現(xiàn)存在節(jié)點(diǎn)信息的新舊交集問題。
13、按節(jié)點(diǎn)所屬的文件進(jìn)行區(qū)別,清除錯(cuò)誤節(jié)點(diǎn)后執(zhí)行fsck -fn /dev/sda5,依然有報(bào)錯(cuò)但已經(jīng)很少。根據(jù)錯(cuò)誤提示發(fā)現(xiàn)這些節(jié)點(diǎn)多位于doc目錄下,不影響系統(tǒng)啟動(dòng),于是直接使用fsck -fy /dev/sda5命令強(qiáng)行修復(fù)。修復(fù)后重啟系統(tǒng),成功進(jìn)入系統(tǒng)桌面。
14、啟動(dòng)oracle數(shù)據(jù)庫服務(wù)和OA應(yīng)用軟件,一切正常無報(bào)錯(cuò)。
15、讓用戶親自對恢復(fù)出來的數(shù)據(jù)和操作系統(tǒng)進(jìn)行檢測,確定沒有問題,本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯:湯梓紅
-
Linux
+關(guān)注
關(guān)注
87文章
11512瀏覽量
213901 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
9797瀏覽量
88033 -
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
7154瀏覽量
125646 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
650瀏覽量
18164
發(fā)布評論請先 登錄
服務(wù)器數(shù)據(jù)恢復(fù)-Linux服務(wù)器RAID5數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤未激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

【服務(wù)器數(shù)據(jù)恢復(fù)】Raid5硬盤離線導(dǎo)致熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲raid5數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤離線且熱備盤未激活的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤同步過程中硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未完全激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列熱備盤同步數(shù)據(jù)失敗的數(shù)據(jù)恢復(fù)案例

raid5數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未完全激活導(dǎo)致崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列多塊硬盤離線導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)

評論