服務器數(shù)據恢復環(huán)境:
某品牌x3850 X5服務器,服務器上有一組由5塊硬盤組建的raid5陣列(包含一塊熱備盤),安裝linux操作系統(tǒng),運行oracle數(shù)據庫。
服務器故障:
服務器上raid5陣列中兩塊硬盤由于未知故障離線,服務器數(shù)據丟失。北亞企安數(shù)據恢復中心安排服務器數(shù)據恢復工程師達到現(xiàn)場對故障服務器進行初檢,發(fā)現(xiàn)raid5陣列中有兩塊硬盤處于離線狀態(tài);熱備盤未激活,經過檢測沒有發(fā)現(xiàn)物理故障,無明顯同步表現(xiàn)。
服務器數(shù)據恢復過程:
1、將故障服務器所有磁盤編號后取出槽位,以只讀方式進行扇區(qū)級全盤鏡像,鏡像后發(fā)現(xiàn)除了2號盤有10-20個壞扇區(qū)外其他硬盤均正常。鏡像完成后將所有磁盤按照編號還原到原服務器中,后續(xù)的數(shù)據分析和數(shù)據恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據造成二次破壞。
2、基于鏡像文件分析所有磁盤底層數(shù)據,獲取raid5陣列的raid結構信息如盤序、條帶大小、塊大小、循環(huán)方向、同異步以及meta區(qū)域等信息。
北亞企安數(shù)據恢復——raid5數(shù)據恢復
3、根據分析獲取的raid信息虛擬重組raid5陣列。組好raid5陣列后驗證數(shù)據,發(fā)現(xiàn)200M以上的最新壓縮包解壓無報錯。按照該raid結構將raid生成到一塊單盤上。將單盤接入原服務器并通過linux SystemRescueCd啟動服務器,使用dd命令進行全盤回寫。
4、數(shù)據回寫完成后無法進入操作系統(tǒng),報錯信息為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。北亞企安數(shù)據恢復工程師通過SystemRescueCd重啟后檢查,發(fā)現(xiàn)文件的權限、時間、大小都有明顯錯誤,對根分區(qū)再次分析,定位出錯的/sbin/pidof/,確定出問題的原因是2號盤有壞道。
5、使用其他盤對2號盤的損壞區(qū)域進行xor補齊并重新校驗文件系統(tǒng),依然有錯誤。北亞企安數(shù)據恢復工程師再次對inode表進行檢查,發(fā)現(xiàn)2號盤損壞區(qū)域有部分節(jié)點表現(xiàn)異常。
北亞企安數(shù)據恢復——raid5數(shù)據恢復
雖然節(jié)點中描述的uid還正常存在,但大小、屬性、最初的分配塊都是錯誤的。通過日志確定原節(jié)點塊的節(jié)點信息并進行修正,重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5/檢測,結果報錯。
北亞企安數(shù)據恢復——raid5數(shù)據恢復
6、經過分析發(fā)現(xiàn),3號盤先離線,節(jié)點信息新舊交集導致有多個節(jié)點共用數(shù)據塊,于是數(shù)據恢復工程師按節(jié)點所屬的文件進行區(qū)別。清除錯誤節(jié)點后,再次執(zhí)行fsck -fn /dev/sda5,依然有部分位于doc目錄下的節(jié)點報錯。由于不影響啟動所以強行修復后重啟系統(tǒng),系統(tǒng)正常,啟動數(shù)據庫正常。
7、由用戶方工程師對服務器數(shù)據進行驗證,數(shù)據正常。
審核編輯 黃宇
-
服務器
+關注
關注
13文章
9791瀏覽量
87920 -
數(shù)據恢復
+關注
關注
10文章
649瀏覽量
18141 -
RAID5
+關注
關注
0文章
131瀏覽量
13055
發(fā)布評論請先 登錄
raid5數(shù)據恢復—raid5陣列熱備盤未完全激活導致崩潰的數(shù)據恢復案例
服務器數(shù)據恢復—Raid5陣列熱備盤上線失敗的數(shù)據恢復案例
服務器數(shù)據恢復—RAID5陣列熱備盤同步數(shù)據失敗的數(shù)據恢復案例

服務器數(shù)據恢復—raid5陣列崩潰導致上層lun無法正常使用的數(shù)據恢復案例

服務器數(shù)據恢復—raid5熱備盤上線過程中又有磁盤離線的數(shù)據恢復案例
服務器數(shù)據恢復—raid硬盤壞道導致服務器操作系統(tǒng)文件錯誤的數(shù)據恢復案例

服務器數(shù)據恢復—硬盤離線導致Raid5陣列熱備盤上線失敗的數(shù)據恢復案例

評論