99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Raid磁盤陣列故障類型和原因分析

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2023-04-21 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于raid的特點(diǎn)和優(yōu)勢,磁盤陣列技術(shù)被廣泛應(yīng)用于服務(wù)器和存儲(chǔ)等商用領(lǐng)域。由于用戶基數(shù)大,出現(xiàn)故障的情況也不少。通過這篇文章介紹一下常見的raid磁盤陣列數(shù)故障類型和原因。

故障類型一、磁盤陣列處于降級狀態(tài)時(shí)未及時(shí)rebuild。

RAID磁盤陣列的數(shù)據(jù)安全冗余是利用部分空余空間實(shí)現(xiàn)的,陣列中有成員盤下線便無法繼續(xù)提供冗余空間。如果此時(shí)未能及時(shí)更換新磁盤并rebuild整個(gè)卷,一旦raid中有其他成員盤離線將會(huì)導(dǎo)致整個(gè)raid卷無法工作。這類故障是北亞企安數(shù)據(jù)恢復(fù)工作中會(huì)經(jīng)常遇到case。

故障類型二、raid控制器故障。

磁盤陣列控制器在充當(dāng)著操作系統(tǒng)與物理硬盤之間的連接紐帶。磁盤陣列中的硬盤數(shù)量、容量大小、raid級別、校驗(yàn)方式等raid信息有的存儲(chǔ)于硬盤,有的存儲(chǔ)于陣列卡或者在二者中都有存儲(chǔ)。如果控制器出現(xiàn)故障,raid信息就無法還原,如果出現(xiàn)這種故障,即使能夠還原raid結(jié)構(gòu)并再次重建raid陣列也無法恢復(fù)數(shù)據(jù)。

故障類型三、固件算法缺陷。

RAID的創(chuàng)建、重建、降級、保護(hù)等功能的實(shí)現(xiàn)依靠的raid固件上的一套非常復(fù)雜的算法,任何復(fù)雜的算法都會(huì)有BUG,盡管廠商不會(huì)輕易承認(rèn)自家產(chǎn)品固件算法的BUG(有可能自己也不知道)。因?yàn)楣碳惴˙UG,發(fā)生無法解釋的故障可能性肯定是有的。比如在北亞企安接到的數(shù)據(jù)恢復(fù)case中就遇到過早期生產(chǎn)的某品牌服務(wù)器RAID中一塊盤OFFLINE后,故障盤與報(bào)警燈不一致的情況。用戶在更換故障盤進(jìn)行REBUILD時(shí)被誤導(dǎo)拔錯(cuò)盤,導(dǎo)致整個(gè)RAID崩潰。

故障類型四、IO通道受阻導(dǎo)致RAID掉盤。

RAID控制器在設(shè)計(jì)時(shí)候優(yōu)先考慮的是數(shù)據(jù)的安全性,RAID會(huì)盡可能避免將數(shù)據(jù)寫到不穩(wěn)定的存儲(chǔ)介質(zhì)上。當(dāng)控制器與物理盤進(jìn)行IO時(shí),如果時(shí)間超過某個(gè)閾值或校驗(yàn)關(guān)系不滿足,RAID控制器便會(huì)認(rèn)為對應(yīng)的存儲(chǔ)介質(zhì)已不具備持續(xù)穩(wěn)定工作的能力并讓其強(qiáng)制下線,然后通知管理員盡快解決問題。這種設(shè)計(jì)的初衷從技術(shù)上和邏輯上來看沒有問題,但對于如物理連接線路松動(dòng),硬盤工作反應(yīng)超時(shí)(硬盤還是完好的)等場景來說,控制器無法分辨存儲(chǔ)介質(zhì)是否真的出現(xiàn)物理故障,這種情況下會(huì)大概率強(qiáng)制磁盤下線。這類故障發(fā)生概率比較高且無法避免,很多用戶因此類故障質(zhì)疑服務(wù)器廠商。實(shí)際上。越是設(shè)計(jì)安全的RAID控制器,越容易發(fā)生此類故障。

故障類型五、控制器的穩(wěn)定性。

RAID的控制器在ONLINE狀態(tài)下(無離線盤)工作是最穩(wěn)定的。當(dāng)部分硬盤(物理故障或者邏輯故障)離線后控制器便會(huì)工作在一個(gè)相對不穩(wěn)定的狀態(tài),這也是好多中低端的RAID控制器在有磁盤離線后就表現(xiàn)出讀寫性能下降的原因。控制器的不穩(wěn)定會(huì)增加數(shù)據(jù)吞吐時(shí)IO滯留的可能性,從而導(dǎo)致上述第四個(gè)類型的故障的發(fā)生。中低端的控制器(無高性能處理芯片或者大容量高速緩存)發(fā)生這類故障的概率要高得多。

故障類型六、陣列中硬盤故障。

很多人認(rèn)為磁盤陣列只要在正常工作,陣列中就不會(huì)存在有物理故障的硬盤。這個(gè)觀點(diǎn)的判斷依據(jù)是一旦raid中有硬盤出現(xiàn)物理故障,陣列控制器就會(huì)將故障硬盤踢下線。然而實(shí)際上并非如此。

RAID很少會(huì)讀取到物理硬盤的所有磁盤空間,同一時(shí)間更是不可能。部分情況下,硬盤會(huì)在RAID沒有讀取到的區(qū)域或者RAID以前讀取過的區(qū)域出現(xiàn)壞道,這類壞道因?yàn)闆]有被RAID讀過,所以在控制器來看還是好的。

出現(xiàn)這種情況后可能會(huì)產(chǎn)生的直接后果就是在REBUILD過程中,當(dāng)一塊物理硬盤離線后,在進(jìn)行REBUILD過程中,如果其他硬盤存在這類沒有被RAID讀取到的壞道,由于REBUILD是對全盤做全面同步,在REBUILD過程中就一定會(huì)讀寫到這類之前沒有被RAID讀取到的壞道。這時(shí)REBUILD還沒完成,新盤無法上線,又在舊盤發(fā)現(xiàn)了壞道,RAID極有可能將發(fā)現(xiàn)壞道的舊盤踢出,這樣就會(huì)導(dǎo)致RAID故障。

故障類型七、人為誤操作。

人為誤操作導(dǎo)致的RAID故障,例如:誤拔了RAID里的硬盤、更換壞盤不及時(shí)、拔出硬盤更換或者進(jìn)行其他操作后忘記硬盤在RAID中的順序、不小心刪除了原RAID配置等。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9793

    瀏覽量

    87947
  • RAID
    +關(guān)注

    關(guān)注

    0

    文章

    282

    瀏覽量

    36835
  • 磁盤
    +關(guān)注

    關(guān)注

    1

    文章

    390

    瀏覽量

    25828
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    raid5數(shù)據(jù)恢復(fù)—Raid陣列重建后如何恢復(fù)原陣列的數(shù)據(jù)?

    raid5陣列數(shù)據(jù)恢復(fù)環(huán)境&故障: 一臺(tái)服務(wù)器上有一組raid5磁盤陣列,該raid5
    的頭像 發(fā)表于 07-10 12:27 ?90次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)raid5磁盤陣列數(shù)據(jù)恢復(fù)案例

    一臺(tái)服務(wù)器上共有10塊硬盤,其中的7塊硬盤組建了一組raid5磁盤陣列,另外3塊硬盤是沒有拔掉的掉線磁盤。 服務(wù)器raid5陣列中硬盤出現(xiàn)
    的頭像 發(fā)表于 04-23 14:30 ?227次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—raid6陣列硬盤故障導(dǎo)致上層分區(qū)丟失的數(shù)據(jù)恢復(fù)案例

    一臺(tái)由16塊硬盤組成的raid6磁盤陣列。磁盤陣列中有一塊硬盤因?yàn)槲锢?b class='flag-5'>故障掉線,導(dǎo)致服務(wù)器上層虛擬機(jī)無法正常使用,部分分區(qū)丟失,重啟物理服務(wù)器后發(fā)現(xiàn)數(shù)據(jù)丟失。
    的頭像 發(fā)表于 04-02 10:15 ?254次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某公司一臺(tái)存儲(chǔ)上有一組由15塊硬盤組建的raid5陣列。raid5陣列上層是一個(gè)xfs裸分區(qū),起始位置是0扇區(qū)。 服務(wù)器
    的頭像 發(fā)表于 03-26 15:17 ?283次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—nas中硬盤離線導(dǎo)致raid6陣列崩潰的數(shù)據(jù)恢復(fù)案例

    一臺(tái)nas上共有14塊硬盤組建了一組raid6磁盤陣列。 該nas在工作過程中,raid6陣列中硬盤出現(xiàn)故障離線,導(dǎo)致
    的頭像 發(fā)表于 01-07 13:13 ?491次閱讀

    RAID 5 磁盤陣列的組成

    和奇偶校驗(yàn)信息來提高性能和容錯(cuò)能力。 RAID 5的基本概念 RAID 5是一種基于奇偶校驗(yàn)的RAID級別,它將數(shù)據(jù)和奇偶校驗(yàn)信息分布在多個(gè)磁盤上。這種分布方式允許
    的頭像 發(fā)表于 12-27 17:06 ?1332次閱讀

    什么是raid磁盤冗余陣列

    什么是raid 磁盤冗余陣列 這是由多塊獨(dú)立磁盤(多為硬盤)組合的一個(gè)超大容量磁盤組。 ? 大白話的解釋
    的頭像 發(fā)表于 12-16 16:41 ?919次閱讀
    什么是<b class='flag-5'>raid</b><b class='flag-5'>磁盤</b>冗余<b class='flag-5'>陣列</b>

    raid 硬盤陣列優(yōu)缺點(diǎn)

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)是一種將多個(gè)硬盤驅(qū)動(dòng)器組合成一個(gè)邏輯單元的數(shù)據(jù)存儲(chǔ)虛擬化技術(shù)。它通過不同的配置來提供數(shù)據(jù)冗余
    的頭像 發(fā)表于 11-12 09:33 ?2052次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—用5盤RAID5陣列中的4塊盤重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)?

    。工作一段時(shí)間后,服務(wù)器出現(xiàn)故障,用戶方請人維修。維修人員在沒有了解故障磁盤陣列環(huán)境的情況下,用另外4塊硬盤(除去掉線的硬盤)重新創(chuàng)建了一組全新的RAID5
    的頭像 發(fā)表于 10-30 15:07 ?673次閱讀

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)存儲(chǔ)上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)盤+1塊熱備盤)組建的RAID5磁盤陣列,F(xiàn)reeBSD操作系統(tǒng)+zfs文件系統(tǒng)。 RAID5
    的頭像 發(fā)表于 10-22 15:48 ?772次閱讀
    <b class='flag-5'>RAID</b>5數(shù)據(jù)恢復(fù)—如何重組<b class='flag-5'>RAID</b>5<b class='flag-5'>陣列</b>?

    云存儲(chǔ)服務(wù)器與磁盤陣列有何區(qū)別?

    通過互聯(lián)網(wǎng)訪問和存儲(chǔ)數(shù)據(jù)。云存儲(chǔ)服務(wù)通常由第三方服務(wù)提供商管理,數(shù)據(jù)存儲(chǔ)在遠(yuǎn)程服務(wù)器上,用戶可以通過各種設(shè)備訪問。 磁盤陣列RAID):是一種將多個(gè)磁盤驅(qū)動(dòng)器組合成一個(gè)邏輯單元的數(shù)據(jù)存儲(chǔ)虛擬化技術(shù)。它通常用于提高性
    的頭像 發(fā)表于 10-10 14:03 ?1375次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有兩組分別由4塊SAS硬盤組建的raid5磁盤陣列,兩組raid5陣列劃分LUN,組成LVM結(jié)構(gòu),格
    的頭像 發(fā)表于 09-19 11:01 ?529次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—<b class='flag-5'>raid</b>5<b class='flag-5'>陣列</b>熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)RAID5陣列崩潰,數(shù)據(jù)如何恢復(fù)?

    拔掉)。整個(gè)RAID5陣列的存儲(chǔ)空間劃分了一個(gè)LUN。 服務(wù)器存儲(chǔ)故障: 硬盤出現(xiàn)故障導(dǎo)致存儲(chǔ)中陣列癱瘓。 和管理員溝通,據(jù)管理員說是
    的頭像 發(fā)表于 09-02 11:35 ?704次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    塊熱備盤啟用替換掉其中一塊離線盤,另外1塊熱備盤未成功啟用,raid5陣列崩潰,存儲(chǔ)不可用。 磁盤陣列中硬盤離線的原因通常是磁盤存在物理
    的頭像 發(fā)表于 08-14 11:27 ?659次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—<b class='flag-5'>raid</b>5<b class='flag-5'>陣列</b>熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例

    兩組分別由4塊SAS硬盤組建的raid5磁盤陣列,ext3文件系統(tǒng)+lvm結(jié)構(gòu)。 磁盤陣列中一塊硬盤離線,熱備盤自動(dòng)上線替換離線硬盤并開始同步數(shù)據(jù)。在熱備盤同步數(shù)據(jù)的過程中該組raid
    的頭像 發(fā)表于 08-09 13:52 ?429次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致<b class='flag-5'>Raid</b>5<b class='flag-5'>陣列</b>熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例