計算機系統(tǒng)容錯技術方法 - 全文

　　隨著計算機技術的發(fā)展，計算機系統(tǒng)的可靠性越來越受到人們的重視，而容錯技術是提高可靠性的一種有效方法。本文研究了計算機容錯技術的各種方法，如硬件容錯、信息容錯、軟件容錯等，介紹了TMR(三模冗余)的原理及其缺點，詳細研究了兩種最基本的軟件容錯技術NVP和RB。這些容錯技術可有效提高計算機系統(tǒng)的可靠性。

　　計算機的應用十分廣泛，航空航天、軍事、銀行監(jiān)管系統(tǒng)、交通運輸系統(tǒng)以及其他重要的工業(yè)領域對計算機的可靠性要求非常高。計算機系統(tǒng)出現(xiàn)故障不僅會導致國家財產(chǎn)的嚴重損失，還會危及人身安全。因此，在這些領域中計算機的可靠性越來越受到人們的重視，國家非常重視可靠性的研究工作，投入了大量的資源。

　　1 基本容錯技術

　　一般而言，提高計算機的可靠性有兩種比較有效的方法。一種是避錯，就是避免出現(xiàn)故障，這就需要嚴格篩選計算機元器件，完善設計，提高制造工藝，以及加強質量管理等。但即使是這樣一個計算機系統(tǒng)，由于其所在的工作環(huán)境有各種環(huán)境應力，如濕度、溫度、電磁干擾、強震動等，因此總避免不了出現(xiàn)故障。這就要求在計算機出現(xiàn)故障的情況下容忍故障的存在，即第二種方法--容錯技術。容錯技術最早由約翰·馮·諾依曼(John VON Neumann)提出，所謂容錯是指在出現(xiàn)一個或者幾個硬件或軟件方面的故障或錯誤的情況下，計算機系統(tǒng)能夠檢測出故障的存在并采取措施容忍故障，不影響正常工作，或者在能夠完成規(guī)定的任務的情況下降級運行[1]。

　　故障是指由于部件的物理失效、環(huán)境應力的作用、操作錯誤或不正確的設計，引起系統(tǒng)的硬件或軟件的錯誤狀態(tài)[2]。下面介紹幾種相關技術的基本概念。

　　故障檢錯技術：對于計算機系統(tǒng)的容錯首先要用到故障檢錯技術，即在計算機系統(tǒng)發(fā)生故障的情況下能夠檢測出故障的存在。

　　故障診斷技術：檢測出系統(tǒng)存在故障后要進行故障的定位，找出故障所在的位置。

　　故障恢復技術：在檢測出故障和定位故障的所在位置之后，就要運用故障恢復技術把系統(tǒng)從故障的狀態(tài)恢復到無故障的狀態(tài)繼續(xù)運行。

　　容錯最基本的的方法是冗余技術，所謂冗余就是超過系統(tǒng)實現(xiàn)正常功能的額外資源。冗余包括硬件冗余、軟件冗余、時間冗余和信息冗余。

　　1.1 硬件容錯技術

　　硬件冗余又包括靜態(tài)硬件冗余(也叫被動硬件冗余)、動態(tài)硬件冗余(也叫主動硬件冗余)和混合冗余(靜態(tài)冗余和動態(tài)冗余的結合)。靜態(tài)硬件冗余常見的形式有三模冗余(TMR)，其基本原理是：系統(tǒng)輸入通過3個功能相同的模塊，產(chǎn)生的3個結果送到多數(shù)表決器進行表決，即三中取二的原則，如果模塊中有一個出錯，而另外兩個模塊正常，則表決器的輸出正確，從而可以屏蔽一個故障，TMR的缺點是，如果3個模塊的輸出各不相同，則無法進行多數(shù)表決;若有兩個模塊出現(xiàn)一致的故障，則表決的結果會出現(xiàn)錯誤。TMR結構如圖1所示。

　　圖1 TMR結構圖

　　三模冗余可推廣到N模冗余(NMR)，其基本原理與TMR的原理相同，其中N≥3，且N為奇數(shù)，以便進行多數(shù)表決。動態(tài)冗余是指當檢測到工作的模塊出現(xiàn)錯誤時，就切換到一個備用的模塊，當換上的備用模塊又發(fā)生故障時，再切換到另一個備用模塊，依次類推，直到備用的模塊用完。

　　1.2 時間容錯技術

　　時間容錯的基本思想是：重復執(zhí)行指令或者一段程序來消除故障的影響，以達到容錯的效果，它是用消耗時間來換取容錯的目的。根據(jù)執(zhí)行的是一條指令還是一段程序，分成兩種方法：

　　一種是指令復執(zhí)。當檢測出故障的時候，重復執(zhí)行故障指令，若故障是瞬時的，則在指令復執(zhí)期間可能不會出現(xiàn)，程序就可以繼續(xù)向前運行。指令復執(zhí)必須保留上一指令結束的“現(xiàn)場”，包括累加器、PC及其他狀態(tài)寄存器的狀態(tài)。

　　另一種是程序卷回。它不是重復執(zhí)行一條指令，而是重復執(zhí)行一小段程序。在整段程序中可以設置多個恢復點，程序有錯誤的情況下可以從一個個恢復點處開始重復執(zhí)行程序。首先檢驗一小段程序的計算結果，若結果出現(xiàn)錯誤則卷回再重復執(zhí)行那個部分，若一次卷回不能解決，可以多次卷回，直到故障消除。

　　1.3 信息容錯技術

　　信息容錯技術是通過在數(shù)據(jù)中附加冗余的信息位來達到故障檢測和容錯的目的。通常情況下，附加的信息位越多，其檢錯糾錯的能力就越強，但是這同時也增加了復雜度和難度。信息冗余最常見的有檢錯碼和糾錯碼。檢錯碼只能檢查出錯誤的存在，不能改正錯誤，而糾錯碼能檢查出錯誤并能糾正錯誤。常用的檢錯糾錯碼有奇偶校驗碼、海明碼、循環(huán)碼等。

　　1.4 軟件容錯技術

　　由于硬件系統(tǒng)的故障主要來自生產(chǎn)和使用階段，因此容錯可以通過相同部件的重復，即相同資源的累積設置來實現(xiàn);而軟件故障主要來自說明、設計和實現(xiàn)階段，因此程序的簡單重復不能實現(xiàn)容錯，它只能防止硬件損壞或者環(huán)境干擾等引起的物理性故障，而不能防止軟件本身缺陷造成的故障。實現(xiàn)軟件容錯的基本方法，是將若干個根據(jù)同一需求說明編寫的不同程序(即多版本程序)，在不同空間同時運行，然后在每一個設置點通過表決或接收測試進行表決。

　　最基本的軟件容錯技術是Algirdas Avizienis提出的基于靜態(tài)冗余的N版本編程方法和B. Randell提出的基于動態(tài)冗余的恢復塊技術。

　　1.4.1 軟件的相異性設計

　　對于軟件容錯，考慮的重點是軟件設計的相異性和版本的獨立性。軟件的相異性設計是為了防止由于軟件發(fā)生共性故障而采用的一種設計方法。軟件設計時的共性越小，出現(xiàn)相同故障的概率也就越小，容錯性能就越強。

　　相異性設計要求，對于同一需求說明的軟件功能，不同的研發(fā)設計人員及不同的研發(fā)設計小組對于這同一功能的軟件設計禁止談論和溝通，在不同的環(huán)境空間中獨立進行設計;另外，還要求軟件設計的多樣性，如采取不同的設計方法、開發(fā)工具、編程語言、編譯器、算法等。在航空航天、核電站控制以及鐵路交通的控制等對軟件的可靠性要求很高的場合，軟件的相異性設計可以有效提高軟件的容錯能力和軟件的可靠性，對提高整個系統(tǒng)的可靠性有很重要的作用。

　　1.4.2 軟件容錯的基本結構

　　軟件容錯的基本結構有兩種：

　　一種是NVP(NVersion Programming)結構(多版本編程設計)，這種結構方法是Algirdas Avizienis于1977年在參考文獻[6]中提出的，它是一種靜態(tài)冗余方法，其基本的設計思想是用N個具有同一功能而采用不同編程方法的程序執(zhí)行一項運算，其結果通過多數(shù)表決器輸出。NVP系統(tǒng)中的多版本是指根據(jù)同一需求說明由不同的設計人員或由不同的設計方法、開發(fā)工具、編程語言等開發(fā)的具有同一功能的軟件版本，即所謂的版本設計的相異性。這種容錯結構方法有效避免了由于軟件共性故障所造成的系統(tǒng)出錯，提高了軟件的可靠性。NNP結構如圖2所示。

　　圖2 NVP結構

　　另一種是RB(Recovery Block，恢復快結構)，它是Randell于1975年在參考文獻[7]中提出的一種的軟件容錯技術，它是一種動態(tài)冗余方法。在RB結構中，有主程序塊和一些備用程序塊構，這里的主程序塊和備用程序塊采用不同編程方法但具有相同的功能。每個主程序塊都可以用一個根據(jù)同一需求說明設計的備用程序塊替換。首先運行主程序塊，然后進行接收測試，如果測試通過則將結果輸出給后續(xù)程序，否則調用第一個備用塊，依次類推，在N個備用程序塊替換完后仍沒有通過測試，則要進行故障處理。RB結構如圖3所示。

　　圖3 RB結構

　　其他的軟件容錯結構都是基于這兩個基本結構而來的，例如NVPP(多版本階段程序設計),它要求程序的版本運行分多個階段進行，而且每個階段運行的程序都包括適當?shù)陌姹緮?shù)量。運行一個階段后，要通過表決程序來對這一階段運行的程序進行表決，如果得到正確的結果就結束運行，否則繼續(xù)下一個階段版本的運行，直到得出正確的結果。

　　NVP和RB這兩種基本結構在軟件容錯中用得最廣泛，占據(jù)很重要的地位。這里要注意的是，驗證表決程序的可靠性以及表決結果的正確性是個難點，因為如果表決程序本身就是錯誤的，那表決的結果就不可信了，所以要用正確性證明技術來保證表決程序的正確。

　　2 結論

　　本文詳細介紹了計算機容錯的各種方法，包括硬件容錯、時間容錯、信息容錯以及軟件容錯等，這些容錯方法在其他工業(yè)場合有廣泛的應用，現(xiàn)在很多工業(yè)系統(tǒng)都是采用基于三模冗余的容錯技術來提高系統(tǒng)的可靠性。對于其他要求可靠性高的場合，計算機容錯技術的方法有著良好的應用前景。

閱讀全文

上一頁 1 2全文

本文導航

第 1 頁：計算機系統(tǒng)容錯技術方法
第 2 頁：1.4 軟件容錯技術

計算機系統(tǒng)(23730) 計算機系統(tǒng)(23730)
容錯技術(7461) 容錯技術(7461)

計算機系統(tǒng)的小常識

計算機系統(tǒng)指用于數(shù)據(jù)庫管理的計算機硬軟件及網(wǎng)絡系統(tǒng)。數(shù)據(jù)庫系統(tǒng)需要大容量的主存以存放和運行操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)程序、應用程序以及數(shù)據(jù)庫、目錄、系統(tǒng)緩沖區(qū)等，而輔存則需要大容量的直接存取設備。此外，系統(tǒng)應具有較強的網(wǎng)絡功能。

2023-05-09 16:05:11

342

淺析計算機系統(tǒng)的組成

近年來，隨著 PC（ Personal Computer，個人電腦）在家庭中的廣泛普及， 計算機對我們的生活產(chǎn)生了深遠的影響。如今，不僅是 PC，與我們生活息息相關的手機、平板等也廣泛應用了計算機。通過此文來介紹一下計算機系統(tǒng)的構成要素及其功能。

2023-05-09 15:57:52

393

CPCI計算機

Compacc 是基于PICMG 標準的工業(yè)用嵌入式計算機總線標準。蘇州惠普聯(lián)電子有限公司的CompactPCI 產(chǎn)品群是基于CPCI標準的嵌入式計算機的產(chǎn)品系列，它的商業(yè)化應用及發(fā)展取決于國際插件式計算機，設備及其他硬件軟件的廣泛應用。

2022-04-22 09:47:55

計算機網(wǎng)絡基礎教程pdf

8.1 計算機網(wǎng)絡基礎知識8.1.1 計算機網(wǎng)絡的形成與發(fā)展1. 計算機網(wǎng)絡的概念計算機網(wǎng)絡是利用通信設備和通信線路將地理上分散的、具有獨立功能的多個計算機系統(tǒng)連接起來，按照特定的通信規(guī)則進行信息交流

2008-08-04 22:28:00

深入理解計算機系統(tǒng) 教材

深入理解計算機系統(tǒng)中文版pdf下載

2021-11-11 18:11:26

計算機網(wǎng)絡與嵌入式系統(tǒng),嵌入式系統(tǒng)與計算機系統(tǒng)有什么不同

原標題：嵌入式系統(tǒng)與計算機系統(tǒng)有什么不同近段時間很多學習單片機或者傳統(tǒng)計算機的人員參加嵌入式培訓的比例在不斷增大，這部分同學可能以前對于計算機的系統(tǒng)相對比較熟悉，到了嵌入式計算機系統(tǒng)相比較通用型

2021-10-21 09:36:00

防止計算機系統(tǒng)免受病毒感染的措施

近年來，由于計算機系統(tǒng)的穩(wěn)固安全、網(wǎng)絡安全意識的提高以及防護軟件的推陳出新，計算機病毒感染事件越來越少。但這并不意味著計算機病毒就可以被消滅，并且在物聯(lián)網(wǎng)、云計算技術迅速發(fā)展的今天，一個小小的病毒，就能造成大面積的計算機系統(tǒng)癱瘓。為了抵御計算機病毒，我們要采取一定的措施以確保計算機系統(tǒng)及數(shù)據(jù)的安全。

2021-06-14 16:57:00

2358

計算機操作系統(tǒng)的幾種分類方式

操作系統(tǒng)是管理計算機硬件與軟件的計算機程序，是計算機系統(tǒng)的核心，是計算機系統(tǒng)中最基礎和最重要的系統(tǒng)軟件。從不同的用戶角度能提供不同的服務和功能。

2020-03-21 14:58:21

18407

計算機系統(tǒng)原理的學習課件資料合集免費下載

本文檔的主要內(nèi)容詳細介紹的是計算機系統(tǒng)原理的學習課件資料合集免費下載包括了：1 微型計算機系統(tǒng)的基礎知識，2 計算機的基本結構和工作原理，3 ARM微處理器，4 STM32微處理器，5 CORTEX-M3指令系統(tǒng)，6 匯編程序設計，7 存儲器及接口技術，8 輸入輸出接口，9 總線，10 中斷系統(tǒng)。

2020-03-13 08:00:00

計算機系統(tǒng)的硬件組織詳細概述

為了解在計算機系統(tǒng)中，程序是如何運行的，首先需要了解計算機系統(tǒng)的硬件組織。

2020-02-15 12:28:41

3620

嵌入式操作系統(tǒng)和通用計算機系統(tǒng)兩者有什么不同之處

嵌入式系統(tǒng)與通用計算機系統(tǒng)有著完全不同的技術要求和技術發(fā)展方向。通用計算機系統(tǒng)的技術要求是高速、海量的數(shù)值計算，其技術發(fā)展方向是總線速度的無限提升、存儲容量的無限擴大。

2019-11-26 11:31:42

13902

嵌入式操作系統(tǒng)和通用計算機系統(tǒng)的區(qū)別是什么

2019-11-19 11:23:13

33123

微型計算機系統(tǒng)應用

許多現(xiàn)代微型計算機系統(tǒng)具有較強的運算能力，這是在過去只有大、中、小型機才具有的。特別是多個微處理器構成的系統(tǒng)，其功能往往可與大型機相匹敵，而成本卻低到足以使大型機趨于淘汰。

2019-01-12 11:22:55

9205

微型計算機系統(tǒng)的特點

微型計算機系統(tǒng)簡稱“微機系統(tǒng)”。是由微型計算機、顯示器、輸入輸出設備、電源及控制面板等組成的計算機系統(tǒng)。配有操作系統(tǒng)、高級語言和多種工具性軟件等。

2019-01-12 11:14:44

16882

深入理解計算機系統(tǒng)(中文版)pdf下載

深入理解計算機系統(tǒng)(中文版)

2018-01-10 16:11:03

微機原理--微型計算機系統(tǒng)及其操作系統(tǒng)簡介

微機原理--微型計算機系統(tǒng)及其操作系統(tǒng)簡介

2016-12-12 22:07:22

計算機系統(tǒng)結構：量化研究方法[中文版][第四版]

電子發(fā)燒友網(wǎng)站提供《計算機系統(tǒng)結構：量化研究方法[中文版][第四版].txt》資料免費下載

2015-03-01 15:49:31

高性能、低功耗SMARC 模塊計算機與加固型計算機系統(tǒng)

凌華科技采用最新一代 Intel? Atom? 及Celeron? 系統(tǒng)單芯片解決方案,發(fā)布高性能、低功耗SMARC 模塊計算機與加固型計算機系統(tǒng).

2013-10-10 10:42:58

1838

計算機系統(tǒng)電磁輻射測量

本文提出了室內(nèi)電磁環(huán)境下計算機系統(tǒng)的電測輻射測量系統(tǒng)的構建方法，完成了對計算機系統(tǒng)輻射頻譜和時域波形的測量。

2012-04-20 14:27:26

1037

微小型計算機系統(tǒng)設備用開關電源通用技術條件

主題內(nèi)容與適用范圍本標準規(guī)定了微小型計算機系統(tǒng)設備用開關電源（以下簡稱產(chǎn)品）通用技術條件，主要內(nèi)容包括術語、技術要求、試驗方法、檢驗規(guī)則、標志、包裝、運輸、貯存等。本標準適用于微小型計算機系統(tǒng)設備用開關電源，本標準是制訂型號產(chǎn)品標準的依

2011-02-15 11:55:51

過程計算機系統(tǒng)和技術過程間的接口GB 12118-89

過程計算機系統(tǒng)和技術過程間的接口GB 12118-89 本詞匯包括約二十個部分，本部分闡述了過程計算機和技術過程間的接口方面的技術裝置、接口、概念以及有關特

2010-04-30 12:01:09

計算機系統(tǒng)小結

計算機系統(tǒng)小結　　習慣上所稱的“電子計算機”是指現(xiàn)在廣泛應用的電子數(shù)字計算機，它分為專用計算機和通用計算機兩大類。專

2010-04-13 14:14:57

648

計算機系統(tǒng)結構的過去和未來

計算機系統(tǒng)結構的過去和未來　　　　自1946年在美國賓夕法尼亞大學制成的世界上第一臺電子數(shù)字計算機以來，計算機的發(fā)展大致經(jīng)歷了五代的變化：

2010-04-13 14:14:05

1319

什么是多級組成的計算機系統(tǒng)

什么是多級組成的計算機系統(tǒng)　　　　1. 微程序設計級　　　　這是一個實在的硬件級，他由機器硬件直接執(zhí)行微命令。如果某一個應用程序直接用

2010-04-13 13:50:36

549

基于DSP高性能的工業(yè)控制計算機系統(tǒng)設計

基于DSP高性能的工業(yè)控制計算機系統(tǒng)設計摘要:文章介紹了一種以工業(yè)控制計算機和DSP為核心的工業(yè)控制系統(tǒng),使用于需要大量數(shù)字信號處理的工業(yè)控制場合。該系統(tǒng)結構簡單

2010-04-06 14:18:16

微型計算機系統(tǒng)

微型計算機系統(tǒng)與傳統(tǒng)的計算機系統(tǒng)一樣，也是由硬件系統(tǒng)和軟件系統(tǒng)兩大部分組成的。2.1 微型計算機系統(tǒng)的組成 2.1.1 硬件系統(tǒng) &

2010-03-03 08:31:44

什么是計算機系統(tǒng)的容錯性

什么是計算機系統(tǒng)的容錯性所謂容錯是指在故障存在的情況下計算機系統(tǒng)不失效，仍然能夠正常工作的特性

2010-01-08 13:49:06

1493

基于EDA平臺的計算機系統(tǒng)結構課程實踐

基于EDA平臺的計算機系統(tǒng)結構課程實踐本文分析了計算機專業(yè)本科生課程計算機系統(tǒng)結構的教學現(xiàn)狀, 結合目前在教學實踐中采用的部分措施, 提出了在計算機系統(tǒng)結

2009-12-05 16:08:20

深入理解計算機系統(tǒng) (PDF版下載)

深入理解計算機系統(tǒng)本書適用于那些想要寫出更快、更可靠程序的程序員。通過掌握程序是如何映射到系統(tǒng)上，以及程序是如何執(zhí)行的，讀者能夠更好的理解程序的行為為什么是

2009-10-09 16:43:26

643

嵌入式微計算機系統(tǒng)實時接口技術

嵌入式微計算機系統(tǒng)實時接口技術介紹了嵌入式策計算機系統(tǒng)的通用設計方法并提供了詳細的Motorola6805、6808、6811和6812 應和示例。作者將基本概念與豐富的應用實例分析相結合

2009-10-09 15:46:11

基于AutoCAD平臺的旋轉體拉伸毛坯計算機系統(tǒng)的開發(fā)

本文將筆者發(fā)現(xiàn)的確定旋轉體拉伸毛坯尺寸的新方法成功地開發(fā)成了旋轉體拉伸毛坯計算機系統(tǒng)，實現(xiàn)了旋轉體拉伸毛坯尺寸的準確設計，用計算機技術提升了傳統(tǒng)產(chǎn)業(yè)工藝設計的

2009-08-24 08:36:46

容錯型計算機聯(lián)鎖系統(tǒng)的軟件設計研究

緊密圍繞計算機聯(lián)鎖系統(tǒng)軟件容錯進行討論，給出了軟件的容錯設計，主要包括：關于聯(lián)鎖數(shù)據(jù)的容錯和關于聯(lián)鎖程序的容錯。針對實例，說明了容錯型計算機聯(lián)鎖系統(tǒng)軟件的詳細

2009-08-15 10:48:20

SCSI（小型計算機系統(tǒng)接口）工作原理

SCSI（小型計算機系統(tǒng)接口）工作原理 SCSI基礎知識

2009-07-27 11:04:00

4095

計算機應用基礎教案

★ 計算機的發(fā)展過程、發(fā)展方向、特點及應用 ★ 計算機系統(tǒng)的組成：硬件系統(tǒng)和軟件系統(tǒng) ★ 計算機主要常用性能指標，常用輸入、輸出設備 ★ 計算機的數(shù)制

2009-05-15 09:59:59

計算機系統(tǒng)安全教程，下載

計算機網(wǎng)絡是指獨立自治、相互連接的計算機集合。獨立自治意味著每臺聯(lián)網(wǎng)的計算機是一個完整的計算機系統(tǒng)，可以獨立運行；相互連接意味著兩臺計算機之間能交換信息。計算

2009-05-09 11:26:54

計算機系統(tǒng)概論

1.1 計算機系統(tǒng)簡介1.2 計算機的基本組成1.3 計算機硬件的主要技術指標1.4 本書結構

2009-04-11 09:31:39

計算機系統(tǒng)維護概述

計算機系統(tǒng)維護概述一、計算機系統(tǒng)維護的意義 計算機是人們經(jīng)常使用操作的智能化工具，如果使用操作不當

2008-10-25 11:00:47

1311

分布式多媒體計算機系統(tǒng)教程

分布式多媒體計算機系統(tǒng)教程系統(tǒng)地論述了分布式多媒體計算機系統(tǒng)。首先從知識經(jīng)濟、信息革命入手，對分布式計算機系統(tǒng)的設計與實現(xiàn)，特別是異構性及實現(xiàn)相關的關鍵技術

2008-09-26 22:23:29

已全部加載完成

搜索歷史

計算機系統(tǒng)容錯技術方法 - 全文

本文導航

評論