在嵌入式系統(tǒng)中為提高微型機(jī)系統(tǒng)的可靠性和安全性, 常用的方法就是使用“看門狗”??撮T狗分硬件看門狗和軟件看門狗。硬件看門狗采用“看門狗”電路, 通過定時器, 對微型機(jī)任務(wù)即“喂狗”在運行時間上加以約束, 任務(wù)必須在最大指定時間范圍內(nèi)完成, 否則重啟系統(tǒng)。軟件看門狗采用處理器內(nèi)部定時器, 把任務(wù)的理論最大運行時間作為時間約束, 如果該任務(wù)超過了這個時間跨度, 則強制退出本次任務(wù)。上述看門狗采用的是單任務(wù)的順序機(jī)制, 容易實現(xiàn)。在多任務(wù)系統(tǒng)中情況稍為復(fù)雜, 如果每個任務(wù)都像單任務(wù)系統(tǒng)那樣,只要有一個任務(wù)正常工作并定期“喂狗”,看門狗定時器就不會溢出, 而只有所有任務(wù)都出現(xiàn)問題時, 定時器才會溢出。重慶師范大學(xué)葉幫利老師曾在windows 系統(tǒng)中探討和解決了這個問題[ 1 ] , 在嵌入式系統(tǒng)中也有人曾談到過[ 2 ] , 但是卻沒有具體實現(xiàn)方法的敘述。
文中把u C / O S - I I 操作系統(tǒng)移植到PHILIPS 公司生產(chǎn)的LPC2132 內(nèi)核中,基于系統(tǒng)的消息機(jī)制和優(yōu)先級權(quán)限, 設(shè)置了一個優(yōu)先級最高的任務(wù)作為監(jiān)視器對微型機(jī)上運行的所有任務(wù)進(jìn)行監(jiān)控, 只要一個任務(wù)出現(xiàn)故障, 該監(jiān)視任務(wù)就延遲喂狗, 使定時器溢出, 重啟系統(tǒng), 以保障微型機(jī)及所有任務(wù)處于長期穩(wěn)定的運行狀態(tài)。
1 系統(tǒng)概述
1 . 1 硬件和開發(fā)環(huán)境簡介
把uC/OS-II 操作系統(tǒng)移植到LPC2132的開發(fā)板中。LPC2132 是一個支持實時仿真和跟蹤的32 位ARM7TDMI-STM 核微處理器,帶64kB 高速FLASH 存儲器,4 個通信接口, 2 個32 位定時器, 1 個10 位8 路ADC,2 個硬件接口,47 個GPIO 以及多達(dá)9個邊沿或電平觸發(fā)的外部中斷, 完全能滿足一般應(yīng)用程序及擴(kuò)展的需求。
uC/OS-II 是一個搶占式多任務(wù)實時操作系統(tǒng), 其源代碼公開、可移植性強, 有著易用性、易開發(fā)性和普及性的特點。uC/OS- Ⅱ最多可以管理64 個任務(wù), 這些任務(wù)通常都是一個無限循環(huán)的函數(shù)。在目前的版本中, 保留了優(yōu)先級為0 、1 、2 、3 、OS_LOWEST_PRIO-3、OS_LOWEST_PRIO-2 、O S _ L O W E S T _ P R I O - 1 、OS_LOWEST_PRIO 的任務(wù),所以用戶可以同時擁有5 6 個任務(wù), 足以滿足用戶設(shè)計的各種要求。
1 . 2 系統(tǒng)實現(xiàn)的功能
在多任務(wù)系統(tǒng)中, 往往希望有一個任務(wù)出問題時把該任務(wù)重啟, 而不重啟整個系統(tǒng), 以達(dá)到不影響其他關(guān)鍵任務(wù)運行的目的, 在多次重啟該任務(wù)無效時再重啟系統(tǒng)。當(dāng)系統(tǒng)的主程序出現(xiàn)錯誤或者系統(tǒng)硬件出現(xiàn)問題時重啟系統(tǒng)?;谝陨戏治鲈O(shè)計的看門狗主要實現(xiàn)以下功能。
( 1 ) 當(dāng)某個任務(wù)出現(xiàn)異常時, 由軟件看門狗重啟該任務(wù)。
( 2 ) 當(dāng)多次重啟某一任務(wù)失敗時, 重啟系統(tǒng)。
( 3 ) 當(dāng)操作系統(tǒng)本身出現(xiàn)異常時, 或者系統(tǒng)硬件出現(xiàn)異常時, 由軟件看門狗或者是硬件看門狗重新啟動微處理器。
2 多任務(wù)看門狗監(jiān)控原理
結(jié)合LPC2132 內(nèi)置硬件看門狗和uC/O S - Ⅱ操作系統(tǒng), 設(shè)置了一個優(yōu)先級別最高的任務(wù)作為監(jiān)視器監(jiān)視各應(yīng)用任務(wù)是否正常運行, 該監(jiān)視器稱為軟件看門狗。該任務(wù)對每個被監(jiān)視任務(wù)都設(shè)定一個計時器, 被監(jiān)視任務(wù)在設(shè)定的時間內(nèi)對對應(yīng)的定時器定時清零, 稱為“喂軟狗”。在被監(jiān)視的任務(wù)都正常工作的情況下, 軟件看門狗對內(nèi)置硬件看門狗定時器周期性清零,稱為“喂狗”。如果被監(jiān)視任務(wù)群某個任務(wù)出現(xiàn)故障, 不能在設(shè)置的時間內(nèi)對軟件看門狗“喂軟狗”, 與之對應(yīng)的定時器溢出,系統(tǒng)內(nèi)核發(fā)送指令, 把該任務(wù)的堆棧地址指到其起始地址, 復(fù)位該任務(wù), 如果在設(shè)定的次數(shù)內(nèi)不能夠有效啟動該任務(wù), 則延時“喂狗”, 硬件看門狗計數(shù)器溢出, 重啟系統(tǒng)。另外當(dāng)監(jiān)視器任務(wù)本身出現(xiàn)故障時,也不能及時對看硬件看門狗定時器清零,重啟系統(tǒng)。
3 軟件實現(xiàn)
3 . 1 應(yīng)用任務(wù)與軟件看門狗之間的通信
在多任務(wù)軟件看門狗與各應(yīng)用任務(wù)間之間進(jìn)行信息傳遞時, 每個應(yīng)用任務(wù)都會對監(jiān)視器發(fā)送運行狀態(tài)消息, 監(jiān)視器任務(wù)也要對每個任務(wù)發(fā)送消息。在應(yīng)用任務(wù)較多的情況下, 如果采用信箱進(jìn)行通訊, 會造成大量無效操作, 也使得編程變得繁瑣, 所以在監(jiān)視器任務(wù)中采用消息隊列來實現(xiàn)與各應(yīng)用任務(wù)間的消息傳遞, 而在各應(yīng)用任務(wù)中設(shè)置兩個信箱, 一個用來對監(jiān)視器消息隊列發(fā)送消息, 一個用來接收監(jiān)視器任務(wù)消息隊列發(fā)送的消息。當(dāng)某個應(yīng)用任務(wù)在執(zhí)行出錯時,調(diào)用OSQPost()函數(shù)向監(jiān)視器任務(wù)消息隊列發(fā)送消息, 監(jiān)視器任務(wù)通過調(diào)用OSQPend()函數(shù)從消息隊列讀取該消息,然后調(diào)用OSMboxPost()函數(shù)向該應(yīng)用任務(wù)的消息接收信箱發(fā)送代表不同意義的消息,該任務(wù)調(diào)用OSMboxPend()函數(shù)從信箱中讀取該消息后執(zhí)行相應(yīng)的操作。
3 . 2 多任務(wù)軟件看門狗的實現(xiàn)
評論