Linux? 的速度或效率都非常不錯,只是在一些情況下,這樣的速度還不能滿足需求。我們需要的是在特定的容差范圍內(nèi)確定性地滿足調(diào)度期限的能力。本文將揭示各種實現(xiàn)實時 Linux 的可選方案以及它們?nèi)绾螌崿F(xiàn)實時性 — 從早期的模仿虛擬化解決方案的架構到如今標準 2.6 內(nèi)核中可用的選項。
本文探索了一些支持實時特性的 Linux 架構,并探討了實時架構 的含意是什么。有許多種解決方案賦予 Linux 實時能力,本文將對瘦內(nèi)核(或微內(nèi)核)方法、超微內(nèi)核方法以及資源內(nèi)核(resource-kernel)方法進行考查。最后,描述了標準 2.6 內(nèi)核的實時功能,并向您示范如何啟用并使用這能。
實時的定義及要求
下列實時 的定義為探討實時 Linux 架構提供了基礎。定義由 Donal Gillies 在 Realtime Computing FAQ 中提出。
實時系統(tǒng)指系統(tǒng)的計算正確性不僅取決于計算的邏輯正確性,還取決于產(chǎn)生結果的時間。如果未滿足系統(tǒng)的時間約束,則認為系統(tǒng)失效。
上下文切換
發(fā)生中斷后分配新任務的過程中隱含著上下文切換。這個過程在中斷時存儲 CPU 的當前狀態(tài),然后恢復一項給定任務的狀態(tài)。上下文切換依賴于操作系統(tǒng)及底層的處理器架構。
換句話說,系統(tǒng)面對變化的負載(從最小到最壞的情況)時必須確定性地保證滿足時間要求。注意,上述定義并未提到性能,原因是實時性與速度關系不大:它與可預見性有關。例如,使用快速的現(xiàn)代處理器時,Linux 可以提供 20 μ 微秒的典型中斷響應,但有時候響應會變得很長。這是一個基本的問題:并不是 Linux 不夠快或效率不夠高,而是因為它不能提供確定性。
一些例子將演示全部這些內(nèi)容的含意。圖 1 顯示的是中斷延遲指標。當中斷到達時(event),CPU 發(fā)生中斷并轉入中斷處理。執(zhí)行一些工作以確定發(fā)生了什么事件,然后執(zhí)行少量工作分配必需的任務以處理此事件(上下文切換)。中斷到達與分發(fā)必需任務之間的時間(假設分配的是優(yōu)先級最高的任務)稱為響應時間。對于實時性要求,響應時間應是確定的并應當在已知的最壞情況的時間內(nèi)完成。
圖 1. 中斷延遲和響應時間
有關這個過程的一個例子就是目前汽車中使用的氣囊。當報告車輛碰撞的傳感器中斷 CPU 后,操作系統(tǒng)應快速地分配展開氣囊的任務,并且不允許其他非實時處理進行干擾。晚一秒鐘展開氣囊比沒有氣囊的情況更糟糕。
除為中斷處理提供確定性外,實時處理也需要支持周期性間隔的任務調(diào)度??紤]圖 2。本圖演示了周期性任務調(diào)度。大量控制系統(tǒng)要求周期性采樣與處理。某個特定任務必須按照固定的周期(p)執(zhí)行,從而確保系統(tǒng)的穩(wěn)定性??紤]一下汽車的防抱死系統(tǒng)(ABS)??刂葡到y(tǒng)對車輛的每個車輪的轉速進行采樣(每秒最多 20 次)并控制每個制動器的壓力(防止它鎖死)。為了保持控制系統(tǒng)的正常工作,傳感器的采樣與控制必須按照一定的周期間隔。這意味著必須搶占其他處理,以便 ABS 任務能按照期望的周期執(zhí)行。
圖 2. 周期性任務調(diào)度
硬實時與軟實時系統(tǒng)
能夠在指定的期限完成實時任務(即便在最壞的處理負載下也能如此)的操作系統(tǒng)稱為硬實時 系統(tǒng)。但并不是任何情況下都需要硬實時支持。如果操作系統(tǒng)在平均情況下能支持任務的執(zhí)行期限,則稱它為軟實時 系統(tǒng)。硬實時系統(tǒng)指超過截止期限后將造成災難性后果(例如展開氣囊過晚或制動壓力產(chǎn)生的滑行距離過長)的系統(tǒng)。軟實時系統(tǒng)超過截止期限后并不會造成系統(tǒng)整體失敗(如丟失視頻中的一幀)。
現(xiàn)在您已經(jīng)對實時性要求有了一些深入了解,讓我們查看一些實時 Linux 架構各支持哪個級別的實時性以及如何做到這一點。
瘦內(nèi)核方法
瘦內(nèi)核(或微內(nèi)核)方法使用了第二個內(nèi)核作為硬件與 Linux 內(nèi)核間的抽象接口(見圖 3)。非實時 Linux 內(nèi)核在后臺運行,作為瘦內(nèi)核的一項低優(yōu)先級任務托管全部非實時任務。實時任務直接在瘦內(nèi)核上運行。
圖 3. 硬實時的瘦內(nèi)核方法
瘦內(nèi)核主要用于(除了托管實時任務外)中斷管理。瘦內(nèi)核截取中斷以確保非實時內(nèi)核無法搶占瘦內(nèi)核的運行。這允許瘦內(nèi)核提供硬實時支持。
雖然瘦內(nèi)核方法有自己的優(yōu)勢(硬實時支持與標準 Linux 內(nèi)核共存),但這種方法也有缺點。實時任務和非實時任務是獨立的,這造成了調(diào)試困難。而且,非實時任務并未得到 Linux 平臺的完全支持(瘦內(nèi)核執(zhí)行稱為瘦 的一個原因)。
使用這種方法的例子有 RTLinux (現(xiàn)在由 Wind River Systems 專有),實時應用程序接口(RTAI)和 Xenomai。
超微內(nèi)核方法
這里瘦內(nèi)核方法依賴于包含任務管理的最小內(nèi)核,而超微內(nèi)核法對內(nèi)核進行更進一步的縮減。通過這種方式,它不像是一個內(nèi)核而更像是一個硬件抽象層(HAL)。超微內(nèi)核為運行于更高級別的多個操作系統(tǒng)提供了硬件資源共享(見圖 4)。因為超微內(nèi)核對硬件進行了抽象,因此它可為更高級別的操作系統(tǒng)提供優(yōu)先權,從而支持實時性。
圖 4. 對硬件進行抽象的超微內(nèi)核法
注意,這種方法和運行多個操作系統(tǒng)的虛擬化方法有一些相似之處。使用這種方法的情況下,超微內(nèi)核在實時和非實時內(nèi)核中對硬件進行抽象。這與 hypervisor 從客戶(guest)操作系統(tǒng)對裸機進行抽象的方式很相似。
關于超微內(nèi)核的示例是操作系統(tǒng)的 Adaptive Domain Environment for Operating Systems (ADEOS)。ADEOS 支持多個并發(fā)操作系統(tǒng)同步運行。當發(fā)生硬件事件后,ADEOS 對鏈中的每個操作系統(tǒng)進行查詢以確定使用哪一個系統(tǒng)處理事件。
資源內(nèi)核法
另一個實時架構是資源內(nèi)核法。這種方法為內(nèi)核增加一個模塊,為各種資源提供預留(reservation)。這種機制保證了對時分復用(time-multiplexed)系統(tǒng)資源的訪問(CPU、網(wǎng)絡或磁盤帶寬)。這些資源擁有多個預留參數(shù),如循環(huán)周期、需要的處理時間(也就是完成處理所需的時間),以及截止時間。
資源內(nèi)核提供了一組應用程序編程接口(API),允許任務請求這些預留資源(見圖 5)。然后資源內(nèi)核可以合并這些請求,使用任務定義的約束定義一個調(diào)度,從而提供確定的訪問(如果無法提供確定性則返回錯誤)。通過調(diào)度算法,如 Earliest-Deadline-First (EDF),內(nèi)核可以處理動態(tài)的調(diào)度負載。
圖 5. 實現(xiàn)資源預留的資源內(nèi)核法
資源內(nèi)核法實現(xiàn)的一個示例是 CMU 公司的 Linux/RK,它把可移植的資源內(nèi)核集成到 Linux 中作為一個可加載模塊。這種實現(xiàn)演化成商用的 TimeSys Linux/RT 產(chǎn)品。
標準 2.6 內(nèi)核中的實時
目前探討的這些方法在架構上都很有趣,但是它們都在內(nèi)核的外圍運行。然而,如果對標準 Linux 內(nèi)核進行必要的修改使其支持實時性,結果會怎么樣呢?
今天,在 2.6 內(nèi)核中,通過對內(nèi)核進行簡單配置使其完全可搶占(見圖 6),您就可以得到軟實時功能。在標準 2.6 Linux 內(nèi)核中,當用戶空間的進程執(zhí)行內(nèi)核調(diào)用時(通過系統(tǒng)調(diào)用),它便不能被搶占。這意味著如果低優(yōu)先級進程進行了系統(tǒng)調(diào)用后,高優(yōu)先級進程必須等到調(diào)用結束后才能訪問 CPU。新的配置選項 CONFIG_PREEMPT 改變了這一內(nèi)核行為,在高優(yōu)先級任務可用的情況下(即使此進程正在進行系統(tǒng)調(diào)用),它允許進程被搶占。
圖 6 允許搶占的標準 2.6 Linux 內(nèi)核
但這種配置選項也是一種折衷。雖然此選項實現(xiàn)了軟實時性能并且即使在負載條件下也可使操作系統(tǒng)順利地運行,但這樣做也付出了代價。代價就是略微減低了吞吐量以及內(nèi)核性能,原因是 CONFIG_PREEMPT 選項增加了開銷。這種選項對桌面和嵌入式系統(tǒng)而言是有用的,但并不是在任何場景下都有用(例如,服務器)。
新的 O(1) 調(diào)度程序
2.6 內(nèi)核中新的 O(1) 調(diào)度程序?qū)π阅苡泻艽蟮奶嵘?,即使存在很多任務的情況下也是如此。不管需要運行的任務有多少個,新的調(diào)度程序都會在有限的時間內(nèi)運行。
在 2.6 內(nèi)核中另一項有用的配置選項是高精度定時器。這個新選項允許定時器以 1μs 的精度運行(如果底層硬件支持的話),并通過紅黑樹實現(xiàn)對定時器的高效管理。通過紅黑樹,可以使用大量的定時器而不會對定時器子系統(tǒng)(O(log n))的性能造成影響。
只需要一點額外的工作,您就可以通過 PREEMPT_RT 補丁實現(xiàn)硬實時。PREEMPT_RT 補丁提供了多項修改,可實現(xiàn)硬實時支持。其中一些修改包括重新實現(xiàn)一些內(nèi)核鎖定原語,從而實現(xiàn)完全可搶占,實現(xiàn)內(nèi)核互斥的優(yōu)先級繼承,并把中斷處理程序轉換為內(nèi)核線程以實現(xiàn)線程可搶占。
結束語
Linux 不僅是一個實驗和描述實時算法的理想平臺,目前在標準的 2.6 內(nèi)核中也實現(xiàn)了實時功能。從標準內(nèi)核中您可以實現(xiàn)軟實時功能,再執(zhí)行一些額外的工作(內(nèi)核補?。┠涂梢詷嫿ㄓ矊崟r應用程序。
本文簡要介紹了一些為 Linux 內(nèi)核提供實時計算的技術。很多早期的嘗試使用瘦內(nèi)核方法把實時任務與標準內(nèi)核分離。后來,出現(xiàn)了超微內(nèi)核法,它與如今的虛擬化解決方案中使用的 hypervisor 非常相似。最后,Linux 內(nèi)核提供了自己的實時方法,包括軟實時和硬實時。
評論