資料介紹
目前,嵌入式多核處理器已經(jīng)在嵌入式設(shè)備領(lǐng)域得到廣泛運(yùn)用,但嵌人式系統(tǒng)軟件開(kāi)發(fā)技術(shù)還停留在傳統(tǒng)單核模式,并沒(méi)有充分發(fā)揮多核處理器的性能。程序并行化優(yōu)化目前在PC平臺(tái)上有一定運(yùn)用,但在嵌入式平臺(tái)上還很少,另外,嵌入式多核處理器與PC平臺(tái)多核處理器有很大不同,因此不能直接將PC平臺(tái)的并行化優(yōu)化方法應(yīng)用到嵌人式平臺(tái)。本文分別從任務(wù)并行和緩存優(yōu)化兩方面進(jìn)行并行化優(yōu)化的研究,探索在嵌人式多核處理器上對(duì)程序進(jìn)行并行化優(yōu)化的方法。
1嵌入式多核處理器結(jié)構(gòu)
嵌人式多核處理器的結(jié)構(gòu)包括同構(gòu)(Symmetric)和異構(gòu)(Asymmetric)兩種。同構(gòu)是指內(nèi)部核的結(jié)構(gòu)是相同的,這種結(jié)構(gòu)目前廣泛應(yīng)用在PC多核處理器;而異構(gòu)是指內(nèi)部核的結(jié)構(gòu)是不同的,這種結(jié)構(gòu)常常在嵌入式領(lǐng)域使用,常見(jiàn)的是通用嵌入式處理器+DSP核。本文探究的嵌入式多核處理器采用同構(gòu)結(jié)構(gòu),實(shí)現(xiàn)同一段代碼在不同處理器上的并行執(zhí)行。

圖1 ARM SMP處理器結(jié)構(gòu)
在目前嵌入式領(lǐng)域中,使用最為廣泛的為ARM處理器,因此以ARM雙核處理器OMAP4430作為研究對(duì)象。ARM對(duì)稱(chēng)多處理(Symmetric Multi-Processing,SMP)結(jié)構(gòu)如圖1所示,根據(jù)程序的局部性原理,每一個(gè)處理器都具有私有的內(nèi)存(Local Memory),常見(jiàn)的是一級(jí)緩存(L1Cache)。然而,多個(gè)處理器之間又涉及到相互通信問(wèn)題,因此在常見(jiàn)的ARM處理器中使用二級(jí)緩存(L2 Cache)來(lái)解決這一問(wèn)題?;趯?duì)稱(chēng)多處理器結(jié)構(gòu),所有的處理器(通常為2的倍數(shù))在硬件結(jié)構(gòu)上都是相同的,在使用系統(tǒng)資源上也是平等的。更重要的是,由于所有的處理器都有權(quán)利去訪問(wèn)相同的內(nèi)存空間,在共享內(nèi)存區(qū)域中,任何一個(gè)進(jìn)程或者線(xiàn)程都可以運(yùn)行在任意一個(gè)處理器之上,這樣就使得程序的并行化成為可能。2在嵌入式多核平臺(tái)上進(jìn)行并行化優(yōu)化,需要考慮以下問(wèn)題:
?、俨⑿谢绦虻男阅苋Q于程序中串行化部分,程序性能不會(huì)隨著并行線(xiàn)程數(shù)目的提升而不斷提升;
②嵌入式多核處理器相對(duì)于PC處理器而言,其總線(xiàn)速度較慢,并且緩存(Cache)更小,會(huì)造成大量數(shù)據(jù)在內(nèi)存(Memory)和緩存(Cache)問(wèn)不斷拷貝,因此在進(jìn)行并行化優(yōu)化的過(guò)程中,應(yīng)考慮緩存友好性(Cache friendly);
?、鄢绦虿⑿谢瘓?zhí)行線(xiàn)程數(shù)目應(yīng)當(dāng)小于或等于物理處理器的數(shù)目,線(xiàn)程過(guò)多會(huì)造成線(xiàn)程間搶占處理器資源,致使并行化性能下降。
2 OpenMP并行化優(yōu)化
2.1 0penMP工作原理簡(jiǎn)介
OpenMP是一個(gè)基于共享內(nèi)存模式的跨平臺(tái)多線(xiàn)程并行的編程接口。主線(xiàn)程生成一系列的子線(xiàn)程,并將任務(wù)映射到子線(xiàn)程進(jìn)行執(zhí)行,這些子線(xiàn)程并行執(zhí)行,由運(yùn)行時(shí)環(huán)境將線(xiàn)程分配給不同的物理處理器。默認(rèn)情況下,各個(gè)線(xiàn)程獨(dú)立執(zhí)行并行區(qū)域的代碼。可以使用work-sharingconstructs來(lái)劃分任務(wù),使每個(gè)線(xiàn)程執(zhí)行其分配部分的代碼。通過(guò)這種方式,使用OpenMP可以實(shí)現(xiàn)任務(wù)并行和數(shù)據(jù)并行。

圖2任務(wù)并行模型
任務(wù)并行模式創(chuàng)建一系列獨(dú)立的線(xiàn)程,每一個(gè)線(xiàn)程運(yùn)行一個(gè)任務(wù),線(xiàn)程之間相互獨(dú)立,如圖2所示。OpenMP使用編譯原語(yǔ)session directive和task directive來(lái)實(shí)現(xiàn)任務(wù)分配,每個(gè)線(xiàn)程可以獨(dú)立運(yùn)行不同的代碼區(qū)域,同時(shí)支持任務(wù)的嵌套和遞歸。一旦創(chuàng)建任務(wù),該任務(wù)就可能會(huì)在線(xiàn)程池(其大小等于物理線(xiàn)程數(shù)目)中空閑的線(xiàn)程上執(zhí)行。
1嵌入式多核處理器結(jié)構(gòu)
嵌人式多核處理器的結(jié)構(gòu)包括同構(gòu)(Symmetric)和異構(gòu)(Asymmetric)兩種。同構(gòu)是指內(nèi)部核的結(jié)構(gòu)是相同的,這種結(jié)構(gòu)目前廣泛應(yīng)用在PC多核處理器;而異構(gòu)是指內(nèi)部核的結(jié)構(gòu)是不同的,這種結(jié)構(gòu)常常在嵌入式領(lǐng)域使用,常見(jiàn)的是通用嵌入式處理器+DSP核。本文探究的嵌入式多核處理器采用同構(gòu)結(jié)構(gòu),實(shí)現(xiàn)同一段代碼在不同處理器上的并行執(zhí)行。

圖1 ARM SMP處理器結(jié)構(gòu)
在目前嵌入式領(lǐng)域中,使用最為廣泛的為ARM處理器,因此以ARM雙核處理器OMAP4430作為研究對(duì)象。ARM對(duì)稱(chēng)多處理(Symmetric Multi-Processing,SMP)結(jié)構(gòu)如圖1所示,根據(jù)程序的局部性原理,每一個(gè)處理器都具有私有的內(nèi)存(Local Memory),常見(jiàn)的是一級(jí)緩存(L1Cache)。然而,多個(gè)處理器之間又涉及到相互通信問(wèn)題,因此在常見(jiàn)的ARM處理器中使用二級(jí)緩存(L2 Cache)來(lái)解決這一問(wèn)題?;趯?duì)稱(chēng)多處理器結(jié)構(gòu),所有的處理器(通常為2的倍數(shù))在硬件結(jié)構(gòu)上都是相同的,在使用系統(tǒng)資源上也是平等的。更重要的是,由于所有的處理器都有權(quán)利去訪問(wèn)相同的內(nèi)存空間,在共享內(nèi)存區(qū)域中,任何一個(gè)進(jìn)程或者線(xiàn)程都可以運(yùn)行在任意一個(gè)處理器之上,這樣就使得程序的并行化成為可能。2在嵌入式多核平臺(tái)上進(jìn)行并行化優(yōu)化,需要考慮以下問(wèn)題:
?、俨⑿谢绦虻男阅苋Q于程序中串行化部分,程序性能不會(huì)隨著并行線(xiàn)程數(shù)目的提升而不斷提升;
②嵌入式多核處理器相對(duì)于PC處理器而言,其總線(xiàn)速度較慢,并且緩存(Cache)更小,會(huì)造成大量數(shù)據(jù)在內(nèi)存(Memory)和緩存(Cache)問(wèn)不斷拷貝,因此在進(jìn)行并行化優(yōu)化的過(guò)程中,應(yīng)考慮緩存友好性(Cache friendly);
?、鄢绦虿⑿谢瘓?zhí)行線(xiàn)程數(shù)目應(yīng)當(dāng)小于或等于物理處理器的數(shù)目,線(xiàn)程過(guò)多會(huì)造成線(xiàn)程間搶占處理器資源,致使并行化性能下降。
2 OpenMP并行化優(yōu)化
2.1 0penMP工作原理簡(jiǎn)介
OpenMP是一個(gè)基于共享內(nèi)存模式的跨平臺(tái)多線(xiàn)程并行的編程接口。主線(xiàn)程生成一系列的子線(xiàn)程,并將任務(wù)映射到子線(xiàn)程進(jìn)行執(zhí)行,這些子線(xiàn)程并行執(zhí)行,由運(yùn)行時(shí)環(huán)境將線(xiàn)程分配給不同的物理處理器。默認(rèn)情況下,各個(gè)線(xiàn)程獨(dú)立執(zhí)行并行區(qū)域的代碼。可以使用work-sharingconstructs來(lái)劃分任務(wù),使每個(gè)線(xiàn)程執(zhí)行其分配部分的代碼。通過(guò)這種方式,使用OpenMP可以實(shí)現(xiàn)任務(wù)并行和數(shù)據(jù)并行。

圖2任務(wù)并行模型
任務(wù)并行模式創(chuàng)建一系列獨(dú)立的線(xiàn)程,每一個(gè)線(xiàn)程運(yùn)行一個(gè)任務(wù),線(xiàn)程之間相互獨(dú)立,如圖2所示。OpenMP使用編譯原語(yǔ)session directive和task directive來(lái)實(shí)現(xiàn)任務(wù)分配,每個(gè)線(xiàn)程可以獨(dú)立運(yùn)行不同的代碼區(qū)域,同時(shí)支持任務(wù)的嵌套和遞歸。一旦創(chuàng)建任務(wù),該任務(wù)就可能會(huì)在線(xiàn)程池(其大小等于物理線(xiàn)程數(shù)目)中空閑的線(xiàn)程上執(zhí)行。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 嵌入式控制系統(tǒng)的ARM處理器
- 基于ARM微處理器的嵌入式TCP-IP協(xié)議的實(shí)現(xiàn)與應(yīng)用
- ARM處理器與嵌入式系統(tǒng)
- 如何使用FPGA實(shí)現(xiàn)嵌入式多核處理器及SUSAN算法并行化 8次下載
- 使用ARM實(shí)現(xiàn)嵌入式處理器的最小系統(tǒng) 16次下載
- ARM嵌入式處理器的GNU工具應(yīng)用程序免費(fèi)下載 7次下載
- 嵌入式系統(tǒng)教程之嵌入式處理器的詳細(xì)資料說(shuō)明 18次下載
- 幾種基本嵌入式處理器的介紹和應(yīng)用概述包括Sitara,ARM,Cortex等 11次下載
- 嵌入式多核處理器任務(wù)調(diào)度研究 1次下載
- 嵌入式軟件開(kāi)發(fā)之基于ARM處理器的嵌入式系統(tǒng)設(shè)計(jì)方案解析 1次下載
- 嵌入式也多核_淺析ARM_Cortex A9 MP Core多核處理器 11次下載
- 基于FPGA的嵌入式多核處理器及SUSAN算法并行化 24次下載
- ARM嵌入式處理器結(jié)構(gòu)與應(yīng)用基礎(chǔ) 9次下載
- 嵌入式RISC處理器體系結(jié)構(gòu)并行技術(shù)的研究 30次下載
- 嵌入式系統(tǒng)及ARM微處理器概述
- dsp是嵌入式微處理器的一種設(shè)備嗎 ARM嵌入式微處理器有何特點(diǎn)? 1043次閱讀
- 什么是嵌入式微處理器?嵌入式微處理器有哪些? 1069次閱讀
- 嵌入式微處理器的原理和應(yīng)用 991次閱讀
- 嵌入式處理器簡(jiǎn)介和種類(lèi) 1085次閱讀
- Arm?ML處理器 嵌入式評(píng)估工具包介紹 8193次閱讀
- 基于嵌入式微處理器EP9315和Linux實(shí)現(xiàn)NAS系統(tǒng)的設(shè)計(jì) 2824次閱讀
- 嵌入式處理器的種類(lèi)有哪些 2.1w次閱讀
- 關(guān)于嵌入式ARM多核處理器的并行方法 4279次閱讀
- Intel嵌入式處理器的相關(guān)基礎(chǔ)知識(shí) 1320次閱讀
- 淺談arm處理器的優(yōu)勢(shì) 1.2w次閱讀
- 基于32位ARM920T內(nèi)核的微處理器的嵌入式Linux系統(tǒng)構(gòu)建詳解 1913次閱讀
- 基于ARM9處理器的嵌入式網(wǎng)絡(luò)撥號(hào)設(shè)計(jì)與實(shí)現(xiàn) 1673次閱讀
- 嵌入式處理器匯總_常見(jiàn)的嵌入式處理器對(duì)比分析 1.4w次閱讀
- 32位嵌入式處理器與8位處理器應(yīng)用開(kāi)發(fā)的區(qū)別 1579次閱讀
- 嵌入式ARM多核處理器并行化方法 1610次閱讀
下載排行
本周
- 1TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開(kāi)關(guān)電源基礎(chǔ)知識(shí)
- 5.73 MB | 6次下載 | 免費(fèi)
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的光纖通信系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 0.61 MB | 2次下載 | 免費(fèi)
- 6基于FPGA的C8051F單片機(jī)開(kāi)發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33564次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21548次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書(shū))
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6653次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537796次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191185次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183278次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論