99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCU軟件基準(zhǔn)測(cè)試實(shí)用技巧:編譯器優(yōu)化能力評(píng)測(cè)指引

li5236 ? 來(lái)源:IAR Systems ? 作者:IAR Systems ? 2022-03-29 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MCU開發(fā)和應(yīng)用中,工程師都需要進(jìn)行MCU的能力測(cè)試,通用的做法是用Benchmark(基準(zhǔn))程序來(lái)測(cè)試。然而,在做基準(zhǔn)測(cè)試時(shí),編譯器的優(yōu)化能力也在測(cè)試結(jié)果中有較為明顯的影響,同一套硬件平臺(tái),選用不同的編譯器和不同的優(yōu)化選項(xiàng),可能得出的結(jié)果相差較大。

為了最大程度釋放MCU的性能,在基準(zhǔn)測(cè)試中取得最理想的結(jié)果,往往需要工程師不僅對(duì)自身的硬件比較了解,更需要深入了解編譯器的優(yōu)化原理,并靈活應(yīng)用,才能在基準(zhǔn)測(cè)試中發(fā)揮出MCU的全部性能。IAR Systems作為全球知名嵌入式工具廠商,其編譯器在優(yōu)化能力上有獨(dú)特的優(yōu)勢(shì),MCU配合IAR的編譯器往往能夠得出較好的基準(zhǔn)測(cè)試結(jié)果。

本文以已在MCU領(lǐng)域內(nèi)廣泛使用的IAR Embedded Workbench開發(fā)工具套件為例,來(lái)分享MCU軟件基準(zhǔn)測(cè)試應(yīng)該注意的項(xiàng)目和以下技巧,從而幫助讀者能夠去生成業(yè)內(nèi)最高效和最完備的代碼。利用以下項(xiàng)目和設(shè)置,工程師可以精準(zhǔn)調(diào)整優(yōu)化等級(jí),最大限度地進(jìn)行測(cè)試和提升所開發(fā)和應(yīng)用代碼的性能。

poYBAGJCuFuAbhGVAADZAWuUulQ949.png

選擇代碼尺寸還是執(zhí)行速度

利用IAR Embedded Workbench等開發(fā)工具套件,工程師可以對(duì)整個(gè)工程范圍或?qū)蝹€(gè)文件設(shè)定優(yōu)化級(jí)別和類型。在源代碼中,甚至可以對(duì)單個(gè)函數(shù)使用 #pragma optimize 指令來(lái)完成此操作。

優(yōu)化的目的是減少代碼尺寸和提高執(zhí)行速度。如果只能滿足其中一個(gè)目標(biāo),編譯器會(huì)根據(jù)用戶指定的設(shè)置進(jìn)行優(yōu)先處理。因此,在實(shí)際的軟件基準(zhǔn)測(cè)試中,工程師可以嘗試各種設(shè)置來(lái)獲得最佳效果。舉個(gè)例子,由于函數(shù)內(nèi)聯(lián)更側(cè)重于執(zhí)行速度的優(yōu)化,相較于采用通用代碼尺寸優(yōu)化設(shè)置,采用函數(shù)內(nèi)聯(lián)與通用代碼執(zhí)行速度優(yōu)化設(shè)置將獲得更小的程序代碼

pYYBAGJCuFuAB1K_AADejuqRXu0400.png

選擇小型內(nèi)存模型

為了能夠充分地發(fā)揮MCU器件的性能和減少應(yīng)用中的問(wèn)題,軟件開發(fā)必須充分考慮MCU器件的內(nèi)存等資源限制,因此需要為目標(biāo)器件和項(xiàng)目選擇盡可能小的內(nèi)存模型。小型內(nèi)存模型的優(yōu)點(diǎn)包括:

· 更小尺寸的地址

· 更小尺寸的指令

· 更小尺寸的指針

· 效率更高

· 代碼更少

諸如IAR Embedded Workbench這樣的成熟的開發(fā)工具套件也集成了相關(guān)評(píng)估功能,可以對(duì)內(nèi)存模型進(jìn)行多方面評(píng)估,從而幫助工程師去測(cè)試軟件的規(guī)模和優(yōu)化設(shè)計(jì)。

選擇合適的運(yùn)行時(shí)庫(kù)

默認(rèn)情況下,運(yùn)行時(shí)庫(kù)是以最高代碼尺寸優(yōu)化級(jí)別進(jìn)行編譯的。如果您想要對(duì)速度進(jìn)行優(yōu)化,請(qǐng)考慮重新編譯生成這些庫(kù)??梢酝ㄟ^(guò)配置選項(xiàng)來(lái)設(shè)置某些標(biāo)準(zhǔn)庫(kù)功能(如語(yǔ)言環(huán)境、文件描述符和多字節(jié))最適合的級(jí)別。

根據(jù)具體需求,在庫(kù)選項(xiàng)中選擇 scanf 輸入和 printf 的格式。默認(rèn)選項(xiàng)并非最小格式。

poYBAGJCuFuAPyqLAAExte1Juaw740.png

pYYBAGJCuFuAZipbAACjCF3a-w8595.png

使用正確的數(shù)據(jù)類型

數(shù)據(jù)類型與代碼尺寸或者執(zhí)行速度息息相關(guān),因此需要利用開發(fā)工具來(lái)對(duì)數(shù)據(jù)類型進(jìn)行觀察和分析,以便找到適合硬件資源的類型。在IAR Embedded Workbench開發(fā)工具套件中,開發(fā)人員可以從以下幾個(gè)方面著手進(jìn)行測(cè)試和優(yōu)化:

· 選擇最適合您應(yīng)用程序的的數(shù)據(jù)類型尺寸

· 盡量使用無(wú)符號(hào)字符型,這樣就能執(zhí)行位操作而不是算術(shù)操作

poYBAGJCuFyALLTJAAAb1fU56_I713.png

檢查目標(biāo)特定選項(xiàng)

檢查能提高性能的目標(biāo)特定選項(xiàng),這在日常的MCU設(shè)計(jì)和應(yīng)用開發(fā)中往往需要工程師具有相當(dāng)?shù)慕?jīng)驗(yàn),但是通過(guò)使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件則可以快速而完善地完成必要的性能檢查:

· 高效的尋址模式——可實(shí)現(xiàn)高效的內(nèi)存訪問(wèn)

· 使用特定的寄存器來(lái)處理常量/變量——代碼在寄存器上的操作效率比在內(nèi)存上更高

· 偶對(duì)齊函數(shù)入口——偶對(duì)齊指令可以提高速度

· 字節(jié)對(duì)齊對(duì)象——更小的存儲(chǔ)空間需求,但可能生成更大的代碼尺寸

使用基準(zhǔn)測(cè)試相關(guān)代碼

所有的MCU開發(fā)工具都應(yīng)該提供基準(zhǔn)測(cè)試相關(guān)代碼,但是成熟的通用開發(fā)工具的代碼庫(kù)都是這些提供商在相關(guān)領(lǐng)域經(jīng)驗(yàn)的濃縮,因此更為全面和高效。其中的重要經(jīng)驗(yàn)包括:

· 嵌入式系統(tǒng)的基準(zhǔn)測(cè)試應(yīng)該針對(duì)嵌入式程序的特點(diǎn)來(lái)設(shè)計(jì)。

· 實(shí)際的應(yīng)用程序通常也適用于基準(zhǔn)測(cè)試,但需要確保代碼的可執(zhí)行性。鏈接器會(huì)刪除未引用的代碼和變量,但并非所有的鏈接器都具備這種功能。

· 確保測(cè)試代碼不受測(cè)試工具(測(cè)試相關(guān)函數(shù))的影響。以下示例其實(shí)是對(duì) printf() (測(cè)試相關(guān)函數(shù))進(jìn)行了基準(zhǔn)測(cè)試。

pYYBAGJCuFyAUBB2AAA2GYGYZw8139.png

· 比較鏈接后生成的代碼。一款編譯器可能會(huì)采用內(nèi)聯(lián)代碼,而另一款編譯器可能會(huì)調(diào)用庫(kù)。

· 充分了解用于執(zhí)行基準(zhǔn)測(cè)試的應(yīng)用代碼!

總結(jié)

通過(guò)使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件,發(fā)揮其在幾十年全球性應(yīng)用中行匯聚和迭代出的知識(shí),MCU設(shè)計(jì)和應(yīng)用開發(fā)工程師可以快速完成上述這些必要的性能測(cè)試,同時(shí)也可以進(jìn)一步有針對(duì)性地發(fā)揮MCU的性能,從而實(shí)現(xiàn)目標(biāo)器件最優(yōu)化的、軟硬件合一的功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    17984

    瀏覽量

    367093
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1662

    瀏覽量

    50232
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么樣的代碼會(huì)被編譯器優(yōu)化

    現(xiàn)在的編譯器有多智能,可能你辛辛苦苦寫的代碼,在編譯器看來(lái)就是幾句廢話,直接被刪除掉。
    的頭像 發(fā)表于 01-16 16:38 ?604次閱讀

    Triton編譯器與GPU編程的結(jié)合應(yīng)用

    Triton編譯器簡(jiǎn)介 Triton編譯器是一種針對(duì)并行計(jì)算優(yōu)化編譯器,它能夠自動(dòng)將高級(jí)語(yǔ)言代碼轉(zhuǎn)換為針對(duì)特定硬件優(yōu)化的低級(jí)代碼。Trit
    的頭像 發(fā)表于 12-25 09:13 ?841次閱讀

    Triton編譯器如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯器扮演著至關(guān)重要的角色。它們不僅將高級(jí)語(yǔ)言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行的代碼,還通過(guò)各種優(yōu)化技術(shù)提升程序的性能。Triton 編譯器作為一種先進(jìn)的
    的頭像 發(fā)表于 12-25 09:12 ?750次閱讀

    Triton編譯器優(yōu)化技巧

    在現(xiàn)代計(jì)算環(huán)境中,編譯器的性能對(duì)于軟件的運(yùn)行效率至關(guān)重要。Triton 編譯器作為一個(gè)先進(jìn)的編譯器框架,提供了一系列的優(yōu)化技術(shù),以確保生成的
    的頭像 發(fā)表于 12-25 09:09 ?999次閱讀

    Triton編譯器的優(yōu)勢(shì)與劣勢(shì)分析

    Triton編譯器作為一種新興的深度學(xué)習(xí)編譯器,具有一系列顯著的優(yōu)勢(shì),同時(shí)也存在一些潛在的劣勢(shì)。以下是對(duì)Triton編譯器優(yōu)勢(shì)與劣勢(shì)的分析: 優(yōu)勢(shì) 高效性能優(yōu)化 : Triton
    的頭像 發(fā)表于 12-25 09:07 ?1192次閱讀

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺(tái)的一部分,它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式,以便在NVIDIA GPU上高效運(yùn)行。Triton編譯器
    的頭像 發(fā)表于 12-24 18:13 ?994次閱讀

    TMS320C6000優(yōu)化編譯器v7.4測(cè)試版用戶指南

    電子發(fā)燒友網(wǎng)站提供《TMS320C6000優(yōu)化編譯器v7.4測(cè)試版用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 12-24 17:42 ?0次下載
    TMS320C6000<b class='flag-5'>優(yōu)化</b><b class='flag-5'>編譯器</b>v7.4<b class='flag-5'>測(cè)試</b>版用戶指南

    Triton編譯器支持的編程語(yǔ)言

    Triton編譯器支持的編程語(yǔ)言主要包括以下幾種: 一、主要編程語(yǔ)言 Python :Triton編譯器通過(guò)Python接口提供了對(duì)Triton語(yǔ)言和編譯器的訪問(wèn),使得用戶可以在Python環(huán)境中
    的頭像 發(fā)表于 12-24 17:33 ?969次閱讀

    Triton編譯器與其他編譯器的比較

    的GPU編程框架,使開發(fā)者能夠編寫出接近手工優(yōu)化的高性能GPU內(nèi)核。 其他編譯器 (如GCC、Clang、MSVC等): 定位:通用編譯器,支持多種編程語(yǔ)言,廣泛應(yīng)用于各種軟件開發(fā)場(chǎng)景
    的頭像 發(fā)表于 12-24 17:25 ?1011次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個(gè)開源的編譯器前端,它支持多種編程語(yǔ)言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯器框架,允許開發(fā)者添加新的編程語(yǔ)言特性和優(yōu)化技術(shù)
    的頭像 發(fā)表于 12-24 17:23 ?1689次閱讀

    MSP430優(yōu)化C/C++編譯器v21.6.0.LTS

    電子發(fā)燒友網(wǎng)站提供《MSP430優(yōu)化C/C++編譯器v21.6.0.LTS.pdf》資料免費(fèi)下載
    發(fā)表于 11-08 14:57 ?0次下載
    MSP430<b class='flag-5'>優(yōu)化</b>C/C++<b class='flag-5'>編譯器</b>v21.6.0.LTS

    ARM優(yōu)化C/C++編譯器 v20.2.0.LTS

    電子發(fā)燒友網(wǎng)站提供《ARM優(yōu)化C/C++編譯器 v20.2.0.LTS.pdf》資料免費(fèi)下載
    發(fā)表于 11-07 10:46 ?0次下載
    ARM<b class='flag-5'>優(yōu)化</b>C/C++<b class='flag-5'>編譯器</b> v20.2.0.LTS

    TMS320C6000優(yōu)化C/C++編譯器v8.3.x

    電子發(fā)燒友網(wǎng)站提供《TMS320C6000優(yōu)化C/C++編譯器v8.3.x.pdf》資料免費(fèi)下載
    發(fā)表于 11-01 09:35 ?1次下載
    TMS320C6000<b class='flag-5'>優(yōu)化</b>C/C++<b class='flag-5'>編譯器</b>v8.3.x

    C7000優(yōu)化C/C++編譯器

    電子發(fā)燒友網(wǎng)站提供《C7000優(yōu)化C/C++編譯器.pdf》資料免費(fèi)下載
    發(fā)表于 10-30 09:45 ?0次下載
    C7000<b class='flag-5'>優(yōu)化</b>C/C++<b class='flag-5'>編譯器</b>

    Keil編譯器優(yōu)化方法

    我們都知道,代碼是可以通過(guò)編譯器優(yōu)化的,有的時(shí)候,為了提高運(yùn)行速度或者減少代碼尺寸,會(huì)開啟優(yōu)化選項(xiàng)。
    的頭像 發(fā)表于 10-23 16:35 ?2104次閱讀
    Keil<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>方法