99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在不改變RTL代碼的情況下,優(yōu)化FPGA HLS設(shè)計(jì)

454398 ? 來(lái)源:賽靈思中文社區(qū) ? 作者:賽靈思中文社區(qū) ? 2020-12-20 11:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

用軟件從 C 轉(zhuǎn)化來(lái)的 RTL 代碼其實(shí)并不好理解。今天我們就來(lái)談?wù)劊绾卧诓桓淖?RTL 代碼的情況下,提升設(shè)計(jì)性能。

本項(xiàng)目所需應(yīng)用與工具:賽靈思HLS、Plunify Cloud 以及 InTime。

前言
高層次的設(shè)計(jì)可以讓設(shè)計(jì)以更簡(jiǎn)潔的方法捕捉,從而讓錯(cuò)誤更少,調(diào)試更輕松。然而,這種方法最受詬病的是對(duì)性能的犧牲。在復(fù)雜的 FPGA 設(shè)計(jì)上實(shí)現(xiàn)高性能,往往需要手動(dòng)優(yōu)化 RTL 代碼,這也意味著從 C 轉(zhuǎn)化得到 RTL 基本不可能。其實(shí),使用 FPGA 工具設(shè)置來(lái)優(yōu)化設(shè)計(jì)可以最小限度地減少對(duì)性能的犧牲,這種方法是存在的。

高效地找到合適的FPGA工具設(shè)置
盡管工程師們知道 FPGA 工具的設(shè)置,但是這些設(shè)置往往并沒(méi)有充分利用。一般而言,工具設(shè)置只有在出現(xiàn)時(shí)序問(wèn)題的時(shí)候才會(huì)派上用途。然而,對(duì)于已經(jīng)達(dá)到性能目標(biāo)的設(shè)計(jì)來(lái)說(shuō),如果繼續(xù)調(diào)整工具設(shè)計(jì),仍然有10%-50%的性能提升潛力。

真正的難點(diǎn)在于選擇正確的工具設(shè)置,畢竟各種 FPGA 工具一般都有有30-70個(gè)不同的布局布線設(shè)置,可選的設(shè)置組合實(shí)在是太多了。您可以寫(xiě)腳本來(lái)運(yùn)行不同的推薦指令/策略。市面上也有工具,來(lái)自動(dòng)管理并運(yùn)行設(shè)計(jì)探索。

另一個(gè)難點(diǎn)就是不充裕的計(jì)算能力。典型的嵌入式應(yīng)用是在單臺(tái)電腦上設(shè)計(jì)的。運(yùn)行多個(gè)編譯需要更多的計(jì)算能力,這就要求更多的時(shí)間。如果您可以(使用云計(jì)算)并行運(yùn)行,周轉(zhuǎn)時(shí)間就會(huì)變短。

如何優(yōu)化高層次的設(shè)計(jì) - “Sobel濾鏡”項(xiàng)目
這是一個(gè)用于視屏處理的參考設(shè)計(jì),來(lái)自賽靈思的官網(wǎng) https://china.xilinx.com/support/documentation/application_notes/xapp890... 。該設(shè)計(jì)的功能是 Sobel 濾鏡,目標(biāo)器件是擁有雙核Dual ARM? Cortex?-A9MPCore 的 FPGA。

我們使用賽靈思 HLS 來(lái)打開(kāi)這個(gè)設(shè)計(jì)。

圖一:參考設(shè)計(jì)– Sobel濾鏡

圖一:參考設(shè)計(jì)– Sobel濾鏡

它的時(shí)鐘周期是5.00ns,也就是200MHz。從下圖的時(shí)序預(yù)估中可以看出,它離時(shí)序目標(biāo)還差506ps(181MH1),也就是比目標(biāo)速率還差10%。

圖二:當(dāng)前時(shí)序結(jié)果

圖二:當(dāng)前時(shí)序結(jié)果

導(dǎo)出成 RTL 項(xiàng)目
不需要改變 C++ 代碼,把設(shè)計(jì)輸出成一個(gè)RTL 的 Vivado 項(xiàng)目。在 “Solution”下面,選擇“Export RTL”。

圖三:從HLS輸出Vivado項(xiàng)目

圖三:從HLS輸出Vivado項(xiàng)目

它會(huì)在后臺(tái)執(zhí)行 Vivado,并生成一個(gè)項(xiàng)目文件(XPR)。它同時(shí)也會(huì)編譯設(shè)計(jì),您應(yīng)該在控制臺(tái)(Console)看到真實(shí)的時(shí)序細(xì)節(jié)。一旦完成,您可以在 /solution/impl/verilog/ 文件夾下找到項(xiàng)目文件。

圖四:Vivado 項(xiàng)目文件

圖四:Vivado 項(xiàng)目文件

找到這個(gè) XPR 文件之后,您可以用 Vivado 打開(kāi)它來(lái)驗(yàn)證。您將看到生成好的 RTL 源文件。

圖五:從 HLS 生成的 RTL

圖五:從 HLS 生成的 RTL

時(shí)序優(yōu)化
下一步,是使用 InTime 設(shè)計(jì)探索工具,當(dāng)然,您也可以自己寫(xiě)腳本來(lái)嘗試 Vivado 工具中自帶的指令和策略。請(qǐng)申請(qǐng) InTime 的免費(fèi)試用在本地運(yùn)行,也可以注冊(cè)一個(gè) Plunify Cloud 云平臺(tái)的賬戶(hù),試用所提供的免費(fèi)云幣來(lái)在云端運(yùn)行預(yù)置好的 FPGA 工具。

啟動(dòng) InTime 之后,打開(kāi)項(xiàng)目文件。在選擇 Vivado 版本時(shí),請(qǐng)使用“相同的”版本。例如,如果您使用2017.3 HLS,請(qǐng)選擇2017.3 Vivado。

選擇“Hot Start”配方(recipe)。此配方包含一系列更具以往其他設(shè)計(jì)的經(jīng)驗(yàn)而推薦的策略。

圖六:選擇

圖六:選擇 "Hot Start" 配方

點(diǎn)擊“Start Recipe”來(lái)開(kāi)始優(yōu)化。如果您在云端運(yùn)行,您應(yīng)該并行運(yùn)行多個(gè)編譯來(lái)減少周轉(zhuǎn)時(shí)間。

優(yōu)化過(guò)程和結(jié)果
第一輪結(jié)束之后 (“Hot Start”配方),最好的結(jié)果是“hotstart_1”策略。然而,它仍然距離目標(biāo)時(shí)序90ns。

我們?cè)凇癏otStart_1”的結(jié)果上使用了第二個(gè)配方,叫做“Extra Opt Exploration”。這一輪將集中優(yōu)化關(guān)鍵的路徑。這是一次迭代優(yōu)化,并且只要仍有提升,就不斷地重復(fù)自己。如果達(dá)到時(shí)序目標(biāo)或者不再提升的時(shí)候,它就會(huì)停止。

圖七:僅通過(guò)工具設(shè)置完成時(shí)序收斂

圖七:僅通過(guò)工具設(shè)置完成時(shí)序收斂

經(jīng)過(guò)兩輪優(yōu)化,總共15此編譯后,設(shè)計(jì)達(dá)到了目標(biāo)時(shí)序,200MHz。而這一切完全沒(méi)有修改 RTL 源代碼。

讓性能更進(jìn)一步
讓性能更進(jìn)一步需要各方面的優(yōu)化 – 結(jié)構(gòu)設(shè)計(jì)、代碼和工具。工具設(shè)置的探索可以克服高層次設(shè)計(jì)的性能犧牲,并且不會(huì)讓生產(chǎn)效率的好處減少。對(duì)于高層次設(shè)計(jì)的工程師來(lái)說(shuō),這是一種共贏。

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22046

    瀏覽量

    618293
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    何在Unified IDE中創(chuàng)建視覺(jué)庫(kù)HLS組件

    最近我們分享了開(kāi)發(fā)者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 傳統(tǒng) IDE)和開(kāi)發(fā)者分享|AMD Vitis HLS 系列 2:AMD
    的頭像 發(fā)表于 07-02 10:55 ?489次閱讀
    如<b class='flag-5'>何在</b>Unified IDE中創(chuàng)建視覺(jué)庫(kù)<b class='flag-5'>HLS</b>組件

    FX2LP如何在不更改硬件的情況下對(duì)其進(jìn)行重新編程?

    我正在使用 FX2LP/ CY7C68013A-128AXC設(shè)備(定制板),我有一些問(wèn)題需要您的幫助。 1如果我的 EEPROM 已經(jīng)有固件并且正在運(yùn)行,如何在不更改硬件的情況下對(duì)其進(jìn)行重新
    發(fā)表于 05-06 11:16

    Vivado HLS設(shè)計(jì)流程

    直接使用C、C++或 System C 來(lái)對(duì) Xilinx 系列的 FPGA 進(jìn)行編程,從而提高抽象的層級(jí),大大減少了使用傳統(tǒng) RTL描述進(jìn)行 FPGA 開(kāi)發(fā)所需的時(shí)間。
    的頭像 發(fā)表于 04-16 10:43 ?732次閱讀
    Vivado <b class='flag-5'>HLS</b>設(shè)計(jì)流程

    LPC1227FBD48如何在沒(méi)有SDK的情況下配置FreeRTOS?

    我想在基于 LPC1227FBD48 系列的現(xiàn)有項(xiàng)目中使用 FreeRTOS,但我們沒(méi)有可用于控制器的 SDK。我們?nèi)?b class='flag-5'>何在沒(méi)有 SDK 的情況下配置 FreeRTOS。
    發(fā)表于 04-02 06:33

    LMX2595在不改變設(shè)定參數(shù)的情況下,能實(shí)現(xiàn)多寬范圍的倍頻?

    我想問(wèn)一LMX2595在倍頻的過(guò)程中,在不改變設(shè)定參數(shù)的情況下,能實(shí)現(xiàn)多寬范圍的倍頻?
    發(fā)表于 12-12 07:05

    助力AIoT應(yīng)用:在米爾FPGA開(kāi)發(fā)板上實(shí)現(xiàn)Tiny YOLO V4

    、 使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開(kāi)發(fā)板當(dāng) HLS 生成的 RTL 代碼準(zhǔn)備就緒后,可以使用 Vivado 將模型部署到
    發(fā)表于 12-06 17:18

    請(qǐng)問(wèn)ADS1292R如何在MCU休眠的情況下通過(guò)脫落檢測(cè)喚醒MCU?

    請(qǐng)問(wèn)ADS1292R如何在MCU休眠的情況下通過(guò)脫落檢測(cè)喚醒MCU?
    發(fā)表于 11-28 08:03

    AIC3106如何在不改變BCLK和LRCLK的情況下,能夠調(diào)好?

    你好,請(qǐng)問(wèn):AIC3106現(xiàn)在配置為從設(shè)備、DAC采樣率為16K、數(shù)據(jù)寬度為32位?,F(xiàn)在主設(shè)備給的BCLK是2048K,LRCLK為16K,播放現(xiàn)在有問(wèn)題,如何在不改變BCLK和LRCLK的情況下,能夠調(diào)好?
    發(fā)表于 10-28 07:06

    有沒(méi)有什么辦法在不改變電源和功率的情況下來(lái)解決TPA311XD2失真的問(wèn)題?

    換了大電源之后就沒(méi)有失真了,有沒(méi)有什么辦法在不改變電源和功率的情況下來(lái)解決芯片失真的問(wèn)題,謝謝?。?!
    發(fā)表于 10-25 08:34

    TAS5548如何在輸入信號(hào)改變情況下,讓38和39這兩個(gè)引腳輸出的PWM產(chǎn)生變化?

    請(qǐng)問(wèn)如何調(diào)整,才能在輸入信號(hào)改變情況下,38和39這兩個(gè)引腳輸出的PWM產(chǎn)生變化?通過(guò)配置I2C可以調(diào)整這三個(gè)AD Mode, BD Mode and Ternary Mode模式,但是輸入
    發(fā)表于 10-17 08:01

    PCM1795如何在通電的情況下切換PCM模式和DSD模式?

    Ti工程師您好,項(xiàng)目上有用到PCM1795這枚芯片,因?yàn)樗哂蠨SD解碼與PCM解碼功能,之前沒(méi)有使用過(guò)類(lèi)似產(chǎn)品 有兩個(gè)問(wèn)題請(qǐng)教下: 1、用MCU初始化PCM1795讓它能正常工作,至少需要配置哪幾個(gè)相關(guān)寄存器 2、如何在通電的情況下 切換PCM模式和DSD模式或者說(shuō)
    發(fā)表于 09-29 06:00

    在不犧牲尺寸的情況下提高脈搏血氧儀溶液的性能

    電子發(fā)燒友網(wǎng)站提供《在不犧牲尺寸的情況下提高脈搏血氧儀溶液的性能.pdf》資料免費(fèi)下載
    發(fā)表于 09-21 10:54 ?0次下載
    在不犧牲尺寸的<b class='flag-5'>情況下</b>提高脈搏血氧儀溶液的性能

    LM324用10V單電源,加入正弦波放大后飽和只有7.4V,如何在不改變10V電源的情況使之能放大成9V?

    LM324用10V單電源,加入正弦波放大后飽和只有7.4V,能有辦法在不改變10V電源的情況使之能放大成9V嗎
    發(fā)表于 09-12 06:26

    在不影響性能或占用空間的情況下隔離您的CAN系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《在不影響性能或占用空間的情況下隔離您的CAN系統(tǒng).pdf》資料免費(fèi)下載
    發(fā)表于 08-29 10:49 ?0次下載
    在不影響性能或占用空間的<b class='flag-5'>情況下</b>隔離您的CAN系統(tǒng)

    優(yōu)化 FPGA HLS 設(shè)計(jì)

    優(yōu)化 FPGA HLS 設(shè)計(jì) 用工具用 C 生成 RTL代碼基本不可讀。以下是如何在
    發(fā)表于 08-16 19:56