優(yōu)化 FPGA HLS 設(shè)計
用工具用 C 生成 RTL 的代碼基本不可讀。以下是如何在不更改任何 RTL 的情況下提高設(shè)計性能。
介紹
高級設(shè)計能夠以簡潔的方式捕獲設(shè)計,從而減少錯誤并更容易調(diào)試。然而,經(jīng)常出現(xiàn)的問題是性能權(quán)衡。在高度復(fù)雜的 FPGA 設(shè)計中實現(xiàn)高性能需要手動優(yōu)化 RTL 代碼,而這對于HLS開發(fā)環(huán)境生成的 RTL 代碼來說是不可能的。然而,存在一些解決方案,可以通過使用 FPGA 工具設(shè)置優(yōu)化設(shè)計本身來最大限度地減少性能損失。
高效找到正確的 FPGA 工具設(shè)置
盡管設(shè)計人員知道 FPGA 工具設(shè)置的存在,但這些設(shè)置往往沒有得到充分利用。通常,只有在出現(xiàn)設(shè)計問題時才使用工具設(shè)置。然而,對于已達(dá)到性能目標(biāo)的設(shè)計,還有額外10% 至 50% 性能改進(jìn)的巨大潛力。
上面的核心問題在于選擇正確的工具設(shè)置,因為不同的 FPGA 工具提供 30 到 70 種用于綜合和布局布線的設(shè)置??赡艿慕M合太多了??梢跃帉懩_本來創(chuàng)建不同的運(yùn)行并嘗試推薦的標(biāo)準(zhǔn)指令/策略。
最后一個挑戰(zhàn)問題是計算能力不足。典型的嵌入式應(yīng)用程序是在單臺計算機(jī)上設(shè)計的。運(yùn)行多個編譯需要更多的計算能力。這是與時間的權(quán)衡。如果可以同時運(yùn)行更多(使用云)綜合策略,周轉(zhuǎn)時間將會更短。
如何優(yōu)化高級設(shè)計 - Sobel 濾波器
Sobel 濾波器是視頻處理中常用的參考設(shè)計。該參考設(shè)計針對具有 Dual ARM Cortex-A9 MPCore 的 FPGA。
我們使用 Xilinx HLS 工具來打開此設(shè)計。
它的時鐘周期為 5.00 ns,即 200 MHz。從時序估計(見下文)來看,它仍然缺少 506 ps 的時序,這相當(dāng)于 181 MHz,比目標(biāo)速度低 10%。
導(dǎo)出到 RTL 項目
在不更改 C++ 代碼的情況下,將設(shè)計導(dǎo)出到 RTL 中的 Vivado 項目中。在“解決方案”下,選擇“導(dǎo)出 RTL”。
它將在后臺執(zhí)行 Vivado 并生成項目文件 (XPR)。它還應(yīng)該編譯設(shè)計,并且應(yīng)該在控制臺中看到實際的時序詳細(xì)信息。完成后,在/solution/impl/verilog/文件夾中找到項目文件。
找到一個 XPR 文件??梢酝ㄟ^Vivado打開它來驗證它,可以看到生成的RTL源碼。
優(yōu)化時序
下一步是使用名為InTime 的設(shè)計探索工具(https://www.plunify.com/en/free-evaluation/)。(同樣,可以自己編寫腳本來嘗試 Vivado 工具中提供的標(biāo)準(zhǔn)指令或策略)可以使用免費(fèi)評估許可證在本地運(yùn)行 InTime ?;蛘撸褂靡恍┟赓M(fèi)積分和預(yù)裝 FPGA 工具注冊 Plunify云帳戶。
啟動InTime后,打開項目文件。當(dāng)提示要使用的 Vivado 版本時,請使用“相同”的 Vivado 版本。例如,如果使用2017.3 HLS,請使用2017.3 Vivado。
選擇“熱啟動”?!盁釂印笔腔谥捌渌O(shè)計經(jīng)驗的推薦策略列表。
單擊“Start Recipe”開始優(yōu)化。如果在云上運(yùn)行,則應(yīng)同時運(yùn)行多個編譯以減少時間。
優(yōu)化過程和結(jié)果
在第一輪(“熱啟動”)之后,最好的結(jié)果是“hotstart_1”策略。然而,它仍然缺少-90ps 的時序。
我們對“HotStart_1”的結(jié)果應(yīng)用了名為“Extra Opt Exploration”的第二個秘訣。這側(cè)重于優(yōu)化關(guān)鍵路徑。這是一種迭代優(yōu)化,只要每次迭代都顯示出改進(jìn),就會不斷重復(fù)。如果達(dá)到時間目標(biāo)或未能顯示出改進(jìn),它最終將自動停止。
經(jīng)過兩輪優(yōu)化,共15次編譯,該設(shè)計能夠滿足200Mhz的性能目標(biāo)。這是無需對 RTL 源代碼進(jìn)行任何更改即可實現(xiàn)的。
更高水平的性能
要達(dá)到更高的性能水平,需要在所有方面進(jìn)行優(yōu)化——架構(gòu)設(shè)計、代碼和工具。工具設(shè)置探索可以克服更高級別設(shè)計的性能權(quán)衡,而不會失去它首先帶來的生產(chǎn)力優(yōu)勢。這對于高級設(shè)計師來說是雙贏。
審核編輯:湯梓紅
-
FPGA
+關(guān)注
關(guān)注
1646文章
22054瀏覽量
618822 -
濾波器
+關(guān)注
關(guān)注
162文章
8139瀏覽量
182151 -
RTL
+關(guān)注
關(guān)注
1文章
390瀏覽量
61161 -
腳本
+關(guān)注
關(guān)注
1文章
398瀏覽量
28495 -
HLS
+關(guān)注
關(guān)注
1文章
133瀏覽量
24886
原文標(biāo)題:優(yōu)化 FPGA HLS 設(shè)計
文章出處:【微信號:Open_FPGA,微信公眾號:OpenFPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何在不改變RTL代碼的情況下,優(yōu)化FPGA HLS設(shè)計

優(yōu)化 FPGA HLS 設(shè)計
怎么利用Synphony HLS為ASIC和FPGA架構(gòu)生成最優(yōu)化RTL代碼?
【正點原子FPGA連載】第一章HLS簡介-領(lǐng)航者ZYNQ之HLS 開發(fā)指南
FPGA高層次綜合HLS之Vitis HLS知識庫簡析
使用Vivado高層次綜合 (HLS)進(jìn)行FPGA設(shè)計的簡介
FPGA并行編程:基于HLS技術(shù)優(yōu)化硬件設(shè)計
利用FPGA工具設(shè)置優(yōu)化FPGA HLS設(shè)計

關(guān)于優(yōu)化FPGA HLS設(shè)計的分析和介紹
使用網(wǎng)絡(luò)實例比較FPGA RTL與HLS C/C++的區(qū)別

ThunderGP:基于HLS的FPGA圖形處理框架

FPGA基礎(chǔ)之HLS
FPGA——HLS簡介
如何使用HLS加速FPGA上的FIR濾波器

評論