99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>ThunderGP:基于HLS的FPGA圖形處理框架

ThunderGP:基于HLS的FPGA圖形處理框架

2022-10-27 | zip | 0.52 MB | 次下載 | 免費(fèi)

資料介紹

描述

“整個(gè)互聯(lián)網(wǎng)電子商務(wù)世界都是由圖分析驅(qū)動(dòng)的”,因?yàn)閳D結(jié)構(gòu)可以自然地代表許多重要應(yīng)用領(lǐng)域的數(shù)據(jù)集,例如社交網(wǎng)絡(luò)、網(wǎng)絡(luò)安全和機(jī)器學(xué)習(xí)。來(lái)自這些應(yīng)用程序的數(shù)據(jù)對(duì)高性能圖形處理提出了迫切的需求。

大量研究構(gòu)建基于 FPGA 的高效圖形處理加速器;但是,高級(jí)圖形應(yīng)用程序與底層 CPU-FPGA 平臺(tái)之間仍然存在差距,這需要開(kāi)發(fā)人員了解硬件細(xì)節(jié)并進(jìn)行大量編程(例如,使用硬件描述語(yǔ)言進(jìn)行編程、調(diào)整管道和進(jìn)行內(nèi)存優(yōu)化) . 這一差距在很大程度上阻礙了數(shù)據(jù)中心應(yīng)用程序開(kāi)發(fā)人員采用 FPGA。

ThunderGP 有什么大不了的?

ThunderGP 通過(guò)為 FPGA 加速圖形處理帶來(lái)性能和可編程性來(lái)彌補(bǔ)上述差距,并已在FPGA'21中被接受。

ThunderGP 是 FPGA 上基于 HLS 的開(kāi)源圖形處理框架,支持 Vitis 和 SDAccel 開(kāi)發(fā)環(huán)境,適用于 Xilinx Alveo 平臺(tái),如 U50、U200、U250 和 VCU1525。使用 ThunderGP,開(kāi)發(fā)人員只需要編寫使用基于顯式高級(jí)語(yǔ)言 (C++) 且與硬件無(wú)關(guān)的 API 的高級(jí)函數(shù)。隨后,ThunderGP 在具有多個(gè)超級(jí)邏輯區(qū)域 (SLR) 的最先進(jìn) FPGA 平臺(tái)上自動(dòng)生成高性能加速器并管理加速器的部署。

pYYBAGNYkpmAERC5AAEBnp1A6Bo506.png
圖 1:ThunderGP 概覽。它與 Vitis 和 SDAccel 工具兼容。
?

ThunderGP 的概述如圖 1 所示。我們簡(jiǎn)要說(shuō)明主要構(gòu)建塊如下。

  • 內(nèi)置加速器模板。ThunderGP 采用 Gather-Apply-Scatter (GAS) 模型作為各種圖算法的抽象,并通過(guò)內(nèi)置的高并行和內(nèi)存高效的加速器模板來(lái)實(shí)現(xiàn)模型。
  • 自動(dòng)加速器生成。自動(dòng)加速器生成可產(chǎn)生可合成的加速器,釋放底層 FPGA 平臺(tái)的全部潛力。除了內(nèi)置加速器模板外,它還采用圖形算法的分散、聚集和應(yīng)用階段(來(lái)自 GAS 模型)和 FPGA 平臺(tái)模型(例如,U50)的用戶定義函數(shù) (UDF) ) 來(lái)自開(kāi)發(fā)人員作為輸入。
  • 圖分區(qū)和調(diào)度。ThunderGP 采用基于目標(biāo)頂點(diǎn)的垂直分區(qū)方法,無(wú)需引入邊緣排序等繁重的預(yù)處理操作,即可通過(guò)片上 RAM 實(shí)現(xiàn)頂點(diǎn)緩沖。
  • 高級(jí)API。ThunderGP 提供了兩組基于 C++ 的 API:用于自定義圖形算法加速器的加速器 API (Acc-API) 和用于加速器部署和執(zhí)行的 Host-API。

有關(guān) GAS 模型、API 和 ThunderGP 設(shè)計(jì)的詳細(xì)信息,請(qǐng)參閱ThunderGP 技術(shù)報(bào)告(附件或GitHub 上)。

ThunderGP 的易用性如何?

我們進(jìn)行了一個(gè)案例研究——使用 Vitis 2020.1 在 Alveo U50 板上進(jìn)行 COVID-19 的傳播預(yù)測(cè)——以展示 ThunderGP 如何輕松應(yīng)用于現(xiàn)實(shí)生活中的圖形處理問(wèn)題。

及時(shí)預(yù)測(cè)人口水平上隨時(shí)間變化的感染流行率對(duì)于部署適當(dāng)?shù)姆怄i措施(例如隔離或社交距離)以減輕病毒傳播具有重要作用。當(dāng)前的傳播預(yù)測(cè)模型一般由空間元胞自動(dòng)機(jī)(CA)和時(shí)間易感感染清除(SIR)模型組成,其中單元代表一個(gè)居民區(qū)(如縣)并保持其狀態(tài)(如感染率)由 SIR 模型根據(jù)相鄰小區(qū)之間的傳輸進(jìn)行更新。因此,傳播可以表述為一個(gè)圖處理問(wèn)題,其中縣及其連接由圖表示,并且 SIR 通過(guò)圖中的傳播更新。

我們使用 ThunderGP 實(shí)現(xiàn)了三個(gè)傳播模型:CA-SIR [1]、CA-SEIR [2] 和 CA-SAIR [3] 模型。該數(shù)據(jù)集來(lái)自 COVID-19 影響分析平臺(tái) [4],包含 3.1K 縣和 2.3M 連接。

在這里,我們展示了為清單 1 中的 CA-SAIR 模型實(shí)現(xiàn)加速器的示例。對(duì)于分散階段,每個(gè)縣(一個(gè)小區(qū))根據(jù)其感染率及其連接強(qiáng)度計(jì)算感染率以推送到相鄰縣它量化了縣際流動(dòng)的數(shù)量和頻率。對(duì)于聚集階段,該縣會(huì)累積推到它的所有感染率。在申請(qǐng)階段,收集到的感染率用于計(jì)算感染率。注意apply階段涉及到很多用戶自定義參數(shù)(ThunderGP支持apply階段自定義參數(shù),詳見(jiàn)技術(shù)報(bào)告)。

pYYBAGNYkpyAIMe0AAG51Gwcl_Q925.png
清單 1:用于在 U50 平臺(tái)上加速 COVID-19 傳播預(yù)測(cè)的用戶輸入。
?

圖 2 顯示了使用公共數(shù)據(jù)集進(jìn)行預(yù)測(cè)一周后美國(guó)感染風(fēng)險(xiǎn)的可視化。結(jié)果與在 CPU 端執(zhí)行的開(kāi)源 Python 程序 [3] 相匹配。

pYYBAGNYkp6ARHlUAAESLIipjbI602.png
圖 2:從預(yù)測(cè)時(shí)間開(kāi)始一周后感染風(fēng)險(xiǎn)的可視化。
?

表 1 量化了 ThunderGP 在此任務(wù)上所涉及的開(kāi)發(fā)工作,并顯示了與基于 Python 的 CPU 實(shí)現(xiàn)的性能比較[3]。根據(jù)結(jié)果??,使用 ThunderGP 解決這個(gè)問(wèn)題的好處是雙重的。首先,ThunderGP 比基于 CPU 的解決方案實(shí)現(xiàn)了高達(dá)419 倍的加速。能夠在短時(shí)間內(nèi)預(yù)測(cè)傳播可以幫助對(duì)傳播狀況做出快速及時(shí)的反應(yīng)。其次,CA-SIR 模型隨著對(duì)病毒認(rèn)識(shí)的不斷深入而快速發(fā)展。使用 ThunderGP,開(kāi)發(fā)者只需編寫幾十行代碼用于加速預(yù)測(cè)通常一天,這最大限度地減少了開(kāi)發(fā)工作。這個(gè)初步結(jié)果是有希望的,并且系統(tǒng)是開(kāi)源的,我們相信可以進(jìn)行更多的案例研究來(lái)進(jìn)一步評(píng)估可編程性的改進(jìn)。

pYYBAGNYkqGASc_zAAC4rUUSJJM386.png
表 1:ThunderGP 在 U50 平臺(tái)上對(duì) COVID-19 傳播預(yù)測(cè)的開(kāi)發(fā)工作。將數(shù)據(jù)集格式化為標(biāo)準(zhǔn)圖形格式的代碼不計(jì)算在內(nèi)。FPGA 映像的編譯時(shí)間不包括在開(kāi)發(fā)時(shí)間中。
?

[1] 馬富恩特斯等人。物理學(xué) A:統(tǒng)計(jì)力學(xué)及其應(yīng)用,1999。

[2] 何塞 M Carcione 等人。基于確定性 seir 模型的 covid-19 流行病模擬arXiv,2020 年。

[3] 周一望等。用于告知美國(guó)縣級(jí) covid-19 風(fēng)險(xiǎn)的時(shí)空流行病學(xué)預(yù)測(cè)模型。哈佛數(shù)據(jù)科學(xué)評(píng)論,2020 年。

[4] 馬里蘭大學(xué) COVID-19 影響分析平臺(tái)。https: //data.covid.umd.edu,2020-09-10。

ThunderGP 的效率如何?

如前所述,已有大量基于 FPGA 的圖形處理加速器的研究工作。在本章中,我們將與最先進(jìn)的設(shè)計(jì)進(jìn)行公平比較,以展示 ThunderGP 的效率。數(shù)據(jù)集和圖應(yīng)用請(qǐng)參考ThunderGP 技術(shù)報(bào)告。

我們首先將 ThunderGP 與最先進(jìn)的基于 RTL 的工作:Hitgraph [1] 進(jìn)行比較,如表 2 所示。性能指標(biāo)是每秒百萬(wàn)邊緣遍歷 (MTEPS)。所有的實(shí)現(xiàn)都基于四個(gè) SLR,但不同之處在于 HitGraph 沒(méi)有考慮使用多個(gè) SLR 的開(kāi)銷,因?yàn)樗男阅苁腔谀M的,只是簡(jiǎn)單地縮放到多個(gè) SLR 的內(nèi)存帶寬。性能加速高達(dá) 2.9 倍。更重要的是我們讓設(shè)計(jì)在真實(shí)硬件上執(zhí)行。

poYBAGNYkqSACbIdAACmJ7-Cfog822.png
表 2:與最先進(jìn)設(shè)計(jì)的性能比較[1]。
?

然后我們將 ThunderGP 與基于 HLS 的框架進(jìn)行比較:Chen 等人。[2] 和 GraphOps[3]。由于他們的實(shí)驗(yàn)不是使用多個(gè) SLR 進(jìn)行的,因此內(nèi)存帶寬較少,為了進(jìn)行公平比較,我們使用帶寬效率 (MTEPS/(GB/s)) 作為衡量標(biāo)準(zhǔn)。如表 3 所示,ThunderGP 比 GraphOps 實(shí)現(xiàn)了高達(dá) 29.2 倍的絕對(duì)加速和 12.3 倍的帶寬效率提升,比 Chen 等人實(shí)現(xiàn)了 5.2 倍的絕對(duì)加速和 2.4 倍的帶寬效率提升。

poYBAGNYkqaANZgsAAFAf0TAh2c776.png
表 3:在絕對(duì)性能和帶寬效率(BW 效率)方面與最先進(jìn)的基于 HLS 的框架進(jìn)行比較。
?

加速來(lái)自 ThunderGP 的先進(jìn)設(shè)計(jì)。請(qǐng)查看技術(shù)報(bào)告了解更多設(shè)計(jì)細(xì)節(jié)。

[ 1 ]周世杰等.HitGraph:FPGA 上的高吞吐量圖處理框架。TPDS,2019 年。

[2] 陳新宇等。用于在基于 opencl 的 fpgas 上進(jìn)行圖形處理的動(dòng)態(tài)并行數(shù)據(jù)混洗。FPL,2019

[3] Tayo Oguntebi 等人。Graphops:用于圖形分析加速的數(shù)據(jù)流庫(kù)。FPGA,2016 年。

讓我們開(kāi)始使用 ThunderGP!

到目前為止,您可能對(duì) ThunderGP 感興趣!

不用擔(dān)心,我們?cè)?GitHub 存儲(chǔ)庫(kù)中提供了使用 ThunderGP 的分步指南。

對(duì)于第一級(jí)使用,我們?yōu)橹恍枰獌?nèi)置圖形處理算法的用戶編寫指南。

對(duì)于二級(jí)使用,我們引導(dǎo)用戶使用系統(tǒng)提供的API為自己的應(yīng)用定制加速器。

查看 README https://github.com/Xtra-Computing/ThunderGP/tree/develop_u50 中的詳細(xì)說(shuō)明。

?


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1DD3118電路圖紙資料
  2. 0.08 MB   |  1次下載  |  免費(fèi)
  3. 2AD庫(kù)封裝庫(kù)安裝教程
  4. 0.49 MB   |  1次下載  |  免費(fèi)
  5. 3PC6206 300mA低功耗低壓差線性穩(wěn)壓器中文資料
  6. 1.12 MB   |  1次下載  |  免費(fèi)
  7. 4網(wǎng)絡(luò)安全從業(yè)者入門指南
  8. 2.91 MB   |  1次下載  |  免費(fèi)
  9. 5DS-CS3A P00-CN-V3
  10. 618.05 KB  |  1次下載  |  免費(fèi)
  11. 6海川SM5701規(guī)格書
  12. 1.48 MB  |  次下載  |  免費(fèi)
  13. 7H20PR5電磁爐IGBT功率管規(guī)格書
  14. 1.68 MB   |  次下載  |  1 積分
  15. 8IP防護(hù)等級(jí)說(shuō)明
  16. 0.08 MB   |  次下載  |  免費(fèi)

本月

  1. 1貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說(shuō)明
  2. 0.50 MB   |  103次下載  |  1 積分
  3. 2涂鴉各WiFi模塊原理圖加PCB封裝
  4. 11.75 MB   |  89次下載  |  1 積分
  5. 3錦銳科技CA51F2 SDK開(kāi)發(fā)包
  6. 24.06 MB   |  43次下載  |  1 積分
  7. 4錦銳CA51F005 SDK開(kāi)發(fā)包
  8. 19.47 MB   |  19次下載  |  1 積分
  9. 5PCB的EMC設(shè)計(jì)指南
  10. 2.47 MB   |  16次下載  |  1 積分
  11. 6HC05藍(lán)牙原理圖加PCB
  12. 15.76 MB   |  13次下載  |  1 積分
  13. 7802.11_Wireless_Networks
  14. 4.17 MB   |  12次下載  |  免費(fèi)
  15. 8蘋果iphone 11電路原理圖
  16. 4.98 MB   |  6次下載  |  2 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935127次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191390次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183342次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81588次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73815次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65989次下載  |  10 積分