1XDF(賽靈思開發(fā)者大會)在北京國際飯店舉行。作為業(yè)界最權(quán)威、最具深度的FPGA交流大會之一,Xilinx把行業(yè)最頂尖的FPGA專家和企業(yè)匯聚一堂,集思廣益,分享和交流FPGA產(chǎn)品開發(fā)經(jīng)驗與應(yīng)用方案,為業(yè)內(nèi)軟硬件開發(fā)者與設(shè)計者提供獨(dú)到的見解和靈感。Xilinx CEO Victor Peng 、華為IT智能計算業(yè)務(wù)副總裁張小華、阿里云FPGA異構(gòu)計算研發(fā)總監(jiān)張振祥等業(yè)內(nèi)領(lǐng)袖出席。同時,在會上,賽靈思推出了業(yè)界首款自適應(yīng)計算加速平臺Versal和加速器Alveo,引爆現(xiàn)場。
作為Xilinx在中國智能汽車電子領(lǐng)域唯一的Certified member,深圳市自行科技有限公司(簡稱:自行科技)受邀參加,公司聯(lián)合創(chuàng)始人兼CTO諶璟博士在現(xiàn)場分享了“基于FPGA的計算機(jī)視覺系統(tǒng)設(shè)計與開發(fā)”的主題演講。諶璟博士結(jié)合其多年的深度學(xué)習(xí)與FPGA開發(fā)經(jīng)驗,從性能、成本、開發(fā)難度等多個維度出發(fā),提出一套系統(tǒng)化的FPGA深度神經(jīng)網(wǎng)絡(luò)優(yōu)化流程,受到了Xilinx AI及邊緣計算產(chǎn)品營銷總監(jiān)Nick與機(jī)器學(xué)習(xí)產(chǎn)品營銷高級經(jīng)理Andy等業(yè)內(nèi)專家的高度贊賞。
圖文:自行科技聯(lián)合創(chuàng)始人兼CTO諶璟博士做主題演講
諶博認(rèn)為,CNN與FPGA的結(jié)合可以組合利用多種算法模塊,充分發(fā)揮FPGA在計算速度、功耗、成本等方面的優(yōu)勢,降低開發(fā)難度與周期,減少開發(fā)成本。但是CNN中存在大量冗余計算,因此如何在FPGA中實(shí)現(xiàn)CNN加速設(shè)計就尤為重要。
諶璟博士演講獲得現(xiàn)場嘉賓觀眾一致好評
自行科技通過多年CNN與FPGA自主研發(fā)經(jīng)驗,開發(fā)出業(yè)內(nèi)最具性價比的FPGA加速設(shè)計方案。會中,她表示,F(xiàn)PGA加速設(shè)計需要算法工程師和FPGA工程師共同參與。一方面,通過剪枝壓縮、權(quán)值壓縮等方法對網(wǎng)絡(luò)壓縮算法進(jìn)行優(yōu)化,以減少網(wǎng)絡(luò)冗余計算,釋放可用資源。例如,我們可以僅僅將少數(shù)“重要”的卷積核量化為8bit權(quán)值,其余卷積核用1bit權(quán)值表示,構(gòu)造混合精度網(wǎng)絡(luò),在確保網(wǎng)絡(luò)檢測性能的基礎(chǔ)上大幅度提高計算效率。另一方面,不同的FPGA架構(gòu)需要適配對應(yīng)的CNN網(wǎng)絡(luò)結(jié)構(gòu),因此需要有針對性地進(jìn)行并行化和結(jié)構(gòu)化設(shè)計,讓計算模塊得到充分利用,避免大量計算資源閑置。同時,在進(jìn)行網(wǎng)絡(luò)設(shè)計時還要充分利用FPGA片內(nèi)資源,避免DSP計算資源與邏輯資源的浪費(fèi)。
以SSD網(wǎng)絡(luò)為例,在不考慮其他操作帶來的時延(DDR時延、FSM狀態(tài)轉(zhuǎn)移時延~等)的情況下,Xilinx zynq7020在CNN計算幀率最高可達(dá)5.7fps;但是,自行科技通過權(quán)值壓縮、并行化設(shè)計等CNN網(wǎng)絡(luò)加速設(shè)計和算法優(yōu)化后,計算幀率提升了4-5倍,大大提高了芯片的運(yùn)行效率,成為了業(yè)內(nèi)低成本高效率FPGA應(yīng)用典范!
最后,諶博總結(jié)到:“FPGA與CNN的結(jié)合具備廣泛的應(yīng)用前景,但是在開發(fā)的過程中也需要我們不斷克服困難和挑戰(zhàn)。當(dāng)前FPGA平臺技術(shù)與工具不斷迭代更新,這就需要我們時刻關(guān)注世界最前沿的技術(shù)。今天我非常高興在現(xiàn)場見證了業(yè)界首款自適應(yīng)計算加速平臺Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創(chuàng)新進(jìn)程,還為我們探索更優(yōu)秀的FPGA加速方案提供了思路。未來,隨著CNN的計算量不斷上升,數(shù)據(jù)吞吐量也會顯著增大,這就需要不斷提高FPGA片內(nèi)BRAM資源利用效率,深入研究CNN模型壓縮算法,優(yōu)化基于FPGA的CNN框架,這也需要行業(yè)共同的努力!”
目前,該方案已經(jīng)成功應(yīng)用于公司的三大產(chǎn)品:前向ADAS系統(tǒng)、駕駛員監(jiān)控(DMS)系統(tǒng)和智能環(huán)視影像系統(tǒng),產(chǎn)品都已順利實(shí)現(xiàn)量產(chǎn)?;贔PGA平臺與CNN算法的深度結(jié)合,自行科技率先開發(fā)出國內(nèi)首款基于深度學(xué)習(xí)技術(shù)的駕駛員監(jiān)控(DMS)系統(tǒng),打造出業(yè)內(nèi)功能最全面、性價比最高的駕駛員監(jiān)控(DMS)系統(tǒng),成為國內(nèi)駕駛員監(jiān)控系統(tǒng)標(biāo)桿企業(yè)。
除此之外,自行科技前向ADAS系統(tǒng)與智能環(huán)視影像系統(tǒng)以其可靠的目標(biāo)檢測準(zhǔn)確性和語義分割精度獲得國內(nèi)眾多傳統(tǒng)車廠(乘用車與商用車)、新能源和互聯(lián)網(wǎng)造車公司和Tier1汽車零部件供應(yīng)商的高度認(rèn)可。相信隨著FPGA開發(fā)技術(shù)的不斷成熟,CNN加速設(shè)計將獲得更廣泛的應(yīng)用,讓我們拭目以待!
-
監(jiān)控系統(tǒng)
+關(guān)注
關(guān)注
21文章
4078瀏覽量
182572 -
高效率
+關(guān)注
關(guān)注
0文章
40瀏覽量
10608 -
異構(gòu)計算
+關(guān)注
關(guān)注
2文章
107瀏覽量
16689
發(fā)布評論請先 登錄
粒子加速器?——?科技前沿的核心裝置

Versal 600G DCMAC Subsystem LogiCORE IP產(chǎn)品指南

第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

小型加速器中子源監(jiān)測系統(tǒng)解決方案

GPU加速計算平臺的優(yōu)勢
消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片
AMD Versal自適應(yīng)SoC器件Advanced Flow概覽(下)


IBM將在云平臺部署AMD加速器
AMD推出第二代Versal Premium系列
AMD Alveo V80計算加速器網(wǎng)絡(luò)研討會
貿(mào)澤開售適用于高性能計算應(yīng)用的AMD Alveo V80加速器卡
AMD Versal自適應(yīng)SoC CPM5 QDMA的Tandem PCIe啟動流程介紹

評論