目的
本文介紹廣州星嵌DSPC6657+Xilinx Zynq7035平臺下Xilinx Zynq7035算力指標(biāo)。
基本概念
FLOPs/FLOPS
FLOPs,F(xiàn)loating Point Operations,浮點運算次數(shù),每一個加、減、乘、除操作都算1FLOPs操作,常用來衡量模型計算復(fù)雜度。
注意下FLOPS,注意全大寫,是floating point operations per second的縮寫,意指每秒浮點運算次數(shù),理解為計算速度。是一個衡量硬件性能的指標(biāo),兩者別弄混。
MACs
Multiply–Accumulate Operations,乘加累積操作數(shù),常常被人們與FLOPs概念混淆。實際上1MACs包含一個乘法操作與一個加法操作,大約包含2FLOPs。通常MACs與FLOPs存在一個2倍的關(guān)系。
關(guān)系
為什么使用乘加運算指標(biāo)(MACs)呢?因為神經(jīng)網(wǎng)絡(luò)運算中內(nèi)積、乘加運算無處不在:
對于一個3*3濾波器在特征圖上的一次運算可以表示為:
y = w 0?x 0 + w 1?x 1 + w 2?x 2 + w 3?x 3 + w 4?x 4 + w 5?x 5 + w 6?x 6 + w 7?x 7 + w 8?x 8
對于上式,記w 0?x 0 +…為一次乘加,即1MACs。所以對于上式而言共有9次乘加,即9MACs(實際上,9次相乘、9-1次相加,但為了方便統(tǒng)計,將計算量近似記為9MACs,就像算法復(fù)雜度通常把O(N+b)表示成O(N)一樣,都只是一種近似)。
對于上式而言,可以認(rèn)為執(zhí)行了9次乘法、9-1次加法,所以一共是9+(9-1)次FLOPs。所以近似來看1FLOPs ≈ 2MACs。
ZYNQ PL端算力指標(biāo)
參考Xilinx官方文檔Zynq-7000 SoC Data Sheet: Overview (DS190),可找到Zynq7035PL端的MACs指標(biāo)值為1334GMACs,約為2668GFLOPs,如下圖所示:
FPGA PS端性能指標(biāo)
參考Xilinx官方資料Zynq-7000 SoC Data Sheet: Overview (DS190),可獲得Zynq7035PS端CPU的性能參數(shù),如下圖紅框標(biāo)出的地方所示:
Zynq7035PS端雙ARM總運算能力:2.5DMIPS/MHz Per CPU x 1000 MHz x 2 CPU = 5000 DMIPS。
審核編輯:湯梓紅
-
dsp
+關(guān)注
關(guān)注
556文章
8155瀏覽量
357138 -
濾波器
+關(guān)注
關(guān)注
162文章
8133瀏覽量
181930 -
Xilinx
+關(guān)注
關(guān)注
73文章
2184瀏覽量
125215 -
算力
+關(guān)注
關(guān)注
2文章
1189瀏覽量
15628
發(fā)布評論請先 登錄
[XILINX] 正點原子ZYNQ7035/7045/7100開發(fā)板發(fā)布、ZYNQ 7000系列、雙核ARM、PCIe2.0、SFPX2!

zynq XC7Z100板卡學(xué)習(xí)資料:基于zynq XC7Z100 FMC接口通用計算平臺
Xilinx Zynq7035算力指標(biāo)
Xilinx Zynq7035 PL SFP光口通信例程
Xilinx Zynq7035 PL Cameralink回環(huán)實現(xiàn)
Xilinx客戶分享Zynq SoC設(shè)計成功經(jīng)驗
Xilinx:如何使用Zynq仿真平臺
如何使用Xilinx SDK創(chuàng)建Zynq引導(dǎo)映像
ZYNQ7000開發(fā)平臺的AX7Z035開發(fā)板用戶手冊免費下載

Xilinx Zynq上FreeRTOS的Tracealyzer

評論