兩種GPU之間的延遲對(duì)比 AMD RDNA2完勝NVIDIA安培

CPU緩存與內(nèi)存延遲測(cè)試，相信大家都有所耳聞，但是GPU同樣的測(cè)試卻幾乎沒(méi)人做過(guò)。

ChipsAndCheese就做了一次特別的測(cè)試，對(duì)比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存遲問(wèn)題。

首先是AMDRDNA2、NVIDIAAmpere兩家最新架構(gòu)的比拼，代表是RX6900XT、RTX3090，前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了InfinityCache無(wú)限緩存，提升帶寬的同時(shí)，延遲也可圈可點(diǎn)，二級(jí)緩存命中率上只增加了大約20ns的延遲，明顯低于Ampere。

更驚人的是，RDNA2顯存延遲和Ampere幾乎一模一樣，但是別忘了，Ampere只有兩個(gè)層級(jí)的緩存，RDNA2卻有四個(gè)。

Ampere的緩存架構(gòu)更加傳統(tǒng)，SM陣列私有一級(jí)緩存到二級(jí)緩存要增加超過(guò)100ns的延遲，RDNA2從零級(jí)緩存到二級(jí)緩存則只增加了約66ns?？雌饋?lái)，GA102核心面積過(guò)大，也直接增加了延遲。

這正好可以解釋AMDRDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀，因?yàn)槎?jí)緩存、三級(jí)緩存延遲很低，更適合執(zhí)行較小的負(fù)載。Ampere則相反，高負(fù)載下優(yōu)勢(shì)明顯，比如說(shuō)4K分辨率。

說(shuō)完了GPU之間的對(duì)比，那么GPU、CPU放在一起怎么樣呢？這里以RX6900XT、Intel四代酷睿i7-4770為例來(lái)看看。

CPU的緩存自然不是一個(gè)級(jí)別的，所以這里Y軸用了線性數(shù)據(jù)，可以看到全程大大低于RDNA2，搭配DDR3-1600CL9內(nèi)存延遲只有63ns，RX6900XT、GDDR6的組合則有226ns，另外末級(jí)緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIAGPU，包括Maxwell架構(gòu)的GTX980Ti、Pascal架構(gòu)的GTX1080、Turing架構(gòu)的RTX2060Mobile。

Maxwell、Pascal其實(shí)差不多，前者整體略高一些，可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子，一級(jí)緩存延遲低得多，二級(jí)差不多，奇怪的是顯存延遲在32MB之后偏高，原因未知。

AMD考察了TeraScale架構(gòu)的HD5850/6950、GCN架構(gòu)的HD7970，再加上RX6900XT，很明顯在逐代降低，而且是各級(jí)緩存都在同時(shí)進(jìn)步。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

amd

amd

+關(guān)注

關(guān)注
25

文章
5589

瀏覽量
136379
cpu

cpu

+關(guān)注

關(guān)注
68

文章
11080

瀏覽量
217114
數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7256

瀏覽量
91891
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4948

瀏覽量
131253

評(píng)論

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
23小時(shí)前

498 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
11小時(shí)前

389 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
11小時(shí)前

381 閱讀

英飛凌TLD7002-16 OTP PRG的常見問(wèn)題解析

駿龍電子
11小時(shí)前

330 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過(guò)程中的焊接技巧與導(dǎo)通檢查要點(diǎn)

駿龍電子
11小時(shí)前

393 閱讀

AnomalyDetection開源流量異常偵測(cè)工具

吳湛
0.88 MB

2積分

1下載

weweChat基于React和Electron的仿微信客戶端

張?chǎng)?/a>
6.81 MB

免費(fèi)

0下載

 AabResGuard Android aab文件資源混淆工具

郝埃連
6.11 MB

2積分

1下載

HUAWEI Site Kit華為位置服務(wù)SDK

zhongnian
0.64 MB

2積分

1下載

數(shù)字電路與邏輯設(shè)計(jì)

香香技術(shù)員
9.11 MB

免費(fèi)

68下載

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語(yǔ)言模型部署

左岸cpx
20小時(shí)前

68 閱讀

【M-K1HSE開發(fā)板免費(fèi)體驗(yàn)】DevEco Studio應(yīng)用開發(fā)體驗(yàn)(物理機(jī)器運(yùn)行失敗)

jf_1137202360
20小時(shí)前

46 閱讀

【RA-Eco-RA6M4開發(fā)板評(píng)測(cè)】開箱、Hello World（串口+OLED）

jf_57061047
20小時(shí)前

74 閱讀

省錢+環(huán)保+個(gè)性：打造一臺(tái)永不“過(guò)時(shí)”的自定義電腦！

早知
1天前

472 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗(yàn)】+溫度大氣壓檢測(cè)及顯示

jinglixixi
1天前

651 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

兩種GPU之間的延遲對(duì)比 AMD RDNA2完勝NVIDIA安培

評(píng)論