(文章來(lái)源:中關(guān)村在線)
隨著AMD的全新7nm制程工藝的RDNA架構(gòu)推出,代表著AMD在未來(lái)的GPU市場(chǎng)上將有一番大作為,在過去的幾代中,AMD的GPU已經(jīng)利用了很久的基于GCN架構(gòu)的計(jì)算單元。GCN多年來(lái)一直很好地服務(wù)于AMD,并且非常適合各種工作負(fù)載,但是對(duì)于Radeon RX 5700系列和Navi核心,AMD的GCN架構(gòu)已經(jīng)不能繼續(xù)滿足了,因此他們推出了全新的RDNA(Radeon DNA)架構(gòu)。
RDNA架構(gòu)采用臺(tái)積電的7nm制程工藝,GDDR6顯存,支持PCI Express 4.0接口。GPU還采用了新的Radeon Media和Radeon Display引擎,以更好地滿足流媒體和內(nèi)容創(chuàng)作者的需求,并引入一系列新的顯示技術(shù)。
Navi核心中的新COMPUTE UNIT(CU單元)設(shè)計(jì)具有多級(jí)緩存層次結(jié)構(gòu)和簡(jiǎn)化的圖形管道,不僅可以提高每時(shí)鐘性能,還可以提高時(shí)鐘頻率。新的CU提供雙倍的GCN指令速率,并且具有兩倍的標(biāo)量單位數(shù)和調(diào)度程序數(shù)。通過資源池,兩個(gè)CU可以協(xié)調(diào)并充當(dāng)工作組處理器。例如,64個(gè)線程可以分組為兩個(gè)Wave32指令,并在單個(gè)時(shí)鐘中執(zhí)行。CU的靈活性和集中資源的能力提高了單線程性能,GPU利用率和效率。
Navi還具有新的緩存層次結(jié)構(gòu)。AMD為其增加了一個(gè)新的L1緩存,并將L0緩存的負(fù)載帶寬加倍到ALU。新的緩存層次結(jié)構(gòu)減少了每個(gè)級(jí)別的緩存延遲,并提高了有效帶寬。
Navi中的DCC(Delta Color Compression,增強(qiáng)色彩壓縮)算法也得到了改進(jìn),并且也可用于緩存子系統(tǒng)的更廣泛部分。使用Navi,著色器現(xiàn)在可以讀取和寫入壓縮的顏色數(shù)據(jù)。新的顯示單元還可以讀取幀緩沖器中的壓縮數(shù)據(jù),而無(wú)需先對(duì)其進(jìn)行解壓縮。最終結(jié)果是整個(gè)GPU的有效帶寬更高。
Navi核心中的整個(gè)圖形管道也已得到改進(jìn),可提高效率,實(shí)現(xiàn)更好的每時(shí)鐘性能,并且GPU還具有更高效的時(shí)鐘門控功能,可提高整體電源效率。相對(duì)于GCN,RDNA提供超過50%的每瓦性能提升和25%更好的整體性能提升。據(jù)AMD稱,超過50%的改進(jìn)來(lái)自架構(gòu)優(yōu)化; GPU的7nm工藝和頻率改進(jìn)也得到了提升。
根據(jù)AMD的說(shuō)法,Navi的40 CU設(shè)計(jì)性能比Vega64提高了約14%,功耗降低了23%。并且具有小得多的芯片尺寸。(Navi 10的面積為251平方毫米,作為對(duì)比Vega 64上面的那顆為495平方毫米。)
最后,我們來(lái)看看采用完整完整的RDNA架構(gòu)的GPU核心里面都有什么呢?40個(gè)RDNA計(jì)算單元,包括80個(gè)標(biāo)量處理器,2560個(gè)流處理器和160個(gè)64位雙線性濾波器單元。GPU具有4MB L2緩存,512K L1和雙倍VSL0負(fù)載帶寬,支持整個(gè)芯片的DCC(Delta Color Compression,增強(qiáng)色彩壓縮)。簡(jiǎn)化的圖形引擎具有新的幾何引擎,64像素單位和4個(gè)異步計(jì)算引擎。
而在未來(lái),當(dāng)RDNA架構(gòu)的顯卡核心從251mm2擴(kuò)大、乃至翻倍后,帶來(lái)更多的流處理器和晶體管,想必會(huì)讓AMD在高端乃至旗艦市場(chǎng)上大發(fā)神威。而在入門級(jí)顯卡上,RDNA架構(gòu)則擁有較GCN架構(gòu)更好的能耗比,能夠更好的控制功耗與發(fā)熱,移植到移動(dòng)端上也非常有可能,從而打破競(jìng)爭(zhēng)對(duì)手在移動(dòng)端顯卡上的一家獨(dú)霸!
(責(zé)任編輯:fqj)
-
amd
+關(guān)注
關(guān)注
25文章
5577瀏覽量
136187 -
cpu
+關(guān)注
關(guān)注
68文章
11066瀏覽量
216617
發(fā)布評(píng)論請(qǐng)先 登錄
基于AMD Versal器件實(shí)現(xiàn)PCIe5 DMA功能

GPU架構(gòu)深度解析

解鎖未來(lái)汽車電子技術(shù):軟件定義車輛與區(qū)域架構(gòu)深度解析
Xilinx Ultrascale系列FPGA的時(shí)鐘資源與架構(gòu)解析

NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析
寶馬發(fā)布全新一代智能電子電氣架構(gòu)
RDNA 4顯卡定在3月發(fā)售 AMD解釋原因
發(fā)現(xiàn)基于Zen 5架構(gòu)的AMD Threadripper “Shimada Peak” 96核和16核CPU

小米SU7的電氣架構(gòu)

AMD確認(rèn)2025年推出RDNA 4顯卡,光追與AI性能大幅提升
車載以太網(wǎng)的整體架構(gòu)解析

所謂的7nm芯片上沒有一個(gè)圖形是7nm的

評(píng)論