99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩種GPU之間的延遲對(duì)比 AMD RDNA2完勝NVIDIA安培

ss ? 來(lái)源:快科技 ? 作者:快科技 ? 2021-04-21 13:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CPU緩存與內(nèi)存延遲測(cè)試,相信大家都有所耳聞,但是GPU同樣的測(cè)試卻幾乎沒(méi)人做過(guò)。

ChipsAndCheese就做了一次特別的測(cè)試,對(duì)比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存遲問(wèn)題。

首先是AMDRDNA2、NVIDIAAmpere兩家最新架構(gòu)的比拼,代表是RX6900XT、RTX3090,前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了InfinityCache無(wú)限緩存,提升帶寬的同時(shí),延遲也可圈可點(diǎn),二級(jí)緩存命中率上只增加了大約20ns的延遲,明顯低于Ampere。

更驚人的是,RDNA2顯存延遲和Ampere幾乎一模一樣,但是別忘了,Ampere只有兩個(gè)層級(jí)的緩存,RDNA2卻有四個(gè)。

Ampere的緩存架構(gòu)更加傳統(tǒng),SM陣列私有一級(jí)緩存到二級(jí)緩存要增加超過(guò)100ns的延遲,RDNA2從零級(jí)緩存到二級(jí)緩存則只增加了約66ns??雌饋?lái),GA102核心面積過(guò)大,也直接增加了延遲。

這正好可以解釋AMDRDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀,因?yàn)槎?jí)緩存、三級(jí)緩存延遲很低,更適合執(zhí)行較小的負(fù)載。Ampere則相反,高負(fù)載下優(yōu)勢(shì)明顯,比如說(shuō)4K分辨率。

說(shuō)完了GPU之間的對(duì)比,那么GPU、CPU放在一起怎么樣呢?這里以RX6900XT、Intel四代酷睿i7-4770為例來(lái)看看。

CPU的緩存自然不是一個(gè)級(jí)別的,所以這里Y軸用了線性數(shù)據(jù),可以看到全程大大低于RDNA2,搭配DDR3-1600CL9內(nèi)存延遲只有63ns,RX6900XT、GDDR6的組合則有226ns,另外末級(jí)緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIAGPU,包括Maxwell架構(gòu)的GTX980Ti、Pascal架構(gòu)的GTX1080、Turing架構(gòu)的RTX2060Mobile。

Maxwell、Pascal其實(shí)差不多,前者整體略高一些,可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子,一級(jí)緩存延遲低得多,二級(jí)差不多,奇怪的是顯存延遲在32MB之后偏高,原因未知。

AMD考察了TeraScale架構(gòu)的HD5850/6950、GCN架構(gòu)的HD7970,再加上RX6900XT,很明顯在逐代降低,而且是各級(jí)緩存都在同時(shí)進(jìn)步。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5589

    瀏覽量

    136379
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217114
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91891
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131253
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?1861次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小<b class='flag-5'>延遲</b>場(chǎng)景中的性能紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一個(gè)包括了個(gè)完全通過(guò)NVlink連接的8 GPU混合立方網(wǎng)狀拓?fù)浣Y(jié)構(gòu): N
    發(fā)表于 06-18 19:31

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會(huì)后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細(xì)分享了RDNA 4架構(gòu)的設(shè)計(jì)理
    的頭像 發(fā)表于 03-06 11:19 ?408次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?1548次閱讀

    納米銅燒結(jié)為何納米銀燒結(jié)?

    在半導(dǎo)體功率模塊封裝領(lǐng)域,互連技術(shù)一直是影響模塊性能、可靠性和成本的關(guān)鍵因素。近年來(lái),隨著納米技術(shù)的快速發(fā)展,納米銀燒結(jié)和納米銅燒結(jié)技術(shù)作為兩種新興的互連技術(shù),備受業(yè)界關(guān)注。然而,在眾多應(yīng)用場(chǎng)景中
    的頭像 發(fā)表于 02-24 11:17 ?950次閱讀
    納米銅燒結(jié)為何<b class='flag-5'>完</b><b class='flag-5'>勝</b>納米銀燒結(jié)?

    ADC12D1600和ADC12D1600RF這兩種型號(hào)之間有什么區(qū)別?

    您好,板子之前采用的是ADC12D1600,現(xiàn)在想換ADC12D1600RF; 請(qǐng)問(wèn): 1.這兩種型號(hào)之間有什么區(qū)別?(一個(gè)高速采樣,一個(gè)射頻采樣) 2.ADC12D1600RF是pin compatible的,能否在不改變已
    發(fā)表于 01-10 06:10

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?664次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    的各個(gè)方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計(jì)算的啟用、NVIDIAAMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 -
    發(fā)表于 12-16 14:25

    兩種轉(zhuǎn)換控制模式Zone 1 Transfer和Zone 2 Transfer怎么區(qū)分使用?

    兩種轉(zhuǎn)換控制模式Zone 1 Transfer和Zone 2 Transfer怎么區(qū)分使用?現(xiàn)在想用Zone 1 Transfer模式,硬件或軟件上應(yīng)該怎么設(shè)置?
    發(fā)表于 11-19 06:20

    AMD確認(rèn)2025年推出RDNA 4顯卡,光追與AI性能大幅提升

    10月30日,AMD在2024年第三季度財(cái)報(bào)電話會(huì)議上宣布了一個(gè)關(guān)于GPU的重要信息:其下一代RDNA 4顯卡計(jì)劃于2025年初發(fā)布。AMD首席執(zhí)行官蘇姿豐明確表示:“我們計(jì)劃在202
    的頭像 發(fā)表于 10-30 16:50 ?1646次閱讀

    AMDNVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場(chǎng),AMDNVIDIA大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能
    的頭像 發(fā)表于 10-27 11:15 ?2536次閱讀

    噪聲傳導(dǎo)的兩種模式

    噪聲傳導(dǎo)有兩種模式,一為差模傳導(dǎo),一為共模傳導(dǎo)。
    的頭像 發(fā)表于 10-15 11:33 ?776次閱讀
    噪聲傳導(dǎo)的<b class='flag-5'>兩種</b>模式

    嵌入式MXM模塊(NVIDIA安培架構(gòu))

    電子發(fā)燒友網(wǎng)站提供《嵌入式MXM模塊(NVIDIA安培架構(gòu)).pdf》資料免費(fèi)下載
    發(fā)表于 10-09 11:09 ?0次下載

    晶閘管的阻斷狀態(tài)有兩種是什么

    晶閘管(Thyristor)是一半導(dǎo)體器件,具有單向?qū)щ娦裕瑥V泛應(yīng)用于電力電子領(lǐng)域。晶閘管的阻斷狀態(tài)有兩種:正向阻斷狀態(tài)和反向阻斷狀態(tài)。以下是對(duì)這兩種阻斷狀態(tài)的分析。 正向阻斷狀態(tài) 正向阻斷狀態(tài)
    的頭像 發(fā)表于 08-14 16:49 ?1423次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42