突破傳統(tǒng)基礎(chǔ)設(shè)施
從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設(shè)計靈活性和總體擁有成本 (TCO) 優(yōu)勢,革新傳統(tǒng)基礎(chǔ)設(shè)施芯片領(lǐng)域。
云和超大規(guī)模服務(wù)運營商正不斷增大計算密度。隨著 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 設(shè)計進(jìn)入市場,單個封裝可實現(xiàn)的性能更強,且下一代的目標(biāo)還將遠(yuǎn)高于 128 核。
隨著 CPU 性能逐步提高,市場對人工智能 (AI)、網(wǎng)絡(luò)和加密加速器等專用計算的需求也隨之持續(xù)增長。這顯然需要將這些加速器集成在一起,才能更有效地提高性能和效率,與此同時,還需實現(xiàn)模塊化設(shè)計,以便將加速器與不同的通用計算引擎進(jìn)行混合搭配。
基于 Neoverse N3 CPU 的Neoverse CSS N3
圖 1:Neoverse CSS N3 概覽
Arm Neoverse 計算子系統(tǒng) (CSS) 支持在新的工藝節(jié)點上快速開發(fā)先進(jìn)的系統(tǒng)級芯片 (SoC)。通過在設(shè)計中使用預(yù)配置、預(yù)驗證的 CSS,合作伙伴節(jié)省了 80 人/年的工程師時間,以及相應(yīng)的機會成本,使其能夠?qū)W⒂趯崿F(xiàn)助其系統(tǒng)增值的“秘密法寶”。
Neoverse CSS N3 構(gòu)建在 Neoverse CSS N2 經(jīng)過市場驗證的優(yōu)良表現(xiàn)之上,能通過新的架構(gòu)功能提供更高的性能和效率,為數(shù)據(jù)中心市場帶來更優(yōu)越的單芯片性能和單 TCO 性能表現(xiàn)。此外,Neoverse CSS N3 還為邊緣和網(wǎng)絡(luò)應(yīng)用帶來了出色的效率。CSS N3 以 Neoverse S3 系統(tǒng) IP 為基礎(chǔ),Neoverse S3 系統(tǒng) IP 包括了一致性網(wǎng)狀網(wǎng)絡(luò) CMN S3、系統(tǒng)內(nèi)存管理單元 MMU S3 和片上網(wǎng)絡(luò) NOC S3。此外,CSS N3 還包含系統(tǒng)管理和本地控制處理器,以及 CPU 和系統(tǒng) IP 協(xié)同設(shè)計與共同開發(fā),以優(yōu)化 PPA 和系統(tǒng)級功能的支持。
Neoverse CSS N3 支持 32 顆 Neoverse N3 核心,可在低至 40W 的功率范圍內(nèi)實現(xiàn)優(yōu)異性能。該產(chǎn)品具備高度可配置性,適用于電信、數(shù)據(jù)處理單元 (DPU) 、網(wǎng)絡(luò)和云等多個領(lǐng)域,可以在 8 核至 32 核之間進(jìn)行擴展配置。
除了性能和效率的大幅提升之外,Neoverse CSS N3 還支持基于芯粒的設(shè)計。它支持 UCIe 晶粒間 (die-to-die) 連接標(biāo)準(zhǔn),結(jié)合 Arm 新的 AMBA CHI C2C 協(xié)議,為構(gòu)建異構(gòu)加速計算奠定了基礎(chǔ)。可以預(yù)見的是,Arm Neoverse CSS N3 將在當(dāng)今專用計算領(lǐng)域蓬勃發(fā)展。
基于 CSS N3 的芯??赏ㄟ^ AMBA CHI C2C 連接到 I/O 一致性加速器,從而將加速器封裝在一起,進(jìn)一步提高性能和效率,這一方法可用來取代傳統(tǒng)的解決方案。在過往的解決方案中,其加速器是通過 PCIe 進(jìn)行板級連接,這會導(dǎo)致更高的延遲、軟件復(fù)雜性和功耗。
Neoverse N3 CPU優(yōu)異的效率表現(xiàn)
以每瓦性能來衡量的性能效率是 CPU 評估的一大關(guān)鍵指標(biāo)。5G/6G 無線基礎(chǔ)設(shè)施要求現(xiàn)代計算解決方案表現(xiàn)出更高的性能,同時功耗預(yù)算須保持不變。新一代的 DPU 需要配備功能更強大的 CPU,以便在 PCIe 設(shè)備規(guī)范的限制內(nèi)運行成熟的操作系統(tǒng)、虛擬機、容器及其他數(shù)據(jù)包處理功能。頭部云服務(wù)提供商正著手在機架的冷卻能力范圍內(nèi),部署核心數(shù)量更多、更密集的 CPU。“能效”幾乎是所有細(xì)分市場的主要設(shè)計決策要素。Neoverse N3 便是以能效作為其設(shè)計核心。
Neoverse N3 CPU 延續(xù)了 Neoverse N2 經(jīng)過市場驗證的效率表現(xiàn)。經(jīng)過 Arm CPU 設(shè)計團隊的不懈努力,他們強化了分支預(yù)測器、預(yù)取器的性能,并優(yōu)化了微架構(gòu),進(jìn)而實現(xiàn)了效率的提升。此外,他們還改進(jìn)了電源管理表現(xiàn),增加了精度更高的每核動態(tài)電壓頻率調(diào)整 (DVFS) 功能,以實現(xiàn)更出色的性能效率。這些工作成果使得 N3 在效率表現(xiàn)上比上一代產(chǎn)品提高了 20% 以上。
Neoverse N3 可以滿足多樣的 SoC 設(shè)計要求,包括 16 核網(wǎng)絡(luò)設(shè)計、32 核電信 RAN 或云 DPU 設(shè)計,以及 192 核超大規(guī)模和云 CPU 等等。Neoverse N3 還提供了多種電壓和頻率選擇,與 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。
圖 1:Arm Neoverse N3 CPU
延續(xù)卓越效率表現(xiàn)
在面積和功耗配置與 Neoverse N2 大致相同,且采用一樣的工藝節(jié)點下,Neoverse N3 在機器學(xué)習(xí) (ML) 和數(shù)據(jù)分析工作負(fù)載方面的性能約提升了三倍,在 SQL 數(shù)據(jù)庫、選定壓縮應(yīng)用程序,以及整數(shù)運算性能等方面分別約提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。
靈活的緩存配置
Neoverse N3 提供多種緩存配置,可滿足不同計算場景的需求。許多橫向擴展的云數(shù)據(jù)分析和數(shù)據(jù)庫應(yīng)用均能從更靠近核心的較大緩存中受益,因此我們?yōu)檫@一細(xì)分領(lǐng)域推出了 2MB L2 緩存選項。此外,1MB L2 緩存選項主要針對 5G/6G 無線基礎(chǔ)設(shè)施、企業(yè)網(wǎng)絡(luò)、DPU 和智能網(wǎng)卡 (SmartNIC) 以及超大規(guī)模服務(wù)器等各種任務(wù)中的通用計算,能夠?qū)崿F(xiàn)性能和面積的良好平衡;而較小的 32KB L1 和 128KB 則適合那些對緩存不敏感,但仍希望能以較小占用空間提供良好算力的工作負(fù)載。
總結(jié)
Neoverse N3 CPU 的推出實現(xiàn)了 Neoverse N 系列持續(xù)提供出色的每瓦性能的目標(biāo)。新的 CSS N3 結(jié)合了 Neoverse N3 優(yōu)異的性能和效率與 Neoverse S3 系統(tǒng) IP,成為一套定制性更強的計算子系統(tǒng)。與上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平臺適用于云到邊緣設(shè)計,可幫助我們的合作伙伴將 Arm 強大的處理器與加密、網(wǎng)絡(luò)或 AI 加速器等等多種專用組件結(jié)合在一起,打造更具差異性的新產(chǎn)品。
我們的合作伙伴將有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的創(chuàng)新芯片設(shè)計,讓我們共同翹首以待。
審核編輯:劉清
-
ARM
+關(guān)注
關(guān)注
134文章
9351瀏覽量
377437 -
加速器
+關(guān)注
關(guān)注
2文章
827瀏覽量
39112 -
SoC芯片
+關(guān)注
關(guān)注
1文章
644瀏覽量
35816 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249366
原文標(biāo)題:Arm Neoverse CSS N3 助力快速實現(xiàn)出色能效
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
解讀基于Arm Neoverse V2平臺的Google Axion處理器
Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新

如何在基于Arm Neoverse平臺的CPU上構(gòu)建分布式Kubernetes集群

基于MediaTek MT9679芯片的堅果投影N3 Pro介紹
Arm技術(shù)助力Google Axion處理器加速AI工作負(fù)載推理

Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心
烏鎮(zhèn)亮點 Arm終端計算子系統(tǒng) (CSS) 榮膺世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎

基于Arm Neoverse的微軟全新Azure虛擬機上線
級聯(lián)精密運算放大器級以實現(xiàn)出色的交流和直流性能

如何調(diào)優(yōu)DS160PR410實現(xiàn)出色的信號完整性

基于Arm架構(gòu)的Azure虛擬機助力云原生應(yīng)用開發(fā)
降壓轉(zhuǎn)換器實現(xiàn)出色PCB布局的五個步驟

評論