99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向AI基礎(chǔ)設(shè)施,Arm Neoverse CSS N3/V3性能加碼,Arm全面設(shè)計生態(tài)不斷壯大

花茶晶晶 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-02-26 17:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)生成式人工智能(GenAI)經(jīng)歷2023年的興起,在2024年迎來新的高度,近期文生視頻又火爆全網(wǎng)。GenAI將滲透到教育、就業(yè)、制造、醫(yī)療和交通等各個領(lǐng)域,創(chuàng)新應(yīng)用不斷涌現(xiàn)。這其中除了GPU對AI至關(guān)重要之外,不斷優(yōu)化的CPU性能同樣必不可少。在AI時代,以Arm為代表的半導(dǎo)體設(shè)計及軟件平臺公司為這些創(chuàng)新奠定基石。

Arm高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理Mohamed Awad分析,計算正越來越專用化,通用CPU不再能滿足需求。以基礎(chǔ)設(shè)施領(lǐng)域來看,計算轉(zhuǎn)型持續(xù)朝向更復(fù)雜的倉庫級計算。與此同時,許多頭部企業(yè)正在打造定制芯片,并希望對支持云計算關(guān)鍵工作負(fù)載的計算進(jìn)行優(yōu)化。

近日,Arm 宣布推出兩款全新 Arm Neoverse 計算子系統(tǒng) (CSS) —— Neoverse CSS N3 和 Neoverse CSS V3,專注于釋放芯粒等新技術(shù)的潛力,并更大限度地優(yōu)化實際工作負(fù)載的 TCO,這對于包括AI、數(shù)據(jù)庫、網(wǎng)絡(luò)等在內(nèi)的整個生態(tài)系統(tǒng)至關(guān)重要。

CSS N3 和 CSS V3均基于全新的第三代 Neoverse IP 構(gòu)建,N 系列聚焦能效,而V系列平臺針對性能優(yōu)先,這也是V系列首次引入CSS。

wKgZomXcVZaAYetuAAa330dyfHk504.png

Neoverse CSS N3和CSS V3性能顯著提升

據(jù)Arm 基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁 Dermot O’Driscoll介紹,CSS N3在進(jìn)行了調(diào)優(yōu)后,提供滿足基礎(chǔ)設(shè)施性能要求的高效計算。CSS N3與CSS N2 相比,其每核心的每瓦性能提升20%。CSS N3 的首個實例可提供 32 核,熱設(shè)計功耗 (TDP) 低至 40W。其可擴展性非常強,可覆蓋電信、網(wǎng)絡(luò)和 DPU 等一系列應(yīng)用。同時還考慮到橫向擴展云配置。CSS N3 基于新的 Neoverse N3 IP 平臺打造,為 N 系列產(chǎn)品引入了 Armv9.2 功能,能為每個核心提供 2MB 的專用 L2 緩存,并支持最新的 PCIe 和 CXL I/O 標(biāo)準(zhǔn)以及 UCIe 芯粒標(biāo)準(zhǔn)。

CSS V3 基于新的Neoverse V3 核心打造,是 Arm 目前單線程性能最高的 Neoverse 核心。與CSS N2 產(chǎn)品相比,CSS V3的單芯片性能提高了50%。CSS V3 在單芯片上最多可擴展至 128 核,并支持最新的高速內(nèi)存和 I/O 標(biāo)準(zhǔn)。V3 為 Arm 機密計算架構(gòu) (CCA) 提供硬件支持。V3也可提供業(yè)界領(lǐng)先的專用 L2 緩存大小,顯著改善性能表現(xiàn)。

以下(見下圖)是基于 Neoverse N 系列和 V 系列打造的芯片在一些關(guān)鍵工作負(fù)載下的性能數(shù)據(jù)。Dermot O’Driscoll表示,這種代際產(chǎn)品之間的性能提升只有通過 Arm 才能實現(xiàn),因為 Arm 能讓客戶掌握創(chuàng)新的步伐,而不受制于技術(shù)供應(yīng)商。

wKgaomXcVaCAcffKAAMVKv7KOjw168.png

與AI耦合,面向AI基礎(chǔ)設(shè)施

新的CPU核心帶來全方位的良好提升,包括從視頻處理到 SQL 數(shù)據(jù)庫的性能均有所躍進(jìn)。N 系列在壓縮方面取得性能優(yōu)勢,可降低云服務(wù)運營商的成本,并最終降低云服務(wù)客戶的成本。V 系列顯著提高了協(xié)議緩沖區(qū)的性能,這是在數(shù)據(jù)中心內(nèi)傳輸數(shù)據(jù)的一項關(guān)鍵功能。在這里,Dermot O’Driscoll重點解析了通過分析關(guān)鍵工作負(fù)載核心的任務(wù)算法,對微架構(gòu)進(jìn)行調(diào)整從而獲得的性能效果。

AI數(shù)據(jù)分析工作負(fù)載就是最好的例證。XGBoost 是一種強大且廣泛使用的機器學(xué)習(xí) (ML) 算法,可以幫助人們理解數(shù)據(jù)并做出更明智的決策。例如為人們推薦下一個媒體內(nèi)容,預(yù)測高峰時段的打車費用,以及等提供相關(guān)的機票優(yōu)惠等等。

在這個用例中(見下圖),通過改進(jìn)分支預(yù)測,更好地管理最后一級緩存和相關(guān)內(nèi)存帶寬,以及大幅增加 L2 緩存。其結(jié)果令人驚嘆,N3 的性能提升高達(dá) 196%。

wKgaomXcVaqARnpkAAZQ4nv08ug945.png

目前行業(yè)重點放在訓(xùn)練大語言模型(LLM)上,但更多業(yè)務(wù)落地在AI推理。分析師認(rèn)為,已部署的 AI 服務(wù)器中有高達(dá) 80% 專用于推理。也就是說找到合適的模型和模型配置,并加以訓(xùn)練,然后將其部署到更具成本效益的計算基礎(chǔ)設(shè)施上。

Dermot O’Driscoll表示,這一轉(zhuǎn)變意味著吞吐量是考量因素之一,而在基于 Arm 架構(gòu)的芯片上,Token 生成吞吐量表現(xiàn)相當(dāng)優(yōu)異。其他考量因素還包括靈活性、易于部署,可支持各種軟件框架,具備低成本和高能效等優(yōu)勢。CPU 推理將是生成式AI計算應(yīng)用的關(guān)鍵組成。下圖為Arm在CPU推理的 LLM 優(yōu)化方面的初步數(shù)據(jù)??梢钥吹?,這些工作負(fù)載已從 ML 專用的 Neoverse 功能(如 Bfloat16、MatMul、SVE 和 SVE2),以及微架構(gòu)優(yōu)化中受益。

wKgZomXcVbSAXNLbAAEIt0jGBZw897.png

當(dāng)然,除了CPU的AI推理,AI加速器也備受關(guān)注。據(jù)最新統(tǒng)計,打造 AI 加速器的公司已接近 80 家。以NVIDIA來看,NVIDIA不僅利用其領(lǐng)先的 Hopper GPU,同時也使用了基于 Neoverse V2 平臺的緊耦合計算芯粒Grace。Dermot O’Driscoll談到,NVIDIA Grace Hopper 的一大關(guān)鍵創(chuàng)新在于內(nèi)存容量和共享內(nèi)存模式。這種緊耦合的 CPU 加上加速器配置,對大參數(shù) LLM 非常有益,對檢索-增強-生成 (RAG) 等新興方法也很有幫助。Neoverse CSS 是專為幫助客戶在基于Arm領(lǐng)先的 CPU 平臺上,快速打造通用計算芯粒而推出的產(chǎn)品。它能提供客戶所需的所有接口,以便選擇耦合自身的加速器。

通用芯?;ミB技術(shù) (UCIe) 是一項行業(yè)標(biāo)準(zhǔn),旨在解決芯粒物理層兼容性的問題。Arm和生態(tài)系統(tǒng)合作伙伴正積極參與這個項目。協(xié)議層存在多種標(biāo)準(zhǔn),包括 PCIe、CXL 和 AMBA。Arm 深入?yún)⑴c到 AMBA CHI,引入芯片到芯片 (C2C) 的擴展功能,但系統(tǒng)架構(gòu)層面仍面臨難題。例如,怎樣在設(shè)計時對芯粒進(jìn)行邏輯分區(qū),如何設(shè)置直接內(nèi)存訪問 (DMA) 和中斷、電源和安全等管理功能,要建立可互操作的生態(tài)系統(tǒng),就需要在生態(tài)系統(tǒng)層面一致地解決這些問題。

Arm近期發(fā)布了芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA) ,正與 20 多家合作伙伴一同對此進(jìn)行審核,齊心協(xié)力推動整個 Arm 生態(tài)系統(tǒng)釋放芯粒技術(shù)的潛力。

Arm全面設(shè)計生態(tài)項目不斷壯大

去年十月,Arm將廣泛的半導(dǎo)體產(chǎn)業(yè)匯聚一起,借由 Arm 全面設(shè)計,圍繞 Arm 計算子系統(tǒng)開展創(chuàng)新設(shè)計。僅僅推出短短四個月內(nèi),Arm 全面設(shè)計已經(jīng)有 20 多家成員加入。其中包括新的 EDA 和配套 IP 提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰(zhàn)略市場的芯片設(shè)計合作伙伴。Arm基礎(chǔ)設(shè)施事業(yè)部營銷副總裁 Eddie Ramirez表示,Arm正在與三家主要代工廠合作,以確保 CSS 產(chǎn)品能在其先進(jìn)工藝節(jié)點上進(jìn)行優(yōu)化。定制芯片離不開可靠供應(yīng)鏈的支持,唯有 Arm 可提供多樣的技術(shù)和選擇。

去年,Socionext 成為首家宣布計劃在臺積公司領(lǐng)先的2納米工藝上開發(fā)基于CSS芯粒的合作伙伴。這款配置 32 核的芯??膳c其他芯粒結(jié)合使用,提供可擴展且經(jīng)濟(jì)高效的計算解決方案。該設(shè)計將基于新推出的Neoverse CSS V3 來打造。

智原科技也在構(gòu)建基于芯粒的服務(wù)器芯片,該芯片將搭載 64 顆 N 系列核心,并基于英特爾代工服務(wù)的 18A 工藝節(jié)點進(jìn)行生產(chǎn)制造。

此外,ADTechnology 將提供高性價比的16 核 CSS N 系列邊緣服務(wù)器平臺,他們將與三星代工廠合作,為邊緣計算釋放更強大的算力。

wKgaomXcVb2AFqY9AAFBOrzGhNo262.png

Arm 全面設(shè)計合作伙伴正在打造多款基于 CSS 的 SoC,以賦能新一代 AI 服務(wù)器,并借助各大代工廠的前沿工藝完成這項任務(wù)。

Arm軟件生態(tài)系統(tǒng)優(yōu)勢凸顯

Arm軟件生態(tài)系統(tǒng)也在迅速擴展,幫助開發(fā)者簡化部署流程,提高采用 Arm技術(shù)的硬件的生產(chǎn)效率。Eddie Ramirez介紹說,去年,80%的云原生計算基金會 (CNCF) 畢業(yè)項目原生支持 Arm 架構(gòu)。CNCF是開源云原生軟件領(lǐng)域的中堅力量,也是當(dāng)今許多現(xiàn)代軟件和云服務(wù)的基礎(chǔ)。Arm 與云服務(wù)提供商一同提供可免費訪問的基于 Neoverse 平臺的云實例,以簡化軟件開發(fā)者的資源訪問路徑。例如,OCI 最近宣布計劃向 CNFC 捐贈 300 萬美元的計算積分,旨在助力實現(xiàn)所有項目支持 Arm 架構(gòu)。

再來看Arm Neoverse 軟件生態(tài)系統(tǒng),它正在不斷擴展以滿足基礎(chǔ)設(shè)施軟件應(yīng)用領(lǐng)域的所有開發(fā)者的需求。從主流編程語言、軟件工具、所有主要 Linux 發(fā)行版,到支持網(wǎng)絡(luò)、存儲和大數(shù)據(jù)以及 AI 應(yīng)用的項目,這包括軟件棧各個級別的知名開源企業(yè)。此外還包括大量獨立軟件供應(yīng)商 (ISV),他們可提供各類應(yīng)用和 SaaS 產(chǎn)品。這一生態(tài)系統(tǒng)正成為云服務(wù)提供商部署其云服務(wù)的上佳之選,以便能夠充分利用 Arm 提供的 TCO 優(yōu)勢。

此外,主要的企業(yè)軟件 ISV 承諾將 Arm 平臺用于其核心產(chǎn)品組合。Oracle 發(fā)布的 Oracle Database 19c 支持基于 Arm 架構(gòu)的服務(wù)器,可用于云端和本地部署。這種向傳統(tǒng)企業(yè)軟件的轉(zhuǎn)變,以及部分大型 ISV 的投資,是 Arm 生態(tài)系統(tǒng)不斷擴展的又一例證。

Eddie Ramirez表示,超過 15 年在 Neoverse 軟件生態(tài)系統(tǒng)的投資,讓Arm實現(xiàn)了強大的軟件支持水平,助力超過五萬家公司在支持 Arm 的基礎(chǔ)設(shè)施上部署關(guān)鍵工作負(fù)載。這也是 Arm 及其合作伙伴生態(tài)系統(tǒng)降低部署成本,并提高正在部署的各類定制芯片可用性的另一種方式。

wKgZomXcVciAWIC9AAMbdt3V0k0503.png

小結(jié):

過去幾年,Arm 能夠在基礎(chǔ)設(shè)施領(lǐng)域取得不小的進(jìn)展,Mohamed Awad認(rèn)為主要是卓越性能、靈活性以及生態(tài)系統(tǒng)三方面助力。

如今,AI 正成為包括網(wǎng)絡(luò)、安全和存儲等諸多領(lǐng)域不可或缺的一部分,它可應(yīng)用到包括小型終端到交換機、路由器和基站等各種設(shè)備在內(nèi)的整個基礎(chǔ)設(shè)施中。Arm 在軟件、 IP 和芯片生態(tài)系統(tǒng)中提供出色性能和靈活性,從而降低配置的總成本并加速產(chǎn)品上市。Arm 將持續(xù)發(fā)揮關(guān)鍵作用,協(xié)助科技先行者解決由AI轉(zhuǎn)型帶來的不斷增長的數(shù)據(jù)和計算需求。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35115

    瀏覽量

    279658
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務(wù)。
    的頭像 發(fā)表于 07-03 14:37 ?346次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> <b class='flag-5'>N</b>2平臺實現(xiàn)DeepSeek-R1滿血版部署

    Arm如何助力AI基礎(chǔ)設(shè)施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎(chǔ)設(shè)施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?331次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    子系統(tǒng)(CSS)? ? 的垂直領(lǐng)域延伸,Niva 旨在通過軟硬件深度整合,解決傳統(tǒng) x86 架構(gòu)在能效比、AI 加速與生態(tài)兼容性上的痛點。以下結(jié)合技術(shù)架構(gòu)、性能突破、競爭格局與戰(zhàn)略意義
    的頭像 發(fā)表于 05-29 09:56 ?679次閱讀

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設(shè)備在 AI 性能、能效比與開發(fā)效率上的挑戰(zhàn)。以下從技術(shù)架構(gòu)、性能突破、應(yīng)用場景、
    的頭像 發(fā)表于 05-29 09:54 ?1133次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計算平臺,屬于其“平臺優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?1356次閱讀

    解讀基于Arm Neoverse V2平臺的Google Axion處理器

    云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發(fā)表于 04-21 13:47 ?517次閱讀

    Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新

    性能、可擴展且高效的解決方案。Arm Neoverse CMN S3 能夠無縫管理一致性通信和內(nèi)存共享,是適合現(xiàn)代存儲架構(gòu)的變革性解決方案,其專為支持 Compute Express
    發(fā)表于 04-09 18:19 ?552次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S<b class='flag-5'>3</b> 推動Compute Express Link (CXL) 存儲創(chuàng)新

    基于MediaTek MT9679芯片的堅果投影N3 Pro介紹

    堅果投影 N3 Pro 搭載 MediaTek MT9679 旗艦投影芯片,該芯片配備 4 核 Arm Cortex-A73 CPU 及 Arm Mail-G52 MC1 GPU,強悍性能
    的頭像 發(fā)表于 03-24 09:10 ?869次閱讀

    虹軟AI視覺賦能雷鳥V3 AI拍攝眼鏡發(fā)布

    近日,雷鳥創(chuàng)新正式發(fā)布全新一代AI拍攝眼鏡——雷鳥V3。該產(chǎn)品搭載多項創(chuàng)新技術(shù),包括融合虹軟AI視覺算法的獵鷹影像系統(tǒng)、通義獨家定制大模型、高通驍龍AR1 Gen 1芯片平臺以及定制揚聲器等諸多創(chuàng)新
    的頭像 發(fā)表于 01-08 10:58 ?1134次閱讀

    Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心

    在快速演進(jìn)的云計算和人工智能 (AI) 時代,企業(yè)需要能助力其優(yōu)化性能、降低成本并在市場競爭中保持領(lǐng)先的方法。Arm Neoverse 已成為眾多前沿企業(yè)的選擇,他們希望在推動創(chuàng)新的同
    的頭像 發(fā)表于 11-26 09:30 ?683次閱讀

    基于Arm Neoverse的微軟全新Azure虛擬機上線

    Neoverse CSS N2 所構(gòu)建。這是我們與微軟長期合作中的一個重要里程碑,通過提供強大的平臺,為各種工作負(fù)載帶來出色的性能、可擴展性和繁榮的軟件
    的頭像 發(fā)表于 10-27 11:00 ?808次閱讀

    Arm全面設(shè)計助力Arm架構(gòu)生態(tài)發(fā)展

    ,通過該生態(tài)項目,Arm、三星晶圓代工廠 (Samsung Foundry)、ADTechnology 和 Rebellions 正在聯(lián)手向市場推出人工智能 (AI) CPU 芯粒 (chiplet) 平臺,
    的頭像 發(fā)表于 10-21 09:58 ?825次閱讀

    Arm全面設(shè)計生態(tài)迅速擴張,推出AI CPU小芯片平臺

    近期,Arm全面設(shè)計(Arm Total Design)在推出一周年之際宣布,其生態(tài)體系中的合作伙伴數(shù)量已迅速增長至超過30家。這些合作伙伴涵蓋了從IC設(shè)計到晶圓代工服務(wù)等多個專業(yè)領(lǐng)域
    的頭像 發(fā)表于 10-18 17:00 ?672次閱讀

    基于高通主板的ARM架構(gòu)服務(wù)器

    架構(gòu)主導(dǎo)服務(wù)器市場,現(xiàn)面臨挑戰(zhàn)。Arm 2008 年入服務(wù)器領(lǐng)域,雖因性能生態(tài)問題未大突破,但近幾年重新沖刺。 (二)技術(shù)創(chuàng)新引領(lǐng) Arm
    的頭像 發(fā)表于 09-11 10:53 ?1152次閱讀

    基于Arm架構(gòu)的Azure虛擬機助力云原生應(yīng)用開發(fā)

    定制芯片有助于解決現(xiàn)代基礎(chǔ)設(shè)施所面臨的計算挑戰(zhàn),例如人工智能 (AI) 時代與日俱增的計算復(fù)雜性。Microsoft Azure Cobalt 100 等采用 Arm Neoverse
    的頭像 發(fā)表于 09-05 15:54 ?2191次閱讀