11月9日,黃仁勛在NVIDIA GTC上發(fā)表主題演講,發(fā)布了一系列新品,包括ReOpt、cuQuantum、cuNumeric,以及Quantum-2平臺(tái)、Modulus、Omniverse、Maxine、Clara Holoscan等等。
ReOpt
ReOpt,一款針對(duì)運(yùn)籌優(yōu)化問(wèn)題(比如車輛路線安排和倉(cāng)庫(kù)揀選與包裝)的加速求解器,配送14個(gè)披薩的路徑有870億種,因此對(duì)于達(dá)美樂(lè)來(lái)說(shuō),要在30分鐘內(nèi)將披薩送達(dá)并非易事,運(yùn)籌優(yōu)化對(duì)于最后一公里配送來(lái)說(shuō)是必需的,對(duì)于倉(cāng)儲(chǔ)及制造物流而言也是如此。
路線規(guī)劃是一個(gè)極其棘手的物流問(wèn)題,應(yīng)用到行業(yè)里,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元,示例,使用NVIDIA Omniverse中的虛擬倉(cāng)庫(kù),來(lái)展示優(yōu)化路線在自動(dòng)訂單揀選場(chǎng)景中帶來(lái)的影響,優(yōu)化后的規(guī)劃能夠使訂單揀選節(jié)省一半的時(shí)間和路程,當(dāng)前路線優(yōu)化求解器在收到新的訂單后,需要數(shù)小時(shí)來(lái)重新運(yùn)行和響應(yīng),NVIDIA ReOpt能夠持續(xù)運(yùn)行并實(shí)時(shí)動(dòng)態(tài)地進(jìn)行重新優(yōu)化。
cuQuantum
量子計(jì)算依靠的是,疊加和糾纏的自然量子物理現(xiàn)象,因此有潛力解決伴隨組合復(fù)雜性增加而出現(xiàn)的問(wèn)題,在世界各地的大學(xué)、科學(xué)實(shí)驗(yàn)室、企業(yè)和初創(chuàng)公司中,有近100個(gè)團(tuán)隊(duì)正在致力于量子處理器、系統(tǒng)、模擬器和算法的研究,但預(yù)計(jì)還需要十到二十年才能制造出一臺(tái)實(shí)用的量子計(jì)算機(jī)。同時(shí),該行業(yè)還需要一個(gè)超高速的量子模擬器來(lái)驗(yàn)證其研究。
NVIDIA創(chuàng)建了cuQuantum DGX設(shè)備,該設(shè)備配備有針對(duì)量子計(jì)算工作流的加速庫(kù),可以使用態(tài)矢量和張量網(wǎng)絡(luò)的方法,來(lái)加速量子電路模擬。曾經(jīng)需要耗費(fèi)幾個(gè)月時(shí)間的模擬現(xiàn)在只需要幾天就可以完成,,NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。
通過(guò)DGX上的cuQuantum,量子計(jì)算機(jī)和算法研究人員可以使用當(dāng)今速度最快的計(jì)算機(jī)來(lái)發(fā)明未來(lái)的計(jì)算機(jī),NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。
cuNumeric
Python是科學(xué)家、機(jī)器學(xué)習(xí)與AI研究人員使用的編程語(yǔ)言,Python擁有豐富的庫(kù)生態(tài)系統(tǒng),包括用于DataFrame進(jìn)行數(shù)據(jù)分析的Pandas,用于n維數(shù)組與矩陣運(yùn)算的NumPy,用于機(jī)器學(xué)習(xí)的Scikit-Learn,用于科學(xué)計(jì)算的SciPy,用于深度學(xué)習(xí)的PyTorch。Python擁有近2000萬(wàn)名用戶。
在會(huì)上還宣布推出NumPy的插入式加速庫(kù)cuNumeric,cuNumeric加速了NumPy從單一GPU擴(kuò)展到多GPU,擴(kuò)展到多節(jié)點(diǎn)集群,進(jìn)而擴(kuò)展到世界上最大的超級(jí)計(jì)算機(jī),其并行性以隱含的方式自動(dòng)完成。
cuNumeric具有很好的可擴(kuò)展性,在著名的CFD Python教學(xué)代碼中,cuNumeric能夠擴(kuò)展至1000個(gè)GPU,而擴(kuò)展效率僅比線性擴(kuò)展效率損失了20%。
黃仁勛表示,ReOpt、cuQuantum、cuNumeric,三個(gè)極佳的新庫(kù)。
Quantum-2平臺(tái)
在分布式計(jì)算中,網(wǎng)絡(luò)是計(jì)算機(jī)的重要中樞神經(jīng)系統(tǒng),網(wǎng)絡(luò)將數(shù)以千計(jì)的GPU連接成一個(gè)巨型的超級(jí)計(jì)算機(jī),是其擴(kuò)展能力和最終性能的決定因素。
Quantum-2是一個(gè)400Gbps的InfiniBand平臺(tái),由Quantum-2交換機(jī),ConnectX-7網(wǎng)卡、BlueField-3 DPU以及一整套面向這種新架構(gòu)的軟件組成,Quantum-2是首個(gè)集超級(jí)計(jì)算機(jī)的性能和云計(jì)算的多租戶共享能力于一身的網(wǎng)絡(luò)平臺(tái)。
黃仁勛表示,在Quantum-2之前,我們只能在裸機(jī)的高性能或安全的多租戶之間選其一,無(wú)法兩者兼得,Quantum-2平臺(tái)的出現(xiàn),使超級(jí)計(jì)算機(jī)擁有了原生云的能力,并得到更好的優(yōu)化。如果NVIDIA 的Selene DGX超級(jí)計(jì)算機(jī),如今也配備Quantum-2,則總帶寬將達(dá)到每秒224000GB/s,大約是互聯(lián)網(wǎng)總流量的1.5倍。
Quantum-2平臺(tái)的InfiniBand交換機(jī)芯片,共計(jì)570億個(gè)晶體管,采用臺(tái)積電7nm制程,和NVIDIA的A100 GPU相近,支持64個(gè)400Gbps端口或128個(gè)200Gbps端口,一個(gè)基于Quantum-2的系統(tǒng)可連接多達(dá)2048個(gè)端口,相較于800個(gè)端口的Quantum-1的交換容量多了5倍。
采用Dragonfly拓?fù)?,基于Quantum-2的網(wǎng)絡(luò)可以僅用3個(gè)hop就擴(kuò)展到100萬(wàn)個(gè)節(jié)點(diǎn),這比當(dāng)前一代增加了6.5倍,這種網(wǎng)絡(luò)速度、交換容量和可擴(kuò)展性對(duì)于需要構(gòu)建的巨型HPC系統(tǒng)來(lái)說(shuō)來(lái)得正是時(shí)候,目前Quantum-2交換機(jī)正處于樣機(jī)階段。
Quantum-2平臺(tái)在主機(jī)端提供兩個(gè)選項(xiàng):ConnectX-7和BlueFied-3。黃仁勛稱,ConnectX-7將是速度最快的網(wǎng)卡,包含80億個(gè)晶體管,采用臺(tái)積電7nm制程,是目前世界上速度最快的網(wǎng)絡(luò)芯片,比上一代ConnectX-6快兩倍。ConnectX-7樣品將于明年1月問(wèn)世。
Quantum-2平臺(tái)還提供BlueFied-3 InfiniBand系列方案,通過(guò)16個(gè)64位Arm CPU來(lái)卸載和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施棧操作,BlueFied-3采用臺(tái)積電7nm制程,包含220億個(gè)晶體管,BlueFied-3樣品將于明年5月問(wèn)世。
黃仁勛說(shuō):“Quantum-2是迄今為止構(gòu)建的非常先進(jìn)的網(wǎng)絡(luò)平臺(tái),將由頂級(jí)計(jì)算機(jī)制造商提供,這將大大推動(dòng)高性能計(jì)算?!?/p>
Modulus
NVIDIA Modulus是一種開發(fā)Physics-ML模型的框架,它使用物理原理以及源自原理型模型和觀測(cè)結(jié)構(gòu)的數(shù)據(jù)訓(xùn)練Physics-ML模型,Modulus已經(jīng)過(guò)優(yōu)化,可以在多個(gè)GPU和多個(gè)節(jié)點(diǎn)上進(jìn)行訓(xùn)練,由此生成的模型,其物理仿真的速度比模擬快1000到10萬(wàn)倍。
借助Modulus,科學(xué)家能夠創(chuàng)建數(shù)字孿生模型,以前所未有的方式更好地理解大型系統(tǒng),Modulus可以用來(lái)解決的一個(gè)重要問(wèn)題,即是氣候科學(xué)。黃仁勛介紹:“我們可以創(chuàng)造地球的數(shù)字孿生模型,它可以持續(xù)運(yùn)行以預(yù)測(cè)未來(lái),用觀測(cè)到的數(shù)據(jù)進(jìn)行校準(zhǔn)并改進(jìn)預(yù)測(cè),然后再預(yù)測(cè)。”
研究人員利用歐洲中期天氣預(yù)報(bào)中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個(gè)A100 GPU上訓(xùn)練需要4個(gè)小時(shí),訓(xùn)練后的模型能以30公里的空間分辨率,預(yù)測(cè)颶風(fēng)的嚴(yán)重程度和路徑,原本需要7天才能完成的預(yù)測(cè),如今在一個(gè)GPU上只需四分之一秒。
虛擬世界模擬引擎Omniverse
Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計(jì),Omniverse的門戶是USD(通用場(chǎng)景描述),本質(zhì)上是一個(gè)數(shù)字蟲洞,將人和計(jì)算機(jī)鏈接到Omniverse,并將一個(gè)Omniverse世界鏈接到另一個(gè)世界,公司可以在Omniverse中建立虛擬工廠,并使用虛擬機(jī)器人進(jìn)行運(yùn)營(yíng)。虛擬工廠和機(jī)器人是其物理復(fù)制品的數(shù)字孿生。
自去年年底推出以來(lái),Omniverse已被500家公司的設(shè)計(jì)師下載了70000次,社區(qū)、公司和工具供應(yīng)商與NVIDIA一起構(gòu)建Omniverse連接器,14個(gè)已經(jīng)投入運(yùn)行,還有15個(gè)即將推出,Bentley宣布帶有Omniverse的iTwin現(xiàn)在正處于搶先體驗(yàn)階段,另外還有寶馬和愛立信。
Clara Holoscan
NVIDIA Clara Holoscan,一款軟件定義的可編程影響平臺(tái),以及全新的高速傳感器處理機(jī)器人芯片Orin。
基礎(chǔ)Holoscan平臺(tái)由Orin和ConnectX-7組成,Orin可以在單個(gè)芯片中處理整個(gè)機(jī)器人流水線,即傳感器、物理、AI、成像和圖形,12個(gè)Arm CPU,5.2TFLOPS(FP32),用于AI的250TOPS,740Gbps高速IO用于連接傳感器,使用者可以選擇添加A6000 Ampere GPU獲得另外39TFLOPS(FP32)和超過(guò)500TOPS的AI推理性能。
Holoscan平臺(tái)是開放的,第三方可以在Holoscan的界面和API的基礎(chǔ)上進(jìn)行構(gòu)建,研究人員可以從事重要的新科學(xué)研究、儀器制造商可以將Holoscan集成到他們的解決方案中,Holoscan應(yīng)用程序可以完整部署在設(shè)備內(nèi)、醫(yī)院的數(shù)據(jù)中心或者兩者結(jié)合,這使得公司可以開放比設(shè)備本身需要更多算力的應(yīng)用程序,或者升級(jí)部署多年的已安裝基礎(chǔ)設(shè)備。
黃仁勛在演講的最后表示還有一項(xiàng)公告要發(fā)布,“我們將構(gòu)建一個(gè)數(shù)字孿生模型來(lái)模擬和預(yù)測(cè)氣候變化,上一臺(tái)超級(jí)計(jì)算機(jī)名為Cambridge 1,即C-1,這臺(tái)新的超級(jí)計(jì)算機(jī)將名為E-2。Earth Two ,地球的數(shù)字孿生,能夠在Omniverse中以Million-X百萬(wàn)倍的速度運(yùn)行,目前發(fā)明的所有技術(shù),均是實(shí)現(xiàn)Earth Two必不可少的,我想象不出比這更宏偉、更重要的用途?!?/p>
責(zé)任編輯:haq
-
芯片
+關(guān)注
關(guān)注
459文章
52471瀏覽量
440391 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5304瀏覽量
106316 -
AI
+關(guān)注
關(guān)注
88文章
35065瀏覽量
279294
原文標(biāo)題:黃教主“真身”引爆黑科技,超強(qiáng)GPU、DPU、最快網(wǎng)卡芯片,打造未來(lái)“虛擬世界”
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
黃仁勛:不再將中國(guó)市場(chǎng)納入業(yè)績(jī)預(yù)測(cè)
NVIDIA英偉達(dá) GTC 巴黎亮點(diǎn):NVIDIA CEO黃仁勛公布?xì)W洲AI發(fā)展新藍(lán)圖

NVIDIA CEO黃仁勛展望AI基礎(chǔ)設(shè)施產(chǎn)業(yè)
黃仁勛:人工智能將提高全球GDP 黃仁勛談中國(guó)AI市場(chǎng)未來(lái)規(guī)??蛇_(dá)500億美元
商湯絕影王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講
NVIDIA GTC 2025精華一文讀完 黃仁勛在GTC上的主題演講

黃仁勛GTC2025演講:人工智能的終極形態(tài)物理AI將徹底改變世界

評(píng)論