電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從最近英偉達(dá)公布的財(cái)報(bào)中就可以看出,AI應(yīng)用的火熱使其賺得盆滿缽滿,原本就在AI軟硬件生態(tài)稱王的英偉達(dá),現(xiàn)今更是如日中天。而這樣的處境也讓不少AI芯片初創(chuàng)公司不好過(guò),他們的產(chǎn)品有的還沒(méi)落地,有的則難以與A100、H100這樣的產(chǎn)品匹敵。這幾年沉寂下去的AI芯片初創(chuàng)公司著實(shí)不少,但還是有的廠商敢于繼續(xù)往這個(gè)市場(chǎng)里鉆。
水平擴(kuò)展性的限制
隨著AI/ML的模型越來(lái)越大,甚至是以5年內(nèi)翻4萬(wàn)倍的速度提升,要想在硬件上跟上軟件進(jìn)度已經(jīng)越來(lái)越難了??杉幢闳绱耍瑥?6nm到4nm,從低精度到脈動(dòng)陣列,都給了我們巨大的優(yōu)勢(shì)去追隨這些大模型。
但運(yùn)行這些大模型終究不是靠單個(gè)芯片的力量,而是整個(gè)規(guī)模集群需要面臨的問(wèn)題,所以這就牽扯到了水平擴(kuò)展性。工藝制程的提高帶來(lái)了5倍的性能提升,芯片架構(gòu)帶來(lái)了14倍的性能提升,而水平擴(kuò)展則要實(shí)現(xiàn)600倍的性能提升,才能滿足未來(lái)的AI/ML計(jì)算要求。這也就是目前AI計(jì)算存在的問(wèn)題,大模型往往需要更大的內(nèi)存、更高的算力和更大的帶寬,隨著設(shè)備數(shù)量越多,這三大硬件要求的分配復(fù)雜程度就變得越來(lái)越高。
比如在GPU上就已經(jīng)嘗試了不少并行擴(kuò)展方案,比如數(shù)據(jù)并行、流水線模型并行或張量模型并行等,但以上方案往往都會(huì)受到內(nèi)存、帶寬和參數(shù)量的限制,并沒(méi)有單一通用的解決方案,大模型往往需要同時(shí)結(jié)合這三種方案,所以擴(kuò)展效率不高。AI芯片公司Cerebras則想出了一個(gè)在大規(guī)模集群下提高水平擴(kuò)展性的解決方案。
Cerebras的WSE
要說(shuō)在AI芯片的初創(chuàng)公司里,走著獨(dú)立無(wú)二路線的公司,Cerebras絕對(duì)能排得上名號(hào)。2019年,他們推出了WSE,一個(gè)晶圓大小的AI處理器,到了2021年,他們又推出了第二代的WSE-2,采用更先進(jìn)的工藝將單個(gè)處理器的核心數(shù)推進(jìn)至85萬(wàn)核。而這次Hot Chips上,他們則展示了用于對(duì)抗英偉達(dá)的解決方案。

WSE-2與GPU大小對(duì)比 / Cerebras
Cerebras選擇了將內(nèi)存和計(jì)算解耦的方案,利用內(nèi)存擴(kuò)展技術(shù)MemoryX,將模型權(quán)重存儲(chǔ)在外部,然后將權(quán)重傳輸給WSE-2組成的CS-2系統(tǒng),CS-2再將梯度傳給外部存儲(chǔ)。Cerebras還打造了一個(gè)互聯(lián)方案SwarmX,用于連接多個(gè)CS-2系統(tǒng),從而提高擴(kuò)展性。
以Cerebras搭建的Andromeda超算為例,該超算由16個(gè)CS-2系統(tǒng)組成,擁有1350萬(wàn)個(gè)AI優(yōu)化核心,稀疏算力高達(dá)1ExaFLOPs,稠密算力高達(dá)120PetaFLOPs。在這樣強(qiáng)大的算力下,訓(xùn)練大模型只要幾周的時(shí)間。而且在Cerebras不同規(guī)模的集群上,不同參數(shù)的大模型可以共享同樣的代碼,以同樣的方式訓(xùn)練,省去了不少開(kāi)發(fā)時(shí)間。
除了Andromeda以外,Cerebras也已經(jīng)開(kāi)始了下一個(gè)AI超算的部署,由64個(gè)CS-2系統(tǒng)組成的Condor Galaxy 1,該超算的算力將擴(kuò)展至4ExaFLOPs的稀疏算力。而Condor Galaxy 1名字后的1,也意味著這僅僅是單個(gè)超算中心所用的系統(tǒng)而已,未來(lái)他們計(jì)劃在2024年底之前擴(kuò)展為9個(gè)超算中心,分布在美國(guó)各地,構(gòu)建最大的分布式超算網(wǎng)絡(luò),總算力高達(dá)36ExaFLOPs,是英偉達(dá)Israel-1超算的9倍,是谷歌最大TPUv4集群的4倍。
寫在最后
單從擴(kuò)展性和性能的角度來(lái)看,Cerebras確實(shí)已經(jīng)做到了一個(gè)新的高度。但對(duì)于購(gòu)置這些GPU或AI芯片的云服務(wù)或互聯(lián)網(wǎng)公司來(lái)說(shuō),GPU或許是一個(gè)更加通用的資源,在AI技術(shù)日新月異的當(dāng)下,GPU總能憑借自己的軟硬件生態(tài)快速找到自己的一席之地,并在高性能的王座上穩(wěn)坐一段時(shí)間。這也就是AI爆款應(yīng)用的市場(chǎng)導(dǎo)向決定的了,性能固然重要,但搶占先機(jī)才是最關(guān)鍵的一環(huán)。
水平擴(kuò)展性的限制
隨著AI/ML的模型越來(lái)越大,甚至是以5年內(nèi)翻4萬(wàn)倍的速度提升,要想在硬件上跟上軟件進(jìn)度已經(jīng)越來(lái)越難了??杉幢闳绱耍瑥?6nm到4nm,從低精度到脈動(dòng)陣列,都給了我們巨大的優(yōu)勢(shì)去追隨這些大模型。
但運(yùn)行這些大模型終究不是靠單個(gè)芯片的力量,而是整個(gè)規(guī)模集群需要面臨的問(wèn)題,所以這就牽扯到了水平擴(kuò)展性。工藝制程的提高帶來(lái)了5倍的性能提升,芯片架構(gòu)帶來(lái)了14倍的性能提升,而水平擴(kuò)展則要實(shí)現(xiàn)600倍的性能提升,才能滿足未來(lái)的AI/ML計(jì)算要求。這也就是目前AI計(jì)算存在的問(wèn)題,大模型往往需要更大的內(nèi)存、更高的算力和更大的帶寬,隨著設(shè)備數(shù)量越多,這三大硬件要求的分配復(fù)雜程度就變得越來(lái)越高。
比如在GPU上就已經(jīng)嘗試了不少并行擴(kuò)展方案,比如數(shù)據(jù)并行、流水線模型并行或張量模型并行等,但以上方案往往都會(huì)受到內(nèi)存、帶寬和參數(shù)量的限制,并沒(méi)有單一通用的解決方案,大模型往往需要同時(shí)結(jié)合這三種方案,所以擴(kuò)展效率不高。AI芯片公司Cerebras則想出了一個(gè)在大規(guī)模集群下提高水平擴(kuò)展性的解決方案。
Cerebras的WSE
要說(shuō)在AI芯片的初創(chuàng)公司里,走著獨(dú)立無(wú)二路線的公司,Cerebras絕對(duì)能排得上名號(hào)。2019年,他們推出了WSE,一個(gè)晶圓大小的AI處理器,到了2021年,他們又推出了第二代的WSE-2,采用更先進(jìn)的工藝將單個(gè)處理器的核心數(shù)推進(jìn)至85萬(wàn)核。而這次Hot Chips上,他們則展示了用于對(duì)抗英偉達(dá)的解決方案。

WSE-2與GPU大小對(duì)比 / Cerebras
Cerebras選擇了將內(nèi)存和計(jì)算解耦的方案,利用內(nèi)存擴(kuò)展技術(shù)MemoryX,將模型權(quán)重存儲(chǔ)在外部,然后將權(quán)重傳輸給WSE-2組成的CS-2系統(tǒng),CS-2再將梯度傳給外部存儲(chǔ)。Cerebras還打造了一個(gè)互聯(lián)方案SwarmX,用于連接多個(gè)CS-2系統(tǒng),從而提高擴(kuò)展性。
以Cerebras搭建的Andromeda超算為例,該超算由16個(gè)CS-2系統(tǒng)組成,擁有1350萬(wàn)個(gè)AI優(yōu)化核心,稀疏算力高達(dá)1ExaFLOPs,稠密算力高達(dá)120PetaFLOPs。在這樣強(qiáng)大的算力下,訓(xùn)練大模型只要幾周的時(shí)間。而且在Cerebras不同規(guī)模的集群上,不同參數(shù)的大模型可以共享同樣的代碼,以同樣的方式訓(xùn)練,省去了不少開(kāi)發(fā)時(shí)間。
除了Andromeda以外,Cerebras也已經(jīng)開(kāi)始了下一個(gè)AI超算的部署,由64個(gè)CS-2系統(tǒng)組成的Condor Galaxy 1,該超算的算力將擴(kuò)展至4ExaFLOPs的稀疏算力。而Condor Galaxy 1名字后的1,也意味著這僅僅是單個(gè)超算中心所用的系統(tǒng)而已,未來(lái)他們計(jì)劃在2024年底之前擴(kuò)展為9個(gè)超算中心,分布在美國(guó)各地,構(gòu)建最大的分布式超算網(wǎng)絡(luò),總算力高達(dá)36ExaFLOPs,是英偉達(dá)Israel-1超算的9倍,是谷歌最大TPUv4集群的4倍。
寫在最后
單從擴(kuò)展性和性能的角度來(lái)看,Cerebras確實(shí)已經(jīng)做到了一個(gè)新的高度。但對(duì)于購(gòu)置這些GPU或AI芯片的云服務(wù)或互聯(lián)網(wǎng)公司來(lái)說(shuō),GPU或許是一個(gè)更加通用的資源,在AI技術(shù)日新月異的當(dāng)下,GPU總能憑借自己的軟硬件生態(tài)快速找到自己的一席之地,并在高性能的王座上穩(wěn)坐一段時(shí)間。這也就是AI爆款應(yīng)用的市場(chǎng)導(dǎo)向決定的了,性能固然重要,但搶占先機(jī)才是最關(guān)鍵的一環(huán)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
AI
+關(guān)注
關(guān)注
88文章
35167瀏覽量
280102 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3953瀏覽量
93815
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
英偉達(dá)、高通布局AI投資版圖,這些明星企業(yè)被收入囊中!
的模型并不會(huì)減少芯片的需求,相反,未來(lái)的計(jì)算需求只會(huì)增加,尤其是對(duì)計(jì)算基礎(chǔ)設(shè)施的需求。 英偉達(dá)也在利用其雄厚的資金大幅增加了對(duì)各種初創(chuàng)公司的
英偉達(dá)收購(gòu)AI初創(chuàng)公司Run:ai
全球領(lǐng)先的芯片制造商英偉達(dá)近日正式完成了對(duì)以色列人工智能初創(chuàng)公司Run:ai的收購(gòu)。這一收購(gòu)案在
微軟大手筆采購(gòu)英偉達(dá)AI芯片
據(jù)全球知名市場(chǎng)調(diào)研機(jī)構(gòu)Omdia的最新估計(jì),微軟在2024年的英偉達(dá)Hopper架構(gòu)芯片采購(gòu)計(jì)劃上展現(xiàn)出了驚人的手筆。這一舉動(dòng)旨在幫助微軟在構(gòu)建下一代人工智能(AI)系統(tǒng)的激烈競(jìng)爭(zhēng)中搶
英偉達(dá)加速認(rèn)證三星新型AI存儲(chǔ)芯片
近日,英偉達(dá)首席執(zhí)行官黃仁勛近日在接受采訪時(shí)透露,英偉達(dá)正在全力加速對(duì)三星最新推出的AI存儲(chǔ)芯片

加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)
jf_15747056
發(fā)布于 :2024年11月21日 17:31:05
OpenAI領(lǐng)投Rain AI,挑戰(zhàn)英偉達(dá)AI芯片市場(chǎng)地位
巨頭英偉達(dá)展開(kāi)有力競(jìng)爭(zhēng)。 為了加強(qiáng)其領(lǐng)導(dǎo)團(tuán)隊(duì),Rain AI于2024年6月成功聘請(qǐng)前蘋果公司芯片執(zhí)行官Jean-Didier Allegr
英偉達(dá)超越蘋果成為市值最高 英偉達(dá)取代英特爾加入道指
蘋果公司的市值,重新成為全球市值最高的公司。 在AI領(lǐng)域,英偉達(dá)正瘋狂奔跑,我們看到有外媒報(bào)道英偉
英偉達(dá)加速Rubin平臺(tái)AI芯片推出,SK海力士提前交付HBM4存儲(chǔ)器
日,英偉達(dá)(NVIDIA)的主要高帶寬存儲(chǔ)器(HBM)供應(yīng)商南韓SK集團(tuán)會(huì)長(zhǎng)崔泰源透露,英偉達(dá)執(zhí)行長(zhǎng)黃仁勛已要求SK海力士提前六個(gè)月交付用于英偉
英偉達(dá)投資日本AI研發(fā)初創(chuàng)公司
Ventures及Lux Capital等業(yè)界巨頭,而英偉達(dá)亦作為重要參與者加入這一行列。此番攜手不僅彰顯了Sakana AI在AI研發(fā)領(lǐng)域的深厚潛力,也預(yù)示著雙方將開(kāi)啟一段嶄新的合
英偉達(dá)投資日本AI公司Sakana AI
英偉達(dá)現(xiàn)身日本人工智能研發(fā)初創(chuàng)公司Sakana AI的A輪融資名單中;據(jù)悉;Sakana AI的
韓國(guó)AI芯片巨頭合并,劍指英偉達(dá)龍頭地位
的合資公司創(chuàng)造超過(guò)1萬(wàn)億韓元的業(yè)務(wù)價(jià)值,標(biāo)志著韓國(guó)在AI芯片領(lǐng)域的雄心壯志,旨在挑戰(zhàn)全球領(lǐng)導(dǎo)者英偉達(dá)(NVIDIA)的霸主地位。
AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500億
誰(shuí)是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉達(dá)肯定有一席之地,特別是現(xiàn)在全球資本市場(chǎng)動(dòng)蕩之際,業(yè)界分析師多認(rèn)為英偉
英偉達(dá)回應(yīng)AI芯片推遲發(fā)布傳聞
近日,英偉達(dá)就外界廣泛關(guān)注的AI芯片Blackwell推遲發(fā)布傳聞作出正式回應(yīng)。8月4日,英偉達(dá)

英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡
顯卡英偉達(dá)
jf_02331860
發(fā)布于 :2024年07月24日 17:18:28
英偉達(dá)帶領(lǐng)芯片股飆升 英偉達(dá)大漲4.76%
1.08%,道指漲0.32%。 AI浪潮之下,業(yè)界預(yù)期正不斷加強(qiáng),在AI算力需求的邊際拉動(dòng)下、疊加消費(fèi)電子復(fù)蘇,新一輪終端AI上新,相關(guān)行業(yè)正迎來(lái)具備較強(qiáng)持續(xù)性的上行周期;英偉
評(píng)論