今年 8 月,集成 1.2 萬(wàn)億個(gè)晶體管的“史上最大芯片”The Cerebras Wafer Scale Engine(以下簡(jiǎn)稱 WSE)誕生,在 11 月 19 日召開(kāi)的 Supercomputing 2019 大會(huì)上,該芯片制造公司 Cerebras Systems 推出了搭載該芯片的計(jì)算機(jī)系統(tǒng)————Cerebras CS-1,這也將是世界上最強(qiáng)大的 AI 計(jì)算系統(tǒng)。美國(guó)兩家國(guó)家實(shí)驗(yàn)室是該公司的客戶,其中,阿貢國(guó)家實(shí)驗(yàn)室已成功部署并宣布,將用這套系統(tǒng)來(lái)發(fā)現(xiàn)癌癥療法和理解黑洞碰撞。
圖 | Cerebras CS-1(來(lái)源:Cerebras Systems)
CS-1 搭載的并不是一個(gè)芯片,而是一整個(gè)晶圓。通常,硅芯片是從 8、10 或 12 英寸等不同規(guī)格的晶圓上單獨(dú)切下來(lái)的。而 Cerebras 把晶圓切割成一個(gè)很大的長(zhǎng)方形,每個(gè)芯片都相互連接,可以使每個(gè)晶體管都能像整體一樣高速運(yùn)轉(zhuǎn)。一個(gè)典型處理器可能在一個(gè)芯片上有 100 億個(gè)晶體管,而 CS-1 搭載的整個(gè)晶片上所有核的晶體管總數(shù)超過(guò) 1.2 萬(wàn)億個(gè)。
在 AI 計(jì)算中,芯片尺寸至關(guān)重要,但是高級(jí)處理器必須要有專用的硬件和軟件系統(tǒng)相配合才能實(shí)現(xiàn)理想的性能。Cerebras 公司 CEO Andrew Feldman 在接受媒體采訪時(shí)說(shuō):“你無(wú)法將法拉利發(fā)動(dòng)機(jī)放入大眾汽車中來(lái)獲得法拉利性能。如果你想獲得 1,000 倍的性能提升,你要做的就是消除瓶頸。”CS-1 系統(tǒng)設(shè)計(jì)和 Cerebras 軟件平臺(tái)相結(jié)合,可以充分用到從 WSE 上的 40 多萬(wàn)個(gè)計(jì)算內(nèi)核和 18 GB 高性能片上存儲(chǔ)器中提取的每一點(diǎn)的處理能力。
GIF 圖 | Cerebras 晶片規(guī)模的引擎(來(lái)源:Cerebras Systems)
與 GPU 集群需要消耗數(shù)十個(gè)機(jī)架并且需要專有的 InfiniBand 進(jìn)行集群不同,CS-1 不需要大量修改現(xiàn)有模型,并且用戶只需將基于標(biāo)準(zhǔn)的 100Gb 以太網(wǎng)鏈路插入交換機(jī)就可以啟動(dòng)培訓(xùn)模型。
CS-1 有 15 個(gè)機(jī)架,大概是 26 英寸高(66.04 厘米)。Andrew Feldman 表示,CS-1 是“最快的 AI 計(jì)算機(jī)”。CS-1 計(jì)算機(jī)的機(jī)器學(xué)習(xí)能力相當(dāng)于數(shù)百架基于 GPU 的計(jì)算機(jī)能力,這些計(jì)算會(huì)消耗數(shù)百千瓦。但 CS-1 僅消耗 17 千瓦,占標(biāo)準(zhǔn)機(jī)架能耗的三分之一。他把 CS-1 和谷歌的 TPU 計(jì)算集群相比,強(qiáng)調(diào)谷歌的 TPU2 機(jī)器學(xué)習(xí)集群需要 10 個(gè)機(jī)架和超過(guò) 100 千瓦的功耗,才能提供一個(gè) CS-1 機(jī)箱三分之一的性能。
Feldman 說(shuō):“我們是由 40 萬(wàn)個(gè)專用 AI 處理器組成的 AI 機(jī)器。”CS-1 由 40 萬(wàn)核、1 萬(wàn)億晶體管大小的處理器芯片驅(qū)動(dòng),可以將原本需要至少幾周的大型神經(jīng)網(wǎng)絡(luò)訓(xùn)練任務(wù)縮短到幾分鐘甚至幾秒鐘。但是,Cerebras 并沒(méi)有提供用標(biāo)準(zhǔn) AI 基準(zhǔn)(如新的 MLPeRF 標(biāo)準(zhǔn))衡量性能的數(shù)據(jù)。相反,它通過(guò)讓潛在客戶在 Cerebras 的機(jī)器上訓(xùn)練他們自己的神經(jīng)網(wǎng)絡(luò)模型來(lái)吸引潛在客戶。
另外,Cerebras 還公布了一些系統(tǒng)軟件的細(xì)節(jié),該軟件允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標(biāo)準(zhǔn)框架來(lái)編寫他們的機(jī)器學(xué)習(xí)模型。強(qiáng)大的圖形編譯器可自動(dòng)將這些模型轉(zhuǎn)換為 CS-1 的優(yōu)化可執(zhí)行文件,而豐富的工具集可實(shí)現(xiàn)直觀的模型調(diào)試和性能分析。
圖 | Cerebras 軟件系統(tǒng)允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標(biāo)準(zhǔn)框架來(lái)編寫他們的機(jī)器學(xué)習(xí)模型(來(lái)源:Cerebras Systems)
這是如何實(shí)現(xiàn)的呢?通過(guò)解決一個(gè)優(yōu)化問(wèn)題,確保所有層以大致相同的速度完成它們的任務(wù)處理,且與相鄰層是連續(xù)的。這樣信息就可以實(shí)現(xiàn)在網(wǎng)絡(luò)中暢通無(wú)阻。該軟件可以在多臺(tái)計(jì)算機(jī)上執(zhí)行這個(gè)優(yōu)化問(wèn)題,如果把 32 個(gè) CS-1 連接在一起,那么這一組計(jì)算機(jī)所構(gòu)成的大型計(jì)算機(jī)的性能可以提高約 32 倍。
Feldman 說(shuō):“GPU 集群無(wú)法實(shí)現(xiàn)相同的效果,你得到的不是一個(gè)大型計(jì)算機(jī)的算力,仍然是一堆小機(jī)器所能實(shí)現(xiàn)的算力?!彼J(rèn)為 CS-1 和 GPU 集群形成了鮮明的對(duì)比。
CS-1 的第一個(gè)應(yīng)用是預(yù)測(cè)癌癥藥物反應(yīng),這是美國(guó)能源部和美國(guó)國(guó)家癌癥研究所合作的一個(gè)項(xiàng)目。能源部負(fù)責(zé)人工智能與技術(shù)的副部長(zhǎng) Dimitri Kusnezov 在一份聲明中說(shuō):“在能源部,我們相信公私合作是加速美國(guó)人工智能研究的重要組成部分?!薄拔覀兤诖c Cerebras 建立長(zhǎng)期而富有成效的合作關(guān)系,這將有助于定義下一代人工智能技術(shù),并改變能源部的運(yùn)作、業(yè)務(wù)和使命?!被蛟S這也是 Feldman 能籌集到數(shù)億美元并雇用大量員工的原因。
圖 | 阿貢實(shí)驗(yàn)室(Argonne National Laboratory)
阿貢實(shí)驗(yàn)室與 Cerebras 的合作已經(jīng)有兩年了。其計(jì)算總監(jiān) Rick Stevens 在新聞發(fā)布會(huì)上表示:“通過(guò)部署 CS-1,我們大大縮短了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間,使我們的研究人員能夠更高效地開(kāi)展深度學(xué)習(xí)研究,在癌癥、創(chuàng)傷性腦損傷以及當(dāng)今和未來(lái)對(duì)社會(huì)有重要意義的其他領(lǐng)域取得重大進(jìn)展?!?/p>
阿貢實(shí)驗(yàn)室是全球最大的超級(jí)計(jì)算機(jī)站點(diǎn)之一,而 CS-1 可以使這個(gè)站點(diǎn)比現(xiàn)有的 AI 加速器得到 100 到 1000 倍的提升,有望在 2021 年實(shí)現(xiàn) Aurora 百萬(wàn)兆級(jí)超算的能力。一臺(tái)百萬(wàn)兆級(jí)的計(jì)算機(jī)一瞬間進(jìn)行的計(jì)算量,相當(dāng)于地球上的所有人每天每秒都不停地計(jì)算四年。
除了用在研究抗癌藥物之外,該系統(tǒng)還將被用來(lái)幫助理解黑洞碰撞行為及其引力波。此前做過(guò)類似研究的 Theta 超級(jí)計(jì)算機(jī),在研究黑洞碰撞問(wèn)題時(shí)需要調(diào)動(dòng)超算所配置的 4392 個(gè)節(jié)點(diǎn)中的 1024 個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含了一個(gè) 64 核處理器和 16 GB 的高帶寬封裝內(nèi)存(MCDRAM),192 GB 的 DDR4 RAM 和 128 GB 的 SSD。
Cerebras 的另一個(gè)客戶勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室也來(lái)頭不小,擁有世界排名第三的 Sequoia 超級(jí)計(jì)算機(jī)。CS-1 也有望進(jìn)一步增強(qiáng)其模擬計(jì)算能力。
-
處理器
+關(guān)注
關(guān)注
68文章
19885瀏覽量
235041 -
晶體管
+關(guān)注
關(guān)注
77文章
10018瀏覽量
141586 -
AI
+關(guān)注
關(guān)注
88文章
35080瀏覽量
279416
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論