99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一塊晶圓等于一顆芯片!全球最大WSE-2處理器發(fā)布!7nm,面積達(dá)826 mm2

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2021-04-23 09:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不知大家是否還記得去年英偉達(dá)發(fā)布的A100 GPU,作為V100推出三年后的又一大計(jì)算卡,其性能較V100提升了20倍,英偉達(dá)更是稱其為最大的7nm芯片,面積達(dá)到826 mm2。而初創(chuàng)公司Cerebras則在近日發(fā)布了第二代Wafer Scale Engine(WSE-2)芯片,奪下了7nm下面積最大芯片的寶座。

WSE-2 芯片/ Cerebras


從2015年到2020年,全球在訓(xùn)練大型模型上的計(jì)算已經(jīng)到了30萬倍,AI的限制更像是運(yùn)算能力的限制,而不單單只是應(yīng)用和創(chuàng)意。驗(yàn)證一個(gè)猜想和訓(xùn)練一個(gè)新模型可能會花上數(shù)周乃至數(shù)月的時(shí)間,Cerebras的WSE-2旨在解決這些影響創(chuàng)新速度的問題。

一塊晶圓 =一個(gè)芯片

WSE-2與A100面積大小對比 / Cerebras


WSE-2從上一代的16nm工藝替換為7nm,盡管面積不變,但新制程的密度優(yōu)勢使其晶體管數(shù)量翻倍,達(dá)到了26000億,AI核心數(shù)更是增加至85萬個(gè)。Cerebras是在參數(shù)簡介上直接對標(biāo)英偉達(dá)的A100,與826 mm2 的A100相比,46225 mm2的WSE-2是前者的56倍。WSE-2片上內(nèi)存為40GB,是A100的千倍,內(nèi)存帶寬更是做到A100的上萬倍。WSE內(nèi)含85萬個(gè)專為AI應(yīng)用優(yōu)化的稀疏線性代數(shù)計(jì)算(SLAC)核心,非常適合神經(jīng)網(wǎng)絡(luò)運(yùn)算。

Cerebras也指出內(nèi)存也是計(jì)算中重要的一環(huán)。就拿上面提到的A100來說,A100只有40MB的L2 cache,卻有著40GB的HBM2內(nèi)存,但這種圖形處理器的缺點(diǎn)就在于這種顯存往往是片外內(nèi)存,而且速度太慢,延遲過高。而WSE-2的40GB內(nèi)存則是均勻分布在AI核心上,且?guī)捒梢赃_(dá)到20PB/s。

其實(shí)早在去年的HotChips大會上,Cerebras就已經(jīng)透露過這個(gè)85萬AI核的新處理器,但由于一些延誤,他們沒法及時(shí)在去年發(fā)布。Cerebras聯(lián)合創(chuàng)始人Andrew Feldman在近期采訪中提到,與客戶合作了一年之后,他們汲取了一些經(jīng)驗(yàn)教訓(xùn),并將其整合進(jìn)了新的AI核心中去,因此這一推遲很可能是由于對AI核心微架構(gòu)的改進(jìn)。

以往一個(gè)晶圓需要切割成多個(gè)芯片,經(jīng)過封裝后再作為處理器上市售賣。而Cerebras的解決方案是晶圓級集成技術(shù),直接利用一個(gè)晶圓的最大面積來生產(chǎn)單一芯片,不過考慮到目前矩形芯片依然是效率最高的選擇,自然不可能直接拿整個(gè)圓形晶圓來制造芯片,Cerebras也從一塊晶圓中選取了最大的正方形。雖然從12英寸晶圓的面積來看,制造一個(gè)WSE-2只用到了2/3的面積,但與芯片的售價(jià)相比,哪怕這些邊角料被浪費(fèi),損失也只是滄海一粟而已。要知道Cerebras賣給匹茨堡超算中心的兩臺基于WSE-1的系統(tǒng),可是從中獲利近500萬美元。

基于WSE-2的AI計(jì)算平臺

但更強(qiáng)大的芯片放在一個(gè)老舊的系統(tǒng)里并非一定能實(shí)現(xiàn)全部的性能,反而可能會凸顯出原有系統(tǒng)的瓶頸,比如通信結(jié)構(gòu)、芯片I/O、電源和散熱等等。這就像是拿法拉利的引擎放在大眾車?yán)?,也跑不出前者的速度一樣?/p>

CS-2散熱系統(tǒng) / Cerebras


基于WSE-2、Cerebras的系統(tǒng)以及軟件平臺,Cerebras也推出了新一代深度學(xué)習(xí)系統(tǒng)CS-2,來突破系統(tǒng)上的限制。這么強(qiáng)大的性能自然需要強(qiáng)大的供電,CS-2采用了9+3的冗余供電配置來驅(qū)動(dòng)WSE-2。但這樣的供電自然也面臨著散熱上的挑戰(zhàn),Cerebras在CS-2內(nèi)部運(yùn)用了一套水冷散熱系統(tǒng),用水冷來對WSE-2散熱,再由風(fēng)冷來降低水溫。與此同時(shí),CS-2的空間占用并不大,這個(gè)26英寸高的機(jī)器僅僅占用15U的機(jī)架空間,雖然大于英偉達(dá)的HGX A100系統(tǒng),但考慮到性能的提升,這點(diǎn)空間占用還是可以接受的。

CS-2 系統(tǒng)/ Cerebras


據(jù)Cerebras透露,WSE-2和CS-2都將于今年第三季度推出,而CS-2的價(jià)格也將從CS-1的2到3百萬美元漲到“幾百萬”美元的不具體數(shù)字。

小結(jié)

盡管Cerebras的WSE-2是一個(gè)性能怪獸,但它的應(yīng)用面并沒有A100那么廣,更像是面向小眾市場。就拿WSE-1的一些客戶來說,多數(shù)在進(jìn)行一些生物及醫(yī)學(xué)研究,比如癌癥治療、藥物發(fā)現(xiàn)等,且多用于超算中心與國家實(shí)驗(yàn)室,比如上面提到的匹茨堡超算中心和阿貢國家實(shí)驗(yàn)室。而英偉達(dá)的A100則可以用于各種AI和HPC應(yīng)用,這也是Cerebras目前的解決方案沒有突破的,但考慮到Cerebras的定位也不是為了做到全面覆蓋,專注于一個(gè)市場反而是Cerebras能做到如此優(yōu)秀的原因所在。

其實(shí)最值得去突破的仍是這種晶圓級集成的技術(shù),固然芯片設(shè)計(jì)廠商希望從單一晶圓中獲取更多的芯片,獲取更高的利潤,但這種純粹追求性能的芯片反而適合如今不少Power-hungry的應(yīng)用。話雖如此,實(shí)現(xiàn)這類芯片的良率同樣是一大挑戰(zhàn),并不是每家公司都像Cerebras一樣在WSE-2上實(shí)現(xiàn)100%的良率的。

本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19890

    瀏覽量

    235124
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52494

    瀏覽量

    440673
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    國民技術(shù)能否開展個(gè)M7處理器的試用活動(dòng)。

    國民技術(shù)最近推出了M7處理器,看起來能力很強(qiáng),電子發(fā)燒友能不能聯(lián)合國民技術(shù)開展個(gè)M7使用的活動(dòng),讓大家了解下M7核的國民技術(shù)。
    發(fā)表于 05-20 22:04

    扇出型級封裝技術(shù)的工藝流程

    上 。這種創(chuàng)新的封裝方式自蘋果A10處理器采用后,在節(jié)約主板表面面積方面成效顯著。根據(jù)線路和焊腳與芯片尺寸的關(guān)系,WLP分為Fanin WLP(線路和焊腳限定在芯片尺寸以內(nèi))和Fano
    的頭像 發(fā)表于 05-14 11:08 ?744次閱讀
    扇出型<b class='flag-5'>晶</b><b class='flag-5'>圓</b>級封裝技術(shù)的工藝流程

    基于龍芯2K0300處理器 龍芯中科攜手正點(diǎn)原子發(fā)布龍芯ATK-DL2K0300B開發(fā)板

    龍芯中科攜手正點(diǎn)原子發(fā)布龍芯ATK-DL2K0300B開發(fā)板。該開發(fā)板為正點(diǎn)原子發(fā)布的首款龍芯開發(fā)板,為基于龍芯2K0300處理器打造,是
    的頭像 發(fā)表于 02-25 15:29 ?851次閱讀
    基于龍芯<b class='flag-5'>2</b>K0300<b class='flag-5'>處理器</b> 龍芯中科攜手正點(diǎn)原子<b class='flag-5'>發(fā)布</b>龍芯ATK-DL<b class='flag-5'>2</b>K0300B開發(fā)板

    RK3126處理器:高效四核Cortex-A7多媒體處理平臺

    RK3126是款集成了四核Cortex-A7 CPU和Mali-400MP2 GPU的高性能多媒體處理器,專為滿足現(xiàn)代智能設(shè)備對高效能、低功耗的需求而設(shè)計(jì)。 在CPU方面,RK312
    的頭像 發(fā)表于 02-08 18:11 ?1420次閱讀

    RK3128處理器:高效四核Cortex-A7多媒體解決方案

    Cortex-A7處理器,頻率高達(dá)1.2GHz,提供了流暢的多任務(wù)處理能力,確保設(shè)備在各種應(yīng)用場景下都能保持出色的響應(yīng)速度和穩(wěn)定性。 GPU方面,RK3128配備了Mali-400MP2
    的頭像 發(fā)表于 02-08 18:08 ?1436次閱讀

    RV1109處理器概述

    RV1109處理器款集成了先進(jìn)技術(shù)的高性能芯片,其主要特性彰顯了在多個(gè)領(lǐng)域的強(qiáng)大應(yīng)用能力。 該處理器搭載了雙核設(shè)計(jì),結(jié)合了ARM Cortex-A
    的頭像 發(fā)表于 02-08 17:04 ?1401次閱讀

    MTK8786_MT8786處理器性能參數(shù)_MTK聯(lián)發(fā)科安卓核心板方案

    聯(lián)發(fā)科的MT8786處理器采用了靈活的2+6架構(gòu),配備2主頻高達(dá)2.0GHz的Cortex-A75大核心和6主頻為1.8GHz的Cort
    的頭像 發(fā)表于 01-09 20:18 ?2437次閱讀
    MTK8786_MT8786<b class='flag-5'>處理器</b>性能參數(shù)_MTK聯(lián)發(fā)科安卓核心板方案

    TPS65911A 66AK2G12處理器用戶指南

    電子發(fā)燒友網(wǎng)站提供《TPS65911A 66AK2G12處理器用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-02 16:11 ?4次下載
    TPS65911A 66AK<b class='flag-5'>2</b>G12<b class='flag-5'>處理器</b>用戶指南

    TPS659118 66AK2G02處理器用戶指南

    電子發(fā)燒友網(wǎng)站提供《TPS659118 66AK2G02處理器用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 12-23 14:40 ?0次下載
    TPS659118 66AK<b class='flag-5'>2</b>G02<b class='flag-5'>處理器</b>用戶指南

    一顆芯片面積頂4H200,博通推出3.5D XDSiP封裝平臺

    平方毫米的3D堆疊硅晶片和12個(gè)HBM模塊集成到個(gè)系統(tǒng)級封裝中。這是什么概念? ? 目前手機(jī)移動(dòng)端的旗艦處理器驍龍8Elite核心面積是124.1平方毫米;英偉達(dá)H200核心
    的頭像 發(fā)表于 12-10 09:15 ?2778次閱讀
    <b class='flag-5'>一顆</b><b class='flag-5'>芯片面積</b>頂4<b class='flag-5'>顆</b>H200,博通推出3.5D XDSiP封裝平臺

    所謂的7nm芯片上沒有個(gè)圖形是7nm

    最近網(wǎng)上因?yàn)楣饪虣C(jī)的事情,網(wǎng)上又是陣熱鬧。好多人又開始討論起28nm/7nm的事情了有意無意之間,我也看了不少網(wǎng)上關(guān)于國產(chǎn)自主7nm工藝的文章。不過這些文章里更多是抒情和遐想,卻很少
    的頭像 發(fā)表于 10-08 17:12 ?822次閱讀
    所謂的<b class='flag-5'>7nm</b><b class='flag-5'>芯片</b>上沒有<b class='flag-5'>一</b>個(gè)圖形是<b class='flag-5'>7nm</b>的

    基于全志V853處理器的智能輔助駕駛算法介紹

    全志V853處理器,是專為智慧視覺領(lǐng)域設(shè)計(jì)的AI處理器,配備了高效的NPU算力和豐富的外設(shè)接口,能夠提供穩(wěn)定的AI邊緣計(jì)算支持;同時(shí),基于V853處理器性能優(yōu)勢,全志還為客戶提供了
    的頭像 發(fā)表于 09-14 09:23 ?1809次閱讀
    基于全志V853<b class='flag-5'>處理器</b>的智能輔助駕駛算法介紹

    使用TPS6521815 PMIC為NXP i.MX 7處理器供電

    電子發(fā)燒友網(wǎng)站提供《使用TPS6521815 PMIC為NXP i.MX 7處理器供電.pdf》資料免費(fèi)下載
    發(fā)表于 09-13 09:40 ?0次下載
    使用TPS6521815 PMIC為NXP i.MX <b class='flag-5'>7</b><b class='flag-5'>處理器</b>供電

    高通驍龍6 Gen 3處理器發(fā)布

    高通公司近日正式推出了驍龍6 Gen 3處理器,這款芯片采用先進(jìn)的三星4nm工藝打造,代號為SM6475-AB,標(biāo)志著中端處理器市場的新
    的頭像 發(fā)表于 09-04 15:43 ?1845次閱讀

    OPA197如果使用多階,用一顆跟隨提供基準(zhǔn)電壓是否可行?

    目前使用該芯片做濾波性能,每階使用一顆作為跟隨,一顆來做濾波。 Q1、如果使用多階,用
    發(fā)表于 08-16 15:08