99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

工程師鄧生 ? 來源:芯東西 ? 作者:溫淑 ? 2021-02-19 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2 月 18 日報(bào)道,本屆集成電路設(shè)計(jì)領(lǐng)域頂會 “國際固態(tài)電路會議(ISSCC 2021)”正在進(jìn)行中(2021 年 2 月 13 日到 22 日)。作為已有近 70 年歷史的集成電路產(chǎn)學(xué)屆盛會,ISSCC 2021 亦被許多廠商視為發(fā)布其領(lǐng)先芯片技術(shù)的權(quán)威舞臺。

本屆會議上,IBM 發(fā)表了據(jù)稱是 “全球首款”的高能效 AI 芯片,該芯片采用 7nm 制程工藝,可達(dá)到 80% 以上的訓(xùn)練利用率和 60% 以上的推理利用率,而通常情況下,GPU 的利用率在 30% 以下。

性能參數(shù)方面,IBM 新品的運(yùn)算密度高于同樣采用 7nm 工藝的 NVIDIA A100 GPU;其在多種精度下的整數(shù)運(yùn)算性能,還優(yōu)于聯(lián)發(fā)科 7nm 專用 AI 芯片等產(chǎn)品。

據(jù) IBM 官網(wǎng)分享,其新款 7nm 高能效 AI 芯片該款芯片在多種場景中均有較好的應(yīng)用前景,比如,可用于混合云環(huán)境中的低能耗 AI 訓(xùn)練、或用于實(shí)現(xiàn)更接近邊緣的云端訓(xùn)練等。

一、IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

對比結(jié)果顯示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韓國科學(xué)院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平頭哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、聯(lián)發(fā)科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮點(diǎn)運(yùn)算次數(shù),分別達(dá)到 16TFLOPS 和 25.6TFLOPS;運(yùn)算密度分別為 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分別為 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的運(yùn)算密度分別為 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分別為 16.5TOPS/W 和 8.9TOPS/W。

對比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮點(diǎn)運(yùn)算次數(shù),分別為 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比為 1.4TFLOPS/W。

另外,在 7nm 芯片陣營中,NVIDIA A100 GPU 在 fp16 精度下的能效比為 0.78TFLOPS/W,在 int4 精度下的能效比為 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片與同類產(chǎn)品的性能參數(shù)對比

二、采用 IBM 自研超低精度訓(xùn)練 / 推理設(shè)計(jì)

IBM 官網(wǎng)文章寫道,其新款 AI 芯片之所以能夠兼顧能效和性能,是因?yàn)樵撔酒С殖途然旌?8 位浮點(diǎn)格式((HFP8,hybrid FP8)。這是 IBM 于 2019 年發(fā)布的一種高度優(yōu)化設(shè)計(jì),允許 AI 芯片在低精度下完成訓(xùn)練任務(wù)和不同 AI 模型的推理任務(wù),同時(shí)避免任何質(zhì)量損失。

據(jù)悉,目前 IBM 將超低精度混合 8 位浮點(diǎn)格式用于訓(xùn)練、超低精度混合 4 位浮點(diǎn)格式用于推理,并開發(fā)了數(shù)據(jù)通信協(xié)議,以提升多核心 AI 芯片上不同核心間的數(shù)據(jù)交換效率。

據(jù) IBM 官網(wǎng)文章,自 2015 年起,該公司每年將芯片的功耗性能提升 2.5 倍。這背后,IBM 致力于實(shí)現(xiàn)算法、架構(gòu)、軟件堆棧等各方面的創(chuàng)新。

▲ IBM 在低精度 AI 訓(xùn)練、推理方面的研究歷程

除了采用超低精度混合 8 位浮點(diǎn)格式外,IBM 新款高能效 AI 芯片添加了電源管理功能。IBM 研究顯示,在同等功率的情況下,通過減緩計(jì)算階段的功率消耗,可以最大限度地提升芯片性能。

結(jié)語:AI 發(fā)展對芯片能耗提出更高要求

隨著智能化浪潮席卷各個(gè)領(lǐng)域,AI 模型的復(fù)雜性日趨提高。相應(yīng)地,AI 應(yīng)用的能源消耗水平亦水漲船高。這一背景下,如何最大限度提升能效,成為 AI 芯片設(shè)計(jì)玩家們面臨的重要命題。

IBM 通過采用超低精度混合 8 位浮點(diǎn)格式和內(nèi)置電源管理功能,為其新款 AI 芯片實(shí)現(xiàn)了業(yè)界領(lǐng)先的高能效。但是,這一芯片尚未實(shí)現(xiàn)規(guī)?;慨a(chǎn),仍有待市場檢驗(yàn)。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    441033
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1823

    瀏覽量

    75833
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106423
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280014
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    優(yōu)化電機(jī)控制以提高能

    機(jī)器人及工廠自動化設(shè)備密布的工業(yè)環(huán)境,電機(jī)已成為不可或缺的動力核心。 與能耗 根據(jù)美國能源信息署數(shù)據(jù),全球約50%的能源消耗來自電機(jī)系統(tǒng),而在工業(yè)領(lǐng)域,這一比例更高達(dá)80%。以2022年美國為例
    發(fā)表于 06-11 09:57

    比和算力提升的衡量方法

    一、比的衡量方法 定義與計(jì)算公式? 比(EER)定義為制冷量與輸入功率的比值,計(jì)算公式為:?EER = Q / W?(Q為制冷量,W為輸入功率)。公制單位通常采用kW/W,英制
    的頭像 發(fā)表于 04-28 07:47 ?1342次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力提升的衡量方法

    Arm 推出 Armv9 邊緣 AI 計(jì)算平臺,以超高能與先進(jìn) AI 能力賦物聯(lián)網(wǎng)革新

    架構(gòu)的超高能 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣
    的頭像 發(fā)表于 03-06 11:43 ?1331次閱讀
    Arm 推出 Armv9 邊緣 <b class='flag-5'>AI</b> 計(jì)算平臺,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>與先進(jìn) <b class='flag-5'>AI</b> 能力賦<b class='flag-5'>能</b>物聯(lián)網(wǎng)革新

    高速公路綜合管理:從理論到實(shí)踐的跨越

    ,不僅面臨著復(fù)雜的地質(zhì)情況和建設(shè)難度,更需要在管理上尋求創(chuàng)新與突破。本文將結(jié)合都巴高速的實(shí)際應(yīng)用案例,探討高速公路綜合管理的創(chuàng)新實(shí)踐。 二、項(xiàng)目概述 ? ? ? 都巴高速主線全
    的頭像 發(fā)表于 02-28 15:42 ?328次閱讀
    高速公路綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理:從理論到實(shí)踐的跨越

    中央空調(diào)系統(tǒng)管理解決方案

    中央空調(diào)系統(tǒng)管理解決方案
    的頭像 發(fā)表于 02-14 08:03 ?368次閱讀
    中央空調(diào)系統(tǒng)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解決方案

    IGBT模塊在頗具挑戰(zhàn)性的逆變器應(yīng)用中提供更高能

    背景:電力驅(qū)動的雖高,但電動汽車、數(shù)據(jù)中心、熱泵等應(yīng)用仍需大量能源運(yùn)行,因此提高能至關(guān)重要。 技術(shù)原理:IGBT(絕緣柵雙極晶體管)模塊是一種電力電子器件,它結(jié)合了MOSFET的
    的頭像 發(fā)表于 01-16 10:47 ?545次閱讀

    安科瑞管理監(jiān)測云平臺

    管理監(jiān)測云平臺的主要內(nèi)容包括以下幾個(gè)方面: 制定科學(xué)的管理制度和標(biāo)準(zhǔn); 建立完善的能源監(jiān)測系統(tǒng)和數(shù)據(jù)分析平臺; 推進(jìn)節(jié)能技術(shù)和設(shè)備的研發(fā)和應(yīng)用; 加強(qiáng)人員培訓(xùn)和管理,提
    的頭像 發(fā)表于 12-18 14:52 ?503次閱讀
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理監(jiān)測云平臺

    Erp指令

    ErP指令EC244/2009、EC245/2009、EU1194/2012和標(biāo)簽指令EU874/2012已經(jīng)實(shí)行多年,歐盟委員會在近3年通過參照不斷改進(jìn)的照明產(chǎn)品技術(shù)、環(huán)境和經(jīng)濟(jì)因素以及實(shí)際
    的頭像 發(fā)表于 11-20 23:57 ?575次閱讀
    Erp指令<b class='flag-5'>能</b><b class='flag-5'>效</b>

    直播預(yù)約 |開源芯片系列講座第24期:SRAM存算一體:賦高能RISC-V計(jì)算

    鷺島論壇開源芯片系列講座第24期「SRAM存算一體:賦高能RISC-V計(jì)算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目SRAM存算一體:
    的頭像 發(fā)表于 11-16 01:10 ?723次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM存算一體:賦<b class='flag-5'>能</b><b class='flag-5'>高能</b><b class='flag-5'>效</b>RISC-V計(jì)算

    上海貝嶺超小封裝物聯(lián)網(wǎng)監(jiān)測芯片BL0971介紹

    為實(shí)現(xiàn)這些監(jiān)測及應(yīng)用需求,上海貝嶺在之前的物聯(lián)網(wǎng)監(jiān)測芯片BL0972的基礎(chǔ)上,針對直流充電樁的應(yīng)用需求,推出了超小封裝的BL0971交直流
    的頭像 發(fā)表于 11-15 11:27 ?1298次閱讀
    上海貝嶺超小封裝物聯(lián)網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>監(jiān)測<b class='flag-5'>芯片</b>BL0971介紹

    安森美推動數(shù)據(jù)中心革新

    隨著數(shù)據(jù)中心為了滿足人工智能(AI)計(jì)算的龐大處理需求而變得越來越耗電,提高能變得至關(guān)重要。與一般的搜索引擎請求相比,搭載AI的引擎需要消耗超過10倍的電力。加快功率半導(dǎo)體的創(chuàng)新以改
    的頭像 發(fā)表于 11-14 09:41 ?592次閱讀

    智慧水務(wù)綜合管理系統(tǒng)-提高污水廠

    簡婷 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務(wù)管理平臺 1平臺概述 安科瑞電氣具備從終端感知、邊緣計(jì)算到管理平臺的產(chǎn)品*態(tài)體系,Acrel
    的頭像 發(fā)表于 10-21 14:14 ?512次閱讀
    智慧水務(wù)綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統(tǒng)-提高污水廠<b class='flag-5'>能</b><b class='flag-5'>效</b>

    聯(lián)發(fā)科天璣9400發(fā)布:比與端側(cè)AI引領(lǐng)移動芯片行業(yè)革新

    AI大模型的推動下,智能手機(jī)市場的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗、高能
    的頭像 發(fā)表于 10-12 15:56 ?1151次閱讀

    使用TPS2116實(shí)現(xiàn)建筑自動化應(yīng)用的高能

    電子發(fā)燒友網(wǎng)站提供《使用TPS2116實(shí)現(xiàn)建筑自動化應(yīng)用的高能.pdf》資料免費(fèi)下載
    發(fā)表于 09-25 11:12 ?0次下載
    使用TPS2116實(shí)現(xiàn)建筑自動化應(yīng)用的<b class='flag-5'>高能</b><b class='flag-5'>效</b>

    此芯科技發(fā)布“此芯P1”異構(gòu)高能芯片,引領(lǐng)AI PC新紀(jì)元

    近日,此芯科技集團(tuán)有限公司(簡稱“此芯科技”)在上海隆重舉辦了AI PC戰(zhàn)略發(fā)布會,正式揭曉了其首款創(chuàng)新力作——“此芯P1”異構(gòu)高能芯片。這一里程碑式的發(fā)布,標(biāo)志著國產(chǎn)
    的頭像 發(fā)表于 08-01 17:42 ?1318次閱讀