99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

稀疏化應(yīng)對算力瓶頸,助力云服務(wù)商大幅降低成本

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-09-02 08:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI、5G等新興產(chǎn)業(yè)的蓬勃發(fā)展催生了海量數(shù)據(jù)計算需求,同時AI算法模型持續(xù)迭代,復(fù)雜化日益凸顯,數(shù)字經(jīng)濟(jì)時代下市場需要強(qiáng)大、普惠的算力引擎。而從供給端來看,先進(jìn)制程的迭代周期變長,使得芯片能效比的提升并不顯著。

針對AI應(yīng)用特點(diǎn)實現(xiàn)硬件架構(gòu)創(chuàng)新是必然趨勢,墨芯人工智能CEO王維在某論壇上談到,依托對AI的理解用軟硬一體解決算力瓶頸問題是行業(yè)公認(rèn)的發(fā)展方向。他認(rèn)為,稀疏化能夠有效應(yīng)對算力瓶頸,實現(xiàn)原理是,不存儲和不處理零值,從而得到更小且更快的模型。

軟硬一體化稀疏路徑符合AI計算核心訴求

軟硬一體化稀疏路徑符合AI計算高吞吐、低功耗、低延時的核心需求。AI稀疏產(chǎn)業(yè)化的成功要素包括:1、跨算法、軟件、硬件領(lǐng)域的協(xié)同開發(fā);2、擁有持續(xù)多層次優(yōu)化稀疏運(yùn)算的底層算法能力;3、架構(gòu)需保證可編程性、高度可拓展屬性及快速迭代能力。

稀疏化路徑已具備批量化工程應(yīng)用能力。英偉達(dá)在2020年推出的A100產(chǎn)品中,就率先引入稀疏Tensor Core實現(xiàn)4:2結(jié)構(gòu)化稀疏,稀疏是神經(jīng)網(wǎng)絡(luò)輕量化的重要手段,英偉達(dá)稀疏化產(chǎn)品有效引領(lǐng)市場應(yīng)用趨勢。稀疏化架構(gòu)可與現(xiàn)有AI軟件生態(tài)深度適配,例如英偉達(dá)直接使用Tensor Core進(jìn)行稀疏矩陣乘累加操作,無需進(jìn)行底層編程。
圖片1
墨芯人工智能CEO王維演講(電子發(fā)燒友拍攝)

基于雙稀疏特點(diǎn),自研核心AI架構(gòu)

墨芯是全球最早研發(fā)稀疏化算法及架構(gòu)的企業(yè),并在2018年開始稀疏化的全球?qū)@季?,該公司也是最早商用稀疏化產(chǎn)品實現(xiàn)銷售的,第一款FPGA產(chǎn)品在2019年Q4開始產(chǎn)生銷售。

王維表示,現(xiàn)有芯片架構(gòu)設(shè)計在稀疏化支持中面臨較大局限,比如CPU架構(gòu),可支持跳點(diǎn)運(yùn)算,但因其算力限制,僅能夠支持邊緣端應(yīng)用,無法支持更大的模型,再比如GPU架構(gòu),只能進(jìn)行并行計算,所有元素(包括0元素)均參與運(yùn)算,無法實現(xiàn)高倍數(shù)加速。

基于雙稀疏特點(diǎn),墨芯自研核心AI架構(gòu)。其雙稀疏架構(gòu)設(shè)計理念:平衡的權(quán)重和激活張量剪枝技術(shù),可將精度損失降至最低的前提下保持對硬件的友好度;墨芯獨(dú)有的剪枝和壓縮技術(shù)可以再許多網(wǎng)絡(luò)和應(yīng)用中實現(xiàn)最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已經(jīng)回片,實測性能ResNet 50超33000SPS;墨芯板卡S4(單顆Antoum-1)僅30W功耗,實測性能實現(xiàn)英偉達(dá)主流產(chǎn)品T4近16倍能效比;墨芯板卡S4對比英偉達(dá)主流產(chǎn)品Latency可以做到1/4-1/5。
圖片2
墨芯人工智能CEO王維演講(電子發(fā)燒友拍攝)

稀疏化計算產(chǎn)品商業(yè)落地,將賦能AI產(chǎn)業(yè)變革。一、助力云服務(wù)商降低單位算力擁有成本,2021年,Nvidia在中國營收超過38億美金,其中阿里,騰訊等頭部互聯(lián)網(wǎng)公司采購金額基本超過1億美金。隨著AI持續(xù)發(fā)展,數(shù)據(jù)量的指數(shù)上升導(dǎo)致AI芯片的需求會持續(xù)上升,云服務(wù)商采購額將逐年增加,因此他們對降低成本的訴求非常強(qiáng)勁,基于Antoum-1的推理卡S4相較于英偉達(dá)對標(biāo)推理卡T4,ResNest50及BERT每FPS/SPS成本降低約85%。

二、助力云服務(wù)商縮減能耗成本,電費(fèi)支出是數(shù)據(jù)中心最大的營業(yè)成本,平均數(shù)據(jù)中心近60%的營業(yè)成本是電力成本,降低能耗是數(shù)據(jù)中心和云服務(wù)商的最大痛點(diǎn),2021年全國數(shù)據(jù)中心的耗電量占社會總用電的近3%,且增長率已連續(xù)8年超過12%,基于Antoum-1的推理卡S4相較于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低約90%。

小結(jié)

目前基于稀疏化的AI架構(gòu)主要面向云端訓(xùn)練場景,不過理論上來說,稀疏化訓(xùn)練由于能大幅降低對內(nèi)存、帶寬與計算的需求,十分適合訓(xùn)練,未來墨芯在滿足推理市場的需求后,將切入訓(xùn)練市場,建立稀疏訓(xùn)練生態(tài),產(chǎn)品在軟件層面對訓(xùn)練做更多的開發(fā),支持訓(xùn)練專用的算子,同時硬件上也會為訓(xùn)練定義架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1195

    瀏覽量

    15645
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm架構(gòu)將占據(jù)半數(shù) 2025年出貨到頭部服務(wù)提供

    Neoverse 技術(shù)的部署已達(dá)到了新的高度:2025 年出貨到頭部超大規(guī)模服務(wù)提供中,將有近 50% 是基于 Arm 架構(gòu)。
    的頭像 發(fā)表于 04-09 17:31 ?741次閱讀

    工業(yè)4.0革命利器!明遠(yuǎn)智睿SSD2351核心板:低成本+高,破解產(chǎn)線智能難題

    行業(yè)痛點(diǎn):傳統(tǒng)工業(yè)設(shè)備智能改造面臨三大瓶頸——不足導(dǎo)致實時性差、接口資源有限難以擴(kuò)展多設(shè)備、進(jìn)口方案成本高昂且供貨不穩(wěn)定。 核心板方案
    發(fā)表于 03-21 14:22

    GPU 加速計算:突破傳統(tǒng)瓶頸的利刃

    在數(shù)字化時代,數(shù)據(jù)呈爆炸式增長,傳統(tǒng)的已難以滿足復(fù)雜計算任務(wù)的需求。無論是人工智能的深度學(xué)習(xí)、大數(shù)據(jù)的分析處理,還是科學(xué)研究中的模擬計算,都對提出了極高的要求。而
    的頭像 發(fā)表于 02-17 10:36 ?290次閱讀

    租用站群服務(wù)器時如何降低成本?

    在租用站群服務(wù)器時,降低成本是許多站群管理者關(guān)注的重要問題。主機(jī)推薦小編為您整理發(fā)布租用站群服務(wù)器時如何降低成本,以下是一些實用的策略和建議,有助于在保持性能的同時
    的頭像 發(fā)表于 01-22 10:45 ?343次閱讀

    Grab選定亞馬遜科技為首選服務(wù)商

    近日,在亞馬遜科技2024年re:Invent全球大會上,一項重大合作宣布出爐。東南亞領(lǐng)先的超級應(yīng)用程序Grab與亞馬遜科技攜手,宣布Grab已正式選定亞馬遜科技作為其首選的
    的頭像 發(fā)表于 12-24 10:22 ?480次閱讀

    超級應(yīng)用程序Grab選擇亞馬遜科技為首選服務(wù)商

    亞馬遜科技為首選服務(wù)商。借助亞馬遜科技,Grab正在實施以技術(shù)為核心的發(fā)展戰(zhàn)略,旨在推動其業(yè)務(wù)在出行、配送、以及包括新增的digibanks在內(nèi)的金融
    的頭像 發(fā)表于 12-19 15:31 ?597次閱讀

    中國AI企業(yè)創(chuàng)新降低成本打造競爭模型

    在中國,面對美國實施的芯片限制以及相較于西方企業(yè)更為有限的預(yù)算,人工智能(AI)公司正積極尋求降低成本的方法,以開發(fā)出具有市場競爭的模型。初創(chuàng)公司如01.ai(零一萬物)和DeepSeek(深度求索)等,通過聚焦小數(shù)據(jù)集進(jìn)行AI模型訓(xùn)練,并聘請價格適中但技術(shù)熟練的計算機(jī)
    的頭像 發(fā)表于 10-22 14:56 ?976次閱讀

    在飽和狀態(tài)下運(yùn)行UCC2888x離線降壓以降低成本

    電子發(fā)燒友網(wǎng)站提供《在飽和狀態(tài)下運(yùn)行UCC2888x離線降壓以降低成本.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 09:47 ?0次下載
    在飽和狀態(tài)下運(yùn)行UCC2888x離線降壓以<b class='flag-5'>降低成本</b>

    降低成本城域網(wǎng)

    電子發(fā)燒友網(wǎng)站提供《降低成本城域網(wǎng).pdf》資料免費(fèi)下載
    發(fā)表于 10-12 11:46 ?0次下載
    <b class='flag-5'>降低成本</b>城域網(wǎng)

    CC2340系統(tǒng)降低成本的方案剖析

    電子發(fā)燒友網(wǎng)站提供《CC2340系統(tǒng)降低成本的方案剖析.pdf》資料免費(fèi)下載
    發(fā)表于 08-27 09:43 ?0次下載
    CC2340系統(tǒng)<b class='flag-5'>降低成本</b>的方案剖析

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國信通院公布首個《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。
    的頭像 發(fā)表于 08-06 14:23 ?1356次閱讀

    IaaS+on+DPU(IoD)+下一代高性能底座技術(shù)白皮書

    數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲、安全等處理性能,助力服務(wù)器運(yùn)行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時,圍繞 DPU 構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)的基礎(chǔ)設(shè)施
    發(fā)表于 07-24 15:32

    中國中心市場持續(xù)增長,智能規(guī)??焖籴绕?/a>

    7月24日,中國信息通信研究院(簡稱“中國信通院”)權(quán)威發(fā)布了《中國中心服務(wù)商分析報告(2024年)》,該報告深入剖析了中國中心市場
    的頭像 發(fā)表于 07-24 15:25 ?1082次閱讀

    曙光攜手“互聯(lián)公共服務(wù)平臺”提高全國匹配效率

    的互聯(lián)互通,助力互聯(lián)公共服務(wù)平臺”功能完善,實現(xiàn)全國一體
    的頭像 發(fā)表于 07-16 15:45 ?1082次閱讀