99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

并行計(jì)算的崛起:為什么GPU將在邊緣AI中取代NPU

穎脈Imgtec ? 2025-06-06 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文章翻譯自EEnews Europe


人工智能AI)不僅是一項(xiàng)技術(shù)突破,它更是軟件編寫、理解和執(zhí)行方式的一次永久性變革。傳統(tǒng)的軟件開(kāi)發(fā)基于確定性邏輯和大多是順序執(zhí)行的流程,而如今這一范式正在讓位于概率模型、訓(xùn)練行為以及數(shù)據(jù)驅(qū)動(dòng)的計(jì)算。這并不是一時(shí)的潮流。AI代表了計(jì)算機(jī)科學(xué)的一次根本性、不可逆的轉(zhuǎn)變——從基于規(guī)則的編程,邁向自適應(yīng)的、基于學(xué)習(xí)的系統(tǒng),這些系統(tǒng)正逐步被集成到越來(lái)越廣泛的計(jì)算問(wèn)題與能力中。

這一轉(zhuǎn)變也對(duì)硬件提出了相應(yīng)的變革需求。在AI架構(gòu)和算法不斷演進(jìn)(并將持續(xù)演進(jìn))的時(shí)代,為狹窄定義任務(wù)而打造的高度專用芯片的舊模式已不再適用。為了滿足不斷變化的AI需求(尤其是在邊緣側(cè)),我們需要具備與工作負(fù)載同樣動(dòng)態(tài)、適應(yīng)能力強(qiáng)的計(jì)算平臺(tái)。

這正是為什么通用并行處理器(即GPU)正在成為邊緣AI的未來(lái),并開(kāi)始取代諸如神經(jīng)網(wǎng)絡(luò)處理器(NPU)這樣的專用處理器。這不僅僅是性能的問(wèn)題——更是關(guān)于靈活性、可擴(kuò)展性,以及與未來(lái)軟件發(fā)展方向保持一致的問(wèn)題。


Makimoto波動(dòng)理論與“靈活性”的回歸

要理解這一轉(zhuǎn)變,我們只需回顧“Makimoto波動(dòng)理論”:這是由日本工程師牧本次雄(Tsugio Makimoto)提出的一個(gè)概念,描述了計(jì)算產(chǎn)業(yè)在不同階段不斷在“標(biāo)準(zhǔn)化”與“定制化”之間擺動(dòng)的趨勢(shì),其背后是市場(chǎng)需求、技術(shù)創(chuàng)新和軟件復(fù)雜性等因素的持續(xù)變化。

(Makimoto波動(dòng)理論展現(xiàn)了計(jì)算產(chǎn)業(yè)在“靈活性”與“專用性”之間的歷史擺動(dòng)。而當(dāng)前AI的發(fā)展軌跡,標(biāo)志著計(jì)算正再次呈現(xiàn)出在“靈活性”和“通用平臺(tái)”之間的擺動(dòng)。)

這一模型與AI硬件的演變過(guò)程高度契合。在AI發(fā)展的早期階段,工作負(fù)載較為明確且穩(wěn)定,此時(shí)采用NPU等固定功能加速器是合理的。這類處理器對(duì)特定任務(wù)(例如使用CNN進(jìn)行圖像分類或目標(biāo)檢測(cè))進(jìn)行了深度優(yōu)化。

但如今AI已進(jìn)入高速演進(jìn)階段。我們已走出簡(jiǎn)單、靜態(tài)模型的時(shí)代,邁入混合網(wǎng)絡(luò)、Transformer架構(gòu)、基礎(chǔ)模型和持續(xù)創(chuàng)新的浪潮之中。為去年AI打造的定制硬件,根本無(wú)法跟上當(dāng)今的發(fā)展節(jié)奏。

我們?cè)俅握驹诹恕癕akimoto拐點(diǎn)”上——從專用硬件,回歸到可擴(kuò)展、可適配的通用計(jì)算平臺(tái)。


AI是一個(gè)并行計(jì)算問(wèn)題,而非專用計(jì)算問(wèn)題

AI的本質(zhì)在于并行計(jì)算。深度學(xué)習(xí)嚴(yán)重依賴并發(fā)操作——矩陣運(yùn)算、張量乘法、向量計(jì)算——這些正是GPU天生擅長(zhǎng)的工作負(fù)載。能夠同時(shí)渲染數(shù)百萬(wàn)像素的架構(gòu),如今正好可以處理數(shù)百萬(wàn)神經(jīng)元的激活。

如今的通用GPU早已不僅僅用于圖形處理。它們擁有可編程管線、計(jì)算著色器,以及日益增強(qiáng)的AI中心化設(shè)計(jì),不僅能加速傳統(tǒng)負(fù)載,也能支持新興的AI工作負(fù)載,是邊緣AI中強(qiáng)大而靈活的計(jì)算引擎。

相比之下,像NPU這樣的專用處理器則難以應(yīng)對(duì)持續(xù)的變革。它們對(duì)特定操作進(jìn)行了優(yōu)化,而當(dāng)AI領(lǐng)域快速演進(jìn)時(shí),這些芯片便迅速被淘汰。顯然,面對(duì)這種全新的軟件范式,我們需要的是一種通用的、并行的、靈活的硬件平臺(tái)—— GPU。


為什么通用平臺(tái)在邊緣側(cè)更具優(yōu)勢(shì)

邊緣AI不僅需要性能,更需要適應(yīng)性、可重用性與較長(zhǎng)的生命周期?,F(xiàn)代GPU等通用并行處理器在這幾個(gè)方面均具備明顯優(yōu)勢(shì):

靈活性:可編程,能夠支持新的模型類型而無(wú)需更換硬件;

可擴(kuò)展性:可適配從IoT傳感器智能攝像頭再到自動(dòng)駕駛汽車等各種邊緣設(shè)備;

軟件生態(tài)成熟:擁有豐富的開(kāi)源工具與開(kāi)發(fā)標(biāo)準(zhǔn)(如OpenCL、LiteRT、TVM);

可持續(xù)性:延長(zhǎng)產(chǎn)品生命周期,減少不斷重新設(shè)計(jì)芯片的需求。

簡(jiǎn)而言之,GPU的通用并行計(jì)算從架構(gòu)層面就為AI的持續(xù)演進(jìn)而設(shè)計(jì)。


展望未來(lái)

盡管有越來(lái)越多的證據(jù)說(shuō)明GPU具備的優(yōu)勢(shì),市場(chǎng)仍然習(xí)慣將AI加速與NPU或定制芯片劃等號(hào)。但正如圖形行業(yè)早年發(fā)現(xiàn),固定功能的圖形管線無(wú)法跟上游戲創(chuàng)新的節(jié)奏,如今AI行業(yè)也發(fā)現(xiàn):固定硬件無(wú)法匹配快速變化的軟件需求。

是時(shí)候重新教育整個(gè)生態(tài)了。邊緣AI的未來(lái)不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計(jì)算平臺(tái),它們能與智能軟件共同成長(zhǎng)并擴(kuò)展。

幾十年前,Makimoto就洞察了這一趨勢(shì)。如今,我們正在親身經(jīng)歷他的遠(yuǎn)見(jiàn)——順應(yīng)著通用性和靈活性的浪潮前行。GPU不再是追趕者,它已處于領(lǐng)先位置。

Dennis Laudick是Imagination Technologies的產(chǎn)品管理副總裁。在加入公司之前,Dennis曾在Arm任職超過(guò)13年,擔(dān)任汽車、AI和GPU相關(guān)業(yè)務(wù)的產(chǎn)品與市場(chǎng)領(lǐng)導(dǎo)職務(wù)。在此之前,他還曾在多家半導(dǎo)體與OEM巨頭企業(yè)擔(dān)任高級(jí)管理崗位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4928

    瀏覽量

    130967
  • 并行計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    9602
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    326

    瀏覽量

    19644
  • 邊緣AI
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    5407
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    arm系統(tǒng)并行計(jì)算優(yōu)化

    32位,這樣可以一次性處理4個(gè)8為數(shù)據(jù),不過(guò)gps處理需要對(duì)每個(gè)數(shù)據(jù)進(jìn)行判斷而導(dǎo)致無(wú)法使用neon。如何數(shù)據(jù)可以多位一起處理,或者說(shuō)多層嵌套循環(huán)有提前跳出的條件存在,并行計(jì)算優(yōu)化還是有希望。
    發(fā)表于 12-30 14:33

    什么是異構(gòu)并行計(jì)算

    先了解什么是異構(gòu)并行計(jì)算同構(gòu)計(jì)算是使用相同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。而異構(gòu)計(jì)算主要是指使用不同類型指令集和體系架構(gòu)的
    發(fā)表于 07-19 08:27

    請(qǐng)問(wèn)openCL并行計(jì)算的程序能運(yùn)行在RK3399Pro的NPU上嗎

    請(qǐng)問(wèn)openCL并行計(jì)算的程序能運(yùn)行在RK3399Pro的NPU上嗎? 有哪位大神可以解答一下嗎
    發(fā)表于 08-19 16:49

    并行計(jì)算和嵌入式系統(tǒng)實(shí)踐教程

    Linux微機(jī)應(yīng)用十分普遍. 高性能并行計(jì)算機(jī)數(shù)量多. 并行計(jì)算,我國(guó)有自己的理論. 對(duì)并行計(jì)算的基本原理,算法,程序設(shè)計(jì)與實(shí)現(xiàn),優(yōu)化,成熟軟件應(yīng)用的推廣不夠. 制約并行計(jì)算在研究和工
    發(fā)表于 05-09 15:54 ?48次下載

    虛擬化環(huán)境下多GPU并行計(jì)算研究

    虛擬化環(huán)境下多GPU并行計(jì)算研究_閔芳
    發(fā)表于 01-03 15:24 ?0次下載

    基于GPU圖像去噪總變分對(duì)偶模型的并行計(jì)算

    研究基于總變分( TV)的圖像去噪問(wèn)題,針對(duì)中央處理器(CPU)計(jì)算速度較慢的問(wèn)題,提出了在圖像處理器( GPU)上并行計(jì)算的方法。考慮總變分最小問(wèn)題的對(duì)偶模型,建立原始變量與對(duì)偶變量的關(guān)系,采用
    發(fā)表于 12-18 17:09 ?1次下載

    基于Matlab和GPU的BESO方法的全流程并行計(jì)算策略

    了Matlab編程環(huán)境實(shí)現(xiàn)GPU并行計(jì)算的三種途徑的優(yōu)缺點(diǎn)和適用范圍;其次,分別采用內(nèi)置函數(shù)直接并行的方式實(shí)現(xiàn)了拓?fù)鋬?yōu)化算法向量和稠密矩
    發(fā)表于 12-21 15:04 ?2次下載
    基于Matlab和<b class='flag-5'>GPU</b>的BESO方法的全流程<b class='flag-5'>并行計(jì)算</b>策略

    基于異構(gòu)并行計(jì)算的兩個(gè)子概念異構(gòu)和并行的簡(jiǎn)單分析

    異構(gòu)并行計(jì)算包含兩個(gè)子概念:異構(gòu)和并行。 1異構(gòu)是指異構(gòu)并行計(jì)算需要同時(shí)處理多個(gè)不同架構(gòu)的計(jì)算平臺(tái)的問(wèn)題。 2并行是指異構(gòu)
    的頭像 發(fā)表于 01-25 16:37 ?6823次閱讀
    基于異構(gòu)<b class='flag-5'>并行計(jì)算</b>的兩個(gè)子概念異構(gòu)和<b class='flag-5'>并行</b>的簡(jiǎn)單分析

    并行計(jì)算的黃金時(shí)代到了?

    “未來(lái)幾十年將進(jìn)入并行計(jì)算黃金時(shí)代,并行計(jì)算軟件和算法的開(kāi)發(fā)將從技術(shù)驅(qū)動(dòng)轉(zhuǎn)向應(yīng)用驅(qū)動(dòng),需要計(jì)算與應(yīng)用等不同領(lǐng)域的專家共同合作開(kāi)發(fā)。”中國(guó)工程院院士李國(guó)杰日前表示。
    的頭像 發(fā)表于 04-03 17:18 ?2496次閱讀

    淺析云計(jì)算并行計(jì)算

    并行計(jì)算可以劃分成時(shí)間并行和空間并行。時(shí)間并行即流水線技術(shù),空間并行使用多個(gè)處理器執(zhí)行并發(fā)計(jì)算,
    的頭像 發(fā)表于 05-03 12:01 ?4969次閱讀
    淺析云<b class='flag-5'>計(jì)算</b>和<b class='flag-5'>并行計(jì)算</b>

    NPU技術(shù)如何提升AI性能

    設(shè)計(jì)的處理器,與傳統(tǒng)的CPU和GPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時(shí)具有更高的效率和更低的能耗。NPU通過(guò)專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)的大量并行計(jì)算任務(wù)。 1. 優(yōu)
    的頭像 發(fā)表于 11-15 09:11 ?1385次閱讀

    NPU邊緣計(jì)算的優(yōu)勢(shì)

    GPU相比,NPU在處理神經(jīng)網(wǎng)絡(luò)相關(guān)的計(jì)算任務(wù)時(shí),能夠提供更高的能效比和更快的處理速度。NPU通過(guò)優(yōu)化數(shù)據(jù)流和計(jì)算結(jié)構(gòu),使得神經(jīng)網(wǎng)絡(luò)的前向
    的頭像 發(fā)表于 11-15 09:13 ?1211次閱讀

    xgboost的并行計(jì)算原理

    在大數(shù)據(jù)時(shí)代,機(jī)器學(xué)習(xí)算法需要處理的數(shù)據(jù)量日益增長(zhǎng)。為了提高數(shù)據(jù)處理的效率,許多算法都開(kāi)始支持并行計(jì)算。XGBoost作為一種高效的梯度提升樹(shù)算法,其并行計(jì)算能力是其受歡迎的原因
    的頭像 發(fā)表于 01-19 11:17 ?975次閱讀

    讀懂極易并行計(jì)算:定義、挑戰(zhàn)與解決方案

    GPU經(jīng)常與人工智能同時(shí)提及,其中一個(gè)重要原因在于AI與3D圖形處理本質(zhì)上屬于同一類問(wèn)題——它們都適用極易并行計(jì)算。什么是極易并行計(jì)算?極易并行計(jì)算
    的頭像 發(fā)表于 04-17 09:11 ?373次閱讀
    讀懂極易<b class='flag-5'>并行計(jì)算</b>:定義、挑戰(zhàn)與解決方案

    邊緣AI廣泛應(yīng)用推動(dòng)并行計(jì)算崛起及創(chuàng)新GPU滲透率快速提升

    是時(shí)候重新教育整個(gè)生態(tài)了。邊緣AI的未來(lái)不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計(jì)算平臺(tái),它們能與智能軟件共同成長(zhǎng)并擴(kuò)展。
    的頭像 發(fā)表于 06-11 14:57 ?214次閱讀