99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)計算的前世今生

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-12-17 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異構(gòu)計算已經(jīng)成了半導(dǎo)體業(yè)界不得不思考的一個話題,傳統(tǒng)通用計算的性能捉襟見肘,過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機(jī)中,各種除CPU以外的計算單元層出不窮,無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。

異構(gòu)計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機(jī)SoC、汽車芯片,大到服務(wù)器芯片和超算處理器,異構(gòu)帶來了更大的算力。但與此同時,異構(gòu)計算也帶來了一些潛在的問題。

異構(gòu)計算的崛起

異構(gòu)計算其實早在計算機(jī)時代的早期就開始零星出現(xiàn)了,比如英特爾在80年代推出的浮點協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉(zhuǎn)眼進(jìn)入了新世紀(jì),異構(gòu)出現(xiàn)的頻率也越來越高,2010年蘋果推出了首個自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領(lǐng)域,加速器和協(xié)處理器也數(shù)量也在逐步增加。

全球超算系統(tǒng)加速器/協(xié)處理器的應(yīng)用趨勢 / TOP500

2020年以后,各國的超級計算機(jī)計劃都定位在了Exascale的百億億級別,要想實現(xiàn)目標(biāo),要么靠堆核心規(guī)模來堆性能,要么就是選擇異構(gòu)計算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構(gòu)設(shè)計。

明眼人都能看出,這種CPU+GPU的異構(gòu)設(shè)計也開始變得愈發(fā)緊密,比如英偉達(dá)今年宣布的Arm CPU Grace,該處理器靠著英偉達(dá)專利互聯(lián)技術(shù)NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實現(xiàn)了500GB/s的內(nèi)存帶寬。

非傳統(tǒng)的架構(gòu)更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個字母了。促使大家選擇異構(gòu)的動力究竟是什么?答案很簡單,異構(gòu)給到了一個更高效的方案,能夠?qū)崿F(xiàn)的算力更高。既然你CPU在計算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術(shù)為我撐腰。

異構(gòu)計算真就完美無缺?

異構(gòu)計算就真的如此完美嗎?并非如此。異構(gòu)計算的存在其實也引出了不少隱患,比如極度差異化的編程模型,從過去的單向編程轉(zhuǎn)為了多向編程。因為異構(gòu)系統(tǒng)中存在多個計算設(shè)備,又有著不同的系統(tǒng)架構(gòu)、指令集和編程模型,因此異構(gòu)系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來說,異構(gòu)混合計算系統(tǒng)需要多套不同的代碼,這增大了應(yīng)用開發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開發(fā)者。

IPU / Graphcore

其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構(gòu),還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構(gòu)下,將并行程序移植到異構(gòu)處理器上需要的可不只是重新編譯,還有代碼重寫。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠(yuǎn)都不會被移植到其他加速器上,甚至這一部分工作量還分?jǐn)偟搅思铀倨鲝S商的軟件開發(fā)工作量上。

所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開發(fā)者充分利用異構(gòu)處理器的計算資源,而不用在編程時考慮復(fù)雜的硬件細(xì)節(jié)?,F(xiàn)在已經(jīng)有了不少跨平臺的編程標(biāo)準(zhǔn),比如C++/Fortran、OpenMP、SYCL和Kokkos等。

最后是復(fù)雜的數(shù)據(jù)存取過程,異構(gòu)帶來的不僅是不同層級的計算架構(gòu),還有不同層級的存儲架構(gòu),比如主存儲、主緩存、設(shè)備主存、設(shè)備緩存和寄存器等等。數(shù)據(jù)要在多種存儲類型之間移動,程序執(zhí)行要在同時對多種存儲進(jìn)行存取,這些存儲方式的帶寬和延遲也不盡相同。

異構(gòu)計算的未來

在近期舉辦的CIUK 2021大會上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對異構(gòu)計算未來的看法。他認(rèn)為異構(gòu)計算的趨勢還將繼續(xù)發(fā)展下去,差異化不會消失,但也不會出現(xiàn)極度差異化的情況。

其次CPU與GPU的關(guān)系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說通用計算性能,GPU還是要略勝一籌。而且依目前的趨勢來看,CPU也在慢慢汲取GPU上的優(yōu)點,比如HBM、寬矢量處理器的核心、核心內(nèi)部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長路要走。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 異構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    44

    瀏覽量

    13369
  • 異構(gòu)計算
    +關(guān)注

    關(guān)注

    2

    文章

    107

    瀏覽量

    16692
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    異構(gòu)計算解決方案(兼容不同硬件架構(gòu))

    異構(gòu)計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術(shù)與實踐方案如下: 一、硬件架構(gòu)設(shè)計 異構(gòu)處理器組合? 主從
    的頭像 發(fā)表于 06-23 07:40 ?186次閱讀

    如何釋放異構(gòu)計算的潛能?Imagination與Baya Systems的系統(tǒng)架構(gòu)實踐啟示

    報告作者:PallaviSharma,Imaginaiton產(chǎn)品管理總監(jiān)Dr.EricNorige,BayaSystems首席軟件架構(gòu)師關(guān)注Imagination公眾號,消息框發(fā)送【異構(gòu)計算】,即可
    的頭像 發(fā)表于 06-13 08:33 ?395次閱讀
    如何釋放<b class='flag-5'>異構(gòu)計算</b>的潛能?Imagination與Baya Systems的系統(tǒng)架構(gòu)實踐啟示

    能效提升3倍!異構(gòu)計算架構(gòu)讓AI跑得更快更省電

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)異構(gòu)計算架構(gòu)通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計算任務(wù)的特點進(jìn)行分工協(xié)作,從而在性能、能效和靈活性之間實現(xiàn)最優(yōu)平衡
    的頭像 發(fā)表于 05-25 01:55 ?2802次閱讀

    全志科技多核異構(gòu)SoC助力行業(yè)智能化創(chuàng)新

    近日, “第十二屆開源操作系統(tǒng)年度技術(shù)會議”在北京舉行,全志科技受邀參會。會上,全志進(jìn)行了題為《多核異構(gòu)SoC在行業(yè)應(yīng)用中軟件方案的思考與實踐》的分享。分享從市場和技術(shù)洞察、方案設(shè)計創(chuàng)新、場景化應(yīng)用落地三個維度展開系統(tǒng)性分享,全面展現(xiàn)了全志科技在異構(gòu)計算領(lǐng)域的技術(shù)積累與行
    的頭像 發(fā)表于 04-18 09:11 ?614次閱讀
    全志科技多核<b class='flag-5'>異構(gòu)</b>SoC助力行業(yè)智能化創(chuàng)新

    RAKsmart智能算力架構(gòu):異構(gòu)計算+低時延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓(xùn)練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓(xùn)練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計算資源池化與超低時延網(wǎng)絡(luò)為核心,重構(gòu)AI訓(xùn)練基礎(chǔ)設(shè)施,助力企業(yè)實現(xiàn)訓(xùn)練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?323次閱讀

    RK3399處理器:高性能多核異構(gòu)計算平臺

    RK3399是一款高性能的多核異構(gòu)計算平臺,集成了強(qiáng)大的CPU、GPU以及豐富的多媒體和接口功能。其獨(dú)特的雙Cortex-A72+四Cortex-A53大小核CPU結(jié)構(gòu),使得RK3399在處理復(fù)雜
    的頭像 發(fā)表于 02-08 18:04 ?1551次閱讀

    異構(gòu)計算的概念、核心、優(yōu)勢、挑戰(zhàn)及考慮因素

    異構(gòu)計算就像是一支由“多才多藝”處理器組成的團(tuán)隊,每個成員都有自己的強(qiáng)項和責(zé)任。 ? 什么是異構(gòu)計算????? “異構(gòu)計算”指的是在同一個計算平臺中,部署多種不同類型的處理單元(比如
    的頭像 發(fā)表于 01-13 11:43 ?1005次閱讀

    安泰功率放大器應(yīng)用:納米材料的前世今生

    ,因此在各個領(lǐng)域具有廣泛的應(yīng)用前景。那么你知道納米材料是如何被發(fā)現(xiàn),又是如何走入我們的生活,獲得長足發(fā)展的嗎?今天Aigtek安泰電子帶大家詳細(xì)了解一下。 納米材料的前世今生 1861年,隨著膠體化學(xué)的建立,科學(xué)家們開始了對直徑為
    的頭像 發(fā)表于 01-02 14:05 ?474次閱讀
    安泰功率放大器應(yīng)用:納米材料的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>

    【一文看懂】什么是異構(gòu)計算?

    隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求,異構(gòu)計算因此應(yīng)運(yùn)而生,成為現(xiàn)代計算領(lǐng)域的一個重要方向。
    的頭像 發(fā)表于 12-04 01:06 ?2793次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>?

    詳解Arm計算平臺的優(yōu)勢

    對于人工智能 (AI) 而言,任何單一硬件或計算組件都無法成為適合各類工作負(fù)載的萬能解決方案。AI 貫穿從云端到邊緣側(cè)的整個現(xiàn)代計算領(lǐng)域,為了滿足不同的 AI 用例和需求,一個可以靈活使用 CPU、GPU 和 NPU 等不同計算
    的頭像 發(fā)表于 12-03 16:53 ?891次閱讀

    深入了解Java泛型——從前世今生到PECS原則

    本文主要介紹泛型誕生的前世今生,特性,以及著名PECS原則的由來。 在日常開發(fā)中,必不可少的會使用到泛型,這個過程中經(jīng)常會出現(xiàn)類似“為什么這樣會編譯報錯?”,“為什么這個列表無法添加
    的頭像 發(fā)表于 11-21 11:45 ?541次閱讀
    深入了解Java泛型——從<b class='flag-5'>前世</b><b class='flag-5'>今生</b>到PECS原則

    澎峰科技高性能計算庫PerfIPP介紹

    PerfIPP是專為計算機(jī)視覺處理和信號處理設(shè)計的優(yōu)化計算庫,計算驅(qū)動層基于OpenCL標(biāo)準(zhǔn),支持異構(gòu)計算加速。
    的頭像 發(fā)表于 09-02 17:39 ?655次閱讀
    澎峰科技高性能<b class='flag-5'>計算</b>庫PerfIPP介紹

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

    關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應(yīng)用場景淺談如下: 優(yōu)勢 異構(gòu)計算能力 : 異構(gòu)雙核設(shè)計結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性,能夠針對特定
    發(fā)表于 08-31 08:32

    打造異構(gòu)計算新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    參考設(shè)計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性,可實現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?676次閱讀
    打造<b class='flag-5'>異構(gòu)計算</b>新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54