99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cygnus超算成為第一臺進入超算top500榜單的GPU、FPGA混合加速超級計算機

DPVg_AI_era ? 來源:lp ? 2019-04-21 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異構(gòu)超級計算機時代已經(jīng)到來。近日,日本筑波大學上線的Cygnus超算成為第一臺進入超算top500榜單的GPUFPGA混合加速超級計算機。在如何讓CPU、GPU、FPGA多硬件協(xié)調(diào)、高效、同步提供算力上邁出了重要一步。

如果說“異構(gòu)超級計算機”的時代已經(jīng)到來,那么本月早些時候在日本筑波大學上線的 CPU、GPU、FPGA混合硬件超算系統(tǒng)就是這個時代的首批探索者之一。

這臺超算名為Cygnus,由NEC制造,目前在日本筑波大計算科學中心(CCS)運行,由Intel Xeon CPU,Nvidia Tesla GPU和Intel Stratix 10 FPGA共同提供硬件支持。

Cygnus系統(tǒng)架構(gòu):所有80個Cygnus節(jié)點都配備了兩個Xeon“Skylake”黃金 CPU和四個Tesla V100 GPU,同時在32個節(jié)點中,還和GPU搭載了兩個Stratix 10 FPGA。48個CPU-GPU專用節(jié)點稱為“Deneb節(jié)點”(以最亮的Cygnus A星命名),而32個CPU-GPU-FPGA節(jié)點稱為Albireo節(jié)點(以Cygnus A雙星命名)。

FPGA型號為Bittware 520N PCIe卡,供應商為Nallatech,這些“重型”FPGA卡可以提供10 teraflops的單精度性能,以及四組DDR4內(nèi)存。尤其是,該卡配備了四個100G光纖網(wǎng)絡端口,共提供400Gbps帶寬,可以通過自身結(jié)構(gòu)直接與其他520N FPGA進行通信。在Cygnus中,可將8×8的2D環(huán)形網(wǎng)絡中的64個FPGA相互連接。Bittware包括一個板級支持包(BSP),可供OpenCL開發(fā)人員使用。

每個Cygnus節(jié)點的雙精度浮點性能為30 teraflops,其中28個節(jié)點算力由四個V100 GPU提供。由兩個Stratix 10器件在配備FPGA的節(jié)點上提供20個單精度teraflops。整機可提供算力為2.4 petaflop(64位浮點)或5.12 petaflop(32位浮點)算力。

目前,Cygnus正在取代該機構(gòu)之前使用的COMA,COMA是一款由Intel Xeon CPU和Xeon Phi協(xié)處理器驅(qū)動的Cray CS300計算機集群。它于2014年組建,今年3月底退役,為Cygnus讓位。

Mellanox HDR InfiniBand負責Cygnus上的系統(tǒng)互連,與獨立的FPGA網(wǎng)絡一樣,系統(tǒng)設計人員確保了足夠的帶寬來進行節(jié)點間通信。每個節(jié)點使用四個100Gbps HDR通道,連接為全二分fat樹網(wǎng)絡。InfiniBand網(wǎng)絡還用于訪問托管在DataDirect Networks ES14KX設備上的2.5 PB Lustre文件系統(tǒng)。

盡管“雙加速硬件”的設定很新潮,但其實Cygnus并不是試驗機。其組建的主要用途是為宇宙學、粒子物理學、生命科學和人工智能等領(lǐng)域科學研究提供生產(chǎn)力。通過CPUGPUFPGA的組合,力求在實際科學研究中最有效地發(fā)揮這些硬件各自的計算優(yōu)勢。

具體來說,GPU負責提供粗粒度并行計算,主要擅長SIMD友好型計算,而FPGA提供細粒度并行計算,更適合應用于非SIMD算法。而對于氣候模擬,生物信息學、分子動力學、地球物理學和線性代數(shù)中使用的一些特定算法,F(xiàn)PGA已經(jīng)證明能夠?qū)崿F(xiàn)比CPU、GPU更快、更高效的運算。不過,在科學上可以通過代碼同時高效利用這兩種架構(gòu)。

Cygnus系統(tǒng)架構(gòu)圖

Cygnus的目標應用之一是模擬早期宇宙,模擬光源的輻射傳輸。模擬過程是在一個套為ARGOT的代碼中實現(xiàn)的,其中名為“ART”(真實輻射傳輸)的光線追蹤算法是該模擬中的重要部分,ART部分更適合FPGA硬件平臺上的大規(guī)模運行。

不過,ARGOT的其他部分在GPU上運行更合適,因此利用“雙硬件加速”成為最佳解決方案。該應用程序在GPU和FPGA之間使用基于PCIe的直接存儲器訪問來實現(xiàn)協(xié)調(diào),避免了使CPU受到影響而出現(xiàn)延遲。

ART實現(xiàn)是使用相對較高級別的OpenCL實現(xiàn)的,這表明其他開發(fā)人員也可以這樣做。Bittware方面表示,使用OpenCL實現(xiàn)的用戶與嚴格使用硬件描述語言(HDL)實現(xiàn)的用戶進行對比發(fā)現(xiàn),在許多情況下,OpenCL實現(xiàn)在性能方面與后者“足夠接近”。

過去幾年來,F(xiàn)PGA軟件開發(fā)的進展促使微軟、亞馬遜和百度等巨頭越來越廣泛地采用FPGA硬件,尤其是在機器學習和推理等應用上。

但是,在高性能計算平臺中,使用FPGA的設備更少。筑波大學的這臺Cygnus將是唯一一個進入超算TOP500榜單的采用FPGA加速的超級計算機。德國帕德博恩大學去年安裝了一臺使用FPGA的超算,Cray CS500超級計算機,配備了32塊Bittware 520N卡,不過該機沒有配備GPU。

還有一些其他FPGA式的HPC集群遍布世界各地,包括美國佛羅里達州的CHREC(現(xiàn)改稱SHREC)的Nova-G#系統(tǒng),英國Hartree中心的Maxeler HPC-X以及Catapult 1和TACC的HARP v2計算機集群。

未來是否會有更多更強大的異構(gòu)超級計算機誕生?這不僅取決于使用者的需求,更多還要取決于硬件廠商和開發(fā)者是否繼續(xù)從上到下推動生態(tài)系統(tǒng)建設。

從Bittware的角度來看,關(guān)鍵的推動力一定是來自中間層面的,同時有賴于對高級語言和更成熟的開發(fā)工具更充分的支持。目前的好消息是,業(yè)界最大的兩家FPGA制造商——英特爾和賽林思都在為開發(fā)人員提供更好的工具,并將這些工具與下一代FPGA產(chǎn)品整合在一起。

從這一點上看,我們似乎可以對異構(gòu)超算的未來保持一份謹慎的樂觀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22050

    瀏覽量

    618564
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131253
  • 超級計算機
    +關(guān)注

    關(guān)注

    2

    文章

    472

    瀏覽量

    42478

原文標題:迎接“異構(gòu)超算”新時代:日本Cygnus超算GPU和FPGA雙硬件加持,TOP500榜單只此一臺

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學發(fā)展

    ,研究人員用個人電腦構(gòu)建了強大的集群,甚至改造游戲顯卡,把它們用于科學研究。 當今的高性能計算系統(tǒng)專為高速計算而設計,其中許多都采用了 NVIDIA 加速計算技術(shù)。在 ISC 2025
    的頭像 發(fā)表于 06-26 19:39 ?504次閱讀
    NVIDIA驅(qū)動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>如何突破速度極限并推動科學發(fā)展

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨中心(LRZ)將迎來全新超級計算機 Blue Lion,其力比該中心現(xiàn)有的 SuperMUC-NG 高性能
    的頭像 發(fā)表于 06-12 15:39 ?415次閱讀

    加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用
    的頭像 發(fā)表于 06-05 13:39 ?565次閱讀
    智<b class='flag-5'>算</b><b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰(zhàn)場上干掉<b class='flag-5'>GPU</b>和TPU!

    GPU 加速計算:突破傳統(tǒng)力瓶頸的利刃

    在數(shù)字化時代,數(shù)據(jù)呈爆炸式增長,傳統(tǒng)的力已難以滿足復雜計算任務的需求。無論是人工智能的深度學習、大數(shù)據(jù)的分析處理,還是科學研究中的模擬計算,都對力提出了極高的要求。而云
    的頭像 發(fā)表于 02-17 10:36 ?293次閱讀

    中心的力如何衡量?

    (ComputationalPower)是指智中心通過其內(nèi)部的計算設備(如CPU、GPU、AI芯片等)對數(shù)據(jù)進行處理和計算的能力。它體現(xiàn)了智
    的頭像 發(fā)表于 01-16 14:03 ?2512次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b>力如何衡量?

    云端超級計算機使用教程

    云端超級計算機種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在
    的頭像 發(fā)表于 12-17 10:19 ?551次閱讀

    NVIDIA加速全球大多數(shù)超級計算機推動科技進步

    HPCwire 讀者和編輯選擇獎。 自 2006 年發(fā)布 CUDA 以來,NVIDIA 不斷推動 AI 和加速計算的進步,最新發(fā)布的全球最強超級計算機
    的頭像 發(fā)表于 11-24 14:38 ?673次閱讀
    NVIDIA<b class='flag-5'>加速</b>全球大多數(shù)<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>推動科技進步

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡平臺,該平臺是專為多租戶
    發(fā)表于 10-30 09:33 ?357次閱讀
    NVIDIA 以太網(wǎng)<b class='flag-5'>加速</b> xAI 構(gòu)建的全球最大 AI <b class='flag-5'>超級</b><b class='flag-5'>計算機</b>

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設,是一臺 NVIDIA DGX SuperPOD 超級計算機。
    的頭像 發(fā)表于 10-27 09:42 ?903次閱讀

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解力芯片CPU

    本篇結(jié)合第1-5章,梳理了解學習CPU流水線、緩存硬件結(jié)構(gòu)、計算單元、邏輯拓撲結(jié)構(gòu)等知識點。 █本書開篇將了TOP500超級計算機。TOP500
    發(fā)表于 10-20 12:03

    力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——力之巔:從基準測試到CPU微架構(gòu)的深度探索

    尤為貼切。TOP500的演變歷程,從最初的向量超級計算機到如今的異構(gòu)并行系統(tǒng),就是生動詮釋這點的寫照。TOP500采用HPL基準測試來評估
    發(fā)表于 10-19 01:21

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    EPYC9004處理器 6.7 Sapphire Rapids 微架構(gòu)Xeon處理器 6.8 Tesla Dojo超級計算機和D處理器 第7章 從圖形到計算GPU 架構(gòu)演進 7
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    和像素統(tǒng)的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片
    發(fā)表于 09-02 10:09

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學期刊《自然》(Nature)本月早些時候發(fā)表了項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?919次閱讀

    力服務器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,力需求日益增長。智中心的服務器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務器也進入
    的頭像 發(fā)表于 07-25 08:28 ?1353次閱讀
    <b class='flag-5'>算</b>力服務器為什么選擇<b class='flag-5'>GPU</b>