99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Exaflop簡史

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-08-03 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可至少進行百億億次浮點運算。

為了解決這個時代最復雜的問題,比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計算機的計算量正在不斷增加。

所有這些重大挑戰(zhàn)將計算帶入了現(xiàn)今的百億億次級時代,頂級性能通常以 exaflops 來衡量。

什么是 Exaflop?

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可以至少進行 10^18 或百億億次浮點運算。

Exaflop 中的 exa-前綴表示“百億億”,即 10 億乘以 10 億或1的后面有 18 個零。同樣,單個 exabyte 的內存子系統(tǒng)可以儲存百億億字節(jié)的數(shù)據。

exaflop 中的“flop”是浮點運算的縮寫。exaflop/s 是表示系統(tǒng)每秒浮點運算次數(shù)的單位。

浮點是指所有數(shù)字都用小數(shù)點表示的計算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15,即 1 的后面有 15 個零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的計算量到底有多大?相當于十億人中的每個人都拿著十億個計算器。

如果他們同時按下等號,就是進行了 1 個 exaflop。

擁有 Big Red 200 和其他幾臺超級計算機的印第安納大學表示,exaflop 計算機的速度相當于一個人每秒鐘進行一次計算,并一直計算 31,688,765,000 年。

Exaflop 簡史

在超級計算發(fā)展史的大部分時間里,一次浮點運算就是一次,但隨著工作負載引入 AI ,這種情況也發(fā)生了變化。

人們開始使用最高的精度格式來表示數(shù)字,這種格式被稱為雙精度,由 IEEE 浮點運算標準定義。它之所以被稱為雙精度或 FP64,是因為計算中的每個數(shù)字都需要以 64 位用 0 或 1 表示的數(shù)據塊表示,而單精度為 32 位。

雙精度使用 64 位確保每個數(shù)字都精確到很細微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

這種格式非常適合當時的大部分工作負載,比如從原子到飛機等全部需要確保模擬結果接近于真實的模擬。

因此,當 1993 年全球最強大的超級計算機榜單 TOP500 首次發(fā)布時,衡量 FP64 數(shù)學性能的 LINPACK 基準(又稱HPL)自然成為了默認的衡量標準。

AI 大爆炸

十年前,計算行業(yè)發(fā)生了 NVIDIA 首席執(zhí)行官黃仁勛所說的 AI 大爆炸。

這種強大的新計算形式開始在科學和商業(yè)應用上展現(xiàn)出重大成果,而且它運用了一些非常不同的數(shù)學方法。

深度學習并不是模擬真實世界中的物體,而是在堆積如山的數(shù)據中篩選,以找到能夠帶來新洞察的模式。

這種數(shù)學方法需要很高的吞吐量,所以用經過簡化的數(shù)字(比如使用 1.01 而不是 1.0001)進行大量計算要比用更復雜的數(shù)字進行少量計算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通過 32 位、16 位和 8 位數(shù)讓用戶更快地進行更多計算。

混合精度不斷發(fā)展

AI 使用 64 位數(shù)就如同在周末外出時帶著整個衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術。

例如首個 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式執(zhí)行矩陣乘法,然后用 FP32 累積結果以獲得更高的精度。

Hopper 通過 FP8 加速

最近,NVIDIA Hopper 架構首次發(fā)布了速度更快的低精度 AI 訓練方法。Hopper Transformer Engine 能夠自動分析工作負載,盡可能采用 FP8 并以 FP32 累積結果。

在進行計算密集度較低的推理工作,比如在生產中運行 AI 模型時,TensorFlow 和 PyTorch 等主要框架通過支持 8 位整數(shù)實現(xiàn)快速性能,因為這樣就不需要使用小數(shù)點來完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用戶可以實現(xiàn)每個工作負載的最優(yōu)加速。

去年,IEEE P3109 委員會開始為機器學習中使用的精度格式制定行業(yè)標準。這項工作可能還需要一到兩年的時間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎,但當?shù)途葦?shù)學能夠更快提供可用結果時,許多人會使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影響 HPC 應用程序性能的因素各不相同

例如,研究人員用 FP32 運行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna?;蚪M學也傾向于使用低精度數(shù)學。

此外,許多傳統(tǒng)的模擬開始在部分工作流程中采用 AI。隨著越來越多的工作負載使用 AI,超級計算機需要支持較低的精度才能有效運行這些新興應用。

基準與工作負載同步發(fā)展

在認識到這些變化后,包括 Jack Dongarra(2021 年圖靈獎得主和 HPL 的貢獻者)在內的研究人員在 2019 年首次發(fā)布了 HPL-AI,這項新基準更適合測量新的工作負載。

Dongarra 在 2019 年的博客中表示:“無論是技術不斷優(yōu)化的傳統(tǒng)模擬,還是 AI 應用,混合精度技術對于提高超級計算機的計算效率越來越重要。正如 HPL 實現(xiàn)了對雙精度能力的基準測試一樣,這種基于 HPL 的新方法可以對超級計算機的混合精度能力進行大規(guī)?;鶞蕼y試?!?/p>

尤利希超級計算中心主任 Thomas Lippert 同意了這一觀點。

他在去年發(fā)表的一篇博客中表示:“我們使用 HPL-AI 基準是因為它既能夠準確地衡量日益增加的 AI 和科學工作負載中的混合精度工作,也能反映準確的 64 位浮點計算結果?!?/p>

現(xiàn)今的 Exaflop 系統(tǒng)

在 6 月的一份報告中,全球 20 個超級計算機中心提交了 HPL-AI 結果,其中有三個中心提供了超過 1 exaflop 的性能。

在這些系統(tǒng)中,橡樹嶺國家實驗室的超級計算機在 HPL 上的 FP64 性能也超過了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 結果的采樣器

兩年前,一非傳統(tǒng)系統(tǒng)首次達到 1 exaflop。這臺由 Folding@home 聯(lián)盟組裝的眾源超級計算機在呼吁幫助抵御新冠疫情后,達到了這一里程碑,到現(xiàn)在已有超過 100 萬臺計算機加入其中。

理論和實踐中的Exaflop

許多組織從那時起就已開始安裝理論峰值性能超過 1 exaflop 的超級計算機。需要注意的是,TOP500 榜單同時發(fā)布 Rmax(實際)和 Rpeak(理論)分數(shù)。

Rmax 指計算機實際表現(xiàn)出的最佳性能。

Rpeak 是一切系統(tǒng)都處于高水平運行時的最高理論性能,而這幾乎從未發(fā)生過。該數(shù)值的計算方法通常是將系統(tǒng)中的處理器數(shù)量乘以其時鐘速度,然后再將結果乘以處理器在一秒鐘內可執(zhí)行的浮點運算數(shù)。

因此,如果有人說他們的系統(tǒng)達到 1 exaflop,請詢問他說的是 Rmax(實際)還是Rpeak(理論)。

Exaflop 時代的眾多指標

這也是新百億億次時代的眾多細微變化之一。

值得注意的是,HPL 和 HPL-AI 屬于合成基準,即它們衡量的是數(shù)學程序的性能,而不是真實世界的應用。MLPerf 等其他基準則基于真實世界中的工作負載。

最后,衡量系統(tǒng)性能的最佳標準當然是它運行用戶應用程序的情況。該衡量標準不是基于 exaflop,而是基于投資回報率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106428
  • 計算機
    +關注

    關注

    19

    文章

    7663

    瀏覽量

    90824
  • AI
    AI
    +關注

    關注

    88

    文章

    35164

    瀏覽量

    280026

原文標題:什么是 Exaflop?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    XR空間音頻革命:蘋果、三星推出新技術,ASAF成Vision Pro最佳搭檔

    (電子發(fā)燒友網綜合報道)隨著技術的不斷進步,空間音頻標準正處于持續(xù)進化之中,眾多科技巨頭如蘋果、三星和谷歌等都在積極布局這一領域。 ? 在WWDC25大會上,蘋果推出了新的空間音頻(Spatial Audio)格式:Apple Spatial Audio Format(ASAF,蘋果空間音頻格式),可以用來打造真正沉浸式的音頻體驗。 ? ASAF 通過確保使用聲學提示來渲染音頻,從而實現(xiàn)真正外化的音頻體驗。它由新的高精度元數(shù)據、線性 PCM 以及蘋果平臺內置的強大空間渲染器組成。 ?
    的頭像 發(fā)表于 07-20 00:11 ?523次閱讀

    OpenAI發(fā)布新智能體!實現(xiàn)在線購物和創(chuàng)建PPT演示文稿

    電子發(fā)燒友原創(chuàng) 章鷹 7月17日,美國OpenAI公司為其聊天機器人ChatGPT推出了一款人工智能體,可以完成復雜的任務,這家微軟支持的人工智能初創(chuàng)公司希望在AI競賽中領先于競爭對手。 OpenAI的總部位于美國舊金山,這家公司在自主運行AI機器人這一大熱領域推出了其最新產品, 這是一款能夠讓用戶自動執(zhí)行在線購物等任務并且能夠創(chuàng)建電子表格和PowerPoint演示文稿的智能體。 智能體被認為是助手的進化——已經受到科技界的廣泛歡迎,其中包括微軟、Sale
    的頭像 發(fā)表于 07-20 00:05 ?4117次閱讀
    OpenAI發(fā)布新智能體!實現(xiàn)在線購物和創(chuàng)建PPT演示文稿

    從良率突破到成本優(yōu)化:PLP解決方案如何改寫半導體封裝規(guī)則

    電子發(fā)燒友網綜合報道 近日,Nordson Electronics Solutions與Powertech Technology, Inc.(PTI)聯(lián)合開發(fā)的面板級封裝(PLP)解決方案,以流體點膠系統(tǒng)的技術革新為切入點,重塑了半導體封裝的工藝范式與產業(yè)邏輯。 ? 這種基于高精度流體控制的創(chuàng)新方案,不僅突破了傳統(tǒng)封裝在良率、效率與可靠性層面的技術瓶頸,更通過面板級制造的規(guī)模效應,推動半導體封裝向高集成、低成本、低功耗的方向深度變革,其影響已延伸至產業(yè)鏈各環(huán)節(jié)的技術路徑與市場格局。
    的頭像 發(fā)表于 07-20 00:04 ?824次閱讀

    “諾基亞”推新款功能機,搭載DeepSeek AI助手

    電子發(fā)燒友網綜合報道?最近諾基亞在京東自營旗艦店推出了兩款帶有AI功能的手機,HMD101?4G?和HMD102?4G,售價分別為149元和169元,102相比101增加了攝像頭。 ? HMD101?4G?和HMD102?4G上沒有帶有諾基亞的Logo,而是使用了HMD品牌,官方宣稱采用諾基亞手機制造工藝與測試標準。通過主鍵30萬次按壓、耳機接口插拔3000次、USB插拔1萬次、滾筒測試200圈、-30℃~70℃24小時冷熱沖擊等測試。 ? 來源:諾基亞手機京東自營旗艦店 ? 在介紹頁面中,這兩款手機面向長輩、
    的頭像 發(fā)表于 07-20 00:04 ?1646次閱讀
    “諾基亞”推新款功能機,搭載DeepSeek AI助手

    突破三大技術瓶頸!這家企業(yè)讓鐵鉻液流電池走向商業(yè)化

    電子發(fā)燒友網綜合報道 在全球能源轉型的關鍵時期,新型儲能技術正成為推動能源綠色低碳轉型的重要支撐?!丁笆奈濉毙滦蛢δ馨l(fā)展實施方案》明確提出,到2025年,新型儲能要由商業(yè)化初期步入規(guī)?;l(fā)展階段。在這樣的背景下,鐵鉻液流電池憑借超長循環(huán)壽命、本質安全、成本優(yōu)勢及環(huán)境友好等特性,成為滿足新型電力系統(tǒng)長時儲能需求的核心技術之一。 ? 與其他儲能技術相比,鐵鉻液流電池在充放電過程中不涉及物相變化,這一特性使其循環(huán)
    的頭像 發(fā)表于 07-20 00:03 ?4560次閱讀

    deepin亮相2025 RISC-V中國峰會,展現(xiàn)開源生態(tài)無限可能

    ? 2025 年 7 月 19 日,為期四天的第五屆 RISC-V 中國峰會在上海張江科學會堂圓滿落幕。本次峰會匯聚了全球 RISC-V 領域的頂尖企業(yè)、研究機構和開源社區(qū),共同探討?RISC-V 技術的創(chuàng)新與應用。 作為國內領先的桌面操作系統(tǒng)社區(qū),deepin 深度參與了此次盛會,通過一系列硬核展示和互動活動,全面彰顯了其在 RISC-V 生態(tài)建設中的重要貢獻和技術實力。 無約束的自由展示:流暢體驗最新桌面系統(tǒng) 在峰會現(xiàn)場,deepin-ports SIG 為與會者帶來了前所未有的自由體驗。
    的頭像 發(fā)表于 07-19 17:35 ?109次閱讀
    deepin亮相2025 RISC-V中國峰會,展現(xiàn)開源生態(tài)無限可能

    人形機器人進化簡史

    最近火爆全網的機器人格斗直播,盡管有很多瑕疵,賽博朋克感依然讓人驚呼科幻走入現(xiàn)實。
    的頭像 發(fā)表于 07-18 14:58 ?348次閱讀

    《電子發(fā)燒友電子設計周報》聚焦硬科技領域核心價值 第13期:2025.05.26--2025.05.30

    標準簡史; IEEE Std 802.3df 和 IEEE P802.3dj 標準的更新; 助力下一代超大規(guī)模數(shù)據中心; 3、前沿技術公開課--知存科技+知名高校教授打造存內計算系列課程 (值得
    發(fā)表于 05-30 19:39

    機器人和自動化的未來(1)

    時代的到來,不僅標志著技術的飛躍,也預示著社會結構和生活方式的巨大變革。1.1機器人簡史:從幻想到現(xiàn)實談到機器人,人們很容易
    的頭像 發(fā)表于 04-19 08:34 ?290次閱讀
    機器人和自動化的未來(1)

    五金清洗機的簡史與未來發(fā)展趨勢解析

    想象一下,身處在繁忙的工業(yè)車間里,金屬零件堆積如山,等待著清洗。你或許會問:“這些金屬零件如何才能恢復到如新般的光澤?”這就要提到五金清洗機的神奇之處。它不僅能高效清潔,還象征著工業(yè)發(fā)展的智能化與自動化。今天,讓我們一起走進五金清洗機的歷史長河,探索它的演變、技術進步以及未來的發(fā)展趨勢。五金清洗機的誕生背景和歷史沿革五金清洗機并非一夕之間的產物,它的誕生與工
    的頭像 發(fā)表于 04-10 16:33 ?481次閱讀
    五金清洗機的<b class='flag-5'>簡史</b>與未來發(fā)展趨勢解析

    AI先鋒對話:DeepSeek爆火背后,戰(zhàn)略破局的新思考

    近日,阿丘科技聯(lián)合創(chuàng)始人鄭慧偉受邀參加由慎思行舉辦的《戰(zhàn)略簡史》老友會,與慎思行老羅、云南白藥戰(zhàn)略負責人顧嘉,一起探討AI將如何影響未來戰(zhàn)略這一時代命題。本次討論主要圍繞“DeepSeek火爆背后
    的頭像 發(fā)表于 02-27 15:11 ?652次閱讀
    AI先鋒對話:DeepSeek爆火背后,戰(zhàn)略破局的新思考

    英飛凌IGBT7系列芯片大解析

    上回書(英飛凌芯片簡史)說到,IGBT自面世以來,歷經數(shù)代技術更迭,標志性的技術包括平面柵+NPT結構的IGBT2,溝槽柵+場截止結構的IGBT3和IGBT4,表面覆銅及銅綁定線的IGBT5等?,F(xiàn)今
    的頭像 發(fā)表于 01-15 18:05 ?1139次閱讀
    英飛凌IGBT7系列芯片大解析

    安森美(onsemi)的超聲波傳感器解決方案的未來趨勢和創(chuàng)新

    簡要介紹超聲波傳感器的發(fā)展歷程,并結合當前和未來的應用,預測未來幾年超聲波傳感器的應用領域。? ? ? 汽車超聲波傳感器簡史 超聲波技術常用于檢測物體和發(fā)現(xiàn)固體材料中的缺陷,其首項專利可以追溯到上世紀30年代。一直
    的頭像 發(fā)表于 11-23 14:53 ?1731次閱讀

    名單公布!【書籍評測活動NO.50】親歷芯片產線,輕松圖解芯片制造,揭秘芯片工廠的秘密

    的知識門檻低,又獨家揭秘了芯片制造工廠的運營到管理,適用于更大讀者群。本書非常適合對芯片這個話題(不管是技術還是產業(yè)運營等)感興趣的IC從業(yè)者和大眾讀者。 相信閱讀過《芯路》《半導體簡史》《圖解
    發(fā)表于 11-04 15:38

    【「ARM MCU嵌入式開發(fā) | 基于國產GD32F10x芯片」閱讀體驗】+書籍整體概況

    系統(tǒng)的概念,ARM簡史,以及前期的準備工作,視頻時長112min。 第二章介紹GD32F10x的架構,包含計算機架構,Cortex-M3架構;第三章通用輸入/輸出端口GPIO介紹,內容非常豐富,介紹
    發(fā)表于 08-25 22:48