2021 年,我們見證了 Covid-19 大流行如何實時影響高性能計算 (HPC) 和數(shù)據(jù)中心行業(yè)。雖然每個人都學(xué)會了掌握遠(yuǎn)程工作和學(xué)習(xí)的藝術(shù),但對更多計算能力和更少延遲的需求推動了 HPC 市場的增長軌跡,甚至超出了專家在 2020 年初的預(yù)測。
隨著塵埃落定,我們都已經(jīng)習(xí)慣了“新常態(tài)”,我們已經(jīng)習(xí)慣了新的工作方式、學(xué)習(xí)方法和一般的社交互動方式。這種數(shù)據(jù)處理和數(shù)據(jù)共享的整體靈活性和先進方法將持續(xù)到明年,使每個人的工作效率更高,信息更容易訪問,協(xié)作更加無縫。因此,我們將繼續(xù)看到 HPC 市場不斷發(fā)展和擴大,越來越多的行業(yè)需要更多互連的硅架構(gòu)以及高速網(wǎng)絡(luò)。
以下是我們對 HPC 今年將進入的新市場、安全性日益重要以及支持 HPC 應(yīng)用程序的不斷發(fā)展的架構(gòu)的主要預(yù)測。
去年,我們看到 HPC 被用于制造預(yù)防 Covid-19 的疫苗。我們將繼續(xù)看到它被用于醫(yī)學(xué)研究和監(jiān)測,但 HPC 也將在 2022 年擴展到更新的市場。
斯科特·杜蘭特:我們看到美國和全世界災(zāi)難性氣候事件的數(shù)量在增加,能夠預(yù)測這些事件以保護人們免受這些事件的影響變得越來越重要。這是一個應(yīng)用程序,在來年將成為 HPC 領(lǐng)域的重點。除此之外,在云中 HPC 的可用性的推動下,我們將看到 HPC 更多地用于面向消費者的應(yīng)用程序。從歷史上看,高性能數(shù)據(jù)中心一直是孤立的,只有研究機構(gòu)、政府和預(yù)算非常龐大的公司才能使用。我們將開始看到虛擬世界或最近開始被稱為“元宇宙”的發(fā)展,既可用于娛樂,如游戲(增強現(xiàn)實和虛擬現(xiàn)實),也可用于模擬,如數(shù)字雙胞胎。
Ruben Molina:你可以證明,過去被認(rèn)為是 HPC 的東西每隔幾年就會成為主流。我預(yù)測邊緣的 HPC 將更多地成為規(guī)則而不是例外。工業(yè)部門將把 HPC 用于機器人技術(shù)、視覺系統(tǒng)以及預(yù)防性維護和監(jiān)控中的應(yīng)用,例如裝配線上的預(yù)定或預(yù)測性故障——基本上,所有需要計算能力的工業(yè)領(lǐng)域都在使用設(shè)備的地方為了減少停機時間的需要。
Susheel Tadikonda:HPC 市場正在隨著新的工作類型而擴展,將人工智能 (AI) 和數(shù)據(jù)分析添加到傳統(tǒng)的模擬和建模中。COVID-19 的興起強調(diào)了對云中靈活且可擴展的 HPC 解決方案的需求。再加上各個垂直行業(yè)(生命科學(xué)、汽車、金融、游戲、制造、航空航天等)對更快數(shù)據(jù)處理和更高準(zhǔn)確性的需求日益增加,這將是未來推動 HPC 采用增長的主要因素年。AI、邊緣計算、5G 和 Wi-Fi 6 等技術(shù)將拓寬 HPC 的能力,催生新的芯片/系統(tǒng)架構(gòu),為各個領(lǐng)域提供高處理和分析能力。
提高 HPC 安全性對于新設(shè)計至關(guān)重要
明年將要處理的數(shù)據(jù)量將呈指數(shù)級增長,這些數(shù)據(jù)的價值和敏感性也會隨之增加。在設(shè)計 HPC 組件時,確保安全性是必不可少的組件(而不是事后考慮),這將是工程師今年和今后每年都將面臨的最大設(shè)計挑戰(zhàn)之一。
Susheel Tadikonda :HPC 系統(tǒng)包含高度定制的硬件和軟件堆棧,這些堆棧針對性能優(yōu)化、電源效率和互操作性進行了調(diào)整。使用自己的使用模式和獨特的組件/屬性來設(shè)計和保護此類系統(tǒng),使其不同于其他類型的通用計算系統(tǒng)。安全威脅不僅限于網(wǎng)絡(luò)/存儲數(shù)據(jù)泄露,還包括側(cè)信道攻擊,例如從電源狀態(tài)、排放和處理器等待時間推斷數(shù)據(jù)模式。我們將看到更多圍繞內(nèi)存和存儲技術(shù)、智能互連、支持芯片的安全性和云安全性的創(chuàng)新,以有效管理海量數(shù)據(jù)。安全驗證/確認(rèn)將代表安全保障中最關(guān)鍵的部分之一,涵蓋架構(gòu)、設(shè)計、
Scott Durrant:保護信息、保護數(shù)據(jù)的機密性和完整性以及提供對數(shù)據(jù)的訪問控制的重要性顯著增加。在過去的一年里,我們已經(jīng)看到了勒索軟件和其他網(wǎng)絡(luò)攻擊可能導(dǎo)致的各種問題。隨著基礎(chǔ)設(shè)施中數(shù)據(jù)的價值越來越大,攻擊的數(shù)量將會越來越多,因此從硬件向上到堆棧的所有級別提供安全性以保護這些信息將變得越來越重要。”
Scott Knowlton:零信任框架也將被更多人采用。這意味著進入并想要訪問數(shù)據(jù)的人需要驗證他們的身份并證明他們有權(quán)訪問數(shù)據(jù)。我們預(yù)計這將在未來一年左右進一步增加。事實上,我們已經(jīng)看到了一些必要硬件的基礎(chǔ)。此外,我們將在基礎(chǔ)架構(gòu)中的每個元素中看到嵌入的信任根。它使他們能夠相互驗證,并確保在與另一臺設(shè)備共享數(shù)據(jù)之前,該設(shè)備有權(quán)使用和處理該數(shù)據(jù)?!?/p>
Ruben Molina:許多市場的數(shù)字化程度越高,安全風(fēng)險的機會就越多。由于增加的高性能計算距離數(shù)據(jù)中心越來越遠(yuǎn),因此無法通過軟件補丁完全緩解的攻擊機會將越來越多。這將給設(shè)計團隊帶來很大的壓力,他們急于推出硬件來解決這些問題,這將導(dǎo)致硬件設(shè)計周期加快。提高設(shè)計師的生產(chǎn)力以跟上上市時間的需求將成為一項關(guān)鍵需求。
分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長
隨著數(shù)據(jù)量的增加,需要考慮的不僅僅是安全性。必須增加存儲基礎(chǔ)設(shè)施以及處理這些數(shù)據(jù)的計算能力。新架構(gòu),包括 3DIC 和 die-to-die 連接,對于滿足最新要求是必要的。
Susheel Tadikonda :HPC 架構(gòu)正在經(jīng)歷一場翻天覆地的轉(zhuǎn)變,這種變化的驅(qū)動因素是不斷發(fā)展的 (AI) 工作負(fù)載、靈活計算(CPU、GPU、FPGA、DPU 等)、成本、內(nèi)存和 IO 吞吐量。微架構(gòu)層面的進步包括更快的互連、更高的計算密度、可擴展的存儲、更高的基礎(chǔ)設(shè)施效率、生態(tài)友好性、空間管理和更高的安全性。從系統(tǒng)的角度來看,下一代 HPC 架構(gòu)將出現(xiàn)分解架構(gòu)(將內(nèi)存與處理器和加速器分離)和異構(gòu)系統(tǒng)的爆炸式增長,其中不同的專業(yè)處理架構(gòu)(FPGA、GPU、CPU 等)集成在單個節(jié)點中允許在細(xì)粒度的模塊之間靈活切換。實現(xiàn)這種集成系統(tǒng)的一個關(guān)鍵方法是使用“小芯片”。如此復(fù)雜的系統(tǒng)帶來了巨大的驗證挑戰(zhàn),尤其是系統(tǒng)上下文中的 IP/節(jié)點級驗證、動態(tài)硬件-軟件編排、基于工作負(fù)載的性能和功率等。這將需要推動新的硬件-軟件驗證方法。
Scott Durrant:系統(tǒng)管理員今天面臨的挑戰(zhàn)之一是移動數(shù)據(jù)需要大量的電力和時間(兩者都供應(yīng)有限)。將處理移近數(shù)據(jù)以減少發(fā)生的數(shù)據(jù)移動量將是我們將在 2022 年看到加速的趨勢。隨之而來的是需要繼續(xù)擴展資源。我認(rèn)為我們將在來年看到真正進步的機制之一是利用先進的封裝和裸片到裸片接口來支持更高性能的設(shè)備,即通過使用多個設(shè)備來擴展設(shè)備內(nèi)的處理能力死。
Ruben Molina:除了通過將數(shù)據(jù)移近處理元件來減少延遲外,多芯片集成還允許通過將多個芯片組合在一個封裝中來擴展計算能力,而無需使用前沿工藝技術(shù)的成本。為實現(xiàn)這一目標(biāo),設(shè)計人員需要能夠?qū)Ψ庋b內(nèi)多個芯片的時序和功率進行布局規(guī)劃、布線和分析。另一種擴展計算能力的方法是為特定任務(wù)定制計算架構(gòu)。公司已經(jīng)開始為網(wǎng)絡(luò)處理器和圖形應(yīng)用程序這樣做,但是需要大量的前期架構(gòu)探索才能在 RTL 中正確使用它,并且將大量精力放在可以在設(shè)計周期早期實現(xiàn)這些權(quán)衡的工具上.
Scott Knowlton:我們還看到了架構(gòu)的分解。像 3DIC 這樣的架構(gòu)正在成為使設(shè)計人員能夠?qū)⒉煌穆闫头庋b放在一起以處理特定計算路徑的關(guān)鍵。因此,現(xiàn)在他們可以使用 3DIC 和 die-to-die 連接設(shè)計封裝,然后將其從特定組件外推到我們看到內(nèi)存系統(tǒng)分解的機器中。這為我們提供了不同類型的設(shè)計和架構(gòu)來處理特定工作流任務(wù)的獨特機會。
審核編輯 黃昊宇
-
計算
+關(guān)注
關(guān)注
2文章
453瀏覽量
39350 -
HPC
+關(guān)注
關(guān)注
0文章
333瀏覽量
24340 -
高性能
+關(guān)注
關(guān)注
0文章
220瀏覽量
20942
發(fā)布評論請先 登錄
高性能計算集群在AI領(lǐng)域的應(yīng)用前景

物聯(lián)網(wǎng)未來發(fā)展趨勢如何?
50%新型HPC擁抱多芯片設(shè)計:性能飛躍的新篇章

評論