99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

超融合數(shù)據(jù)中心網(wǎng)絡發(fā)展及趨勢

架構師技術聯(lián)盟 ? 來源:架構師技術聯(lián)盟 ? 2023-05-19 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)中心網(wǎng)絡連接數(shù)據(jù)中心內(nèi)部通用計算、存儲和高性能計算資源,服務器間的所有數(shù)據(jù)交互都要經(jīng)由網(wǎng)絡轉發(fā)。當前,IT架構、計算和存儲技術都在發(fā)生重大變革,驅動數(shù)據(jù)中心網(wǎng)絡從原來的多張網(wǎng)絡獨立部署向全以太化演進。而傳統(tǒng)的以太網(wǎng)無法滿足存儲和高性能計算的業(yè)務需求。超融合數(shù)據(jù)中心網(wǎng)絡以全無損以太網(wǎng)來構建新型的數(shù)據(jù)中心網(wǎng)絡,使通用計算、存儲、高性能計算三大種類業(yè)務均能融合部署在一張以太網(wǎng)上,同時實現(xiàn)全生命周期自動化和全網(wǎng)智能運維。

為什么會產(chǎn)生超融合數(shù)據(jù)數(shù)據(jù)中心網(wǎng)?

現(xiàn)狀:數(shù)據(jù)中心內(nèi)有三張網(wǎng)絡

數(shù)據(jù)中心內(nèi)部有三類典型的業(yè)務:通用計算(一般業(yè)務)、高性能計算(HPC)業(yè)務和存儲業(yè)務。每類業(yè)務對于網(wǎng)絡有不同的訴求,比如:HPC業(yè)務的多節(jié)點進程間通信,對于時延要求非常高;而存儲業(yè)務對可靠性訴求非常高,要求網(wǎng)絡0丟包;通用計算業(yè)務規(guī)模大,擴展性強,要求網(wǎng)絡低成本、易擴展。

由于上述業(yè)務對網(wǎng)絡的要求不同,當前數(shù)據(jù)中心內(nèi)部一般會部署三張不同的網(wǎng)絡:

由IB(InfiniBand)網(wǎng)絡來承載HPC業(yè)務

由FC(Fiber Channel)網(wǎng)絡來承載存儲網(wǎng)絡

由以太網(wǎng)來承載通用計算業(yè)務

415ab00c-f5ef-11ed-90ce-dac502259ad0.png


數(shù)據(jù)中心內(nèi)的三張網(wǎng)絡

AI時代的變化1:存儲和計算能力大幅提升,網(wǎng)絡成為瓶頸

企業(yè)數(shù)字化過程中將產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)正在成為企業(yè)核心資產(chǎn)。通過AI技術從海量數(shù)據(jù)中挖掘價值成為AI時代不變的主題。通過AI機器學習利用各種數(shù)據(jù)輔助實時決策,已經(jīng)成為企業(yè)經(jīng)營的核心任務之一。與云計算時代相比,AI時代企業(yè)數(shù)據(jù)中心的使命正在從聚焦業(yè)務快速發(fā)放向聚焦數(shù)據(jù)高效處理轉變。

41628566-f5ef-11ed-90ce-dac502259ad0.png


數(shù)據(jù)中心正在從云計算時代走向AI時代 為了提升海量AI數(shù)據(jù)處理的效率,存儲和計算領域正在發(fā)生革命性的變化:

存儲介質從機械硬盤(HDD)演進到閃存盤(SSD),來滿足數(shù)據(jù)的實時存取要求,存儲介質時延降低了不止100倍。

為了滿足數(shù)據(jù)高效計算的訴求,業(yè)界已經(jīng)在采用GPU甚至專用的AI芯片,處理數(shù)據(jù)的能力提升了100倍以上。

隨著存儲介質和計算能力的大幅提升,在高性能的數(shù)據(jù)中心集群系統(tǒng)中,當前網(wǎng)絡通信的時延成為應用整體性能進一步提升的瓶頸,通信時延在整個端到端時延中占比從10%上升到60%以上,也就是說,寶貴的存儲或計算資源有一半以上的時間是在等待網(wǎng)絡通信。

總的來說,隨著存儲介質和計算處理器的演進,網(wǎng)絡的低效阻礙了計算和存儲性能的發(fā)揮;只有將通信時長降低到與計算和存儲接近,才能消除木桶原理中的“短板”,提升應用整體的性能。

AI時代的變化2:RDMA替代TCP/IP成為大勢所趨,但RDMA的網(wǎng)絡承載方案存在不足

如下圖所示,在服務器內(nèi)部,由于TCP協(xié)議棧在接收/發(fā)送報文,以及對報文進行內(nèi)部處理時,會產(chǎn)生數(shù)十微秒的固定時延,這使得在AI數(shù)據(jù)運算和SSD分布式存儲這些微秒級系統(tǒng)中,TCP協(xié)議棧時延成為最明顯的瓶頸。另外,隨著網(wǎng)絡規(guī)模的擴大和帶寬的提高,寶貴的CPU資源越來越地多被用于傳輸數(shù)據(jù)。

RDMA(Remote Direct Memory Access)允許應用與網(wǎng)卡之間的直接數(shù)據(jù)讀寫,將服務器內(nèi)的數(shù)據(jù)傳輸時延降低到接近1us。同時,RDMA允許接收端直接從發(fā)送端的內(nèi)存讀取數(shù)據(jù),極大減少了CPU的負擔。

416a61aa-f5ef-11ed-90ce-dac502259ad0.png


RDMA與TCP的對比

根據(jù)業(yè)務的測試數(shù)據(jù), 采用RDMA可以將計算的效率同比提升6~8倍;而服務器內(nèi)1us的傳輸時延也使得SSD分布式存儲的時延從ms級降低到us級成為可能,所以在最新的NVMe(Non-Volatile Memory express)接口協(xié)議中,RDMA成為主流的默認網(wǎng)絡通信協(xié)議棧。因此,RDMA替換TCP/IP成為大勢所趨。

在服務器之間的互聯(lián)網(wǎng)絡中,當前有兩種方案來承載RDMA:專用InfiniBand網(wǎng)絡和傳統(tǒng)IP以太網(wǎng)絡,然而,它們都存在不足:

InfiniBand網(wǎng)絡:架構封閉,采用私有協(xié)議,難以與現(xiàn)網(wǎng)大規(guī)模的IP網(wǎng)絡實現(xiàn)很好的兼容互通;運維復雜,專人運維,OPEX居高不下。

傳統(tǒng)IP以太網(wǎng):對于RDMA來說,大于10-3的丟包率,將導致網(wǎng)絡有效吞吐急劇下降,2%的丟包則使得RDMA的吞吐率下降為0。要使得RDMA吞吐不受影響,丟包率必須保證在十萬分之一以下,最好為無丟包。而擁塞丟包是傳統(tǒng)IP以太網(wǎng)絡的基本機制,傳統(tǒng)IP以太網(wǎng)中會使用PFC和ECN機制來避免丟包,但其基本原理是通過反壓降低發(fā)送端速度來保證不丟包,實際上并沒有達到提升吞吐率的效果。

因此,RDMA的高效運行,離不開一個0丟包、高吞吐的開放以太網(wǎng)作為承載。

AI時代的變化3:分布式架構成為趨勢,加劇網(wǎng)絡擁塞,驅動網(wǎng)絡變革

在企業(yè)的數(shù)字化轉型中,以金融和互聯(lián)網(wǎng)企業(yè)為代表,大量的應用系統(tǒng)遷移到分布式系統(tǒng)上:通過海量的PC平臺替代傳統(tǒng)小型機,帶來了成本低廉、易擴展、自主可控等優(yōu)勢,同時也給網(wǎng)絡互聯(lián)帶來了挑戰(zhàn):

分布式架構帶來了服務器間大量的互通需求。

Incast型流量(多點對一點的流量)會在接收端造成流量突發(fā),瞬間超過接收端接口能力,造成擁塞丟包。

41733ad2-f5ef-11ed-90ce-dac502259ad0.png


分布式架構流量模型示意

隨著分布式系統(tǒng)應用復雜度的增加,服務器之間交互的消息長度越來越大,即流量具備“大包”特征,進一步加劇了網(wǎng)絡擁塞。

什么是超融合網(wǎng)數(shù)據(jù)中心網(wǎng)絡的核心指標?

從上一節(jié)來看,為了滿足AI時代的數(shù)據(jù)高效處理訴求、應對分布式架構挑戰(zhàn),0丟包、低時延、高吞吐成為下一代數(shù)據(jù)中心網(wǎng)絡的三個核心指標。這三個核心指標是互相影響,有蹺蹺板效應,同時達到最優(yōu)有很大的挑戰(zhàn)。

417afce0-f5ef-11ed-90ce-dac502259ad0.png


三個核心指標相互影響

同時滿足0丟包、低時延、高吞吐,背后的核心技術是擁塞控制算法。通用的無損網(wǎng)絡的擁塞控制算法DCQCN(Data Center Quantized Congestion Notification),需要網(wǎng)卡和網(wǎng)絡進行協(xié)作,每個節(jié)點需要配置數(shù)十個參數(shù),全網(wǎng)的參數(shù)組合達到幾十萬;為了簡化配置,只能采用通用的配置,導致針對不同的流量模型,常常無法同時滿足這三個核心指標。

超融合數(shù)據(jù)中心網(wǎng)絡與HCI有什么異同?

HCI(Hyper-Converged Infrastructure,超融合基礎架構)是指在同一套單元設備中不但具備了計算、網(wǎng)絡、存儲和服務器虛擬化等資源和技術,而且多套單元設備可以通過網(wǎng)絡聚合起來,實現(xiàn)模塊化的無縫橫向擴展(Scale—Out),形成統(tǒng)一的資源池。

HCI將虛擬化計算和存儲整合到同一個系統(tǒng)平臺。簡單地說就是物理服務器上運行虛擬化軟件(Hypervisor),通過在虛擬化軟件上運行分布式存儲服務供虛擬機使用。分布式存儲可以運行在虛擬化軟件上的虛擬機里也可以是與虛擬化軟件整合的模塊。廣義上說,HCI既可以整合計算和存儲資源,還可以整合網(wǎng)絡以及其它更多的平臺和服務。目前業(yè)界普遍認為,軟件定義的分布式存儲層和虛擬化計算是HCI架構的最小集。

與HCI不同,超融合數(shù)據(jù)中心網(wǎng)絡只專注于網(wǎng)絡層面,提供全新的計算、存儲互聯(lián)的網(wǎng)絡層方案。使用超融合數(shù)據(jù)中心網(wǎng)絡,不需像HCI那樣對計算資源、存儲資源進行改造和融合,并且基于以太網(wǎng)很容易實現(xiàn)成低成本的快速擴容。

的超融合數(shù)據(jù)中心網(wǎng)絡,基于開放以太網(wǎng),通過獨特的AI算法,可以使以太網(wǎng)絡同時滿足低成本,0丟包和低時延的訴求。超融合數(shù)據(jù)中心網(wǎng)絡成為AI時代的數(shù)據(jù)中心構建統(tǒng)一融合的網(wǎng)絡架構的最佳選擇。

41818a88-f5ef-11ed-90ce-dac502259ad0.png


從獨立組網(wǎng)到統(tǒng)一融合的組網(wǎng)

超融合數(shù)據(jù)數(shù)據(jù)中心網(wǎng)絡有什么價值?

傳統(tǒng)的FC專網(wǎng)和IB專網(wǎng),價格昂貴,生態(tài)封閉,且需要專人運維,也不支持SDN,無法滿足云網(wǎng)協(xié)同等自動化部署的訴求。

使用華為超融合數(shù)據(jù)中心網(wǎng)絡具有以下價值:

提升端到端業(yè)務性能使用華為超融合數(shù)據(jù)中心網(wǎng)絡,據(jù)權威第三方測試EANTC測試結論,可以在HPC場景下最高降低44.3%的計算時延,在分布式存儲場景下提升25%的IOPS能力,且所有場景保證網(wǎng)絡0丟包。

使用華為超融合數(shù)據(jù)中心網(wǎng)絡,可提供25G/100G/400G組網(wǎng),滿足AI時代海量數(shù)據(jù)對網(wǎng)絡大帶寬的需求。

降低成本,提升收益

數(shù)據(jù)中心投資中網(wǎng)絡占比僅10%左右,相對服務器/存儲的投資(占比85%),有10倍的杠桿效應,撬動服務器和存儲投資的大幅降低;華為超融合數(shù)據(jù)數(shù)據(jù)中心網(wǎng)絡可以帶來25%的存儲性能提升,40%的計算效率提升,將帶來數(shù)十倍的ROI(Return On Investment)能力。

支持SDN自動化和智能運維

華為超融合數(shù)據(jù)中心網(wǎng)絡支持SDN云網(wǎng)協(xié)同的全生命周期業(yè)務自動化,OPEX降低至少60%以上。另外,由于華為超融合數(shù)據(jù)中心網(wǎng)絡本質上是以太網(wǎng),因此傳統(tǒng)以太網(wǎng)運維人員就可以管理,且可以依托華為智能分析平臺iMaster NCE-FabricInsight,多維度地、可視化地對網(wǎng)絡進行運維。

超融合數(shù)據(jù)數(shù)據(jù)中心網(wǎng)絡如何工作?

上文提到,使用以太網(wǎng)來承載RDMA流量,目前使用的協(xié)議為RoCE(RDMA over Converged Ethernet)v2。華為超融合數(shù)據(jù)中心網(wǎng)絡,使用iLossless智能無損算法構建無損以太網(wǎng)絡,是一系列技術的合集,通過以下三個方面技術的相互配合,真正解決傳統(tǒng)以太網(wǎng)絡擁塞丟包的問題,為RoCEv2流量提供“無丟包、低時延、高吞吐”的網(wǎng)絡環(huán)境,滿足RoCEv2應用的高性能需求。

流量控制技術

流量控制是端到端的,需要做的是抑制發(fā)送端的發(fā)送速率,以便接收端來得及接收,防止設備端口在擁塞的情況下出現(xiàn)丟包。華為提供了PFC死鎖檢測和死鎖預防,提前預防PFC死鎖的發(fā)生。

擁塞控制技術

擁塞控制是一個全局性的過程,目的是讓網(wǎng)絡能承受現(xiàn)有的網(wǎng)絡負荷,往往需要轉發(fā)設備、流量發(fā)送端、流量接收端協(xié)同作用,并結合網(wǎng)絡中的擁塞反饋機制來調(diào)節(jié)整網(wǎng)流量才能起到緩解擁塞、解除擁塞的效果。在擁塞控制過程中,華為提供了AI ECN、iQCN、ECN Overlay和NPCC功能,解決了傳統(tǒng)DCQCN存在的問題。

智能無損存儲網(wǎng)絡技術為了更好地服務存儲系統(tǒng),華為提供了iNOF(智能無損存儲網(wǎng)絡)功能,實現(xiàn)對主機的快速管控。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:超融合數(shù)據(jù)中心網(wǎng)絡發(fā)展及趨勢

文章出處:【微信號:架構師技術聯(lián)盟,微信公眾號:架構師技術聯(lián)盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中型數(shù)據(jù)中心中的差分晶體振蕩器應用與匹配方案

    核心網(wǎng)絡、存儲、通信與計算節(jié)點。 通過精準選型與合理布線,這些高性能差分晶體振蕩器可有效提升數(shù)據(jù)中心設備間的時鐘一致性與傳輸效率,是構建穩(wěn)定、可靠、高吞吐量數(shù)據(jù)中心的關鍵器件。
    發(fā)表于 07-01 16:33

    小型數(shù)據(jù)中心晶振選型關鍵參數(shù)全解

    的準確傳輸。 芯片型號 Intel I350-AM4:適用于10GbE和1GbE的網(wǎng)絡接口卡,廣泛應用于數(shù)據(jù)中心網(wǎng)絡交換設備中。 Broadcom BCM57414:支持10GbE網(wǎng)絡
    發(fā)表于 06-11 13:37

    數(shù)據(jù)中心冷卻技術的發(fā)展趨勢

    預計到2025年,全球發(fā)電量將達到26,787TWh,其中數(shù)據(jù)中心和加密貨幣將消耗約536TWh,約占全球總發(fā)電量的2%[1],[2]。按照目前的趨勢,數(shù)據(jù)中心的電力消耗到2030年很可能達到甚至超過1,000TWh,接近全球總
    的頭像 發(fā)表于 05-15 13:38 ?342次閱讀

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡

    隨著人工智能(AI)技術的迅猛發(fā)展,數(shù)據(jù)中心面臨著前所未有的計算和網(wǎng)絡壓力。從大語言模型(LLM)訓練到生成式AI應用,海量數(shù)據(jù)處理需求推動了網(wǎng)絡
    發(fā)表于 03-25 17:35

    華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡

    在華為中國合作伙伴大會2025期間,以 “星河AI數(shù)據(jù)中心網(wǎng)絡,賦AI時代新動能”為主題的數(shù)據(jù)中心網(wǎng)絡分論壇圓滿落幕。本次論壇匯聚了來自全國的300多位客戶和伙伴,共同探討
    的頭像 發(fā)表于 03-24 14:46 ?478次閱讀

    優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案

    高速線纜支持熱插拔功能,具有低功耗和小彎曲半徑,便于靈活布線,可實現(xiàn)高穩(wěn)定性、低成本、節(jié)省空間和高散熱等優(yōu)勢,非常適合數(shù)據(jù)中心布線需求。這些高速線纜能夠與交換機、路由器和服務器無縫集成,確保網(wǎng)絡
    發(fā)表于 03-24 14:20

    數(shù)據(jù)中心發(fā)展與改造

    全球多數(shù)數(shù)據(jù)中心基礎設施已六年,能耗高而效率低。隨著AI的發(fā)展,企業(yè)正致力于整合與提升能效的現(xiàn)代化改造。同時數(shù)據(jù)中心呈現(xiàn)規(guī)模化、高密化、綠色化發(fā)展
    的頭像 發(fā)表于 02-28 16:50 ?390次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>發(fā)展</b>與改造

    華為發(fā)布2025數(shù)據(jù)中心能源十大趨勢

    今日,華為舉辦2025數(shù)據(jù)中心能源十大趨勢發(fā)布會,華為數(shù)據(jù)中心能源領域總裁堯權全面解讀數(shù)據(jù)中心能源十大趨勢,為AI時代
    的頭像 發(fā)表于 01-14 10:24 ?497次閱讀

    NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡建設技術要求》

    Alliance,以下簡稱 “NIDA”)攜手中國信息通信研究院等9家組織成員共同發(fā)布了《智算數(shù)據(jù)中心網(wǎng)絡建設技術要求》(以下簡稱 “技術要求”)。該技術要求明確了智算場景下數(shù)據(jù)中心網(wǎng)絡
    的頭像 發(fā)表于 12-04 11:13 ?845次閱讀

    當今數(shù)據(jù)中心新技術趨勢

    當今數(shù)據(jù)中心的新技術趨勢正以前所未有的速度推動著行業(yè)的變革與創(chuàng)新。隨著云計算、大數(shù)據(jù)、人工智能等技術的快速發(fā)展,數(shù)據(jù)中心作為信息技術的核心基
    的頭像 發(fā)表于 10-24 15:15 ?992次閱讀

    簡述數(shù)據(jù)中心網(wǎng)絡架構的演變

    隨著全球對人工智能(AI)的需求不斷增長,數(shù)據(jù)中心作為AI計算的重要基礎設施,其網(wǎng)絡架構與連接技術的發(fā)展變得尤為關鍵。
    的頭像 發(fā)表于 10-22 16:23 ?839次閱讀

    數(shù)據(jù)中心的前沿動態(tài)與趨勢

    、云計算等新一代數(shù)字技術發(fā)展數(shù)據(jù)中樞和算力載體,對于數(shù)字經(jīng)濟增長具有重要助推作用。數(shù)據(jù)中心作為各個行業(yè)信息系統(tǒng)運行的物理載體,已成為經(jīng)濟社會運行不可或缺的關鍵基礎設施。 工信部:健全促進實體經(jīng)濟和數(shù)字經(jīng)濟深度
    的頭像 發(fā)表于 09-02 15:57 ?754次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>的前沿動態(tài)與<b class='flag-5'>趨勢</b>

    怎樣保障數(shù)據(jù)中心不間斷電源不斷電 提供可靠安全的供配電#數(shù)據(jù)中心

    數(shù)據(jù)中心配電系統(tǒng)
    安科瑞王金晶
    發(fā)布于 :2024年08月29日 14:51:36

    數(shù)據(jù)中心在5G網(wǎng)絡中的演進與發(fā)展

    幾十年來,數(shù)據(jù)中心一直位于或靠近網(wǎng)絡中心。對于企業(yè)、電信運營商、有線電視運營商以及近來的Google和Facebook等服務提供商而言,數(shù)據(jù)中心是IT的心臟和肌肉。云技術的出現(xiàn)更是彰顯了現(xiàn)代數(shù)
    的頭像 發(fā)表于 08-16 16:02 ?743次閱讀

    融合一體機是服務器嗎?與服務器有什么區(qū)別

    融合一體機不是單純的服務器,它是一種基于融合技術構建的IT基礎設施解決方案,集成了軟件和硬件,提供計算、存儲和網(wǎng)絡功能。這種一體機不僅簡
    的頭像 發(fā)表于 08-14 11:50 ?1627次閱讀