隨著5G、云計(jì)算、AI等技術(shù)的不斷演進(jìn),SDN與NFV或者其他虛擬化網(wǎng)絡(luò)技術(shù)在數(shù)據(jù)中心進(jìn)行應(yīng)用。數(shù)據(jù)中心經(jīng)歷了從經(jīng)典三層架構(gòu)、大二層網(wǎng)絡(luò)架構(gòu)、再到Spine/Leaf的葉脊架構(gòu),數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的發(fā)展越來越扁平化與自動(dòng)化。
另外,數(shù)據(jù)中心有簡化的趨勢,數(shù)據(jù)中心網(wǎng)絡(luò)新設(shè)計(jì)正在從2層轉(zhuǎn)向3層。當(dāng)前最先進(jìn)的數(shù)據(jù)中心只是運(yùn)行BGP、EVPN和BFD協(xié)議來進(jìn)行快速的故障轉(zhuǎn)移。
數(shù)據(jù)中心越先進(jìn),運(yùn)行的協(xié)議就越少,配置文件就越短。然而,這種簡化趨勢主要是需要更多的可見性,因?yàn)槁斆鞯娜讼胍吹剿麄兊木W(wǎng)絡(luò)內(nèi)部發(fā)生了什么。隨著網(wǎng)絡(luò)變得越來越大、越來越快,精明的IT管理人員正在使用更少的協(xié)議,但目標(biāo)是更多的遙測和監(jiān)控技術(shù),以實(shí)現(xiàn)更好的可見性。
面對數(shù)據(jù)中心的網(wǎng)絡(luò)結(jié)構(gòu)的發(fā)展變化,納多德在已有大量項(xiàng)目方案的實(shí)際經(jīng)驗(yàn)基礎(chǔ)上,介紹五種新方法,來幫助用戶優(yōu)化企業(yè)的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu):
用VXLAN替換VLAN
使用ARP抑制來減少廣播流
用EVPN Multihoming替換MLAG
使用ECMP和UCMP 處理流量平衡
利用自適應(yīng)路由解決流量極化問題
1.用VXLAN替換VLAN
VXLAN(Virtual eXtensible Local Area Network,虛擬擴(kuò)展局域網(wǎng))是由IETF定義的NVO3(Network Virtualization over Layer 3)標(biāo)準(zhǔn)技術(shù)之一,采用L2 over L4(MAC-in-UDP)的報(bào)文封裝模式,將二層報(bào)文用三層協(xié)議進(jìn)行封裝,可實(shí)現(xiàn)二層網(wǎng)絡(luò)在三層范圍內(nèi)進(jìn)行擴(kuò)展,同時(shí)滿足數(shù)據(jù)中心大二層虛擬遷移和多租戶的需求。
傳統(tǒng)2層網(wǎng)絡(luò)具有以下缺點(diǎn):
它依賴生成樹協(xié)議(STP),導(dǎo)致帶寬利用率、冗余和多路徑的能力受到生成樹功能的限制。
它只能在一個(gè)子網(wǎng)內(nèi)運(yùn)行,當(dāng)使用MLAG時(shí) ,冗余通常僅限于兩個(gè)設(shè)備。
任何路徑級冗余都需要鏈路聚合控制協(xié)議(LACP),這是端口的標(biāo)準(zhǔn)冗余技術(shù)。
如上圖所示,VXLAN克服了傳統(tǒng)2層網(wǎng)絡(luò)的缺陷,允許網(wǎng)絡(luò)管理者在3層路由結(jié)構(gòu)上進(jìn)行優(yōu)化。用戶仍然可以實(shí)現(xiàn)2層網(wǎng)絡(luò)的覆蓋,但由于使用EVPN作為控制平面,因此不再需要生成樹來進(jìn)行控制平面收斂。EVPN通過BGP地址簇來交換MAC信息,而不是低效的廣播泛洪和學(xué)習(xí)。此外,VXLAN使用24位ID ,可定義多達(dá)1600萬個(gè)虛擬網(wǎng)絡(luò),而VLAN只有12位ID,僅限于4094個(gè)虛擬網(wǎng)絡(luò)??傊?,VXLAN通過MAC-in-UDP的報(bào)文封裝,實(shí)現(xiàn)了二層報(bào)文在三層網(wǎng)絡(luò)上的透傳,在云端上架起了一道道無形的“彩虹”,解決了云計(jì)算中虛擬化帶來的一系列問題。
2. 使用ARP抑制來減少廣播傳播
在部署VXLAN的數(shù)據(jù)中心中BUM報(bào)文可以通過ARP抑制進(jìn)一步優(yōu)化。通常是在EVPN中使用頭端復(fù)制的方式(具體體現(xiàn)是在橋中添加mac地址為全0的FDB表項(xiàng)進(jìn)行頭端復(fù)制)來進(jìn)行實(shí)現(xiàn)。當(dāng)有很多的ARP廣播請求報(bào)文的時(shí)候,容易造成廣播泛濫。采用ARP抑制可以有效限制廣播ARP報(bào)文的數(shù)量。
如上圖所示,VXLAN三層網(wǎng)關(guān)通過動(dòng)態(tài)學(xué)習(xí)終端租戶的ARP表項(xiàng),再根據(jù)ARP表項(xiàng)生成主機(jī)信息(包括主機(jī)IP地址、 MAC地址、 VTEP地址和VNI ID),并將主機(jī)信息通過MP-BGP或BGP EVPN對外發(fā)布,使其他的BGP鄰居可以學(xué)習(xí)到主機(jī)信息。因此部署ARP抑制可以優(yōu)化覆蓋網(wǎng)絡(luò)控制平面的,獲得更快的地址解析速度。它還減少了網(wǎng)絡(luò)中的廣播流量,因?yàn)锳RP抑制減少了向VXLAN基礎(chǔ)設(shè)施中的每個(gè)VTEP發(fā)送ARP請求的需要。
3. 用 EVPN Multihoming(EVPN-MH(EVPN多宿主))替換MLAG
在某些場景中,VXLAN環(huán)境中仍然需要MLAG來實(shí)現(xiàn)冗余多宿主機(jī)的連接。EVPN-MH是一個(gè)擺脫現(xiàn)有專用MLAG解決方案的機(jī)會(huì),它提供雙活服務(wù)器冗余支持,因?yàn)閷S肕LAG解決方案的擴(kuò)展范圍不超過一個(gè)設(shè)備冗余級別。
EVPNMultihoming特點(diǎn)
無需在TOR交換機(jī)之間建立Peerlink鏈路或交換機(jī)間鏈路
允許兩個(gè)以上TOR交換機(jī)成為一個(gè)冗余組
提供單個(gè)BGP-EVPN 控制平面
允許多供應(yīng)商互操作性
如上圖所示,VXLAN有助于消除MLAG所需的背靠LEAF到SPINE交換機(jī)連接的需要。EVPN-MH進(jìn)一步消除了Server到TOR交換機(jī)連接中對MLAG的任何需要。
Multihoming 使用EVPN消息與宿主機(jī)進(jìn)行通信,并使用主機(jī)連接信息動(dòng)態(tài)構(gòu)建與服務(wù)器的2層鄰接關(guān)系。當(dāng)MLAG需要LAG ID時(shí),Multihoming使用以太網(wǎng)段ID。接口映射到用于作為與同一終端主機(jī)邏輯連接的以太網(wǎng)段(Ethernet Segment)。
此外,通過在交換機(jī)中使用標(biāo)準(zhǔn)協(xié)議構(gòu)造冗余,轉(zhuǎn)向使用EVPN-MH可以提高網(wǎng)絡(luò)供應(yīng)商的互操作性。由于EVPN底層使用開放標(biāo)準(zhǔn)協(xié)議BGP ,任何通過RFC規(guī)范實(shí)現(xiàn)EVPN-MH的供應(yīng)商都可以成為以太網(wǎng)段的一部分。
4. ECMP和UCMP處理流量平衡
ECMP(等價(jià)多路徑路由)即存在多條到達(dá)同一個(gè)目的地址的相等開銷的路徑。它是大多數(shù)3層路由協(xié)議中的標(biāo)準(zhǔn)功能,在這些協(xié)議中,在所有可用的下一跳上行鏈路中實(shí)現(xiàn)平衡的等價(jià)路由。2層控制平面技術(shù)(如:生成樹)僅允許通過依賴外部技術(shù)(如:LACP)實(shí)現(xiàn)同等價(jià)負(fù)載分擔(dān)。
ECMP是3層路由中的原生功能,它使您能夠提高網(wǎng)絡(luò)設(shè)備的效率。
在某些情況下,ECMP可能會(huì)導(dǎo)致轉(zhuǎn)發(fā)效率低下,特別是在部署全面的3層解決方案時(shí),在網(wǎng)絡(luò)中的任何位置都使用點(diǎn)對點(diǎn)L3鏈路,甚至到主機(jī)。在這種情況下,您可能希望在使用鏈路數(shù)量以外的指標(biāo)來平衡流量。UCMP(非平衡鏈路負(fù)載均衡)在這里很有用,因?yàn)樗褂肂GP標(biāo)記創(chuàng)建跨躍點(diǎn)的流量分布,以便更好地與應(yīng)用程序分布相匹配。UCMP區(qū)別于傳統(tǒng)ECMP,其最大特點(diǎn)是利用權(quán)重值來區(qū)別對待帶寬的使用,使得兩條不同帶寬的出口,可根據(jù)帶寬大小不同來承擔(dān)不同的數(shù)據(jù)流量傳輸.
5. 通過自適應(yīng)路由解決流量極化問題
自適應(yīng)路由是現(xiàn)有InfiniBand技術(shù)在以太網(wǎng)交換上的實(shí)現(xiàn)。自適應(yīng)路由監(jiān)控鏈路帶寬、鏈路利用率、交換機(jī)緩沖區(qū)和ECN/PFC ,將轉(zhuǎn)發(fā)到ECMP組的流量選擇擁塞程度最低的端口進(jìn)行傳輸,擁塞程度基于出口隊(duì)列負(fù)載進(jìn)行評估,確保 ECMP組在不考慮“熵”級別的情況下保持良好平衡。
“熵”是一種衡量流經(jīng)既定網(wǎng)絡(luò)的流量的豐富性和多樣性的方法。
例如:當(dāng)您有數(shù)千個(gè)從全球各地的客戶端隨機(jī)連接的流時(shí),您的網(wǎng)絡(luò)被稱為有high entropy(高熵)。然而,當(dāng)您只有少數(shù)大型流時(shí)(這在 AI 和存儲(chǔ)工作負(fù)載中經(jīng)常發(fā)生),大型流會(huì)控制帶寬,因此會(huì)出現(xiàn) low entropy(低熵)。這種低熵流量模式也稱為“大象流”分布,在許多數(shù)據(jù)中心工作負(fù)載中都很明顯。
當(dāng)使用靜態(tài) ECMP 的傳統(tǒng)技術(shù),您需要“高熵”來將流量均勻地分布在多個(gè)鏈路上,而不會(huì)出現(xiàn)擁塞。然而,在“大象流”場景中,多個(gè)流可能出現(xiàn)在同一條鏈路上,從而創(chuàng)建一個(gè)超過線路帶寬的流量熱點(diǎn)或微突發(fā)。這會(huì)導(dǎo)致?lián)砣⒀舆t增加、數(shù)據(jù)包丟失和重傳。對于許多應(yīng)用程序,性能不僅取決于網(wǎng)絡(luò)的平均帶寬,還取決于流完成時(shí)間的分布。完成時(shí)間分布中的長尾或異常值可能會(huì)顯著降低應(yīng)用程序性能。
因此,通過自適應(yīng)路由技術(shù)利用其靈活的網(wǎng)絡(luò)拓?fù)溥m應(yīng)性,對于 CLOS(或葉/脊椎)等典型拓?fù)洌郊榷繕?biāo)的各種路徑間距相同時(shí),交換機(jī)通常擁塞最小的端口傳輸數(shù)據(jù)包。當(dāng)在路徑間距不同的其他拓?fù)渲?,交換機(jī)傾向于通過最短路徑發(fā)送流量。如果擁塞發(fā)生在最短路徑上,則選擇擁塞最小的備選路徑。這確保了網(wǎng)絡(luò)帶寬得到有效利用。自適應(yīng)路由的目標(biāo)是將網(wǎng)絡(luò)管理員從手動(dòng)調(diào)整干預(yù)中解放出來,讓基礎(chǔ)網(wǎng)絡(luò)處理聚合流負(fù)載均衡的優(yōu)化工作。
以上我們介紹了數(shù)據(jù)中心網(wǎng)絡(luò)中可用的優(yōu)化方案。這些優(yōu)化有助于減少基礎(chǔ)設(shè)施上不必要的控制流量,并且可平衡現(xiàn)有物理鏈路上的流量,充分利用所有可用鏈路帶寬。
納多德NADDOD利用自有光連接件與NVIDIA的網(wǎng)絡(luò)硬軟件產(chǎn)品資源和技術(shù)優(yōu)勢,可為客戶提供更豐富、更靈活、更優(yōu)質(zhì)的產(chǎn)品技術(shù)解決方案,為用戶業(yè)務(wù)賦能。納多德NADDOD光網(wǎng)絡(luò)整體解決方案如下圖所示:
面對數(shù)據(jù)中心的網(wǎng)絡(luò)結(jié)構(gòu)的發(fā)展變化,納多德NADDOD作為NVIDIA網(wǎng)絡(luò)產(chǎn)品Elite Partner,實(shí)現(xiàn)光連接+NVIDIA 網(wǎng)絡(luò)產(chǎn)品與解決方案強(qiáng)強(qiáng)聯(lián)合,充分發(fā)揮雙方產(chǎn)品技術(shù)、市場覆蓋與生態(tài)優(yōu)勢,在技術(shù)領(lǐng)先競爭力與產(chǎn)品整體方案豐富度上優(yōu)勢互補(bǔ),為數(shù)據(jù)中心、高性能計(jì)算、邊緣計(jì)算、人工智能等應(yīng)用場景提供更具優(yōu)勢與價(jià)值的光連接產(chǎn)品和整體解決方案,大幅提高客戶業(yè)務(wù)加速能力。
審核編輯:湯梓紅
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5186瀏覽量
73368 -
網(wǎng)絡(luò)結(jié)構(gòu)
+關(guān)注
關(guān)注
0文章
48瀏覽量
11524 -
5G
+關(guān)注
關(guān)注
1360文章
48799瀏覽量
571591
發(fā)布評論請先 登錄
華為數(shù)據(jù)中心自動(dòng)駕駛網(wǎng)絡(luò)通過EANTC歐洲高級網(wǎng)絡(luò)測試中心L4級自智網(wǎng)絡(luò)測評

數(shù)據(jù)中心和通信網(wǎng)絡(luò)有什么區(qū)別

小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解
華為面向亞太地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡(luò)方案
華為面向中東中亞地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡(luò)
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
華為攜手中控技術(shù)打造全國數(shù)據(jù)中心網(wǎng)絡(luò)創(chuàng)新示范項(xiàng)目
華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡(luò)
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
800G光模塊:引領(lǐng)未來數(shù)據(jù)中心與網(wǎng)絡(luò)通信的新引擎
NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》
Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片

評論