隨著網(wǎng)絡(luò)與硬件技術(shù)地快速發(fā)展,資源解耦架構(gòu)因其資源利用率高、硬件拓展性好等諸多優(yōu)勢,成為了未來數(shù)據(jù)中心的主要發(fā)展方向之一,從資源管理的角度出發(fā),目前的方案主要分為三個技術(shù)路線,包括“以CPU為中心”、“以內(nèi)存為中心”和“資源去中心化”。
第七屆未來網(wǎng)絡(luò)發(fā)展大會發(fā)布《算網(wǎng)操作系統(tǒng)白皮書》、《光電融合服務(wù)定制廣域網(wǎng)》、《以網(wǎng)絡(luò)IO為中心的無服務(wù)器數(shù)據(jù)中心》白皮書,本文選自"以網(wǎng)絡(luò)IO為中心的無服務(wù)器數(shù)據(jù)中心"。。
以內(nèi)存為中心
在“以內(nèi)存為中心”的技術(shù)路線下,內(nèi)存管理功能從傳統(tǒng)操作系統(tǒng)中分離出來,并運行在內(nèi)存?zhèn)?,以便實現(xiàn)內(nèi)存的獨立拓展和異構(gòu)計算單元對內(nèi)存的共享訪問,進(jìn)而實現(xiàn)更高效的數(shù)據(jù)處理和計算。例如,內(nèi)存池化后可預(yù)處理內(nèi)存分配和回收,進(jìn)而提高內(nèi)存的利用效率和性能;內(nèi)存共享后可以減少計算核心之間的數(shù)據(jù)搬移次數(shù),從而加速計算任務(wù)的完成;大內(nèi)存消除了數(shù)據(jù)的換出換入開銷等。在此技術(shù)路線上,目前的實現(xiàn)方案有HP The Machine、天蝎項目和NetDAM等。
1、HP The Machine
惠普在2016年的倫敦發(fā)布會上推出了“以內(nèi)存為中心”的新型計算機原型機——The Machine。如圖2-10所示,與傳統(tǒng)計算機相比,The Machine[12]架構(gòu)主要有以下幾個關(guān)鍵技術(shù),包括系統(tǒng)級芯片(SoC)、統(tǒng)一存儲、內(nèi)存池化共享和全光通信。
首先,The Machine采用了經(jīng)過能效和算法優(yōu)化的SoC,是TheMachine的核心組成,旨在支撐高度可擴(kuò)展、節(jié)能且安全的系統(tǒng),主要由FAM(Fabric-attached Memory)芯片、I/O端口、網(wǎng)絡(luò)相關(guān)組件等構(gòu)成。其中,F(xiàn)AM芯片的主要功能是連接傳統(tǒng)計算核心與遠(yuǎn)端內(nèi)存池,同時減少對數(shù)據(jù)移動的需求。
此外,該SoC還提供安全特性,如硬件強制隔離等。其次,The Machine中的存儲是統(tǒng)一的。具體來說,原來由RAM和硬盤/閃存承擔(dān)的存儲任務(wù)(RAM負(fù)責(zé)臨時存儲,硬盤/閃存負(fù)責(zé)長期存儲)全部由NVM完成。在傳統(tǒng)的分層存儲架構(gòu)下,數(shù)據(jù)需要在兩種存儲(RAM與硬盤/閃存)之間來回交換,這既影響性能又增加能耗。
2、天蝎項目
在國內(nèi)的服務(wù)器市場,BAT三家互聯(lián)網(wǎng)公司在2011年聯(lián)合成立了天蝎聯(lián)盟。于2014年8月,天蝎聯(lián)盟正式升級為開放數(shù)據(jù)中心委員會(ODCC)。如圖2-11所示,天蝎計劃[13]發(fā)展至今,已演進(jìn)至3.0版本。
天蝎1.0確立了集中供電、集中風(fēng)扇(散熱)、集中管理的天蝎整機柜服務(wù)器基本形態(tài)。機柜模塊作為整機柜服務(wù)器的“外殼”,中間4U空間用于部署集中供電模塊(Power Supply Unit,PSU)、集中管理模塊以及網(wǎng)絡(luò)模塊(交換機)。
為了更好的協(xié)調(diào)組織活動,擴(kuò)大天蝎整機柜服務(wù)器的適用范圍,ODCC發(fā)布了天蝎2.0規(guī)范,主要包括機柜的尺寸、機柜背板和頂部功能、風(fēng)扇尺寸、服務(wù)器節(jié)點與機柜系統(tǒng)解耦等。此外,基于中國數(shù)據(jù)中心行業(yè)的基本情況,天蝎2.0規(guī)范還對環(huán)境(溫濕度)及機房提出了高度、供電和承重等方面的要求。
天蝎3.0旨在打破1U/2U服務(wù)器節(jié)點的限制,解除計算和存儲資源在小空間里的耦合,在機柜級的大空間里再耦合。CPU、內(nèi)存、閃存、硬盤等同類資源物理上聚集在一起,形成不同種類的資源池。從外部看,整機柜服務(wù)器是一個整體,但其內(nèi)部的資源是可以分割的,不同類型、數(shù)量的資源自由組合為不同配置的“邏輯”服務(wù)器,必要時還可以更改配置或打散重組,提高資源利用率,進(jìn)一步降低能耗。
3、NetDAM
NetDAM主要思想是將內(nèi)存直接掛載到以太網(wǎng)控制器上,并提供大量的ALU和可編程邏輯,旨在提供高效的內(nèi)存池化、存內(nèi)計算(In-Memory Computing)以及在網(wǎng)計算(In-Network Computing)的新范式。
從NetDAM的功能構(gòu)成來看,其通過內(nèi)存共享以及對存內(nèi)計算和在網(wǎng)計算的指令級支持,實現(xiàn)主機內(nèi)和主機間協(xié)議的橋接。具體來說,NetDAM采用以太網(wǎng)IP/UDP來傳輸NetDAM數(shù)據(jù),主要通過以下四個技術(shù)點來保證低時延和大帶寬:
1)確定性時延:NetDAM通過消除PCIe DMA和跳過緩存一致性嗅探來固定了數(shù)據(jù)包處理流水線,從而實現(xiàn)數(shù)據(jù)包在確定時延內(nèi)得到回復(fù);
2)可選的可靠性傳輸:該設(shè)計主要出于以下兩點考慮,一是具有虛擬化或容器覆蓋支持的無損以太網(wǎng)將帶來大量開銷,二是很多分布式應(yīng)用可以設(shè)計冪等接口,簡單地重傳并不影響結(jié)果;
3)可選的排序:交換操作運行亂序執(zhí)行,因為每個數(shù)據(jù)包中都有內(nèi)存地址字段來隔離操作內(nèi)存空間,同時每個數(shù)據(jù)包中也有序列號字段以支持用戶在編程邏輯中增加可選的重排序模塊;
4)多徑傳輸:為了使數(shù)據(jù)傳輸與網(wǎng)絡(luò)拓?fù)錈o關(guān),NetDAM在UDP數(shù)據(jù)包內(nèi)加入段路由頭,因此源節(jié)點可以選擇專用路徑,避免交換機緩沖區(qū)溢出,充分利用網(wǎng)絡(luò)帶寬。
NetDAM實現(xiàn)的存算資源互聯(lián)系統(tǒng),CPU、DSA、存儲等資源可以通過AXI、CHI或PCIe/CXL等總線直連到NetDAM,不同NetDAM之間通過以太網(wǎng)互聯(lián),NetDAM上的內(nèi)存資源形成共享池。
資源去中心化
在“以CPU為中心”的技術(shù)路線下,所有存算資源的管理和使用邏輯都運行在CPU上,并通過訪問遠(yuǎn)端資源的方式使用解耦的其他存算資源。此技術(shù)路線不僅使CPU成為故障中心,還會因遠(yuǎn)端資源管理引入大量的帶寬和時延開銷,特別在大規(guī)模部署的資源解耦數(shù)據(jù)中心中這一問題尤為顯著。
“以內(nèi)存為中心”的技術(shù)路線是將傳統(tǒng)OS中的內(nèi)存管理功能遷移至內(nèi)存?zhèn)?,使得?nèi)存資源可按需獨立拓展,同時實現(xiàn)不同類型的計算核心對內(nèi)存資源的共享使用。該技術(shù)路線雖然減少了內(nèi)存管理的開銷,但除內(nèi)存外的其他資源(如外存等)還由CPU來進(jìn)行管理和調(diào)度,仍存在“以CPU為中心”技術(shù)路線的局限性。
總的來說,以上兩種技術(shù)路線,本質(zhì)上仍是都是以某種資源為中心的管理邏輯,此邏輯使得其他資源仍受制于某類資源,進(jìn)而無法充分發(fā)揮解耦資源的使用效率,并在可拓展性和彈性方面仍存在不足,因此,“資源去中心化”的理念被提出,數(shù)據(jù)中心中的計算、存儲和網(wǎng)絡(luò)等資源都被視為獨立的服務(wù),不同資源的拓展和使用均不存在依賴關(guān)系。
在“資源去中心化”的技術(shù)路線下,傳統(tǒng)OS被徹底解耦,使不同資源的管理功能位于相應(yīng)的資源側(cè),彼此之間通過消息傳遞的方式進(jìn)行通信和協(xié)作,真正實現(xiàn)所有資源的高可按需拓展和高彈性使用。
具體來說,“資源去中心化”包含拆分內(nèi)核功能、將管理模塊運行在相應(yīng)資源的控制器上、用網(wǎng)絡(luò)消息代替一致性。
目前來說,“資源去中心化”的具體實現(xiàn)仍處于探究完善階段,如LegoOS,但它的設(shè)計理念對資源解耦數(shù)據(jù)中心的資源管理與使用邏輯設(shè)計有著重要的啟示和參考價值,可充分發(fā)揮資源解耦架構(gòu)下資源的可拓展性和使用彈性。
編輯:黃飛
-
以太網(wǎng)
+關(guān)注
關(guān)注
41文章
5642瀏覽量
176066 -
cpu
+關(guān)注
關(guān)注
68文章
11083瀏覽量
217195 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5232瀏覽量
73545 -
解耦
+關(guān)注
關(guān)注
0文章
42瀏覽量
12091 -
存內(nèi)計算
+關(guān)注
關(guān)注
0文章
33瀏覽量
1521
原文標(biāo)題:數(shù)據(jù)中心解耦架構(gòu)技術(shù)路線(下)
文章出處:【微信號:架構(gòu)師技術(shù)聯(lián)盟,微信公眾號:架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論