相較于結(jié)合了運(yùn)算單元與網(wǎng)絡(luò)卡的「智能網(wǎng)絡(luò)卡」,結(jié)合了運(yùn)算單元,以及快閃儲存裝置的「智能型SSD(Intelligent SSD)」,歷史相對短了許多,是這4、5年才成熟的新型加速運(yùn)算裝置。
智能型SSD的正式稱呼是「運(yùn)算型儲存(Computational Storage)」,顧名思義,是一種擁有運(yùn)算能力的儲存裝置,基本概念與智能網(wǎng)絡(luò)卡相似,都是透過裝置上內(nèi)含的嵌入式處理器,幫助卸除服務(wù)器CPU的運(yùn)算負(fù)擔(dān),藉此釋放出更多CPU資源給應(yīng)用程序,進(jìn)而提高資源利用率與整體效能。
但比起由網(wǎng)絡(luò)卡延伸發(fā)展的智能網(wǎng)絡(luò)卡,基于SSD的智能型SSD,針對的應(yīng)用型態(tài)與廠商生態(tài),也有所差異。
智能型SSD的應(yīng)用要求,是「就近」處理自身儲存的數(shù)據(jù),從而「在儲存裝置上同時完成運(yùn)算與儲存」,如此一來,便無須耗費(fèi)CPU周期、經(jīng)由PCIe總線將數(shù)據(jù)從后端儲存裝置讀取到內(nèi)存中進(jìn)行運(yùn)算,減少了數(shù)據(jù)傳輸與移動的需求,達(dá)到加快處理速度、減少延遲的目標(biāo)。
標(biāo)準(zhǔn)化的努力
相對于主要由網(wǎng)絡(luò)卡廠商推動的智能網(wǎng)絡(luò)卡,智能型SSD理所當(dāng)然是由儲存廠商主導(dǎo),不過比起自行其是的智能網(wǎng)絡(luò)卡廠商們,在智能型SSD領(lǐng)域,則有標(biāo)準(zhǔn)化組織領(lǐng)導(dǎo)發(fā)展共通標(biāo)準(zhǔn)。
為避免生態(tài)系分裂為互不兼容的產(chǎn)品,儲存網(wǎng)絡(luò)工業(yè)協(xié)會(SNIA)成立了運(yùn)算型儲存技術(shù)工作小組(Technical Work Group),正在制定標(biāo)準(zhǔn),并發(fā)展一套通用程序編撰模型,最終目標(biāo)是運(yùn)算型儲存應(yīng)用的通用化,讓客戶端的應(yīng)用程序,能透過標(biāo)準(zhǔn)化的界面,發(fā)現(xiàn)與使用連接到服務(wù)器主機(jī)上的任何運(yùn)算型儲存設(shè)備資源。
SNIA目前將運(yùn)算型儲存設(shè)備,分成3個層級:
●運(yùn)算型儲存處理器(Computational Storage Processor,CSP):指運(yùn)算引擎,不包含儲存裝置。
●運(yùn)算型儲存裝置(Computational Storage Drive,CSD):結(jié)合了運(yùn)算引擎與儲存單元而成。
●運(yùn)算型儲存數(shù)組(Computational Storage Array,CSA):由多組運(yùn)算引擎與儲存裝置,加上數(shù)組控制器組成的設(shè)備。
在SNIA框架下,列出了一系列可由運(yùn)算型儲存設(shè)備執(zhí)行的功能列表,并區(qū)分了兩種產(chǎn)品:
●固定用途(Fixed Purpose)運(yùn)算型儲存:提供定義明確的運(yùn)算型儲存服務(wù),如壓縮、erasure coding、加密等。
●通用(General Purpose)運(yùn)算型儲存:提供可程序化的運(yùn)算型儲存服務(wù),執(zhí)行客制化的運(yùn)算功能。
新創(chuàng)廠商引領(lǐng)產(chǎn)品發(fā)展
不同于大廠林立的智能網(wǎng)絡(luò)卡領(lǐng)域,在智能型SSD的領(lǐng)域,目前除了三星以外,其余供貨商如NGD System、ScaleFlux、Eideticom等,大多數(shù)為新創(chuàng)公司。
以產(chǎn)品層級來說,三星、NGD System與ScaleFlux的產(chǎn)品,都屬于運(yùn)算型儲存裝置(CSD),也就是完整的智能型SSD產(chǎn)品,Eideticom與Pliops的產(chǎn)品則屬于運(yùn)算型儲存處理器(CSP),只含運(yùn)算引擎,須另外搭配儲存裝置運(yùn)作。
在產(chǎn)品應(yīng)用用途方面,ScaleFlux、Eideticom與Pliops的產(chǎn)品是以固定運(yùn)算功能為主,如ScaleFlux著重在壓縮,Eideticom能提供壓縮、erasure coding、加密、重復(fù)數(shù)據(jù)刪除與機(jī)器學(xué)習(xí)等功能,Pliops則專門提供數(shù)據(jù)庫KV值作業(yè)加速。至于三星與NGD System,則強(qiáng)調(diào)執(zhí)行客制化程序的多用途能力。
而就最關(guān)鍵的運(yùn)算核心來說,相較于智能網(wǎng)絡(luò)卡領(lǐng)域,呈現(xiàn)多核處理器、FPGA與訂制網(wǎng)絡(luò)處理器三大類型鼎立的局面,智能型SSD目前是以FPGA為主流,多數(shù)產(chǎn)品的運(yùn)算引擎都是基于Xilinx FPGA,但目前出現(xiàn)了朝向Arm多核處理器轉(zhuǎn)型的趨勢。
其中,NGD System已率先完成從FPGA向Arm處理器的轉(zhuǎn)型,他們的前2代產(chǎn)品Catalina-1與Catalina-2,原本都是基于Xilinx FPGA,但新的Newport Platform系列產(chǎn)品,便轉(zhuǎn)換到內(nèi)嵌在該公司專屬ASIC芯片中的Arm處理器。
ScaleFlux也已表明,預(yù)定于今年下半年發(fā)表的下一代產(chǎn)品中,將以基于Arm處理器的運(yùn)算核心,取代目前使用的FPGA,藉此可以降低成本與功耗、提高速度,并提供更多的運(yùn)算功能。
最特別的是Nyriad,其用于搭配自身Nsulate儲存平臺的加速卡,是基于Nvidia GPU,可以提供erasure coding功能,也能用于其他運(yùn)算。
最后,雖然SNIA正在發(fā)展通用的標(biāo)準(zhǔn)化應(yīng)用接口,但是,就目前而言,客戶端還是必須透過各廠商各自提供的開發(fā)工具與API,才能使用智能型SSD的運(yùn)算功能。
智能型SSD vs. 智能網(wǎng)絡(luò)卡:角色與特性的異同
智能型SSD與智能網(wǎng)絡(luò)卡,都是內(nèi)含嵌入式運(yùn)算單元的服務(wù)器加速裝置,目的也同樣是卸除服務(wù)器CPU的運(yùn)算負(fù)擔(dān),但是,盡管基本應(yīng)用概念相同,由于產(chǎn)品的型態(tài)差異,促使兩種裝置存在著一系列關(guān)鍵區(qū)別。
角色與應(yīng)用定位
SSD與網(wǎng)絡(luò)卡這兩種裝置,在服務(wù)器上有著不同位置與角色,因此分別由兩者發(fā)展來的智能型SSD與智能網(wǎng)絡(luò)卡,也各自有著合適的運(yùn)用方式。
網(wǎng)絡(luò)卡位于服務(wù)器I/O最前端、作為數(shù)據(jù)流出入口,所以智能網(wǎng)絡(luò)卡先天適合執(zhí)行針對I/O數(shù)據(jù)流進(jìn)出的實(shí)時處理相關(guān)運(yùn)算,例如網(wǎng)絡(luò)與儲存?zhèn)鬏攨f(xié)議,以及安全控管方面的運(yùn)算卸除。
SSD位于服務(wù)器I/O最末端,是數(shù)據(jù)最終保存之處,因而智能型SSD適合針對已寫入數(shù)據(jù)的相關(guān)運(yùn)算,例如數(shù)據(jù)庫查詢、掃描、AI學(xué)習(xí)、數(shù)據(jù)分析、圖像處理等。
也就是說,合理的運(yùn)用概念,是讓運(yùn)算裝置「就近」處理運(yùn)算工作,盡可能減少數(shù)據(jù)移動。智能網(wǎng)絡(luò)卡位于I/O出入口,適合「就近」處理網(wǎng)絡(luò)傳輸與安全方面的運(yùn)算;智能型SSD位于數(shù)據(jù)保存位置,適合「就近」執(zhí)行儲存數(shù)據(jù)的分析運(yùn)算。反之,若違反「就近運(yùn)算」原則,就會產(chǎn)生數(shù)據(jù)搬移需求,必須耗費(fèi)CPU周期與PCIe傳輸,以致帶來額外延遲。
裝置型式與傳輸信道的差異
比起網(wǎng)絡(luò)卡型式的智能網(wǎng)絡(luò)卡,智能型SSD產(chǎn)品的型態(tài)更為多元,包含常見的2.5吋U.2或M.2規(guī)格SSD,PCIe SSD卡,還有長尺狀的EDSFF規(guī)格,除了PCIe SSD卡是透過PCIe插槽連接主機(jī)外,其余幾種規(guī)格,都是藉由NVMe接口,嫁接到PCIe總線上,但這也形成了傳輸帶寬的相對劣勢。
NVMe目前只達(dá)到PCIe 3.0 x4,而高速網(wǎng)絡(luò)卡是從PCIe3.0 x8起跳,部分還是采用PCIe 3.0 x16或PCIe 4.0 x8,所以,基于NVMe的智能型SSD,與服務(wù)器主機(jī)之間的傳輸帶寬,只有智能網(wǎng)絡(luò)卡的一半或1/4。
但另一方面,比起必須占用PCIe擴(kuò)展槽的智能網(wǎng)絡(luò)卡,透過NVMe磁盤槽部署的智能型SSD,有利于「以量取勝」,獲得相當(dāng)可觀的運(yùn)算能力。如ScaleFlux便聲稱,每臺服務(wù)器可安裝8臺他們的CSS系列智能型SSD,NGD System還測試過在2U服務(wù)器上滿載24臺智能型SSD的機(jī)器學(xué)習(xí)系統(tǒng),遠(yuǎn)超過單一服務(wù)器所能部署的智能網(wǎng)絡(luò)卡數(shù)量。
編輯:黃飛
?
評論