99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Corundum架構(gòu)的100G RDMA網(wǎng)卡設(shè)計(jì)

FPGA技術(shù)江湖 ? 來源: 網(wǎng)絡(luò)交換FPGA ? 2023-10-24 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

三年前的2020年5月12日,我們分享了一篇有關(guān)100G開源網(wǎng)卡的文章《【干貨】尋找開源100G NIC Corundum中的隱藏BUG等。大概兩年前,我們決定基于開源的Corundum架構(gòu)研制100G RDMA網(wǎng)卡,終于目前有了穩(wěn)定的一版,以下是詳細(xì)介紹,歡迎大家留言討論指導(dǎo)。

傳統(tǒng)TCP/IP技術(shù)處理數(shù)據(jù)包需通過操作系統(tǒng)和其他軟件層,導(dǎo)致數(shù)據(jù)在系統(tǒng)內(nèi)存、處理器緩存和網(wǎng)絡(luò)控制器緩存間頻繁復(fù)制,增加了服務(wù)器CPU和內(nèi)存的負(fù)擔(dān),特別是在網(wǎng)絡(luò)帶寬、處理器速度與內(nèi)存帶寬不匹配時(shí),網(wǎng)絡(luò)延遲會進(jìn)一步加劇。RDMA技術(shù)通過將數(shù)據(jù)處理從CPU旁路并卸載到硬件上來實(shí)現(xiàn)低時(shí)延和高帶寬特性。

基于這一研究背景,介紹一種具備RDMA功能的FPGA網(wǎng)卡實(shí)現(xiàn)方案—RNIC 。本方案以Corundum開源高性能原型平臺為基礎(chǔ), 實(shí)現(xiàn)了100Gbps的RoCE v2網(wǎng)絡(luò)協(xié)議棧卸載加速;在保留Corundum原生PCIe DMA引擎等組件的基礎(chǔ)上,通過精準(zhǔn)的拆分設(shè)計(jì)、邏輯耦合和路徑復(fù)用,將RoCE v2網(wǎng)絡(luò)協(xié)議棧嵌入以太網(wǎng)網(wǎng)卡設(shè)計(jì)。方案支持單邊RDMA READ和RDMA WRITE操作、雙邊SEND/RECV操作以及立即數(shù)操作,提供Back-to-N的重傳機(jī)制保障數(shù)據(jù)傳輸完整性的同時(shí)提供了可達(dá)256的Outstanding能力, 并支持基于DCQCN算法的擁塞控制機(jī)制為本方案在數(shù)據(jù)中心等場景的大規(guī)模部署提供保障。實(shí)測RNIC能夠?qū)崿F(xiàn)低至4us左右的硬件端到端延遲以及高達(dá)96Gbps的吞吐量。

83410e0a-7216-11ee-939d-92fbcf53809c.png

834ca3a0-7216-11ee-939d-92fbcf53809c.png

我們實(shí)現(xiàn)的100G RDMA網(wǎng)卡具體指標(biāo)和性能如下:

83637c24-7216-11ee-939d-92fbcf53809c.png

836fcace-7216-11ee-939d-92fbcf53809c.png

測試場景及拓?fù)溥B接圖如下。

8380fb78-7216-11ee-939d-92fbcf53809c.png

8397cd6c-7216-11ee-939d-92fbcf53809c.png

TCP測試結(jié)果如下。

83a3340e-7216-11ee-939d-92fbcf53809c.png

TCP性能表現(xiàn):實(shí)測在Linux系統(tǒng)環(huán)境下,端到端連接拓?fù)?,?dāng)MTU=9214B,不進(jìn)行多核優(yōu)化時(shí),本方案的iperf TCP帶寬可達(dá)59.7G bps;CPU占用率為12%左右 ; TCP/IP協(xié)議普遍延遲在100–200微秒之間。

TCP測試分析:性能開銷集中在內(nèi)核協(xié)議棧的系統(tǒng)調(diào)用、內(nèi)存拷貝、協(xié)議處理與中斷處理等方面。這些開銷占用了大量的CPU 資源,增加了數(shù)據(jù)延遲。

RDMA測試結(jié)果如下。

83adad94-7216-11ee-939d-92fbcf53809c.png

83b4cc5a-7216-11ee-939d-92fbcf53809c.png

RDMA性能表現(xiàn):在Linux系統(tǒng)環(huán)境下,相同測試拓?fù)洌褂门涮昨?qū)動(dòng)程序和應(yīng)用程序發(fā)送RDMA命令進(jìn)行測試。本方案的RDMA網(wǎng)卡實(shí)測單邊RDMA語義讀寫帶寬可達(dá)96.28G bps;CPU占用率不超過0.3%;硬件端到端讀寫延遲低至4us左右。

RDMA測試分析:當(dāng)消息大小大于8KB時(shí),系統(tǒng)吞吐量可以逼近滿帶寬,當(dāng)消息較小時(shí),吞吐量會顯著降低。原因一方面是數(shù)據(jù)幀幀頭開銷占比上升導(dǎo)致有效帶寬下降,另一方面在于硬件設(shè)計(jì)無法支撐更高的消息速率。時(shí)延會隨消息大小出現(xiàn)近似線性的增長,最大的延遲花費(fèi)在PCIe鏈路和網(wǎng)絡(luò)鏈路上,硬件的處理開銷占比很小。

對比以太網(wǎng)和RDMA的測試結(jié)果可知,在相同的硬件條件下,使用RDMA技術(shù)的網(wǎng)卡可以擁有更高的網(wǎng)絡(luò)帶寬和更低的傳輸時(shí)延,對于云服務(wù)、數(shù)據(jù)中心等具有高吞吐量的網(wǎng)絡(luò)業(yè)務(wù)需求場景,RDMA技術(shù)更能滿足實(shí)際需要,能充分解放處理器資源,提高帶寬,降低成本。

下面視頻詳細(xì)介紹實(shí)際測試情況:

我們未來有很多工作要做,如添加我們之前做的P4可編程的工作(【Verilog開源】一種用于智能網(wǎng)卡或可編程交換機(jī)的,支持P4語言的高性能開源解析器的設(shè)計(jì)),突破Corundum架構(gòu)限制支持百萬QP對和提升小包性能,進(jìn)一步優(yōu)化流量控制、擁塞管理和負(fù)載均衡等問題,進(jìn)一步的提高數(shù)據(jù)中心網(wǎng)絡(luò)的數(shù)據(jù)傳輸速率和穩(wěn)定性。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3123

    瀏覽量

    75253
  • 網(wǎng)卡
    +關(guān)注

    關(guān)注

    4

    文章

    326

    瀏覽量

    28069
  • Verilog
    +關(guān)注

    關(guān)注

    29

    文章

    1367

    瀏覽量

    112260
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3680

    瀏覽量

    43818
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    85

    瀏覽量

    9290

原文標(biāo)題:基于Corundum架構(gòu)的100G RDMA網(wǎng)卡

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    解密100G QSFP28光模塊種類、解決方案

    是:一定碼率的光信號輸入模塊后由光探測二極管轉(zhuǎn)換為電信號。經(jīng)前置放大器后輸出相應(yīng)碼率的電信號。100G QSFP28光模塊的應(yīng)用 光模塊廣泛運(yùn)用于交換機(jī),路由器,服務(wù)器網(wǎng)卡等設(shè)備上。 100G
    發(fā)表于 12-27 14:25

    100G光模塊專題:100G光模塊概述、優(yōu)點(diǎn)和應(yīng)用

    `用戶對數(shù)據(jù)傳輸需求的增長,意味著光通訊供應(yīng)商不能只停留在25G、40G這些數(shù)據(jù)傳輸階段。近兩年來,由于光學(xué)行業(yè)以“100G網(wǎng)絡(luò)部署”為中心進(jìn)行發(fā)展,100G光模塊在數(shù)據(jù)中心市場上得以
    發(fā)表于 01-30 14:10

    什么是100G光模塊?介紹:100G光模塊標(biāo)準(zhǔn)、參數(shù)、優(yōu)勢

    `100G光模塊的應(yīng)用,光通信、數(shù)據(jù)中心的發(fā)展,兩者的結(jié)合使得光傳輸?shù)玫搅藰O大的提升。但是,什么是100G光模塊?100G光模塊有什么標(biāo)準(zhǔn)?有哪些參數(shù)?相比其他類型的光模塊有哪些優(yōu)勢?再有10
    發(fā)表于 03-09 15:37

    100G AOC有源光纜和100G高速線纜有什么區(qū)別?

    `我們知道,100G有源光纜AOC和100G高速線纜都有著傳輸數(shù)據(jù)的作用。但是,100G AOC有源光纜和100G高速線纜之間又存在著一定的區(qū)別。易飛揚(yáng)通信將在這里為大家詳細(xì)介紹一下
    發(fā)表于 03-19 14:50

    什么是100G SR4光模塊?100G SR4有哪些特性、優(yōu)點(diǎn)和應(yīng)用?

    `光通信市場的快速發(fā)展,因用戶需求和市場的缺口,高速率光模塊在不斷誕生。從低速10G到現(xiàn)在的100G/200G也不過是短短幾年的時(shí)間。但是,在大家的目光都聚焦在200G甚至400
    發(fā)表于 05-23 14:53

    數(shù)據(jù)中心100G QSFP28光模塊優(yōu)勢

    6W到24W之間。由此看來,QSFP28光模塊要比其他100G光模塊的功耗要低得多。成本現(xiàn)在的數(shù)據(jù)中心主要是10G網(wǎng)絡(luò)架構(gòu),其互連解決方案主要是10G-SR光模塊和雙工LC多模光纖跳線
    發(fā)表于 07-06 14:37

    如何實(shí)現(xiàn)100G光傳送網(wǎng)?

    供應(yīng)商、企業(yè)以及服務(wù)提供商認(rèn)為100G系統(tǒng)最終會在市場上得到真正實(shí)施。推動(dòng)其實(shí)施的主要力量是用戶持續(xù)不斷的寬帶需求。各種標(biāo)準(zhǔn)組織正在制定傳送網(wǎng)和以太網(wǎng)以及光接口100G標(biāo)準(zhǔn)。對于希望在標(biāo)準(zhǔn)發(fā)布之前,先期設(shè)計(jì)100G系統(tǒng)的開發(fā)人員
    發(fā)表于 11-07 07:25

    光通信主流100G光模塊淺析

    ,多個(gè)光通信國際標(biāo)準(zhǔn)組織積極制定100G相關(guān)標(biāo)準(zhǔn),涵蓋100G以太網(wǎng)接口、光器件、光模塊、OTN 成幀、系統(tǒng)架構(gòu)等領(lǐng)域。IEEE 802.3ba涵蓋40/100G 以太網(wǎng)接口標(biāo)準(zhǔn),并于
    發(fā)表于 12-06 14:27

    普通電腦換上Xilinx Alveo U50 100G網(wǎng)卡傳文件會有多快

    高性能數(shù)據(jù)中心的網(wǎng)絡(luò)演進(jìn)趨勢開源100Gbps NIC(Corundum架構(gòu)簡介基于流水線的隊(duì)列管理基于Xilinx Alevo U50和VCU118 板卡的測試
    發(fā)表于 01-28 07:14

    如何選擇最適合自己的RDMA網(wǎng)卡

    近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場上刮起一股旋風(fēng),特別是阿里、騰訊、浪潮、超微、聯(lián)想等一些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA網(wǎng)卡。2019年,據(jù)官方數(shù)據(jù)報(bào)道,天
    發(fā)表于 10-21 15:35 ?940次閱讀

    開源100 Gbps NIC Corundum環(huán)境的搭建

    Corundum是一個(gè)基于FPGA的開源原型平臺,用于高達(dá)100Gbps及更高的網(wǎng)絡(luò)接口開發(fā)。Corundum平臺包括一些用于實(shí)現(xiàn)實(shí)時(shí),高線速操作的核心功能,包括:高性能數(shù)據(jù)路徑,10G
    的頭像 發(fā)表于 08-02 08:03 ?2438次閱讀
    開源<b class='flag-5'>100</b> Gbps NIC <b class='flag-5'>Corundum</b>環(huán)境的搭建

    100G DSFP網(wǎng)卡+100G DSFP AOC解決方案

    基于數(shù)據(jù)中心高吞吐和大帶寬的發(fā)展趨勢,服務(wù)器網(wǎng)卡和接入交換機(jī)都在往下一代100G接口演進(jìn)。下一代100G接口與現(xiàn)階段大規(guī)模使用的QSFP28接口最直接的區(qū)別在尺寸上,下一代100G接口
    的頭像 發(fā)表于 09-14 17:08 ?2870次閱讀
    <b class='flag-5'>100G</b> DSFP<b class='flag-5'>網(wǎng)卡</b>+<b class='flag-5'>100G</b> DSFP AOC解決方案

    什么是100G QSFP28單波光模塊

    目前流行的100G光學(xué)標(biāo)準(zhǔn),如100G SR4、100G LR4、100G CWDM4、100G PSM4、
    的頭像 發(fā)表于 09-16 10:54 ?3106次閱讀
    什么是<b class='flag-5'>100G</b> QSFP28單波光模塊

    25G/100G網(wǎng)卡選購指南

    升級成為了發(fā)展的必然趨勢。盡管目前10G和40G還占據(jù)著大部分的以太網(wǎng)端口市場,但未來對25G100G的需求將會比以往任何時(shí)候都要強(qiáng)烈,因?yàn)楦邘挷豢煞裾J(rèn)地正推動(dòng)著數(shù)據(jù)中心朝著更高擴(kuò)
    的頭像 發(fā)表于 09-26 15:01 ?2894次閱讀
    25<b class='flag-5'>G</b>/<b class='flag-5'>100G</b><b class='flag-5'>網(wǎng)卡</b>選購指南

    尋找開源100G NIC Corundum中的隱藏BUG

    Corundum是一個(gè)基于FPGA的開源NIC原型平臺,用于高達(dá)100Gbps及更高的網(wǎng)絡(luò)接口開發(fā)。
    發(fā)表于 05-23 14:57 ?1968次閱讀
    尋找開源<b class='flag-5'>100G</b> NIC <b class='flag-5'>Corundum</b>中的隱藏BUG