99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思正式推出Versal Premium 可提供比當前FPGA高達三倍的吞吐量

半導體動態(tài) ? 來源:芯智訊 ? 作者:浪劍客 ? 2020-03-12 09:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018年10月16日,FPGA大廠賽靈思(Xilinx)在北京的“Xilinx開發(fā)者大會 ”(XDF)上,發(fā)布了全球首款自適應計算加速平臺(ACAP)芯片系列Versal,并發(fā)布了AI Core系列和Prime系列。去年,這兩個系列產(chǎn)品也已經(jīng)成功推向了市場。

今天(3月11日),賽靈思舉行線上發(fā)布會,正式推出了Versal ACAP產(chǎn)品組合的第三大產(chǎn)品系列—— Versal Premium。

賽靈思認為,隨著來自多元化應用和工作負載(比如智能設備、視頻流、物聯(lián)網(wǎng)、企業(yè)等)的數(shù)據(jù)爆炸性增長,這也使得核心網(wǎng)正面臨巨大的壓力。

數(shù)據(jù)顯示,2019年區(qū)域流量容量提升了100倍,帶寬年復合增長率達到了51%。

隨著數(shù)據(jù)的爆炸性增長,對于整個網(wǎng)絡基礎設施提出了更高的要求,這也加速驅(qū)動了網(wǎng)絡轉(zhuǎn)型。而在這個轉(zhuǎn)型過程當中,我們可以看到三個趨勢:

1、下一代核心網(wǎng)絡加速擴展。

根據(jù)ABI Research數(shù)據(jù)顯示,2020年-2024年5G核心網(wǎng)年復合增長率預計為313%。

2、安全已成為網(wǎng)絡運營商最高優(yōu)先級的問題。

ISH Markit的研究顯示,對于網(wǎng)絡運營商來說,過去性能、擴展性、成本一直是運營商主要關注的問題,而現(xiàn)在,安全性已經(jīng)成為了網(wǎng)絡運營商最為關注的問題。

3、隨著數(shù)據(jù)的增長,對于計算能力與帶寬的需求越來越高。

我們可以看到,現(xiàn)在網(wǎng)絡的帶寬的增長非常的迅速,但是,隨著摩爾定律的放緩甚至是趨于消亡,芯片的計算能力越來越跟不上了。根據(jù)賽靈思的估算,2018年之時,服務器端口速度的增長已經(jīng)超過了摩爾定律對于服務器CPU性能所帶來的增長,并且差距正在進一步擴大。

在此背景之下,為了加速運營商的網(wǎng)絡轉(zhuǎn)型,賽靈思推出了Versal Premium ACAP系列產(chǎn)品,其具備了高度集成且功耗優(yōu)化的網(wǎng)絡硬核,是業(yè)界帶寬最高、計算密度最高的自適應平臺。專為在散熱條件和空間受限的環(huán)境下運行最高帶寬網(wǎng)絡,以及需要可擴展、靈活應變應用加速的云提供商而設計。

Versal Premium ACAP系列詳解

我們都知道,2018年賽靈思推出的Versal系列是業(yè)界首款自適應計算加速平臺( ACAP ),是一個功能遠超常規(guī)芯片架構的革命性全新異構計算器件類別。而據(jù)賽靈思介紹,其去年就已經(jīng)向客戶交付的Versal AI Core系列和Versal Prime系列,已經(jīng)獲得了幾百家客戶的采用,反響很好,目前正在加速生產(chǎn)。

而此次賽靈思推出的全新Versal Premium則是Versal Prime系列的升級款版,是針對網(wǎng)絡基礎設施推出的旗艦級產(chǎn)品,采用臺積電7nm工藝制程打造而成,融軟件可編程能力與動態(tài)可配置硬件加速、預制連接和安全功能為一體,為加快產(chǎn)品上市進程提供了強大引擎。

作為 Versal ACAP 的最新產(chǎn)品系列, Versal Premium 系列可提供比當前FPGA高達三倍的吞吐量,且擁有高度集成的軟件/硬件平臺,內(nèi)置了以太網(wǎng)接口、Interlaken和加密引擎,以打造快速、安全的網(wǎng)絡。該系列還提供了當前部署主流 FPGA 兩倍的計算密度,同時還面向持續(xù)擴展的多元化且不斷演進的云工作負載及網(wǎng)絡工作負載,提供了靈活應變的能力。

Versal Prime系列

具體來說,與之前的Versal Prime系列相比,Versal Premium系列在其原有的靈活多變的平臺(集成了Arm應用處理器內(nèi)核和實時處理器內(nèi)核、自適應硬件、DSP引擎、高速片上可編程網(wǎng)絡等等)上,突破性地集成了功耗優(yōu)化的網(wǎng)絡硬核(ASIC),包括:400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、112G PAM4收發(fā)器、帶有DMA的PCIe 5.0、CCIX。

Versal Premium系列

據(jù)賽靈思介紹,Versal Premium系列所提供的網(wǎng)絡IP集成,提供了等效22個16nm FPGA的邏輯密度,極大縮減了開發(fā)者在設計基礎架構與連接上的投入,可以使得開發(fā)者將更多的精力專注于差異化。

同時,這也使得Versal Premium系列能夠超越摩爾定律的局限,實現(xiàn)新一代的帶寬與處理能力,并且能夠顯著降低資本支出與運營成本。

前面提到,Versal Premium系列所集成的一系列功耗優(yōu)化的網(wǎng)絡硬核,提供了等效22個16nm FPGA的邏輯密度,這也意味著Versal Premium系列可以釋放更多的邏輯用于個性化定制。

根據(jù)賽靈思公布的資料顯示,其Virtex UltraScale+ VU9P內(nèi)部的20萬個LUT被用于了控制器、存儲器、PCIe接口等基礎設施(包括4個存儲器、4個控制器和一個PCIe+DMA),而相比之下,Versal Premium系列直接將這些作成了網(wǎng)絡硬核,使得其基礎設施對于內(nèi)部的LUT的消耗為0??梢詭椭蛻艚档彤悩嫵杀?,更好的專注于差異化。

另外,在易用性方面,賽靈思面向各種類型的開發(fā)人員提供了豐富的軟硬件集成平臺,可以讓他們使用自己熟悉的框架和工具來進行開發(fā)。

對于數(shù)據(jù)科學家來說,可以通過TensorFlow、Caffe、PyTorch等同用框架來利用Versal Premium系列;軟件開發(fā)者也可通過賽靈思去年推出的Vitis統(tǒng)一開發(fā)平臺來使用Versal Premium系列;而硬件開發(fā)者則可以通過VIVADO平臺來使用Versal Premium系列。

賽靈思表示,下一代基礎設施需要更大的帶寬密度,且方案受限于現(xiàn)有的外形尺寸、功耗和材料,另外,數(shù)據(jù)中心的占地面積也是有限的。這就要求,下一代的基礎設施需要功耗優(yōu)化的高吞吐量與計算量。

Versal Premium系列所集成的112G PAM4收發(fā)器、400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、帶有DMA的PCIe Gen5&CCIX等硬核IP,不僅能夠提供功能優(yōu)化的高帶寬密度,提供自適應硬件的靈活應變性,還可適合AI和ML,可以幫助客戶系統(tǒng)適應不斷變化的算法和安全威脅。

隨著 5G 網(wǎng)絡投入運營,網(wǎng)絡流量大幅增長,導致現(xiàn)有空間和功耗范圍內(nèi)功耗優(yōu)化吞吐量與計算密度的需求不斷提高。為支持業(yè)界應對這一挑戰(zhàn),Versal Premium 系列提供了高達 9Tb/s 的可擴展、自適應串行帶寬。具體方法是將 112G PAM4 收發(fā)器與集成的網(wǎng)絡功能模塊用于核心網(wǎng)、城域網(wǎng)和數(shù)據(jù)中心互聯(lián)( DCI )基礎設施,將每端口帶寬密度提高兩倍,并降低時延高達 50%。

另外,在當前400G網(wǎng)絡的發(fā)展與部署上,58Gb/s的PAM4收發(fā)器就足以應對,而Versal Premium系列所集成的112Gb/s PAM4收發(fā)器則可在向下兼容的基礎上,同時可面向未來的單通道100G光通信和800G網(wǎng)絡基礎設施的發(fā)展需求。并且可兼容更具挑戰(zhàn)性的銅纜線和基板。

Versal Premium系列的通道化以太網(wǎng)硬核能夠以最小占板空間提供高達5Tb/s的可擴展以太網(wǎng)吞吐量,可適用于下一代核心網(wǎng)400G和800G基礎設施,支持多速率、多標準;支持1.8Tb/s現(xiàn)有的Interlaken協(xié)議下的芯片間的互聯(lián)通信;支持1.6TB/s加密線路速率吞吐量(擁有硬化的400G加密引擎),并支持 AES-GCM-256/128、MACsec 和 IPsec 。

Versal Premium系列是全球邏輯密度最高的7nm可編程邏輯平臺,支持硬件差異化、標準演進以及AI/ML。為開發(fā)者提供了很大的差異化設計且與未來兼容:如帶內(nèi)網(wǎng)絡遙測、vRAN,且適應各種標準與協(xié)議;擁有網(wǎng)絡異常檢測AI:支持入侵檢測、惡意軟件識別,應對新興威脅的自適應AI算法,賽靈思隨機森林算法IP;配置與網(wǎng)絡性能AI:自動檢測與性能瓶頸糾正,自動配置,最大限度延長正常運行時間。

根據(jù)賽靈思提供的數(shù)據(jù)顯示,Versal Premium系列擁有業(yè)界領先的多太比特吞吐量,相比賽靈思Virtex UltraScale+(VU13P)提升了5倍以上。

在能效方面,Versal Premium系列可以低于100瓦的功耗提供單芯片800G DCI(數(shù)據(jù)中心互聯(lián))吞吐量,與前代的Virtex UltraScale+相比,功耗降低了60%。在數(shù)據(jù)中心的應用當中,Versal Premium與前代的FPGA相比,可以提供2倍的帶寬密度,這也意味著,在帶寬相同的情況下,Versal Premium的機柜空間占用只有前代FPGA的一半。

與此同時,Versal Premium系列還支持以嵌入式方式將預制連接與硬核集成到現(xiàn)有云基礎設施中。從基因組學、數(shù)據(jù)分析和視頻轉(zhuǎn)碼,到針對語音和圖像識別的 AI 推斷,Versal Premium 提供了高度集成的云就緒平臺,為多元化的工作負載提供突破性能。

具體到AI性能方面,Versal Premium系列在NeatNet50(224 x 224)圖像分類模型下的性能是英偉達Tesla V100的1.6倍,是英偉達Tesla T4的2.3倍;在Yolov2(608×608)對象檢測模型下,性能分別是英偉達V100和T4的4.6倍和7.7倍;在異常檢測AI方面(隨機森林算法),性能是英特爾Xeon的65倍。

另外,存儲器也是計算加速的一個重要瓶頸。Versal Premium系列不僅擁有1Gb的緊密耦合的存儲器,可以改善性能,降低功耗和延時,同時內(nèi)部還集成了LUTRAM、塊RAM、UltraRAM,以及高速片上網(wǎng)絡、硬化的內(nèi)存控制器,可以提供高達123TB/s的片上存儲器帶寬,分別是英偉達Tesla V100和T4 GPU的9倍和25倍。而將超過123TB/s 的片上存儲器帶寬與可定制存儲器層級相結合,能夠減少數(shù)據(jù)移動從而消除相應的關鍵瓶頸。

賽靈思表示,Versal Premium ACAP解鎖了GPU無法企及的性能。

產(chǎn)品與供貨

賽靈思Versal Premium系列提供了7款產(chǎn)品,系統(tǒng)邏輯單元從最小160萬個到最高740萬個;自適應引擎LUT數(shù)量從最低72萬個到最高340萬個。

據(jù)介紹,Versal Premium 系列將于 2021 年上半年開始為早期用戶提供樣品。目前已提供文檔,客戶可立即使用 Versal Prime 評估套件開始原型設計。Versal Prime 器件與 Versal Premium 器件擁有眾多相同的架構模塊,支持引腳遷移至 Versal Premium。

責任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22048

    瀏覽量

    618326
  • 賽靈思
    +關注

    關注

    33

    文章

    1797

    瀏覽量

    132346
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    數(shù)據(jù)吞吐量提升!面向下一代音頻設備,藍牙HDT、星閃、Wi-Fi、UWB同臺競技

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)音頻設備數(shù)據(jù)吞吐量的提升是當前無線通信領域的一個重要發(fā)展趨勢,藍牙、Wi-Fi和UWB作為種主要的無線通信技術,在這一趨勢中扮演著關鍵角色。 ? 數(shù)據(jù)吞吐量
    的頭像 發(fā)表于 12-25 01:22 ?3220次閱讀

    CY7C65211 作為 SPI 從機模式工作時每秒的最大吞吐量是多少?

    CY7C65211 作為 SPI 從機模式工作時每秒的最大吞吐量是多少? 有實際的測試數(shù)據(jù)嗎?
    發(fā)表于 05-27 07:38

    如何在Visual Studio 2022中運行FX3吞吐量基準測試工具?

    我正在嘗試運行 John Hyde 的書“SuperSpeed by Design”中的 FX3 吞吐量基準測試工具。 但是,我面臨一些困難,希望得到任何指導。 具體來說,我正在使用 Visual
    發(fā)表于 05-13 08:05

    第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    第二代 AMD Versal Premium 系列自適應 SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用需求
    的頭像 發(fā)表于 04-24 14:52 ?502次閱讀
    第二代AMD <b class='flag-5'>Versal</b> <b class='flag-5'>Premium</b>系列SoC滿足各種CXL應用需求

    高通吞吐量超高精度加工

    是一款工業(yè)超短脈沖 (USP) 激光器,可提供高功率 (100 W) 綠光輸出和始終如一的光束質(zhì)量組合。因此它能夠支持需要高吞吐量的要求嚴格的高精度材料加工應用。 高通量太陽能電池劃片
    的頭像 發(fā)表于 02-19 06:21 ?342次閱讀
    高通<b class='flag-5'>吞吐量</b>超高精度加工

    低溫失效的原因,有沒有別的方法或者一些見解?

    低溫失效的原因,有沒有別的方法或者一些見解。就是芯片工作溫度在100°--40°區(qū)間,然后呢我們到了0°以下就不工作了,然后在低溫的情況下監(jiān)測了電流和電壓都正常,頻率也都正常,頻率不是F
    發(fā)表于 12-30 16:28

    ADC芯片的采樣率為100MSPS,位寬16位,那么吞吐量是多少?

    例如ADC芯片的采樣率為100MSPS,位寬16位,那么吞吐量是多少? 用差分LVDS和FPGA相連,FPGA的時鐘速率多少能夠滿足要求/?
    發(fā)表于 12-18 08:49

    AMD推出Versal Premium Series Gen 2,這是業(yè)界第一個支持CXL 3.1和PCIe Gen6的FPGA平臺。

    AMD推出Versal Premium Series Gen 2,這是業(yè)界第一個支持CXL 3.1和PCIe Gen6的FPGA平臺。 ? AMD為數(shù)據(jù)中心、航空航天、通信和T M市
    的頭像 發(fā)表于 11-21 15:59 ?1286次閱讀
    AMD<b class='flag-5'>推出</b>了<b class='flag-5'>Versal</b> <b class='flag-5'>Premium</b> Series Gen 2,這是業(yè)界第一個支持CXL 3.1和PCIe Gen6的<b class='flag-5'>FPGA</b>平臺。

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應 SoC 平臺旨在面向各種工作負載提供最高水平系統(tǒng)加速。第二代
    的頭像 發(fā)表于 11-13 09:27 ?913次閱讀

    TMS320VC5510 HPI吞吐量和優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5510 HPI吞吐量和優(yōu)化.pdf》資料免費下載
    發(fā)表于 10-16 09:35 ?0次下載
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和優(yōu)化

    TMS320C6474模塊吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474模塊吞吐量.pdf》資料免費下載
    發(fā)表于 10-15 13:52 ?0次下載
    TMS320C6474模塊<b class='flag-5'>吞吐量</b>

    TMS320C6474通用總線架構(CBA)吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474通用總線架構(CBA)吞吐量.pdf》資料免費下載
    發(fā)表于 10-15 10:29 ?0次下載
    TMS320C6474通用總線架構(CBA)<b class='flag-5'>吞吐量</b>

    TMS320DM36x SoC架構和吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320DM36x SoC架構和吞吐量.pdf》資料免費下載
    發(fā)表于 10-14 10:51 ?0次下載
    TMS320DM36x SoC架構和<b class='flag-5'>吞吐量</b>

    TMS320C6472/TMS320TCI6486的吞吐量應用程序報告

    電子發(fā)燒友網(wǎng)站提供《TMS320C6472/TMS320TCI6486的吞吐量應用程序報告.pdf》資料免費下載
    發(fā)表于 10-14 09:27 ?0次下載
    TMS320C6472/TMS320TCI6486的<b class='flag-5'>吞吐量</b>應用程序報告

    求助,關于使用iperf測量mesh節(jié)點吞吐量問題求解

    我把esp-mesh-lite的no-route例程和iperf例程合在一起,想測試兩個mesh節(jié)點間tcp通信的吞吐量,實際過程中一開始流量正常,數(shù)秒后客戶端發(fā)數(shù)據(jù)這邊monitor卡死沒有任何
    發(fā)表于 07-23 06:59