99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Scale out成高性能計(jì)算更優(yōu)解,通用互聯(lián)技術(shù)大有可為

Felix分析 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2024-04-07 00:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)從聊天機(jī)器人程序ChatGPT,到文生視頻大模型Sora,AI大模型的蓬勃發(fā)展背后,為算法模型、高質(zhì)量數(shù)據(jù)、算力基礎(chǔ)設(shè)施帶來(lái)了持續(xù)的挑戰(zhàn)?!爱?dāng)企業(yè)通過(guò)Scale out提升集群規(guī)模,就需要把數(shù)據(jù)中心從微觀到宏觀、點(diǎn)對(duì)點(diǎn)地連接起來(lái),增強(qiáng)各個(gè)層面的互聯(lián)性能,真正有效地應(yīng)用算力資源?!?奇異摩爾創(chuàng)始人兼CEO田陌晨在接受電子發(fā)燒友采訪(fǎng)時(shí)表示。

伴隨著摩爾定律的放緩步伐,通過(guò)Scale up提升單處理器系統(tǒng)的性能和算力遭遇了“流水線(xiàn)過(guò)長(zhǎng),延遲高、布線(xiàn)困難”等重重困境。Scale out作為Scale up的延續(xù),在物理層面引入了規(guī)模性互聯(lián),讓“算力-互聯(lián)”成為算力提升的新型抓手。研究機(jī)構(gòu)IPnest預(yù)測(cè),2025年,“片間互聯(lián)技術(shù)”接口IP市占率有望超過(guò)處理器IP,成為排名第一的IP品類(lèi)。那么,片內(nèi)、片間、網(wǎng)間的互聯(lián)技術(shù)未來(lái)會(huì)呈現(xiàn)何種特點(diǎn)?高性能計(jì)算體系將如何發(fā)展?就這些話(huà)題,我們采訪(fǎng)了互聯(lián)技術(shù)領(lǐng)域代表企業(yè)奇異摩爾CEO田陌晨先生。
片內(nèi)互聯(lián):從專(zhuān)用到通用
理論上,芯??杀灰曌鞴潭K,實(shí)現(xiàn)不同產(chǎn)品、代際的復(fù)用。在智算中心集群發(fā)展中,以互聯(lián)芯粒IO Die為代表的互聯(lián)芯粒在提升良率、降低制造復(fù)雜度和成本等方面所顯示出的優(yōu)勢(shì),已成為行業(yè)發(fā)展共識(shí)。AMD的Zen系列和英特爾Clearwater Forest旗艦級(jí)數(shù)據(jù)中心處理器都是典型案例。
Intel Clearwater Forest 2
田陌晨認(rèn)為,IO Die為代表的片內(nèi)互聯(lián)技術(shù)呈現(xiàn)芯?;?、3D化發(fā)展兩大趨勢(shì)。芯?;菫榱嗽鲞M(jìn)架構(gòu)靈活性,降低芯片對(duì)先進(jìn)工藝的依賴(lài);3D化則是通過(guò)縱向維度進(jìn)一步提升互聯(lián)密度。
目前,市場(chǎng)上的IO Die主要為AMD、英特爾等大廠(chǎng)主導(dǎo),但私有協(xié)議無(wú)法兼容不同來(lái)源的芯粒,專(zhuān)用IO Die的封閉生態(tài)已成為其發(fā)展掣肘。受到巨大的需求推動(dòng),通用IO芯粒開(kāi)始嶄露頭角。以奇異摩爾旗下的通用互聯(lián)芯粒 Kiwi IO Die為例,產(chǎn)品集成了如D2DDDRPCIeCXL等大量存儲(chǔ)、互聯(lián)接口,最高可以支持10+Chiplets,構(gòu)建高達(dá)192 core CPU或1000T GPU的算力平臺(tái)。
奇異摩爾通用互聯(lián)芯粒 Kiwi IO Die
與其同時(shí),受益于先進(jìn)封裝技術(shù)的進(jìn)步,IO Die也出現(xiàn)了2.5D向3D的結(jié)構(gòu)變化。Base Die可視為IO Die的3D形態(tài),允許不同計(jì)算、存儲(chǔ)芯粒的堆疊或并排放,可顯著提升芯片單位面積晶體管的集成度,帶來(lái)更高的帶寬,更低的延遲、功耗。
市場(chǎng)上Base Die的境況與IO Die類(lèi)似,雖然專(zhuān)用產(chǎn)品已在市場(chǎng)上展現(xiàn)了商業(yè)化價(jià)值,但技術(shù)并未擴(kuò)散,而是被少數(shù)頭部企業(yè)壟斷。在奇異摩爾為代表的創(chuàng)新企業(yè)努力下,Base Die通用市場(chǎng)開(kāi)始起步。據(jù)田陌晨介紹,奇異摩爾旗下的通用互聯(lián)底座Kiwi 3D Base Die,在3D高性能通用底座方面屬全球首例,實(shí)現(xiàn)了通用互聯(lián)芯粒在帶寬、能效、搭載芯片數(shù)量等多方面的突破性進(jìn)展,能夠以20%的功耗實(shí)現(xiàn)8倍于2.5D結(jié)構(gòu)的互聯(lián)密度,最高可實(shí)現(xiàn)16顆算力芯粒堆疊。
奇異摩爾通用互聯(lián)底座Kiwi 3D Base Die
IO Die和Base Die只是互聯(lián)技術(shù)的兩個(gè)典型的例子,說(shuō)明片內(nèi)互聯(lián)技術(shù)如何在計(jì)算與存儲(chǔ)之間、在龐大的智算中心和Scaling out 的浪潮中,產(chǎn)生對(duì)計(jì)算能力的更多助力。事實(shí)上,除了片內(nèi)互聯(lián),還有許多種方法可以讓更多的數(shù)據(jù)實(shí)現(xiàn)更高好的連接和更低的成本,比如片間互聯(lián)、網(wǎng)間互聯(lián)技術(shù)的單點(diǎn)到全面突破。
亟待加速的片間互聯(lián):D2D接口
和片內(nèi)互聯(lián)一樣,受益于算力和突飛猛進(jìn)的算力增長(zhǎng)需求,片間互聯(lián)技術(shù)亟需加速?;贑hiplet技術(shù)的Die-to-Die技術(shù)(D2D)帶來(lái)了一種更高效的計(jì)算和內(nèi)存的連接方式,可以看似毫不費(fèi)力的將計(jì)算、存儲(chǔ)芯粒集成在一起,在互聯(lián)層面上形成一個(gè)SoC級(jí)芯片。
相比傳統(tǒng)的計(jì)算芯片和存儲(chǔ)芯片的互聯(lián)方式,D2D提供了更高效、更低延遲的連接方式,是Chiplet實(shí)現(xiàn)的基礎(chǔ),田陌晨介紹。通過(guò)Die間通信,D2D可以實(shí)現(xiàn)更高的傳輸帶寬和更高密度的集成;D2D能有效縮短數(shù)據(jù)傳輸?shù)奈锢砭嚯x,降低延遲,提高處理速度;作為先進(jìn)封裝的基礎(chǔ),D2D可以實(shí)現(xiàn)計(jì)算和存儲(chǔ)單元的無(wú)縫連接,進(jìn)一步提高性能、降低功耗;基于D2D,企業(yè)可以更靈活地實(shí)現(xiàn)計(jì)算和存儲(chǔ)單元的多模組配置,提高系統(tǒng)可擴(kuò)展性、靈活性,降低系統(tǒng)維護(hù)成本。這些優(yōu)勢(shì),使得D2D接口在高性能集群的Scaling out建設(shè)中,發(fā)揮了關(guān)鍵的作用。
和IO Die一樣,D2D也需要通用化的大力推進(jìn)。奇異摩爾基于UCIe標(biāo)準(zhǔn),推出了全球首批支持 UCIe V1.1 的 Die2Die IP,互聯(lián)速度高達(dá)32GT/s,延時(shí)低至數(shù)納秒,全面支持UCIe、CXL、Streaming等主流協(xié)議,即插即用。田陌晨說(shuō),奇異摩爾所有產(chǎn)品都構(gòu)建在國(guó)際標(biāo)準(zhǔn)協(xié)議之上,致力于使各家產(chǎn)品實(shí)現(xiàn)互聯(lián)互通,構(gòu)成一個(gè)開(kāi)放的Chiplet系統(tǒng)。
奇異摩爾高速互聯(lián)接口Kiwi Die2Die IP
RISC-V+Chiplet:1+1>2
如今,Chiplet之外,RISC-V架構(gòu)也在大舉邁進(jìn)高性能計(jì)算。邊緣計(jì)算市場(chǎng),傳統(tǒng)通用型MCU/MPU/CPU已經(jīng)難以滿(mǎn)足不同應(yīng)用場(chǎng)景和性能要求,RISC-V了帶來(lái)更好的PPA實(shí)現(xiàn)。RISC-V的本質(zhì)是一個(gè)開(kāi)放標(biāo)準(zhǔn),沖擊高性能運(yùn)算市場(chǎng)是發(fā)展的必然,而二者(與Chiplet)的融合,被認(rèn)為能為高性能計(jì)算市場(chǎng)開(kāi)辟一場(chǎng)1+1>2的創(chuàng)新動(dòng)力。這也是RISC-V高性能處理器的代表性企業(yè)Ventana與奇異摩爾合作的深層動(dòng)因。
Ventana創(chuàng)始人兼CEO?Balaji?Baktha介紹,兩家企業(yè)聯(lián)手打造了一個(gè)可擴(kuò)展處理器架構(gòu),可將多個(gè)Ventana?Veyron?V2與奇異摩爾的IO?Die組成不同配置的SoC。田陌晨認(rèn)為,V2與奇異摩爾IO?Die的結(jié)合,是RISC-V和Chiplet在高性能計(jì)算領(lǐng)域融合的成功案例。

“RISC-V具備開(kāi)源、開(kāi)放、靈活和高度可定制特性,設(shè)計(jì)了多種用于任務(wù)加速的指令集擴(kuò)展,能實(shí)現(xiàn)向量計(jì)算、加解密等任務(wù)加速,具有較高的計(jì)算性能,且簡(jiǎn)潔特性能降低芯片的功耗。”Balaji說(shuō),“而Chiplet是構(gòu)建下一代半導(dǎo)體產(chǎn)品前進(jìn)戰(zhàn)略的重要組成部分,可以輕松構(gòu)建高性能CPU。其‘可組合性’讓用戶(hù)以最佳比例組合計(jì)算、內(nèi)存和IO,創(chuàng)造一個(gè)在性能、成本效益、工作負(fù)載等各方面都更為高效的系統(tǒng)。將RISC-V的開(kāi)放式架構(gòu)與 Chiplet開(kāi)放式硬件設(shè)計(jì)相結(jié)合,能有效推動(dòng)數(shù)據(jù)中心的工作流程效率,將單插槽性能發(fā)揮到極致?!?/div>
記者了解到,奇異摩爾和Ventana一直在努力將RISC-V和IO Die的組合推向下一代計(jì)算架構(gòu)的前沿,以提高數(shù)據(jù)中心服務(wù)的效率和工作負(fù)載的效率,并共同創(chuàng)建了一款高性能數(shù)據(jù)中心級(jí)RISC-V處理器,其融合了RISC-V 架構(gòu)和模塊化的Chiplet設(shè)計(jì)的優(yōu)勢(shì),每個(gè)V2單元包括32個(gè)核心,最終實(shí)現(xiàn)最高192個(gè)內(nèi)核,這也是全球首例數(shù)據(jù)中心級(jí)的RISC-V Chiplet處理器。
回顧這次和Ventana的合作,田陌晨稱(chēng),從技術(shù)互通性角度看,基于IO Die的互聯(lián),x86、ARM和RISC-V三大架構(gòu)都需要采用大量存儲(chǔ)訪(fǎng)問(wèn)和外部接口,進(jìn)行大量傳輸、讀取及調(diào)度。RISC-V和Chiplet技術(shù)融合進(jìn)一步提升了計(jì)算平臺(tái)的定制特性,可以避免那些對(duì)高性能運(yùn)算有需求的客戶(hù)被鎖定在一個(gè)供應(yīng)商的生態(tài)內(nèi),并助力企業(yè)應(yīng)對(duì)AGI所引發(fā)的架構(gòu)變革挑戰(zhàn),這在x86和ARM的Chiplet設(shè)計(jì)中較難實(shí)現(xiàn)。
當(dāng)然,RISC-V和Chiplet技術(shù)融合,也伴隨著如Die間通信、高性能、特定領(lǐng)域等多重挑戰(zhàn),如,為實(shí)現(xiàn)不同來(lái)源芯粒的通信,兩家公司采取了IO Die中央設(shè)計(jì)連接CPU芯粒的方案,通過(guò)Kiwi Fabric實(shí)現(xiàn)了納秒級(jí)的低延遲和高效的數(shù)據(jù)傳輸。讓整個(gè)SoC在工作流的角度上,呈現(xiàn)獨(dú)立CPU的特質(zhì)。
在性能方面,為達(dá)到現(xiàn)有ISA(x86/ARM)設(shè)定的高性能基準(zhǔn),確保處理器微架構(gòu)可以提供世界一流性能,雙方合作的產(chǎn)品最高可實(shí)現(xiàn)192個(gè)內(nèi)核。同時(shí),通過(guò)一致性互聯(lián),讓所有內(nèi)核共享高性能、高速緩存和內(nèi)存。
在特定領(lǐng)域方面,通過(guò)對(duì)計(jì)算芯粒、內(nèi)存和各種加速器配比的整體規(guī)劃,為各種工作負(fù)載提供靈活的硬件配置選項(xiàng);在CPU中內(nèi)置了端到端的RAS,確保所有總線(xiàn)都受到安全啟動(dòng)驗(yàn)證和級(jí)別驗(yàn)證等保護(hù),同時(shí)克服側(cè)通道攻擊和其他漏洞,確保CPU芯粒和整個(gè)SoC層面的安全。
從計(jì)算加速到網(wǎng)絡(luò)加速
從行業(yè)動(dòng)態(tài)來(lái)看,高性能運(yùn)算從Scale up向Scale out的轉(zhuǎn)變是全方位的,在芯片設(shè)計(jì)、算力卡間、集群間無(wú)不如此。簡(jiǎn)單的說(shuō),Scale out最核心的改變就是互聯(lián)。田陌晨認(rèn)為,在Scale out所引發(fā)的巨量數(shù)據(jù)交互挑戰(zhàn)背后,是加速重點(diǎn)從計(jì)算到網(wǎng)絡(luò)的轉(zhuǎn)變和“Bandwidth, Efficiency, Workload”互聯(lián)三要素的優(yōu)化需求。
在算力集群網(wǎng)絡(luò)傳輸協(xié)議方面,傳統(tǒng)協(xié)議TCP/IP存在CPU負(fù)載重、延遲高等缺點(diǎn),難以滿(mǎn)足高性能計(jì)算對(duì)網(wǎng)絡(luò)吞吐、時(shí)延的苛刻要求。RDMA能直接通過(guò)網(wǎng)絡(luò)接口訪(fǎng)問(wèn)內(nèi)存數(shù)據(jù),無(wú)需操作系統(tǒng)內(nèi)核的介入,讓大規(guī)模并行計(jì)算集群成為可行。計(jì)算機(jī)網(wǎng)絡(luò)協(xié)議棧將從TCP/IP過(guò)渡到RDMA,在網(wǎng)絡(luò)層面上,把一個(gè)集群變成一臺(tái)設(shè)備。
RDMA并未規(guī)定完整的協(xié)議棧,因此包含不同的分支,如英偉達(dá)的Quantum InfiniBand是專(zhuān)門(mén)為RDMA設(shè)計(jì)的一種超低延遲、超高吞吐量的專(zhuān)用網(wǎng)絡(luò)引擎。然而,業(yè)界需要一種更為通用化的解決方案。在性能方面可與InfiniBand匹敵的RoCE顯著降低了RDMA協(xié)議通信成本,被認(rèn)為能夠打破英偉達(dá)在這個(gè)領(lǐng)域的技術(shù)壟斷。
這也是奇異摩爾推出高性能網(wǎng)絡(luò)加速芯粒Kiwi NDSA(Network Domain Specific Accelerator)系列的原因所在。據(jù)介紹,Kiwi NDSA內(nèi)建RoCE V2高性能 RDMA (Remote Direct Memory Access) 和數(shù)十種卸載/加速引擎,可作為獨(dú)立芯粒,實(shí)現(xiàn)系統(tǒng)不同位置的加速。Kiwi NDSA產(chǎn)品系列包括“NDSA-RN-F”和“NDSA-RN”。前者是全球首批200/400G的高性能FPGA RDMA網(wǎng)卡,將在近期面世;后者是全球首款支持800G帶寬的RDMA NIC Chiplet產(chǎn)品,除帶寬升級(jí)到800G之外,延時(shí)也降至納秒級(jí),并支持?jǐn)?shù)十GB的超大規(guī)模數(shù)據(jù)包。
奇異摩爾高性能網(wǎng)絡(luò)加速芯粒Kiwi NDSA
結(jié)語(yǔ)
在高性能計(jì)算體系全方位從Scale up向Scale out轉(zhuǎn)變的背景下,互聯(lián)技術(shù)已成為提升集群算力的新方案。以IO Die為代表的互聯(lián)芯粒正在加速其通用化進(jìn)程和2.5D至3D轉(zhuǎn)變;片間PCIe等傳統(tǒng)傳輸方式正在被低延遲、低功耗的D2D技術(shù)取代;集群互聯(lián)網(wǎng)絡(luò)則從TCP/IP轉(zhuǎn)向RDMA架構(gòu),通用RDMA方案將迎來(lái)更廣闊的機(jī)遇?;ヂ?lián)技術(shù)和RISC-V架構(gòu)的融合,能夠助力企業(yè)更好地應(yīng)對(duì)AGI所引發(fā)的架構(gòu)變革挑戰(zhàn),幫助高性能計(jì)算領(lǐng)域用戶(hù)實(shí)現(xiàn)Scale out。未來(lái),對(duì)幾乎每一家高性能計(jì)算產(chǎn)業(yè)鏈上的企業(yè)來(lái)說(shuō),互聯(lián)都是一個(gè)至關(guān)重要的市場(chǎng)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SCALE
    +關(guān)注

    關(guān)注

    3

    文章

    14

    瀏覽量

    14291
  • 高性能計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    13656
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    459

    瀏覽量

    12997
  • 奇異摩爾
    +關(guān)注

    關(guān)注

    0

    文章

    61

    瀏覽量

    3731
  • 芯粒
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    277
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用樹(shù)莓派構(gòu)建 Slurm 高性能計(jì)算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹(shù)莓派構(gòu)建Slurm高性能計(jì)算集群的經(jīng)歷。一段時(shí)間前,我開(kāi)始使用這個(gè)集群作為測(cè)試平臺(tái),來(lái)創(chuàng)建一個(gè)更大的、支持GPU計(jì)算高性能
    的頭像 發(fā)表于 06-17 16:27 ?500次閱讀
    使用樹(shù)莓派構(gòu)建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>集群:分步指南!

    高性能計(jì)算面臨的芯片挑戰(zhàn)

    高性能計(jì)算(簡(jiǎn)稱(chēng)HPC)聽(tīng)起來(lái)像是科學(xué)家在秘密實(shí)驗(yàn)室里才會(huì)用到的東西,但它實(shí)際上是當(dāng)今世界上最重要的技術(shù)之一。從預(yù)測(cè)天氣到研發(fā)新藥,甚至訓(xùn)練人工智能,高性能
    的頭像 發(fā)表于 05-27 11:08 ?409次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>面臨的芯片挑戰(zhàn)

    輕量化、低功耗,邊緣計(jì)算芯片在儲(chǔ)能中大有可為

    。 ? 在此背景下,邊緣計(jì)算芯片應(yīng)運(yùn)而生。在一些本地化智能決策場(chǎng)景中,例如電網(wǎng)通信中斷的情況,或者在偏遠(yuǎn)地區(qū)(如無(wú)基站覆蓋的儲(chǔ)能電站),邊緣計(jì)算芯片能夠支持離線(xiàn)自主控制(如虛擬同步機(jī)慣量支撐、離網(wǎng)模式切換),確保
    的頭像 發(fā)表于 04-17 00:22 ?2032次閱讀

    AI演進(jìn)的核心哲學(xué):使用通用方法,然后Scale Up!

    ,得到一個(gè)AI發(fā)展的重要?dú)v史教訓(xùn):利用計(jì)算能力的通用方法最終是最有效的,而且優(yōu)勢(shì)明顯”。核心原因是摩爾定律,即單位計(jì)算成本持續(xù)指數(shù)級(jí)下降。大多數(shù) AI 研究假設(shè)可用計(jì)算資源是固定的,所
    的頭像 發(fā)表于 04-09 14:31 ?343次閱讀
    AI演進(jìn)的核心哲學(xué):使用<b class='flag-5'>通用</b>方法,然后<b class='flag-5'>Scale</b> Up!

    核芯互聯(lián)推出高性能任意時(shí)鐘發(fā)生器CLG5908M

    中國(guó)領(lǐng)先的時(shí)鐘解決方案提供商——核芯互聯(lián),正式發(fā)布CLG5908集MEMS硅振蕩器版本CLG5908M。作為國(guó)內(nèi)首顆集成MEMS硅振蕩器的高性能任意時(shí)鐘發(fā)生器,這一全新版本在原有CLG5908
    的頭像 發(fā)表于 03-05 17:17 ?1082次閱讀
    核芯<b class='flag-5'>互聯(lián)</b>推出<b class='flag-5'>高性能</b>任意時(shí)鐘發(fā)生器CLG5908M

    高性能計(jì)算,名副其實(shí)的“算力皇冠”

    和推理的高性能計(jì)算技術(shù)。今天,我們就來(lái)聊一聊高性能計(jì)算計(jì)算機(jī)科學(xué)的“皇冠”初次涉及高性能
    的頭像 發(fā)表于 02-08 14:27 ?859次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>,名副其實(shí)的“算力皇冠”

    解析DeepSeek MoE并行計(jì)算優(yōu)化策略

    本期Kiwi Talks將從集群Scale Up互聯(lián)的需求出發(fā),解析DeepSeek在張量并行及MoE專(zhuān)家并行方面采用的優(yōu)化策略。DeepSeek大模型的工程優(yōu)化以及國(guó)產(chǎn)AI 產(chǎn)業(yè)鏈的開(kāi)源與快速部署預(yù)示著國(guó)產(chǎn)AI網(wǎng)絡(luò)自主自控將大有可為
    的頭像 發(fā)表于 02-07 09:20 ?1770次閱讀
    解析DeepSeek MoE并行<b class='flag-5'>計(jì)算</b>優(yōu)化策略

    鴻蒙原生頁(yè)面高性能解決方案上線(xiàn)OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應(yīng)用開(kāi)發(fā)熱度高漲,數(shù)量激增。但在三方應(yīng)用鴻蒙化進(jìn)程中,性能問(wèn)題頻出。為此,HarmonyOS NEXT推出了一整套原生頁(yè)面高性能解決方案,包括
    發(fā)表于 01-02 18:00

    芯和半導(dǎo)體:國(guó)產(chǎn)EDA大有可為

    隨著AI、5G、IoT、云計(jì)算技術(shù)和應(yīng)用的不斷發(fā)展,全球半導(dǎo)體行業(yè)正在加速向2030年的萬(wàn)億規(guī)模突進(jìn)。然而,要匹配AI大模型算力增長(zhǎng)的驚人需求,傳統(tǒng)的摩爾定律的路徑已經(jīng)舉步維艱,半導(dǎo)體行業(yè)急需在
    的頭像 發(fā)表于 12-24 11:15 ?697次閱讀

    一文了解AI網(wǎng)絡(luò)互聯(lián)的市場(chǎng)潛力

    購(gòu)以色列公司Mellanox,自此成就了它的暴力美學(xué)。通過(guò)高性能的單個(gè)GPU加速卡,NVLink及NVSwitch打造Scale-up護(hù)城河,同時(shí)還配備用于后端網(wǎng)絡(luò)Scale-out的ConnectX系列
    的頭像 發(fā)表于 11-27 10:08 ?1046次閱讀
    一文了解AI網(wǎng)絡(luò)<b class='flag-5'>互聯(lián)</b>的市場(chǎng)潛力

    低空經(jīng)濟(jì)時(shí)代來(lái)臨,激光技術(shù)如何借東風(fēng)?

    低空經(jīng)濟(jì)新風(fēng)口,依托先進(jìn)航空、通信等技術(shù),引領(lǐng)多領(lǐng)域變革。激光技術(shù)在低空經(jīng)濟(jì)中大有可為,涉及關(guān)鍵零部件、電池制造、導(dǎo)航定位等。多地政府出臺(tái)政策支持,成立產(chǎn)業(yè)基金,激光企業(yè)迎來(lái)新機(jī)遇需
    的頭像 發(fā)表于 11-27 09:38 ?1059次閱讀
    低空經(jīng)濟(jì)時(shí)代來(lái)臨,激光<b class='flag-5'>技術(shù)</b>如何借東風(fēng)?

    AI高性能計(jì)算平臺(tái)是什么

    AI高性能計(jì)算平臺(tái)不僅是AI技術(shù)發(fā)展的基石,更是推動(dòng)AI應(yīng)用落地、加速產(chǎn)業(yè)升級(jí)的重要工具。以下,是對(duì)AI高性能計(jì)算平臺(tái)的介紹,由AI部落小編
    的頭像 發(fā)表于 11-11 09:56 ?705次閱讀

    氫能源車(chē)加速放量,AEM制氫大有可為

    制加氫一體站將是支撐氫能交通發(fā)展的基石,伴隨著站點(diǎn)普及,AEM制氫大有可為!
    的頭像 發(fā)表于 08-27 09:51 ?724次閱讀
    氫能源車(chē)加速放量,AEM制氫<b class='flag-5'>大有可為</b>!

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)

    、VMware、Palo Alto 等公司紛紛推出相關(guān)解決方案。這些方案背后共同的本質(zhì)思想是:將云計(jì)算的 IaaS 層組件從服務(wù)器側(cè)卸載后圍繞 DPU 構(gòu)筑高性能算力底座,與 AWS、阿里云的技術(shù)路線(xiàn)不謀而合
    發(fā)表于 07-24 15:32

    帶你了解什么是高性能計(jì)算(HPC)

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進(jìn)入HPC大周期,高性能計(jì)算的發(fā)展水平已經(jīng)成為衡量一個(gè)國(guó)家綜合實(shí)力和高科技發(fā)展水平的重要標(biāo)志,美國(guó)、歐盟、日本、英國(guó)都高度重視高性能計(jì)算
    的頭像 發(fā)表于 07-20 08:28 ?1329次閱讀
    帶你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>(HPC)