99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

轉(zhuǎn)載 | 高性能計算與AI網(wǎng)絡(luò)大融合,如何重塑網(wǎng)絡(luò)智能時代?

華為數(shù)據(jù)通信 ? 來源:未知 ? 2023-08-31 12:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomTwG_qATWR-AABYb2B4C6Q886.png

近年來,數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)一直在不斷發(fā)展,以滿足日益增長的數(shù)據(jù)處理需求。從最初的傳統(tǒng)結(jié)構(gòu),到軟件定義網(wǎng)絡(luò)(SDN),再到云原生網(wǎng)絡(luò)(CN-NFV),數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)已經(jīng)走過了一個漫長的發(fā)展歷程。AI時代,高性能計算需求正呈現(xiàn)爆發(fā)性增長態(tài)勢,數(shù)據(jù)中心網(wǎng)絡(luò)面臨更為復(fù)雜的挑戰(zhàn),技術(shù)將會有哪些新的變化?是否有合適的解決之道?

wKgaomTwG_uAcCX4AAAAjgjvZ2U503.png

wKgaomTwG_uAZjFuABAUaoSDmqk775.png

華為數(shù)據(jù)通信產(chǎn)品線數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域副總裁 張白

2023年8月23日-25日,全國高性能計算學(xué)術(shù)年會(CCF HPC China 2023)在青島舉辦,CCF HPC China是高性能計算領(lǐng)域全球最具影響力的三大超算盛會之一,有著“中國超算風(fēng)向標”的稱號。本次大會上,華為數(shù)據(jù)通信產(chǎn)品線數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域副總裁張白分享隨著AI時代的到來,高性能計算對網(wǎng)絡(luò)新的訴求,以及如何依靠星河AI網(wǎng)絡(luò)解決方案去解決智能時代網(wǎng)絡(luò)面臨的新的挑戰(zhàn)。

高性能計算需要什么樣的互聯(lián)網(wǎng)絡(luò)?

當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革加速演進,高性能計算正帶領(lǐng)人類從“信息時代”走向“算力時代”。據(jù)中國電子信息產(chǎn)業(yè)發(fā)展研究院發(fā)布的《2022中國數(shù)字經(jīng)濟發(fā)展研究報告》顯示,目前中國算力規(guī)模約占全球的27%,排名第二。我國算力進入高速發(fā)展階段,到2025年總算力規(guī)模將達到300EFlops,同比2020年增長120%。

數(shù)據(jù)的爆炸性增長需要算力去解決,一方面需要更高效的算力結(jié)構(gòu),另一方面需要好的算力網(wǎng)絡(luò)。高性能計算主要關(guān)注如何利用大規(guī)模計算的資源來解決科學(xué)、工程和商業(yè)問題。HPC應(yīng)用程序通常需要使用并行計算,億級、10億級的超算,它的并行計算帶給網(wǎng)絡(luò)非常大的挑戰(zhàn)。比如,并行通信、數(shù)據(jù)同步、大規(guī)模穩(wěn)定運行等。同時,隨著AI人工智能快速發(fā)展,HPC和AI結(jié)合的研究,HPC和AI應(yīng)用程序通常需要處理大量的數(shù)據(jù),并且在計算節(jié)點之間進行數(shù)據(jù)傳輸和存儲,對網(wǎng)絡(luò)的吞吐及負載均衡也提出了新的挑戰(zhàn)。

以當(dāng)前火爆的大模型來說,其對數(shù)據(jù)中心網(wǎng)絡(luò)要求更為苛刻,可以說,大規(guī)模算力環(huán)境下的網(wǎng)絡(luò)問題已成為當(dāng)今數(shù)據(jù)中心所面臨的“緊箍咒”之一。

官網(wǎng)顯示,ChatGPT-4輸入?yún)?shù)已經(jīng)達到萬億,2.5年增長了570倍,1.5萬張A100卡來支撐訓(xùn)練,大量服務(wù)器通過高速網(wǎng)絡(luò)組成算力集群,共同完成訓(xùn)練任務(wù)。但是大規(guī)模不等于大帶寬,AI大模型的訓(xùn)練場景中會存在負載不均衡的情況,而且設(shè)備網(wǎng)絡(luò)規(guī)模越大,傳統(tǒng)負載方式?jīng)_突會越嚴重。類似于要想提高車輛運行速度,在拓寬道路的基礎(chǔ)上,還需要解決堵車的難題。大規(guī)模的網(wǎng)絡(luò)不僅讓業(yè)務(wù)調(diào)優(yōu)復(fù)雜,后期運維也是雪上加霜,無法采用傳統(tǒng)手段運維,據(jù)統(tǒng)計50%的迭代過程會被迫中斷,定位時長平均1天以上。由此可見,AI訓(xùn)練對于網(wǎng)絡(luò)的訴求可以用三個詞來歸納:大規(guī)模,高吞吐,高可靠。

如何釋放高性能計算100%算力?

加大高性能計算供給,必須增加算力網(wǎng)絡(luò)可靠性。自2020年至今,大模型引領(lǐng)AI進入新的發(fā)展階段,但大模型訓(xùn)練是個復(fù)雜的系統(tǒng)工程,網(wǎng)絡(luò)基礎(chǔ)設(shè)施正是長穩(wěn)訓(xùn)練的關(guān)鍵之一。對于用戶來說,其需要投入大量的資金和人才戰(zhàn)略來施行其智能化戰(zhàn)略,要怎樣才能進行數(shù)據(jù)中心的創(chuàng)新,建立其符合未來需求的數(shù)據(jù)中心網(wǎng)絡(luò)呢?

針對當(dāng)前業(yè)界火爆的AI大模型,華為在2023CCF全國高性能計算學(xué)術(shù)年會(CCF HPC China 2023)上帶來星河AI網(wǎng)絡(luò)解決方案,提供“運得多、運得快,運得穩(wěn)”的高運力數(shù)據(jù)中心網(wǎng)絡(luò),為客戶提供大規(guī)模、高吞吐、高可靠的網(wǎng)絡(luò)建設(shè)。

AI場景下對網(wǎng)絡(luò)的第一要求是大規(guī)模,適配萬卡集群是網(wǎng)絡(luò)最基本的要求。華為采用業(yè)界最高密200/400GE交換機,匹配大模型訓(xùn)練基本硬件算力訴求,支持超大帶寬組網(wǎng),支持萬億參數(shù)量,規(guī)模可以達到IB的2-4倍。

網(wǎng)絡(luò)的另一個要求是高吞吐,面對大規(guī)模網(wǎng)絡(luò)采用算網(wǎng)一體化的方式部署,效率可以提升10倍以上。在AI場景中網(wǎng)絡(luò)時延不是關(guān)鍵指標,而網(wǎng)絡(luò)吞吐才是業(yè)務(wù)性能的關(guān)鍵因素,華為獨創(chuàng)AI智能加速器,提高網(wǎng)絡(luò)吞吐,訓(xùn)練效率提升20%。

高可靠同樣是客戶對網(wǎng)絡(luò)的重要要求,華為采用智能化運維的方式來保證訓(xùn)練實時可視分鐘級識別慢主機,保證訓(xùn)練的過程不中斷。通過采用網(wǎng)絡(luò)的控制器,包括網(wǎng)絡(luò)以及計算強強聯(lián)手,實現(xiàn)“算網(wǎng)一體的融合”,最終實現(xiàn)算力網(wǎng)絡(luò)“運得多,運得快,運得穩(wěn)”的目標,從而實現(xiàn)算力100%釋放。

進入AI時代,數(shù)據(jù)中心的使命正在從聚焦業(yè)務(wù)快速發(fā)放向聚焦數(shù)據(jù)高效處理進行轉(zhuǎn)變,計算、存儲、網(wǎng)絡(luò)等這些IT基礎(chǔ)設(shè)施的核心組成部分,正在融入更多的AI元素。企業(yè)如果想要打造未來型數(shù)據(jù)中心,就必須尋找優(yōu)秀的技術(shù)合作伙伴,致力于提供一套更好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。華為星河AI網(wǎng)絡(luò)解決方案通過構(gòu)建支持AI業(yè)務(wù)的網(wǎng)絡(luò),實現(xiàn)從大型模型訓(xùn)練到推理的全過程。目前,華為星河AI網(wǎng)絡(luò)解決方案已在成全球100+企業(yè)部署商用。

如何打造面向未來的AI 網(wǎng)絡(luò)?

到2030年,全球聯(lián)接數(shù)預(yù)計將達到2000億,數(shù)據(jù)中心流量10年增長100倍,IPv6地址滲透率將達到90%,AI算力將增長500倍。當(dāng)前及未來的數(shù)據(jù)中心將如何應(yīng)對這些趨勢和發(fā)展要求?這就需要構(gòu)建一個立體超寬、滿足確定性時延的智能原生AI網(wǎng)絡(luò)。在華為看來,AI網(wǎng)絡(luò)的所有技術(shù)手段,都需要以業(yè)務(wù)為本,核心指標就是減少模型的訓(xùn)練時間。

首先,大模型需要規(guī)模算力,需要非常大的GPU集群。而把大規(guī)模的GPU集群連起來,需要大規(guī)模的網(wǎng)絡(luò)。對于數(shù)據(jù)中心網(wǎng)絡(luò)而言,大規(guī)模網(wǎng)絡(luò)本身不是問題,更重要的是要考量建網(wǎng)的成本。華為主張采用大容量的交換設(shè)備組網(wǎng)降低網(wǎng)絡(luò)的層次,由原來的三層合適組網(wǎng)變成兩層寬河組網(wǎng),從而來降低組網(wǎng)的成本。

其次,大規(guī)模的集群只是把AI物理服務(wù)器物理上連接在一起,要發(fā)揮效果還需要釋放集群算力。網(wǎng)絡(luò)在提高集群的加速比上需要發(fā)揮更加關(guān)鍵的作用。

最后,AI訓(xùn)練的本質(zhì)是并行計算,有典型的木桶效應(yīng),水桶的盛水量是由幾塊木板中最短的一塊決定的。一個環(huán)節(jié)出問題,會拉慢整個系統(tǒng)甚至讓整個系統(tǒng)癱瘓。網(wǎng)絡(luò)需要盡可能多的保障服務(wù)器之間的連通性,對網(wǎng)絡(luò)的高可靠需求更高。未來網(wǎng)絡(luò)要提高集群的整體可用性,做到在99%的情況下都不會因為網(wǎng)絡(luò)導(dǎo)致訓(xùn)練中斷。

在過去20年,網(wǎng)絡(luò)技術(shù)獲得了長足發(fā)展——2000年開始的ALL IP技術(shù)推動了互聯(lián)網(wǎng)的大規(guī)模應(yīng)用,2010年開始的All Cloud技術(shù)驅(qū)動了企業(yè)IT基礎(chǔ)設(shè)施的大規(guī)模云化。而今天,AI浪潮正撲面而來,持續(xù)演進的AI對網(wǎng)絡(luò)的需求將會處于指數(shù)級增長的態(tài)勢,網(wǎng)絡(luò)也需要全面擁抱人工智能時代。在這個過程中,華為將繼續(xù)攜手伙伴開放合作與持續(xù)創(chuàng)新,在算力領(lǐng)域的發(fā)展和應(yīng)用中作出更大的貢獻。

wKgaomTwG_yANRmPAAEQIydIJUA826.png

wKgaomTwG_yANHPHAABH79rerUY833.gif 點擊“閱讀原文”,了解更多華為數(shù)據(jù)通信資訊!


原文標題:轉(zhuǎn)載 | 高性能計算與AI網(wǎng)絡(luò)大融合,如何重塑網(wǎng)絡(luò)智能時代?

文章出處:【微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    35212

    瀏覽量

    255935

原文標題:轉(zhuǎn)載 | 高性能計算與AI網(wǎng)絡(luò)大融合,如何重塑網(wǎng)絡(luò)智能時代?

文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了
    發(fā)表于 07-16 15:29

    高性能計算集群在AI領(lǐng)域的應(yīng)用前景

    隨著人工智能技術(shù)的飛速發(fā)展,高性能計算集群(HPC)在AI領(lǐng)域的應(yīng)用前景日益受到關(guān)注。HPC提供的計算能力與
    的頭像 發(fā)表于 06-23 13:07 ?440次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群在<b class='flag-5'>AI</b>領(lǐng)域的應(yīng)用前景

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡(luò)處理器 NPU, Android 14.0/
    發(fā)表于 04-23 10:55

    6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界

    在萬物互聯(lián)的時代背景下,邊緣計算與8K顯示的融合需求日益迫切。傳統(tǒng)的云端處理模式在面對8K超高清視頻數(shù)據(jù)時,常常出現(xiàn)延遲高、帶寬壓力大等問題,而邊緣計算設(shè)備由于算力有限,難以支撐8K視
    發(fā)表于 04-18 15:32

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    數(shù)據(jù)中心依賴數(shù)千甚至上萬個GPU集群進行高性能計算,對帶寬、延遲和數(shù)據(jù)交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環(huán)境提供推理服務(wù)。這類數(shù)據(jù)中心要求
    發(fā)表于 03-25 17:35

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    的發(fā)展,加速創(chuàng)新和降低成本。 總之,F(xiàn)PGA與AI的結(jié)合正在重塑芯片生態(tài),推動技術(shù)融合、應(yīng)用拓展和產(chǎn)業(yè)變革。未來,F(xiàn)PGA將在AI加速、邊緣計算
    發(fā)表于 03-03 11:21

    華為5G-A智能核心網(wǎng)助力運營商加速網(wǎng)絡(luò)商業(yè)變現(xiàn)

    5G-A與AI技術(shù)的融合,不僅拉開了移動AI時代的序幕,更標志著通信網(wǎng)絡(luò)加速邁向智能世界邁進的里
    的頭像 發(fā)表于 02-25 16:11 ?1197次閱讀

    AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍海

    功耗的AI邊緣計算平臺;對于算法企業(yè),要研發(fā)更輕量化、更精準的邊緣AI模型;對于系統(tǒng)集成商,則要構(gòu)建完整的邊緣智能解決方案。這個萬億級的新市場,正在等待更多創(chuàng)新者的加入。 在這場
    發(fā)表于 02-15 11:41

    高性能計算,名副其實的“算力皇冠”

    近年來,從金融到汽車、從教育到醫(yī)療,人工智能技術(shù),特別是以ChatGPT為代表的生成式人工智能,正在給整個世界帶來顛覆性體驗。在如今這個“人工智能時代”,人工
    的頭像 發(fā)表于 02-08 14:27 ?865次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>,名副其實的“算力皇冠”

    中國信通院栗蔚:云計算AI加速融合,如何開啟智算時代新紀元?

    中國信通院栗蔚:云計算AI加速融合,如何開啟智算時代新紀元?
    的頭像 發(fā)表于 01-17 18:48 ?992次閱讀
    中國信通院栗蔚:云<b class='flag-5'>計算</b>與<b class='flag-5'>AI</b>加速<b class='flag-5'>融合</b>,如何開啟智算<b class='flag-5'>時代</b>新紀元?

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI
    的頭像 發(fā)表于 11-11 09:56 ?706次閱讀

    InfiniBand網(wǎng)絡(luò)內(nèi)計算的關(guān)鍵技術(shù)和應(yīng)用

    InfiniBand在高性能計算(HPC)和人工智能AI)應(yīng)用中發(fā)揮著關(guān)鍵作用,體現(xiàn)在它提供了高速、低延遲的網(wǎng)絡(luò)通信能力,以支持大規(guī)模數(shù)據(jù)
    的頭像 發(fā)表于 10-23 11:33 ?949次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)
    發(fā)表于 10-14 09:16

    AI云服務(wù)器:開啟智能計算時代

    ,旨在為人工智能應(yīng)用提供堅實的支持。 特點 高性能:配備先進的處理器,如多核CPU和高性能GPU,能夠快速處理大量復(fù)雜的計算任務(wù),滿足深度學(xué)習(xí)和機器學(xué)習(xí)模型訓(xùn)練及推理的需求。 可擴展性
    的頭像 發(fā)表于 08-09 16:08 ?1648次閱讀

    燧原科技與銳捷網(wǎng)絡(luò)攜手共筑AI數(shù)據(jù)中心高性能網(wǎng)絡(luò)新紀元

    近日,燧原科技與知名網(wǎng)絡(luò)解決方案提供商銳捷網(wǎng)絡(luò)正式簽署戰(zhàn)略合作協(xié)議,雙方宣布將共同研發(fā)面向未來人工智能數(shù)據(jù)中心的高性能網(wǎng)絡(luò)互聯(lián)解決方案。此次
    的頭像 發(fā)表于 07-29 11:27 ?928次閱讀