99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中國(guó)為何同時(shí)面臨算力過(guò)剩與短缺 ?

穎脈Imgtec ? 2025-04-24 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

原文標(biāo)題:《China’s Weird Chip Surplus, Explained——How China has both compute overcapacity and shortage》

原文作者:Nicholas Welch, Lily Ottinger, and Jordan Schneider

原文鏈接:https://www.chinatalk.media/p/chinas-weird-chip-surplus-explained

編譯:超算百科


隨著DeepSeek近期的突破性進(jìn)展占據(jù)新聞?lì)^條,一個(gè)更深層次的問(wèn)題依然存在:中國(guó)政府是否真的在推動(dòng)實(shí)現(xiàn)通用人工智能(AGI)?如果是的話(huà),它在計(jì)算資源分配中可能扮演了何種角色?

盡管DeepSeek的成就表明,獲取超越對(duì)沖基金所能拼湊的計(jì)算能力或許并不是開(kāi)發(fā)算法進(jìn)步的直接瓶頸,但情況要復(fù)雜得多。西方實(shí)驗(yàn)室仍在競(jìng)相構(gòu)建大規(guī)模的10萬(wàn)GPU級(jí)別的集群(更不用提“星際之門(mén)項(xiàng)目”),希望以規(guī)?;绞介_(kāi)發(fā)和部署AGI。而DeepSeek的首席執(zhí)行官也多次表示,他面臨計(jì)算資源的限制。

在本文中,我們探討一個(gè)關(guān)鍵的悖論:中國(guó)為何能夠同時(shí)存在計(jì)算資源過(guò)剩和短缺的現(xiàn)象?這又說(shuō)明了中國(guó)是否準(zhǔn)備好邁向開(kāi)發(fā)和部署AGI的下一步?

自2024年初以來(lái),有關(guān)中國(guó)閑置計(jì)算中心的報(bào)道不斷涌現(xiàn)。9月,租賃Nvidia AI芯片在中國(guó)的價(jià)格比美國(guó)更低。

乍一看,這似乎不合邏輯。由于美國(guó)限制了中國(guó)獲取先進(jìn)AI芯片的渠道,人們本應(yīng)看到芯片短缺、所有可用芯片被充分利用以及云服務(wù)價(jià)格高企的局面。

那么,到底發(fā)生了什么?

這一謎團(tuán)也引起了中國(guó)記者的關(guān)注。在本文中,我們綜合了兩篇去年11月發(fā)表的長(zhǎng)篇中文文章的觀點(diǎn):

吳俊宇為《財(cái)經(jīng)雜志》撰寫(xiě)的《中國(guó)算力,過(guò)剩了嗎?》

張帥為《鈦媒體》撰寫(xiě)的《智算中心太“多”,大模型不夠用了》



本文關(guān)鍵要點(diǎn)

2024年,中國(guó)在其計(jì)算能力中新增了至少100萬(wàn)塊AI芯片(其中70%為Nvidia,30%為華為)——從理論上講,這足以構(gòu)建多個(gè)10萬(wàn)GPU規(guī)模的集群(這可能是與GPT-5或其他下一代西方模型競(jìng)爭(zhēng)所需的規(guī)模)。

但為什么即使在當(dāng)前的1萬(wàn)GPU規(guī)模集群時(shí)代,中國(guó)已經(jīng)出現(xiàn)了過(guò)?,F(xiàn)象?

解釋一:芯片部署不當(dāng),導(dǎo)致“高質(zhì)量算力”短缺,而“低質(zhì)量算力”過(guò)剩。

人工智能熱潮中,許多公司和地方政府急于購(gòu)買(mǎi)GPU,認(rèn)為僅僅擁有這些硬件就能確保利潤(rùn)。然而,由于其中許多人缺乏技術(shù)和市場(chǎng)專(zhuān)業(yè)知識(shí),芯片最終被分散部署在地理位置偏遠(yuǎn)、質(zhì)量較低的數(shù)據(jù)中心,要么難以使用,要么處于沒(méi)有需求的地方。這種投機(jī)行為和資源管理不善導(dǎo)致了盡管整體算力短缺,卻仍出現(xiàn)閑置計(jì)算中心的現(xiàn)象。

政府對(duì)此作出回應(yīng),不再批準(zhǔn)新建數(shù)據(jù)中心的許可,除非它們位于八個(gè)指定樞紐之一。行業(yè)的整合和專(zhuān)業(yè)化使得類(lèi)似混亂在2025年阻礙中國(guó)數(shù)據(jù)中心建設(shè)的可能性降低。

解釋二:短期過(guò)剩,長(zhǎng)期短缺。

到2024年,對(duì)基礎(chǔ)模型訓(xùn)練的需求顯著放緩。許多在2023年匆忙開(kāi)發(fā)基礎(chǔ)模型的參與者已停止訓(xùn)練新一代模型。

盡管推理需求正在快速增長(zhǎng),但仍不足以完全吸收先前用于訓(xùn)練的過(guò)剩算力。

未來(lái),推理需求的增長(zhǎng)以及更大基礎(chǔ)模型的開(kāi)發(fā)預(yù)計(jì)將引發(fā)新的短缺。當(dāng)前這種暫時(shí)性過(guò)剩的“過(guò)渡期”預(yù)計(jì)將在2025年中期結(jié)束。

接下來(lái),我們將更詳細(xì)地探討中國(guó)媒體對(duì)以下問(wèn)題的看法:

中國(guó)擁有多少AI芯片,又是誰(shuí)在部署它們;

“虛假”和“偽”1萬(wàn)GPU集群的出現(xiàn),以及政府如何應(yīng)對(duì);

使用國(guó)產(chǎn)芯片的算力集群所面臨的獨(dú)特挑戰(zhàn);

從訓(xùn)練需求向推理需求的轉(zhuǎn)變;

中國(guó)是否需要更多公共云計(jì)算,而非私有GPU集群;

在10萬(wàn)GPU規(guī)模時(shí)代,中國(guó)如何避免1萬(wàn)GPU規(guī)模時(shí)代的陷阱。



誰(shuí)參與投資了智算中心?

首先,《財(cái)經(jīng)》雜志概述了在中國(guó)實(shí)際構(gòu)建算力集群的主體。主要分為三大類(lèi):

1.大型科技公司(阿里巴巴、騰訊、百度):預(yù)計(jì)2024年資本支出總額超過(guò)1300億元人民幣;

2.國(guó)有電信運(yùn)營(yíng)商(中國(guó)移動(dòng)、中國(guó)電信):計(jì)劃在2024年投資845億元人民幣;

3.地方政府和國(guó)有企業(yè):統(tǒng)計(jì)數(shù)據(jù)不完整,但僅2024年1月至10月的投資就至少達(dá)到275億元人民幣。

《財(cái)經(jīng)》深入分析了這些數(shù)據(jù),以估算這三類(lèi)主體在2024年投入使用的芯片總數(shù)。

大型科技公司

《財(cái)經(jīng)》認(rèn)為,資本支出(Capex)是衡量算力中心投資的良好指標(biāo),因?yàn)橘Y本支出通常用于購(gòu)買(mǎi)芯片和租賃土地。


2024年上半年,阿里巴巴、騰訊和百度的總資本支出達(dá)到504.4億元人民幣,同比增長(zhǎng)121.6%,這是自2018年以來(lái)的最高增長(zhǎng)率。如果這一增長(zhǎng)趨勢(shì)延續(xù)到下半年,那么2024年阿里巴巴、騰訊和百度的總資本支出將超過(guò)1300億元人民幣。


需要注意的是,華為和字節(jié)跳動(dòng)也運(yùn)營(yíng)著重要的算力中心。但由于它們并非上市公司,未披露相關(guān)數(shù)據(jù)——這意味著“大型科技公司”這一類(lèi)別中的總投資實(shí)際上高于這里呈現(xiàn)的數(shù)據(jù)。


預(yù)計(jì)在未來(lái)幾個(gè)月內(nèi),DeepSeek將像OpenAI與微軟合作那樣,與其中一家公司達(dá)成合作。據(jù)鈦媒體周一報(bào)道,字節(jié)跳動(dòng)正“考慮與DeepSeek開(kāi)展研究合作”。與字節(jié)跳動(dòng)的合作可能為DeepSeek的研究人員帶來(lái)巨大的突破,使其能夠獲得數(shù)量級(jí)更高的計(jì)算資源支持。


圖1:阿里巴巴、騰訊和百度的資本支出(2021年第一季度至2024年第二季度)單位:億元人民幣


0dfaab0a-20da-11f0-9434-92fbcf53809c.jpg


注:1. 阿里巴巴的自然年與其財(cái)年不一致,數(shù)據(jù)已根據(jù)自然年進(jìn)行調(diào)整。2. 科技公司的資本支出通常用于購(gòu)買(mǎi)芯片和服務(wù)器,以及租賃土地建設(shè)數(shù)據(jù)中心;因此,科技公司的資本支出與算力投資直接相關(guān)。| 來(lái)源:財(cái)經(jīng)

2024年上半年,英偉達(dá)報(bào)告稱(chēng)其在中國(guó)市場(chǎng)的收入達(dá)到61.6億美元(約合437億元人民幣),同比增長(zhǎng)42.3%。由于國(guó)內(nèi)科技公司仍然主要依賴(lài)英偉達(dá)芯片,這些數(shù)據(jù)為估算中國(guó)主要科技公司購(gòu)買(mǎi)芯片的數(shù)量提供了另一個(gè)有用的參考。


圖5:英偉達(dá)在全球各地區(qū)的營(yíng)收規(guī)模(2022年第一季度至2024年第二季度) 單位:美元


0e178cf2-20da-11f0-9434-92fbcf53809c.jpg


注:1. 英偉達(dá)的自然年與財(cái)年不一致,數(shù)據(jù)已根據(jù)自然年進(jìn)行調(diào)整。2. 為便于統(tǒng)計(jì),英偉達(dá)來(lái)自中國(guó)大陸、臺(tái)灣及其他非美國(guó)地區(qū)的收入在圖表中被合并為“其他”。3. 英偉達(dá)財(cái)務(wù)報(bào)告統(tǒng)計(jì)中的中國(guó)大陸收入包含香港。

國(guó)有電信運(yùn)營(yíng)商

《財(cái)經(jīng)》解釋稱(chēng),自2023年以來(lái),國(guó)有電信運(yùn)營(yíng)商已將投資重點(diǎn)從5G轉(zhuǎn)向算力中心投資。事實(shí)上,其投資規(guī)模與上述私營(yíng)科技公司的差距并不大。

中國(guó)移動(dòng)和中國(guó)電信均披露了2024年的算力投資計(jì)劃,其中中國(guó)移動(dòng)計(jì)劃投資475億元人民幣,中國(guó)電信計(jì)劃投資370億元人民幣。兩者合計(jì)845億元人民幣,同比增長(zhǎng)13%。中國(guó)聯(lián)通未披露相關(guān)數(shù)據(jù),因此本部分的數(shù)據(jù)也存在不完整性。

圖3:電信運(yùn)營(yíng)商與算力相關(guān)的資本支出(2022-2024) 單位:億元人民幣

0e2c8396-20da-11f0-9434-92fbcf53809c.jpg

注:2024年的數(shù)據(jù)為2023年財(cái)務(wù)報(bào)告中披露的計(jì)劃數(shù)據(jù)。

中國(guó)移動(dòng)已公開(kāi)發(fā)布了兩份公開(kāi)招標(biāo)的采購(gòu)公告。這兩份采購(gòu)文件顯示,計(jì)劃采購(gòu)超過(guò)9200臺(tái)華為昇騰AI服務(wù)器(一臺(tái)昇騰AI服務(wù)器通常配備4到8個(gè)GPU,因此這大約相當(dāng)于3.6萬(wàn)到7.4萬(wàn)個(gè)GPU)。中標(biāo)者是國(guó)內(nèi)知名的昇騰經(jīng)銷(xiāo)商,例如昆侖、華鯤振宇、寶德、百信、長(zhǎng)江、鯤泰、湘江鯤鵬和四川虹信軟件。一些文章指出,中國(guó)移動(dòng)在2024年建設(shè)的計(jì)算基礎(chǔ)設(shè)施中,約85%依賴(lài)國(guó)產(chǎn)芯片。

《財(cái)經(jīng)》提醒,即使是這些國(guó)產(chǎn)芯片也依賴(lài)全球供應(yīng)鏈:

華為的一位代表在今年9月向我們表示,盡管Nvidia的H20芯片目前仍在向中國(guó)銷(xiāo)售,但必須為最壞的情況做好準(zhǔn)備,因?yàn)楣?yīng)鏈隨時(shí)可能中斷。華為的昇騰910系列芯片依賴(lài)韓國(guó)SK海力士提供的高帶寬存儲(chǔ)器(HBM)。目前,國(guó)內(nèi)缺乏既有效又可靠的HBM替代品。在極端情況下,如果SK海力士的HBM供應(yīng)鏈被切斷,昇騰910芯片的生產(chǎn)能力也會(huì)受到影響。


地方政府和國(guó)有企業(yè)

這里的數(shù)據(jù)顯示最為雜亂且不完整?!敦?cái)經(jīng)》的統(tǒng)計(jì)表明,截至2024年10月16日,各地城市已至少啟動(dòng)了30個(gè)與人工智能計(jì)算中心相關(guān)的招標(biāo)項(xiàng)目,總投資額不少于275億元人民幣。

0e3f8554-20da-11f0-9434-92fbcf53809c.jpg

注:1. 統(tǒng)計(jì)時(shí)段為2024年1月至2024年10月16日,以上統(tǒng)計(jì)并不完整。2. 投資金額包括軟件、硬件及土建工程投資,例如服務(wù)器采購(gòu)和智能計(jì)算中心建設(shè)。



中國(guó)到底擁有多少算力?

基于上述投資數(shù)據(jù),《財(cái)經(jīng)》謹(jǐn)慎估計(jì),2024年中國(guó)新增了:

70萬(wàn)塊Nvidia H20芯片;

30萬(wàn)塊國(guó)產(chǎn)華為芯片。


文章還提到了Semianalysis更為樂(lè)觀的估算:

超過(guò)100萬(wàn)塊Nvidia H20芯片;

55萬(wàn)塊國(guó)產(chǎn)(如華為)芯片。


然而,據(jù)《財(cái)經(jīng)》報(bào)道,大多數(shù)中國(guó)業(yè)內(nèi)人士認(rèn)為后者的估算并不可信。

無(wú)論如何,這使得中國(guó)擁有了足夠的GPU來(lái)構(gòu)建多個(gè)10萬(wàn)GPU規(guī)模的集群。作為對(duì)比,Epoch AI估計(jì)僅谷歌一家就運(yùn)營(yíng)著超過(guò)100萬(wàn)塊芯片。(需要注意的是,Epoch AI的數(shù)據(jù)反映的是其總?cè)萘?,而上述中?guó)的數(shù)據(jù)特指2024年新增的容量,因此兩者并不直接可比。)

0e93ebbc-20da-11f0-9434-92fbcf53809c.jpg

鈦媒體估算,2024年上半年:

國(guó)內(nèi)智算中心交付了17億卡時(shí)(card-hours),其中5.6億卡時(shí)被使用,利用率約為32%。其他數(shù)據(jù)顯示,當(dāng)前算力基礎(chǔ)設(shè)施行業(yè)的平均機(jī)架利用率不足60%。


不同運(yùn)營(yíng)商的利用率存在差異:

通過(guò)云服務(wù)提供更多的算力資源可以有效提升智能算力的使用效率。阿里云和華為云已經(jīng)向多個(gè)政府部門(mén)提交了這一建議。

公共云服務(wù)的合理利用率在40%-60%之間,政務(wù)云服務(wù)的利用率在25%-40%之間,但私有化計(jì)算資源的利用率通常不超過(guò)5%。



“假的”1萬(wàn)GPU集群?

僅僅擁有GPU是不夠的。在2023年和2024年中國(guó)建設(shè)1萬(wàn)GPU規(guī)模集群的過(guò)程中,出現(xiàn)了許多關(guān)于高效和合理分配的問(wèn)題。

阿里云智能科技研究中心主任安琳指出,當(dāng)前中國(guó)存在三種類(lèi)型的“1萬(wàn)GPU集群”:

1. 假的1萬(wàn)GPU集群(假萬(wàn)卡集群):這類(lèi)集群的技術(shù)定義是公司確實(shí)擁有1萬(wàn)個(gè)AI加速器,但這些GPU分散在多個(gè)不同地點(diǎn)的數(shù)據(jù)中心。每個(gè)數(shù)據(jù)中心可能只有幾百或幾千塊GPU,盡管總數(shù)可能超過(guò)1萬(wàn)塊,但它們無(wú)法作為一個(gè)統(tǒng)一的集群運(yùn)行。

2. 偽1萬(wàn)GPU集群(偽萬(wàn)卡集群):這種集群將1萬(wàn)塊AI加速卡部署在一個(gè)數(shù)據(jù)中心內(nèi)。然而,雖然硬件設(shè)施集中在一個(gè)地方,但這些GPU并未被用作統(tǒng)一資源來(lái)訓(xùn)練單一的大模型。例如,一部分GPU可能用于訓(xùn)練模型A,另一部分則用于模型B。

3. 真正的1萬(wàn)GPU集群(真萬(wàn)卡集群):在一個(gè)數(shù)據(jù)中心內(nèi)集中部署超過(guò)1萬(wàn)塊GPU,并通過(guò)先進(jìn)的大規(guī)模資源調(diào)度技術(shù)實(shí)現(xiàn)互聯(lián),使其能夠作為一個(gè)整體協(xié)同工作。這使得單一大模型可以同時(shí)利用全部1萬(wàn)塊GPU進(jìn)行訓(xùn)練。


創(chuàng)建一個(gè)真正的1萬(wàn)GPU集群需要克服諸多技術(shù)挑戰(zhàn),例如:

高性能網(wǎng)絡(luò)以處理巨大的數(shù)據(jù)流量;

高效的調(diào)度系統(tǒng)以最大化GPU利用率;

穩(wěn)定的運(yùn)行能力,能夠應(yīng)對(duì)頻繁的硬件故障。


在人工智能熱潮中,許多公司和地方政府急于購(gòu)買(mǎi)GPU,認(rèn)為僅憑擁有這些硬件就能在AI競(jìng)賽中占據(jù)優(yōu)勢(shì)。然而,其中許多人缺乏實(shí)際部署這些資源所需的技術(shù)專(zhuān)長(zhǎng),導(dǎo)致了“假的1萬(wàn)GPU集群”和“偽1萬(wàn)GPU集群”的出現(xiàn)。據(jù)鈦媒體報(bào)道:


“目前,囤積NVIDIA顯卡確實(shí)造成了一些算力浪費(fèi)。許多買(mǎi)家缺乏構(gòu)建智能計(jì)算中心所需的網(wǎng)絡(luò)、調(diào)度和運(yùn)營(yíng)能力。一位業(yè)內(nèi)技術(shù)專(zhuān)家直言不諱地表示:‘投機(jī)行為太多了。很多人其實(shí)并不在這個(gè)行業(yè)——他們以為囤積硬件就能賺錢(qián)。他們把這些GPU隨便塞進(jìn)某個(gè)數(shù)據(jù)中心,卻沒(méi)有解決穩(wěn)定性、容錯(cuò)性等技術(shù)問(wèn)題,結(jié)果造成了大量資源浪費(fèi)?!?


此外,一些中國(guó)的中小型云服務(wù)提供商可能提供價(jià)格低廉的服務(wù),但其質(zhì)量同樣較低。



政府的應(yīng)對(duì)措施

中國(guó)政府清楚地意識(shí)到2023年及2024年初因數(shù)據(jù)中心建設(shè)混亂所造成的資源浪費(fèi),并已采取措施,試圖主動(dòng)減緩新建數(shù)據(jù)中心的步伐。

據(jù)鈦媒體報(bào)道,國(guó)家發(fā)展和改革委員會(huì)(NDRC)已停止批準(zhǔn)新建數(shù)據(jù)中心的能源配額。不過(guò),如果在去年我們文章中探討過(guò)的中國(guó)“東數(shù)西算”項(xiàng)目的八大節(jié)點(diǎn)之一中使用華為芯片,則可能會(huì)獲得例外批準(zhǔn)。

《科技日?qǐng)?bào)》(黨媒《科技日?qǐng)?bào)》頭版文章)發(fā)表了一篇題為“智算中心建設(shè)不應(yīng)盲目跟風(fēng)”的文章,提出了以下觀點(diǎn):


智算中心的運(yùn)營(yíng)和管理高度依賴(lài)專(zhuān)業(yè)技術(shù)人才和高效的管理團(tuán)隊(duì)。如果沒(méi)有這些,算力中心可能無(wú)法按預(yù)期發(fā)揮作用,導(dǎo)致設(shè)備閑置和資源浪費(fèi)。

因此,是否建設(shè)、何時(shí)建設(shè)以及在何處建設(shè)智算中心需要科學(xué)審慎的決策。“從眾心理”或急于“跟風(fēng)”的行為必須避免??傮w原則應(yīng)是基于明確且可持續(xù)的市場(chǎng)需求,因地制宜地建設(shè)智算中心,并適度超前規(guī)劃。


地方政府正在提高對(duì)承包商的要求:


一些地方政府加強(qiáng)了對(duì)智算中心運(yùn)營(yíng)的要求。例如,山東德州一個(gè)價(jià)值約2億元人民幣的項(xiàng)目,在招標(biāo)文件中明確表示將采用“設(shè)計(jì)、施工、采購(gòu)與運(yùn)營(yíng)一體化模式”。該項(xiàng)目要求運(yùn)營(yíng)期不少于五年,并明確規(guī)定了項(xiàng)目驗(yàn)收和交付使用后每年的算力收入下限。

據(jù)云軸科技(ZStack)CTO王偉介紹,政府如今對(duì)智算中心提出了更高要求。過(guò)去,簡(jiǎn)單建成算力中心即可,但現(xiàn)在政府希望尋找有能力的運(yùn)營(yíng)商,或?qū)⒔ㄔO(shè)與運(yùn)營(yíng)整合起來(lái),以確保算力的高效利用。


其他地方政府則嘗試將其閑置的計(jì)算資源交給云服務(wù)提供商:


一些地方政府已開(kāi)始協(xié)調(diào),鼓勵(lì)云服務(wù)提供商租賃其智算中心的閑置算力?!拔覀兩踔敛恢绹?guó)內(nèi)有這么多GPU。某種意義上,算力短缺與資源錯(cuò)配并存,”一位業(yè)內(nèi)人士表示。


此外,還有幾項(xiàng)政府政策試圖解決小型分散計(jì)算中心的資源浪費(fèi)問(wèn)題:


《數(shù)據(jù)中心綠色低碳發(fā)展專(zhuān)項(xiàng)行動(dòng)計(jì)劃》對(duì)數(shù)據(jù)中心行業(yè)的區(qū)域布局、能源和水資源效率以及綠色電力的使用提出了嚴(yán)格而全面的要求。該計(jì)劃還提出“全面取消對(duì)高耗能行業(yè)的地方優(yōu)惠電價(jià)政策”。人們普遍認(rèn)為,這一政策將加速淘汰落后產(chǎn)能,優(yōu)化行業(yè)供給結(jié)構(gòu),推動(dòng)健康發(fā)展。

工業(yè)和信息化部(MIIT)近期批準(zhǔn)了六個(gè)城市的云邊端一體化智能算力應(yīng)用試點(diǎn)。這些試點(diǎn)旨在解決各地早期建設(shè)智算中心過(guò)程中出現(xiàn)的問(wèn)題,尤其是由國(guó)有資金支持的小型分散算力中心的資源浪費(fèi)問(wèn)題。


除了這些政府措施外,文章還指出,隨著市場(chǎng)逐漸成熟,投資策略逐步調(diào)整,低質(zhì)量或低效的參與者(如部署次優(yōu)或閑置系統(tǒng)的機(jī)構(gòu))可能會(huì)自然被淘汰。隨著時(shí)間推移,更高效的參與者將占據(jù)主導(dǎo)地位,從而緩解閑置計(jì)算資源的問(wèn)題。



國(guó)產(chǎn)芯片是否更容易閑置?

文章對(duì)國(guó)產(chǎn)芯片在閑置算力悖論中的作用傳遞了復(fù)雜的信息。

據(jù)《財(cái)經(jīng)》報(bào)道,受閑置悖論影響最嚴(yán)重的集群是由國(guó)有移動(dòng)運(yùn)營(yíng)商和地方政府運(yùn)營(yíng)的那些。部分原因在于它們使用的是國(guó)產(chǎn)芯片:


國(guó)產(chǎn)AI芯片的情況更為特殊。目前,國(guó)產(chǎn)AI芯片僅達(dá)到了“能用”的水平,但距離“好用”仍有差距。盲目使用這些芯片只會(huì)導(dǎo)致算力浪費(fèi)。企業(yè)需要通過(guò)各種技術(shù)手段進(jìn)行適配,以最大化國(guó)產(chǎn)AI芯片的效率。


鈦媒體也描述了華為芯片面臨的生態(tài)挑戰(zhàn),但引用業(yè)內(nèi)人士的觀點(diǎn)稱(chēng),這些問(wèn)題只是小問(wèn)題,是不可避免的,并且最終將有助于華為生態(tài)的成熟:


一方面,有觀點(diǎn)認(rèn)為,國(guó)內(nèi)智算中心仍然依賴(lài)海外生態(tài)系統(tǒng),需要三到五年的過(guò)渡期。在此期間,大規(guī)模快速建設(shè)此類(lèi)中心很可能導(dǎo)致顯著的浪費(fèi)。專(zhuān)家指出,國(guó)內(nèi)AI計(jì)算存在效率低下問(wèn)題,他表示:“華為的運(yùn)營(yíng)能力非常強(qiáng)大。然而,在用戶(hù)準(zhǔn)備好采用國(guó)產(chǎn)GPU或華為解決方案之前,華為已經(jīng)投入大量資源開(kāi)發(fā)計(jì)算集群和智算中心。電信運(yùn)營(yíng)商雖然建起了數(shù)萬(wàn)GPU的集群,但硬件從可用到高效使用之間仍存在差距。隨著更多國(guó)產(chǎn)芯片進(jìn)入市場(chǎng),這些低效問(wèn)題可能會(huì)更加突出?!?

另一方面,也有觀點(diǎn)認(rèn)為,海外限制只會(huì)愈加嚴(yán)格,國(guó)內(nèi)AI計(jì)算生態(tài)必須更快成熟。與國(guó)家戰(zhàn)略競(jìng)爭(zhēng)相比,因建設(shè)過(guò)快引發(fā)的一些小問(wèn)題是可接受的?!安贿^(guò),總體而言,我對(duì)國(guó)產(chǎn)GPU持樂(lè)觀態(tài)度,特別是在大模型時(shí)代的算力趨勢(shì)變化下。過(guò)去,AI模型非常分散,Nvidia的CUDA生態(tài)系統(tǒng)之所以占據(jù)主導(dǎo)地位,是因?yàn)樗枰С秩绱硕嗟牟煌P?。如今,隨著大模型逐漸整合,主流框架變得更加統(tǒng)一。同時(shí),Nvidia GPU價(jià)格昂貴,且獲取其算力面臨諸多挑戰(zhàn),因此會(huì)有更多人愿意嘗試國(guó)產(chǎn)GPU,”專(zhuān)家補(bǔ)充道。


從訓(xùn)練需求向推理需求的轉(zhuǎn)變

2023年,無(wú)數(shù)公司爭(zhēng)相開(kāi)發(fā)基礎(chǔ)模型,推動(dòng)了全國(guó)范圍內(nèi)眾多算力中心的建設(shè)。


2023年出現(xiàn)了算力短缺,因?yàn)椤鞍倌4髴?zhàn)”導(dǎo)致對(duì)訓(xùn)練算力的需求激增。美國(guó)出口管制進(jìn)一步限制了供應(yīng),而企業(yè)的恐慌性采購(gòu)加劇了供需失衡。一家領(lǐng)先科技公司的戰(zhàn)略規(guī)劃師在2023年8月提到,他們的公司在2023年以比Nvidia官方定價(jià)高出1.5至2倍的價(jià)格購(gòu)買(mǎi)了市場(chǎng)上的A100/A800和H100/H800芯片,甚至從小型和中型分銷(xiāo)商手中收購(gòu)了散貨囤積的芯片。


然而,到2024年,許多公司已放棄開(kāi)發(fā)基礎(chǔ)模型的雄心,導(dǎo)致訓(xùn)練需求急劇下降。這表明資源正逐漸集中到行業(yè)中的少數(shù)主導(dǎo)者手中。根據(jù)鈦媒體的報(bào)道,截至2024年10月,在中國(guó)正式獲批的188個(gè)模型中(《ChinaTalk》編輯注:原文未提供數(shù)據(jù)來(lái)源,因此僅供參考):


超過(guò)30%的模型在獲批后沒(méi)有進(jìn)一步進(jìn)展;

僅有約10%的模型仍在積極進(jìn)行訓(xùn)練;

近50%的模型將重點(diǎn)轉(zhuǎn)向AI應(yīng)用開(kāi)發(fā)。


《財(cái)經(jīng)》也認(rèn)同這一觀點(diǎn),并指出:


需求結(jié)構(gòu)正在發(fā)生變化。到2024年,隨著企業(yè)囤積了越來(lái)越多的芯片,算力逐漸變得充足。模型訓(xùn)練的需求開(kāi)始放緩,而應(yīng)用推理的需求尚未爆發(fā)。此時(shí),一個(gè)過(guò)渡性的“空檔期”出現(xiàn)了。

目前,國(guó)內(nèi)科技公司如阿里巴巴、字節(jié)跳動(dòng)和百度的旗艦?zāi)P托阅芤呀咏麿penAI的GPT-4。由于GPT-4之后的下一代模型尚未真正出現(xiàn),追趕GPT-4的任務(wù)已基本結(jié)束。因此,國(guó)內(nèi)主要科技公司暫時(shí)放緩了模型訓(xùn)練的努力。

在2022年至2027年之間,訓(xùn)練算力的比例將下降至27.4%,而推理算力的比例將上升至72.6%。

0eb09ae6-20da-11f0-9434-92fbcf53809c.jpg

2024年至2027年的數(shù)據(jù)來(lái)自國(guó)際市場(chǎng)研究公司IDC的估算。| 來(lái)源:《財(cái)經(jīng)》

然而,推理需求正在增長(zhǎng)。百度的Token消耗量從2024年5月的2500億增長(zhǎng)到8月的1萬(wàn)億,增加了四倍。字節(jié)跳動(dòng)同期的模型Token消耗甚至增長(zhǎng)了十倍。


圖7:百度與字節(jié)跳動(dòng)大型模型的日均Token消耗量 單位:億/日均

0ec97872-20da-11f0-9434-92fbcf53809c.jpg

注:1. 百度數(shù)據(jù)來(lái)源于百度財(cái)報(bào)披露。2. 字節(jié)跳動(dòng)數(shù)據(jù)來(lái)源于字節(jié)跳動(dòng)新聞發(fā)布會(huì)披露。


所有這些都表明,最終可能會(huì)再次出現(xiàn)算力短缺。《財(cái)經(jīng)》指出:


我們從多家技術(shù)云服務(wù)提供商和部分電信運(yùn)營(yíng)商處獲悉,他們的共同判斷是“短期充足,但長(zhǎng)期不足”。短期內(nèi),現(xiàn)有的算力能夠滿(mǎn)足基本業(yè)務(wù)需求,并在局部出現(xiàn)過(guò)?,F(xiàn)象。然而,從長(zhǎng)遠(yuǎn)來(lái)看,AI應(yīng)用的落地將需要更多的算力支持。

這一“過(guò)渡期”的長(zhǎng)短取決于兩個(gè)因素:第一,下一代模型訓(xùn)練競(jìng)賽何時(shí)開(kāi)始;第二,推理算力需求增長(zhǎng)的速度,這取決于AI應(yīng)用的采納與普及速度。


一些科技公司的技術(shù)專(zhuān)家預(yù)測(cè),這一過(guò)渡期可能會(huì)持續(xù)到2025年中期,但總體而言不會(huì)持續(xù)太久。

本文轉(zhuǎn)自:超算百科

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35194

    瀏覽量

    280322
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1202

    瀏覽量

    15674
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    798

    瀏覽量

    1775
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為助力中國(guó)移動(dòng)全面升級(jí)“九州”互聯(lián)網(wǎng)

    中國(guó)移動(dòng)云智大會(huì)期間,以“智啟新,安全筑基“為主題的智基礎(chǔ)設(shè)施及安全峰會(huì)成功舉辦。會(huì)上,中國(guó)移動(dòng)聯(lián)合華為等重磅發(fā)布了《“九州”
    的頭像 發(fā)表于 04-14 16:46 ?600次閱讀

    AI 報(bào)告來(lái)了!2025中國(guó)AI市場(chǎng)將達(dá) 259 億美元

    報(bào)告來(lái)源:IDC、浪潮信息2月13日,國(guó)際數(shù)據(jù)公司(IDC)攜手浪潮信息,重磅發(fā)布《2025年中國(guó)人工智能計(jì)算發(fā)展評(píng)估報(bào)告》。當(dāng)下,大模型與生成式人工智能熱度飆升,需求水漲船高,
    的頭像 發(fā)表于 03-07 13:27 ?824次閱讀
    AI <b class='flag-5'>算</b><b class='flag-5'>力</b>報(bào)告來(lái)了!2025<b class='flag-5'>中國(guó)</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b>市場(chǎng)將達(dá) 259 億美元

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?2539次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?473次閱讀

    首個(gè)國(guó)產(chǎn)萬(wàn)卡集群!賽思時(shí)間同步服務(wù)器助力?“東數(shù)西”甘肅慶陽(yáng)樞紐節(jié)點(diǎn)打造「中國(guó)谷」!

    中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所副所長(zhǎng)栗蔚指出,對(duì)服務(wù)而言,東數(shù)西的本質(zhì)就是能夠把像水和
    的頭像 發(fā)表于 12-27 21:22 ?535次閱讀
    首個(gè)國(guó)產(chǎn)萬(wàn)卡<b class='flag-5'>算</b><b class='flag-5'>力</b>集群!賽思時(shí)間同步服務(wù)器助力?“東數(shù)西<b class='flag-5'>算</b>”甘肅慶陽(yáng)樞紐節(jié)點(diǎn)打造「<b class='flag-5'>中國(guó)</b><b class='flag-5'>算</b>谷」!

    澎峰科技助力中國(guó)移動(dòng) 重磅發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    11月30日 ,由中國(guó)通信學(xué)會(huì)主辦、中國(guó)移動(dòng)研究院承辦的2024中國(guó)信息通信大會(huì)“網(wǎng)絡(luò)網(wǎng)一
    的頭像 發(fā)表于 12-03 15:08 ?736次閱讀
    澎峰科技助力<b class='flag-5'>中國(guó)</b>移動(dòng) 重磅發(fā)布智<b class='flag-5'>算</b>“芯合”<b class='flag-5'>算</b><b class='flag-5'>力</b>原生基礎(chǔ)軟件棧2.0

    澎峰科技助力中國(guó)移動(dòng)發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    近日 ,由中國(guó)通信學(xué)會(huì)主辦、中國(guó)移動(dòng)研究院承辦的2024中國(guó)信息通信大會(huì)“網(wǎng)絡(luò)網(wǎng)一體創(chuàng)新發(fā)
    的頭像 發(fā)表于 12-03 13:29 ?642次閱讀

    基礎(chǔ)篇:從零開(kāi)始了解

    即計(jì)算能力(Computing Power),狹義上指對(duì)數(shù)字問(wèn)題的運(yùn)算能力,而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過(guò)程的能力都可抽象為。比
    的頭像 發(fā)表于 11-15 14:22 ?2282次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)篇:從零開(kāi)始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    聯(lián)想亮相2024中國(guó)大會(huì)

    日前,2024中國(guó)大會(huì)在河南鄭州拉開(kāi)帷幕。作為全球領(lǐng)先的基礎(chǔ)設(shè)施和服務(wù)提供商,聯(lián)想集團(tuán)參會(huì)參展并攜手異構(gòu)智
    的頭像 發(fā)表于 10-14 11:43 ?939次閱讀

    中國(guó)大會(huì)召開(kāi),業(yè)界首個(gè)高質(zhì)量評(píng)估體系發(fā)布

    首次完整地構(gòu)建了人工智能時(shí)代高質(zhì)量的理論體系,并探索性提出業(yè)界首個(gè) "五位一體"的高質(zhì)量評(píng)估體系。 發(fā)布現(xiàn)場(chǎng) 在當(dāng)前由大模型和AIGC驅(qū)動(dòng)的AI時(shí)代,
    的頭像 發(fā)表于 09-28 16:50 ?503次閱讀
    <b class='flag-5'>中國(guó)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大會(huì)召開(kāi),業(yè)界首個(gè)<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評(píng)估體系發(fā)布

    2024中國(guó)大會(huì),河南如何繪寫(xiě)長(zhǎng)卷?

    河南,先鋒集結(jié),共繪智能繁榮的《清明上河圖》
    的頭像 發(fā)表于 09-19 10:14 ?2283次閱讀
    2024<b class='flag-5'>中國(guó)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大會(huì),河南如何繪寫(xiě)<b class='flag-5'>算</b><b class='flag-5'>力</b>長(zhǎng)卷?

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書(shū)中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國(guó)信通院公布首個(gè)《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智
    的頭像 發(fā)表于 08-06 14:23 ?1383次閱讀

    中國(guó)中心市場(chǎng)持續(xù)增長(zhǎng),智能規(guī)??焖籴绕?/a>

    7月24日,中國(guó)信息通信研究院(簡(jiǎn)稱(chēng)“中國(guó)信通院”)權(quán)威發(fā)布了《中國(guó)中心服務(wù)商分析報(bào)告(2024年)》,該報(bào)告深入剖析了
    的頭像 發(fā)表于 07-24 15:25 ?1100次閱讀