99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2024年,GPU能降價(jià)嗎?

半導(dǎo)體產(chǎn)業(yè)縱橫 ? 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 2024-01-03 15:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023過去,當(dāng)我們回顧這一年的最受產(chǎn)業(yè)關(guān)注的芯片,相信大多數(shù)人會(huì)將票投向GPU。2023年中,我們總能聽到“GPU緊缺”、“英偉達(dá)狂飆”、“黃仁勛分享成功秘訣”。

無可否認(rèn),2023年生成式AI的熱潮無邊無際,全球高科技公司都涌入了AI的軍備競賽。隨之帶來的是算力告急、全球瘋搶GPU。

01 全球最火的GPU

2023年層出不窮地傳出,人工智能AI大模型的消息。OpenAI、百度、谷歌、騰訊都在搭建屬于自己的大模型。對于這些五花八門的大模型,我們不多贅述,但大模型的搭建,最需要的就是GPU,而2023年需求量最大的GPU不外乎:A100/H100。

首當(dāng)其沖的就是A100GPU。OpenAI使用的是3,617臺(tái)HGXA100服務(wù)器,包含近3萬塊英偉達(dá)GPU。國內(nèi)云計(jì)算相關(guān)專家認(rèn)為,做好AI大模型的算力最低門檻是1萬枚英偉達(dá)A100芯片。

TrendForce研究則顯示,以A100的算力為基礎(chǔ),GPT-3.5大模型需要高達(dá)2萬枚GPU,未來商業(yè)化后可能需要超過3萬枚。

H100也是業(yè)內(nèi)追求的對象。H100于去年9月量產(chǎn),由臺(tái)積電4N工藝代工。相較于前任A100,H100單卡在推理速度上提升3.5倍,在訓(xùn)練速度上提升2.3倍;如果用服務(wù)器集群運(yùn)算的方式,訓(xùn)練速度更是能提高到9倍,原本一個(gè)星期的工作量,現(xiàn)在只需要20個(gè)小時(shí)。

63728dbc-a955-11ee-8b88-92fbcf53809c.png

考慮到整體系統(tǒng)成本,H100每美元產(chǎn)生的性能比A100還要高4到5倍之多。與A100相比,H100的單卡價(jià)格更貴,但是由于其訓(xùn)練、推理效率增加,成為了最具性價(jià)比的產(chǎn)品。

正因如此,科技大廠各個(gè)都搶著要買英偉達(dá)H100GPU,或者更準(zhǔn)確地說,是英偉達(dá)的8-GPU HGX H100SXM服務(wù)器。

英偉達(dá)成為了最受關(guān)注的賣鏟人。針對中國市場,還按照A800操作模式(A100芯片的降維版本),推出了完全符合出口規(guī)定的H100的降維版本芯片。

02 熱情的買家

“GPU就是新時(shí)代的比特幣?!監(jiān)penAI首席科學(xué)家IlyaSutskever將這句話寫在他個(gè)人的X賬號(hào)上。在算力激增的背景下,英偉達(dá)的GPU成為了“硬通貨”。

夸張的是,甚至有海外初創(chuàng)企業(yè)開始利用GPU進(jìn)行抵押融資,一家硅谷的創(chuàng)業(yè)公司使用H100拿到了23億美元的債務(wù)融資。

購買H100和A100的公司有三種。第一種,是需要超過1000張的公司,包括訓(xùn)練LLM的創(chuàng)業(yè)公司,如OpenAI、Anthropic;云服務(wù)提供商,如谷歌云、AWS、騰訊云;其他大公司,如特斯拉。第二種,是需要超過100張的公司,也就是對開源模型進(jìn)行大量微調(diào)的初創(chuàng)公司。第三種,需要10張的公司,就是大部分創(chuàng)業(yè)公司和開源勢力,熱衷使用大模型的輸出微調(diào)小模型。

這些買家需要多少GPU呢?OpenAI可能需要5萬張、Inflection要2.2萬張、Meta需要2.5萬張、大型云廠商(Azure、GoogleCloud、AWS、Oracle),每家可能需要3萬張,Lambda和CoreWeave以及其他私有云可能總共需要10萬張,Anthropic、Helsing、Mistral、Character,每家可能要1萬張。

僅僅這幾家公司,就已經(jīng)需要43.2萬張H100,如果以每塊約3.5萬美元計(jì)算,GPU的價(jià)值約為150億美元。而這還沒有包括字節(jié)、百度、騰訊等國內(nèi)公司。

在AI大模型競爭上,榜上有名的幾個(gè)國家:中國、美國、沙特阿拉伯、阿聯(lián)酋,都是英偉達(dá)的座上賓。

沙特阿拉伯已通過公共研究機(jī)構(gòu)阿卜杜拉國王科技大學(xué)(Kaust)購買了至少3000塊英偉達(dá)的H100芯片。這些芯片將于2023年底全部交付,總價(jià)值約為1.2億美元,用于訓(xùn)練AI大模型。

阿聯(lián)酋也獲得了數(shù)千顆英偉達(dá)芯片的使用權(quán),并已推出自己的開源大語言模型“Falcon40B”,“Falcon40B”使用了384個(gè)A100芯片進(jìn)行訓(xùn)練。

03 GPU的出貨量

英偉達(dá)H100的出貨量也備受關(guān)注。研究機(jī)構(gòu)Omdia披露,英偉達(dá)在2023年第二季度的H100出貨量為900噸。按照單片H100GPU的重量約為3千克,那么英偉達(dá)在二季度售出了約30萬片H100。

到了三季度,英偉達(dá)大約賣出了50萬臺(tái)H100和A100 GPU。每家能夠分到的GPU數(shù)量有限,Meta和微軟各自采購了15萬個(gè)H100GPU,谷歌、亞馬遜、甲骨文和騰訊則各采購了5萬片。

642da8fe-a955-11ee-8b88-92fbcf53809c.png

如此龐大的GPU需求量,導(dǎo)致基于H100的服務(wù)器需要36~52周的時(shí)間才能交付。按照英偉達(dá)官方的說法,2024年一季度之前的GPU芯片早已全部售罄。

業(yè)內(nèi)預(yù)估,明年英偉達(dá)的出貨量將達(dá)到150萬-200萬顆。

04 2024,GPU能降價(jià)嗎?

GPU能否降價(jià),還要看明年的供需情況。上圖是GPUUtils列出的目前對GPU市場供需變化最有直接影響的科技公司,包括了:開發(fā)出Chat-GPT的OpenAI、臺(tái)積電、微軟、Meta以及成立僅僅一年便募得13億美元資金的AI新創(chuàng)Inflection。

買方

有的人不想買。谷歌、Meta都覺得英偉達(dá)的GPU太貴了。

Meta最近已經(jīng)宣布構(gòu)建了自己的DLRM推理芯片,并且得到廣泛部署。Meta大大方方承認(rèn),自己即將發(fā)布的AI芯片并不能直接替代英偉達(dá)的芯片,但是自研芯片可以降低成本。

就算在谷歌I/O開發(fā)者大會(huì)兩個(gè)小時(shí)的演講中,谷歌方面一直在贊賞英偉達(dá)的H100GPU芯片。這也不妨礙,谷歌開始“騎驢找馬”,谷歌的云服務(wù)器上已經(jīng)用上了自家TPU。

Google TPU v5e于2023年8月發(fā)布,成為人工智能硬件領(lǐng)域的強(qiáng)大力量,專為大型語言模型和生成式人工智能量身定制。與前代產(chǎn)品相比,TPUv5e的每美元訓(xùn)練性能顯著提高2倍,每美元推理性能顯著提高2.5倍,可大幅節(jié)省成本。其突破性的多片架構(gòu)可實(shí)現(xiàn)數(shù)萬個(gè)芯片的無縫連接,突破了以往的限制,為處理海量人工智能任務(wù)開辟了途徑。

有的人不能買。中國是英偉達(dá)的第三大市場,占據(jù)其收入的1/5以上。隨著美國政府宣布進(jìn)一步禁止中國銷售英偉達(dá)H800和A800芯片,賣不出去的GPU,必然會(huì)對英偉達(dá)產(chǎn)生負(fù)面影響。

此外,明年AI或許迎來退潮。2023年的AI熱潮,除了大模型震驚業(yè)界外,炒作的因素也不在少數(shù)。毫無疑問,ChatGPT是2023年的世界頂流。因?yàn)樗?,OpenAI網(wǎng)站的流量在4月份就超過了18億,進(jìn)入了全球流量排名前20。然而,網(wǎng)絡(luò)分析公司Similarweb公布的數(shù)據(jù)顯示,在狂飆半年后,ChatGPT的訪問量首次出現(xiàn)負(fù)增長,6月份的訪問量環(huán)比下滑9.7%。

在大模型創(chuàng)業(yè)狂飆200多天后,探索者們的心態(tài),從理想亢奮來到現(xiàn)實(shí)落地。大模型的維護(hù)依賴大量的高性能芯片,而單要建構(gòu)、維護(hù)生成式AI工具的成本就非常巨大。這對于大公司而言還好,但是對于許多組織與創(chuàng)作者而言,這卻是一筆難以負(fù)擔(dān)的支出。

對于生產(chǎn)式AI,2024年還會(huì)再次迎來大眾的檢驗(yàn)。行業(yè)分析師認(rèn)為,2023年關(guān)于生成式人工智能的炒作非常大,AI被過度吹捧,因?yàn)橄嚓P(guān)技術(shù)需要克服許多障礙才能將其推向市場。

退潮之后,能夠剩下的高性能GPU需求還能有多少?

賣方

我們先來看看英偉達(dá)這個(gè)最大的賣家。優(yōu)先關(guān)注兩個(gè)方面:能不能供應(yīng)足夠的GPU,明年是否有新品刺激市場需求。

第一個(gè)供貨方面,眾所周知,英偉達(dá)只與臺(tái)積電合作生產(chǎn)H100,臺(tái)積電一共有4個(gè)生產(chǎn)節(jié)點(diǎn)是為5nm芯片提供產(chǎn)能:N5、N5P、N4、N4P。而H100只在N5或者是N5P的中的4N節(jié)點(diǎn)上生產(chǎn),這是一個(gè)5nm芯片的增強(qiáng)型節(jié)點(diǎn),同時(shí)英偉達(dá)還必須與蘋果、AMD高通共享這個(gè)節(jié)點(diǎn)的產(chǎn)能,至于A100顯卡則是在臺(tái)積電的N7生產(chǎn)線制作的。從短期的情況看,三星英特爾都因?yàn)橹瞥碳夹g(shù)的問題,無法替英偉達(dá)緩解供應(yīng)緊張的問題。因此,預(yù)計(jì)明年市場,英偉達(dá)的GPU供應(yīng)仍會(huì)緊缺。

6572f584-a955-11ee-8b88-92fbcf53809c.png

第二個(gè)新品方面,英偉達(dá)在2023年11月底時(shí),發(fā)布了H100的下一代繼承者——H200。表示在處理Llama2等LLM時(shí),H200的推理速度比H100GPU提高了近2倍。從2024年開始,亞馬遜網(wǎng)絡(luò)服務(wù)、谷歌云、微軟Azure和甲骨文云基礎(chǔ)設(shè)施將成為首批部署基于H200實(shí)例的云服務(wù)提供商。盡管還沒有公布H200的價(jià)格,但一定比H100目前每臺(tái)2.5萬美元至4萬美元的價(jià)格更加昂貴。

從兩個(gè)方面看,英偉達(dá)的GPU供需還存在較大的不確定性。不過。賣家市場,會(huì)有更多廠商加入。

明年GPU的另一大賣家,就是回過神來的AMD。

從最近的財(cái)報(bào)來看,AMD預(yù)計(jì)四季度GPU收入將達(dá)到4億美元,到2024年底將超過10億美元。其CEO蘇姿豐對明年充滿期待:“MI300將成為自2020年后,銷售額達(dá)到10億美元最快的產(chǎn)品。”

2023年11月,AMD正式發(fā)布了對標(biāo)H100的產(chǎn)品——MI300。據(jù)AMD展示,由8塊MI300X組成的服務(wù)器在大模型推理方面的表現(xiàn),要比同樣規(guī)模的H100速度最高提升1.6倍之多。對于AMD來說,這種直接對標(biāo),實(shí)屬罕見。

有意思的是,Meta、微軟和OpenAI公司在AMD投資者活動(dòng)上表態(tài),未來他們將會(huì)使用AMD最新的人工智能(AI)芯片InstinctMI300X。

不過,英偉達(dá)對AMD的對標(biāo)也態(tài)度強(qiáng)硬,官方發(fā)布博客,駁斥AMD的評測不客觀。英偉達(dá)表示,如果H100GPU使用了優(yōu)化過的軟件進(jìn)行正確的基準(zhǔn)測試,它的性能將大大超過MI300X。

由于MI300還未正式應(yīng)用,對于我們對于AMD和英偉達(dá)之間的“官司”很難分說,但不論如何,AMD已經(jīng)走到了高性能GPU的起跑線。

總而言之,2024年的GPU還充滿變數(shù)。在AI大模型冷靜后、在買家不想當(dāng)冤大頭后、在賣家越來越多后,GPU還會(huì)維持天價(jià)嗎?相信各位看官心中自有答案。從市場的角度看,無論是當(dāng)下多先進(jìn)的技術(shù),到最后終將會(huì)越來越普世。就看GPU玩家們,在2024年如何進(jìn)攻戰(zhàn)場了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4945

    瀏覽量

    131227
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249410
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1208

    瀏覽量

    8914
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3141

    瀏覽量

    4064

原文標(biāo)題:2024年,GPU能降價(jià)嗎?

文章出處:【微信號(hào):ICViews,微信公眾號(hào):半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為2024營收8621億凈利潤626億 華為2024年年報(bào)完整版免費(fèi)下載

    華為2024營收8621億凈利潤626億 華為2024年年報(bào)完整版免費(fèi)下載
    的頭像 發(fā)表于 03-31 18:01 ?2076次閱讀
    華為<b class='flag-5'>2024</b><b class='flag-5'>年</b>營收8621億凈利潤626億  華為<b class='flag-5'>2024</b><b class='flag-5'>年年</b>報(bào)完整版免費(fèi)下載

    2024risc-v的發(fā)展總結(jié)

    新的一已經(jīng)來臨,請問有人能將risc-v在2024的發(fā)展做一個(gè)比較全面的總結(jié)?
    發(fā)表于 02-01 18:27

    曬獎(jiǎng)品——2024度優(yōu)秀版主

    感謝電子發(fā)燒友論壇,給予我2024度優(yōu)秀版主的光榮稱號(hào)。今天收到了獎(jiǎng)杯,分享如下: 在2025里,我獎(jiǎng)繼續(xù)努力為論壇做貢獻(xiàn)。 祝咱電子發(fā)燒友論壇2025人氣多多,紅紅火火!
    發(fā)表于 01-19 11:20

    2024GPU出貨量增長顯著,超越CPU

    近日,根據(jù)知名市場研究機(jī)構(gòu)Jon Peddie Research(JPR)最新發(fā)布的報(bào)告,2024全球GPU(包括集成顯卡和獨(dú)立顯卡)市場呈現(xiàn)出強(qiáng)勁的增長態(tài)勢。報(bào)告顯示,該年度GPU
    的頭像 發(fā)表于 01-17 14:12 ?525次閱讀

    榜樣力量,智領(lǐng)未來——2024度電子發(fā)燒友社區(qū)表彰

    2024 年里,電子發(fā)燒友匯聚了超過670萬名用戶,他們在這里分享、學(xué)習(xí)并探索最新的技術(shù)內(nèi)容。 這一,電子發(fā)燒友平臺(tái)累計(jì)產(chǎn)生超過120000篇文章、36000篇帖子、21000個(gè)資料、22000個(gè)
    發(fā)表于 01-16 13:36

    紫光國微發(fā)布2024度業(yè)績快報(bào)

    1月13日晚間,紫光國微(002049.SZ)發(fā)布2024度業(yè)績快報(bào),公司2024實(shí)現(xiàn)營業(yè)收入55.11億元,歸母凈利潤11.91億元。截止20
    的頭像 發(fā)表于 01-14 13:55 ?812次閱讀

    2024Thread的重要亮點(diǎn)

    Thread Group近期通過本篇博文來總結(jié)2024取得的驚人進(jìn)步和成就。目前,Thread會(huì)員基礎(chǔ)已近 200 家公司,從去年1月份參加CES 2024,到7月份慶祝成立 10 周年,再到
    的頭像 發(fā)表于 01-14 09:30 ?671次閱讀

    理想汽車202412月交付58513輛

    近日,理想汽車公布202412月交付數(shù)據(jù)。202412月,理想汽車交付新車58,513輛,同比增長16.2%。截至2024
    的頭像 發(fā)表于 01-02 16:56 ?801次閱讀

    盤點(diǎn)NVIDIA 2024的創(chuàng)新成果

    2024,AI 的影響力已經(jīng)擴(kuò)展到加速計(jì)算和數(shù)據(jù)科學(xué)等多個(gè)關(guān)鍵領(lǐng)域,成為驅(qū)動(dòng)各行各業(yè)技術(shù)革新和產(chǎn)業(yè)升級(jí)的關(guān)鍵因素。在這一里,NVIDIA 又帶來了哪些創(chuàng)新成果,實(shí)現(xiàn)了哪些突破?跟隨本文一起盤點(diǎn) NVIDIA
    的頭像 發(fā)表于 01-02 14:32 ?676次閱讀

    飛騰榮獲“2024度十佳卓越課題”及“2024度優(yōu)秀課題”獎(jiǎng)項(xiàng)

    近日,北京金融科技產(chǎn)業(yè)聯(lián)盟2024度會(huì)員代表大會(huì)在京成功召開,飛騰公司憑借在金融行業(yè)產(chǎn)業(yè)研究、課題攻關(guān)方面的專業(yè)能力和突出成果榮獲 “2024度十佳卓越課題” 及 “
    的頭像 發(fā)表于 12-19 13:59 ?726次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024GPU計(jì)算指南。涵蓋GP
    發(fā)表于 12-16 14:25

    預(yù)計(jì)2024全球GPU市場銷售額將超985億美元

    根據(jù)市場研究機(jī)構(gòu)Jon Peddie Research(JPR)最新發(fā)布的預(yù)測數(shù)據(jù),2024全球GPU市場的銷售額預(yù)計(jì)將超過985億美元,這一數(shù)字凸顯出GPU市場的強(qiáng)勁增長勢頭。
    的頭像 發(fā)表于 11-15 16:26 ?823次閱讀

    談?wù)?b class='flag-5'>GPU的使用壽命

    上文結(jié)合論文談一談,三壽命的GPU [上]說到,電路腐蝕導(dǎo)致橡樹嶺實(shí)驗(yàn)室的GPU壽命只有3,更換了11,000塊GPU。
    的頭像 發(fā)表于 11-01 10:27 ?834次閱讀
    談?wù)?b class='flag-5'>GPU</b>的使用壽命

    2024國產(chǎn)測徑儀的現(xiàn)狀?

    關(guān)鍵字:國產(chǎn)測徑儀,國產(chǎn)光電測徑儀,進(jìn)口光電測徑儀,非接觸測徑儀,工業(yè)測徑儀,藍(lán)鵬測控,國產(chǎn)測徑儀三大品牌, 2024國產(chǎn)測徑儀的現(xiàn)狀呈現(xiàn)出多個(gè)方面的積極態(tài)勢。以下是對當(dāng)前國產(chǎn)測徑儀現(xiàn)狀的詳細(xì)分析
    發(fā)表于 09-26 16:47

    名單公布!【書籍評測活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    紙質(zhì)媒體的高質(zhì)量和專業(yè)網(wǎng)絡(luò)媒體的信息更新速度。 算力芯片在最近15有著巨大性能突破,這些Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA的GPU產(chǎn)品從第一次實(shí)現(xiàn)頂點(diǎn)
    發(fā)表于 09-02 10:09