99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾推云端AI芯片 擬聯(lián)手國內(nèi)廠商開發(fā)AI服務(wù)器

科創(chuàng)板日報 ? 來源:科創(chuàng)板日報 ? 2023-07-13 11:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英特爾在中國推出云端AI訓(xùn)練芯片Habana Gaudi2,該芯片可滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。

7月11日,英特爾在中國市場推出云端AI訓(xùn)練芯片——Habana Gaudi2。該芯片可滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。據(jù)現(xiàn)場介紹,該芯片性能在一些關(guān)鍵指標上勝過英偉達A100。

據(jù)了解,該Gaudi2處理器及Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),具有24個可編程Tensor處理器核心(TPCs)。

每顆芯片集成了21個專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2 RDMA以太網(wǎng)接口,配備配置96GB HBM高速內(nèi)存及2.4TB/秒的總內(nèi)存帶寬,滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。

據(jù)現(xiàn)場介紹,英特爾Gaudi2運行ResNet-50的每瓦性能約是英偉達A100的2倍,運行1760億參數(shù)BLOOMZ模型的每瓦性能約達A100的1.6倍。

在發(fā)布會上,浪潮信息高級副總裁、AI和HPC總經(jīng)理劉軍現(xiàn)場發(fā)布搭載Gaudi2的新一代AI服務(wù)器NF5698G7。

目前,英特爾已與浪潮信息合作,打造基于Gaudi2深度學(xué)習(xí)加速器的AI服務(wù)器NF5698G7。該服務(wù)器集成了8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強可擴展處理器,支持AMX/DSA等AI加速引擎。當(dāng)日,該款A(yù)I服務(wù)器也正式發(fā)布。

浪潮信息高級產(chǎn)品經(jīng)理王磊強調(diào),NF5698G7是專為面向生成式AI市場開發(fā)的新一代AI服務(wù)器,支持8顆OAM高速互聯(lián)的Gaudi2加速器,將為AI客戶提供大模型訓(xùn)練和推理能力。

新華三集團計算存儲產(chǎn)品線副總裁劉宏程表示,基于英特爾Gaudi2 AI加速器,新華三正與英特爾合作,開發(fā)適合大模型訓(xùn)練和推理的高性能AI服務(wù)器。

同時,超聚變數(shù)字技術(shù)有限公司算力基礎(chǔ)設(shè)施領(lǐng)域總裁唐啟明指出,超聚變將與英特爾,共同推出基于Gaudi2的全新產(chǎn)品與解決方案。

此前,英特爾中國區(qū)董事長王銳在接受《科創(chuàng)板日報》記者采訪時指出,ChatGPT浪潮帶來計算需求的大幅度提升,目前正與包括百度、阿里等在內(nèi)的中國的客戶開展共同研究。王銳透露,不管是高性能的計算還是分布式的計算,都已經(jīng)進行了布局。

一位英特爾技術(shù)專家《科創(chuàng)板日報》記者分享了英特爾在大模型領(lǐng)域的布局情況。在訓(xùn)練層面,針對CPUGPU、IPU、Habana等異構(gòu)計算,英特爾用oneAPI以及XPU平臺來提供更多的選擇。在推理方面,第四代Sapphire Rapids發(fā)布后,基于AMX加速器,可在行業(yè)中解決80%以上的客戶推理需求。同時,也充分利用CPU,包括用于訓(xùn)練的Ponte Vecchio,和用于推理的Arctic Sound等。

伴隨著大模型的熱潮,云計算的商業(yè)模式正朝著MaaS(模型即服務(wù))的方向演進,其所帶來的算力需求也值得關(guān)注。

“它的理念是利用預(yù)訓(xùn)練模型,對行業(yè)數(shù)據(jù)進行訓(xùn)練,從而形成針對特定場景的、面向各行業(yè)的細分模型。我們知道通用模型的參數(shù)量非常大,例如GPT-3可達到1750億,部署這些模型會比較麻煩,因此,可能需要對大模型進行蒸餾和壓縮,形成行業(yè)可部署的模型?!鄙鲜黾夹g(shù)專家稱。

此外,把大模型進行私有化部署是不少行業(yè)的潛在需求?!昂芏嗉毞中袠I(yè)不接受SaaS服務(wù),尤其金融等行業(yè)。因此,英特爾正在探討如何把這個模型小型化之后,在本土落地做私有化部署,使其真正在行業(yè)落地?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10195

    瀏覽量

    174666
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7976

    瀏覽量

    140024
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35902
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3139

    瀏覽量

    4062

原文標題:欲與英偉達決高下?英特爾推云端AI芯片 擬聯(lián)手國內(nèi)廠商開發(fā)AI服務(wù)器

文章出處:【微信號:chinastarmarket,微信公眾號:科創(chuàng)板日報】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    有什么特殊之處呢? AI加速系統(tǒng)為何看重CPU主控能力? 作為造價極高的AI加速系統(tǒng),DGX B300可以不計成本地選任何CPU,只要它能充分的發(fā)揮整套系統(tǒng)的性能。選擇英特爾至強6作為默認推薦的CPU配置,這意味著它能很好地滿足
    的頭像 發(fā)表于 06-27 11:44 ?172次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6助力<b class='flag-5'>AI</b>系統(tǒng)高效運轉(zhuǎn)

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理(GPU)和AI加速產(chǎn)品系列。包括全新英特爾銳炫? Pro B系
    的頭像 發(fā)表于 05-20 12:27 ?4439次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1514次閱讀

    英特爾先進封裝:助力AI芯片高效集成的技術(shù)力量

    ),以靈活性強、能效比高、成本經(jīng)濟的方式打造系統(tǒng)級芯片(SoC)。因此,越來越多的AI芯片廠商青睞這項技術(shù)。 英特爾自本世紀70年代起持續(xù)創(chuàng)
    的頭像 發(fā)表于 03-28 15:17 ?339次閱讀
    <b class='flag-5'>英特爾</b>先進封裝:助力<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>高效集成的技術(shù)力量

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動力大會上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強 6 性能核處理的第四代服務(wù)器實例,以打造彈性算力底座的產(chǎn)品化實踐。同時,
    的頭像 發(fā)表于 12-23 14:05 ?944次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強處理英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?592次閱讀

    英特爾計劃明年AI PC出貨一億臺

    目標相較于原先2024年4000萬臺的目標有了大幅提升。這些AI PC將由英特爾AI處理驅(qū)動,其中大部分將基于去年年底推出的Meteor Lake平臺,該平臺今年的出貨量已達到了2
    的頭像 發(fā)表于 10-31 14:26 ?883次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當(dāng)前消費者對汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗需求。 英特爾副總裁、汽車事業(yè)部總經(jīng)理
    的頭像 發(fā)表于 10-30 16:26 ?435次閱讀

    英特爾AI PC無所不能的實力

    百業(yè)的最后一公里問題。而客戶端的AI能力也在不斷提升,最終將解決個人AI的數(shù)據(jù)隱私和個性化問題??梢?,AI非常適合云邊端三級架構(gòu),按照用戶場景進行針對性部署。英特爾為云邊端都提供了強大
    的頭像 發(fā)表于 10-12 10:26 ?764次閱讀

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項重大合作——推出基于英特爾Gaudi 3 AI加速
    的頭像 發(fā)表于 10-09 16:40 ?751次閱讀

    英特爾調(diào)降明年AI服務(wù)器芯片出貨目標

    近日,有消息稱英特爾為應(yīng)對內(nèi)部策略調(diào)整及終端需求變化,已對其旗下AI服務(wù)器芯片Gaudi 3的明年出貨目標進行了大幅調(diào)整。
    的頭像 發(fā)表于 10-08 15:38 ?564次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預(yù)計該服務(wù)
    的頭像 發(fā)表于 09-03 15:52 ?662次閱讀

    軟銀與英特爾AI芯片合作計劃告吹

    近日,科技界傳來消息,軟銀集團與英特爾公司關(guān)于共同開發(fā)人工智能(AI芯片的合作計劃以失敗告終。據(jù)悉,雙方曾計劃攜手生產(chǎn)AI
    的頭像 發(fā)表于 08-16 17:46 ?1230次閱讀

    軟銀與英特爾AI芯片合作談判破裂,合作計劃告終

    8月15日最新消息,英國《金融時報》披露,軟銀集團與英特爾之間的秘密會談未能如愿達成,原本旨在聯(lián)手開發(fā)能夠與英偉達一較高下的AI芯片項目宣告
    的頭像 發(fā)表于 08-15 16:04 ?818次閱讀

    從運動員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應(yīng)對多重挑戰(zhàn)

    打造的生成式AI(GenAI)檢索增強生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾?至強?處理英特爾??Gaudi
    的頭像 發(fā)表于 07-25 09:28 ?532次閱讀
    從運動員到<b class='flag-5'>開發(fā)</b>者: <b class='flag-5'>英特爾</b>以開放式<b class='flag-5'>AI</b>系統(tǒng)應(yīng)對多重挑戰(zhàn)