99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI終端時(shí)代:端側(cè)算力快速提升,AI芯片競(jìng)爭(zhēng)進(jìn)入新的階段

Monika觀察 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2024-04-22 07:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)全球終端市場(chǎng)在經(jīng)歷了高峰之后,在2022年、2023年出現(xiàn)明顯的終端市場(chǎng)下滑。進(jìn)入2024年,全球終端市場(chǎng)又迎來(lái)了小幅反彈,AI技術(shù)的加持是市場(chǎng)反彈的動(dòng)力之一。毫不夸張地說(shuō),是AI重新點(diǎn)燃了終端市場(chǎng)。

2023年被認(rèn)為是AI終端的元年,那么進(jìn)入2024年,AI終端市場(chǎng)會(huì)迎來(lái)哪些發(fā)展機(jī)會(huì),上游的芯片環(huán)節(jié),AI芯片有哪些最新解決方案。

AI終端成為交互入口,首款A(yù)I PC個(gè)人智能體已經(jīng)面世

為什么AI算力會(huì)轉(zhuǎn)移到終端側(cè)?IDC中國(guó)及全球副總裁王吉平提到了四大方面的原因。

一是芯片廠商技術(shù)革命,未來(lái)是在混合算力的基礎(chǔ)上,端側(cè)算力未來(lái)會(huì)快速提升。二是模型正在不斷演變,例如混合專(zhuān)家模型(MoE)正受到業(yè)內(nèi)人士的關(guān)注。三是人們?cè)絹?lái)越關(guān)注安全性,端側(cè)模型對(duì)于個(gè)人安全隱私,以及端之間互聯(lián)互通的安全性有很好地保護(hù)。四是大模型開(kāi)始垂直化整合,垂直領(lǐng)域端+小模型的需求也在提升,王吉平認(rèn)為小模型和小終端之間也可以非常完美地匹配。

目前,在終端產(chǎn)品中,PC、智能家居、車(chē)載設(shè)備、智能手機(jī)、智能手表、耳機(jī),甚至是AR/VR等設(shè)備都能得到AI技術(shù)的加持。

可以預(yù)測(cè)到,隨著場(chǎng)景化發(fā)展,不同場(chǎng)景下的終端分工更加細(xì)致和專(zhuān)業(yè),AI技術(shù)將加速終端未來(lái)十年新一輪的融合。

目前,手機(jī)廠商已經(jīng)打造了各自的AI大模型,將其賦能至智能手機(jī)中,例如華為小藝語(yǔ)音助手用到了盤(pán)古大模型,小米小愛(ài)同學(xué)用的是小米AI大模型MiLM-6B等等。

在AI PC方面,已經(jīng)從普通的AI PC走向了AI PC智能體,例如聯(lián)想于4月18日發(fā)布的業(yè)內(nèi)首款A(yù)I PC個(gè)人智能體——聯(lián)想小天,具備文生圖的功能,還能實(shí)現(xiàn)圖像訓(xùn)練和深度編輯。
圖源:聯(lián)想

在AI機(jī)器人方面,傳音旗下創(chuàng)新科技品牌TECNO在MWC24上,展示了公司首款A(yù)I增強(qiáng)型仿生四足機(jī)器人Dynamic 1,能夠用于智能助手、教育培訓(xùn)等場(chǎng)景。

AI終端在發(fā)展過(guò)程中,大模型(LLM)向智能體(Agent)轉(zhuǎn)變,最終形成一個(gè)完整的閉環(huán)。那么,未來(lái)AI終端會(huì)朝著哪些方向發(fā)展呢?業(yè)內(nèi)人士普遍認(rèn)為,未來(lái)AI終端將成為個(gè)人AI助理,IDC認(rèn)為將具備以下五大特征:

一是成為第一交互入口。此外,當(dāng)國(guó)內(nèi)的推理芯片搭載在各個(gè)終端后,會(huì)形成國(guó)內(nèi)生態(tài)的智能體應(yīng)用于各個(gè)行業(yè)中。二是終端將標(biāo)配本地混合AI算力,例如CPU/NPU/GPU等;隨之,形成個(gè)人終端和個(gè)人邊緣協(xié)同計(jì)算結(jié)構(gòu)。三是終端內(nèi)嵌個(gè)人大模型,形成個(gè)性化本地知識(shí)庫(kù)。四是必須會(huì)有個(gè)人數(shù)據(jù)和隱私安全保護(hù)。五是有一個(gè)連接開(kāi)放的AI應(yīng)用生態(tài),同時(shí)它要開(kāi)發(fā)API接口。



AI芯片進(jìn)入新的競(jìng)爭(zhēng)階段,英偉達(dá)、英特爾高通攻克推理性能
在技術(shù)底層,AI終端的發(fā)展離不開(kāi)AI芯片。隨著AI大模型在終端進(jìn)行規(guī)?;瘮U(kuò)張,部署端側(cè)算力顯得尤為重要。英特爾CEO帕特·基辛格曾表示在人工智能領(lǐng)域,推理技術(shù)變得越來(lái)越重要,甚至比訓(xùn)練還更加重要。

IDC中國(guó)及全球副總裁王吉平也預(yù)測(cè)了大語(yǔ)言模型端側(cè)芯片的發(fā)展趨勢(shì),他認(rèn)為XPU模式會(huì)推動(dòng)端側(cè)模型推理能力明顯提升。
圖源:電子發(fā)燒友網(wǎng)攝

目前,在AI芯片領(lǐng)域,英偉達(dá)、英特爾、AMD等是國(guó)際主流玩家。在近兩年,國(guó)內(nèi)的推理芯片廠商也逐漸進(jìn)入業(yè)內(nèi)視野中,例如阿里平頭哥、寒武紀(jì)、燧原科技、云天勵(lì)飛等,隨著技術(shù)的迭代,上述國(guó)產(chǎn)芯片廠商的AI芯片性能也在不斷提升。

AI芯片領(lǐng)域的競(jìng)爭(zhēng)進(jìn)入了新的階段。目前,英特爾、英偉達(dá)、高通都推出了各自面向AI推理的芯片。

就在美國(guó)時(shí)間4月9日,英特爾發(fā)布了新一代AI芯片Gaudi 3,可對(duì)標(biāo)英偉達(dá)H100。Gaudi 3采用5nm工藝制造,具有64個(gè)第五代張量處理核心、8個(gè)矩陣計(jì)算引擎,24個(gè)200 Gbps以太網(wǎng) RDMA NIC,以太網(wǎng)的通用標(biāo)準(zhǔn)能連接數(shù)萬(wàn)個(gè)加速器,最高 16 條 PCIe 5.0 總線。與Gaudi 2相比,Gaudi 3的FP8吞吐量達(dá)到1835 TFLOPS,BF16性能提升四倍,網(wǎng)絡(luò)帶寬提升兩倍,內(nèi)存帶寬提升1.5倍。

英偉達(dá)H100芯片是在2023年發(fā)布的產(chǎn)品,采用4nm工藝,搭載了最新Hopper架構(gòu),集成Transformer引擎、第四代TensorCore、第四代張量?jī)?nèi)核等技術(shù)。支持PCle Gen5和利用HBM3,憶體頻寬達(dá)到3TB/s,F(xiàn)P8 算力與A100相比提升了3倍,達(dá)4000TFLOPS。

在今年3月的英偉達(dá)GTC人工智能大會(huì),英偉達(dá)還發(fā)布了Blackwell B200 GPU,有著2080億個(gè)晶體管,H100的FP4性能為4 petaflops,而B(niǎo)200 能提供高達(dá)20 petaflops FP4的算力。兩個(gè)B200與單個(gè)英偉達(dá)Grace CPU相連,打造出GB200 Grace Blackwell超級(jí)芯片。

在AI芯片新的競(jìng)爭(zhēng)階段,廠商都更加重視芯片的推理能力,從英特爾和英偉達(dá)的新品正好說(shuō)明了這一點(diǎn)。英特爾Gaudi系列面向AI應(yīng)用場(chǎng)景,其推理能力也在不斷提升,Gaudi 3的模型訓(xùn)練速度提升40%,推理速度則提升50%。

英偉達(dá)介紹,H100采用了新的Transformer Engine專(zhuān)門(mén)用于加速Transformer 模型的訓(xùn)練和推理,在進(jìn)行語(yǔ)言模型的訓(xùn)練和推理時(shí),訓(xùn)練速度是A100的9倍,推理速度是A100的30倍。Blackwell GPU更是能提供30倍的推理性能,AI訓(xùn)練和大模型實(shí)時(shí)推理的規(guī)模擴(kuò)展到10萬(wàn)億參數(shù)。

高通也在2023年10月發(fā)布驍龍 X Elite,這是一款面向 Windows 11 PC 的旗艦 PC 芯片,集成了Oryon?CPU、Adreno?GPU、Hexagon?NPU,支持在端側(cè)運(yùn)行超過(guò) 130 億參數(shù)的生成式 AI 模型。

在當(dāng)時(shí)的發(fā)布會(huì)上,高通透露搭載驍龍 X Elite 芯片的筆記本電腦在今年中期面世。近期已有消息顯示,聯(lián)想 YOGA Slim 7 14 2024 驍龍版,以及一款命名為T(mén)hinkPad T14s Gen 6 驍龍版的筆記本或?qū)⒋钶d高通驍龍X Elite 芯片。高通驍龍X Elite 芯片會(huì)給聯(lián)想AI PC帶來(lái)哪些AI性能,值得期待。

而英偉達(dá)的H100已經(jīng)應(yīng)用在其超級(jí)計(jì)算機(jī)Eos中,總共搭載了4608個(gè)H100 GPU,還有1,152個(gè)英特爾至強(qiáng)Platinum 8480C處理器。Eos被認(rèn)為是英偉達(dá)速度最快的人工智能超級(jí)計(jì)算機(jī),可用于人工智能和高性能計(jì)算工作負(fù)載。

每一代AI芯片的推出,都有它各自的應(yīng)用定位。從終端市場(chǎng)來(lái)看,AI技術(shù)已經(jīng)從手機(jī)、PC滲透進(jìn)更多終端產(chǎn)品,未來(lái)會(huì)走向高性能PC、工作站等,不管是面向TO C,還是TO B的行業(yè)場(chǎng)景(服務(wù)業(yè)、制造業(yè)等),所需要的算力將隨著應(yīng)用需求逐步提升,也會(huì)提高推理芯片的要求。未來(lái)推理芯片在AI終端會(huì)迎來(lái)怎么樣的發(fā)展,又會(huì)提升哪些應(yīng)用體驗(yàn),值得期待。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35194

    瀏覽量

    280287
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35937
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1202

    瀏覽量

    15671
  • AI PC
    +關(guān)注

    關(guān)注

    0

    文章

    137

    瀏覽量

    495
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    側(cè)AI需求大爆發(fā)!安謀科技發(fā)布新一代NPU IP,賦能AI終端應(yīng)用

    ,汽車(chē)自動(dòng)駕駛的本地決策,都依賴提升,這對(duì)側(cè)AI SoC的性能帶來(lái)挑戰(zhàn),上游IP廠商的新品
    的頭像 發(fā)表于 07-11 01:16 ?6766次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>需求大爆發(fā)!安謀科技發(fā)布新一代NPU IP,賦能<b class='flag-5'>AI</b><b class='flag-5'>終端</b>應(yīng)用

    邊緣計(jì)算時(shí)代,科通技術(shù)以AI方案重構(gòu)分配格局

    隨著AI大模型技術(shù)的快速發(fā)展,其在終端設(shè)備中的應(yīng)用正成為行業(yè)突破的關(guān)鍵方向。深圳市科通技術(shù)股份有限公司(以下簡(jiǎn)稱(chēng)“科通技術(shù)”)憑借“DeepSeek+AI
    的頭像 發(fā)表于 05-28 14:23 ?210次閱讀

    蘋(píng)芯科技 N300 存一體 NPU,開(kāi)啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長(zhǎng),智能設(shè)備對(duì)本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問(wèn)題成為制約
    的頭像 發(fā)表于 05-06 17:01 ?485次閱讀
    蘋(píng)芯科技 N300 存<b class='flag-5'>算</b>一體 NPU,開(kāi)啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> <b class='flag-5'>AI</b> 新征程

    側(cè) AI 芯片終端智能落地的核心引擎

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)側(cè) AI 芯片,是專(zhuān)門(mén)為在諸如智能手機(jī)、IoT 設(shè)備、自動(dòng)駕駛汽車(chē)等終端設(shè)備上,高效運(yùn)行人工智能算法而設(shè)
    的頭像 發(fā)表于 04-14 02:11 ?2508次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓側(cè)AI模型接入得心應(yīng)手

    猛增50倍,將訓(xùn)練時(shí)間從一整天縮短至半小時(shí)。更快的側(cè)LoRA訓(xùn)練,讓側(cè)AI基于用戶
    發(fā)表于 04-13 19:52

    側(cè)AI應(yīng)用——“后DeepSeek時(shí)代”產(chǎn)業(yè)機(jī)遇分析

    ,面向行業(yè)進(jìn)一步釋放 "側(cè) AI 應(yīng)用" 的確定性機(jī)遇,推動(dòng)“后DeepSeek時(shí)代” PC生產(chǎn)邊界實(shí)現(xiàn)跨越式拓展。 搭載AMD銳龍
    的頭像 發(fā)表于 03-26 17:34 ?339次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點(diǎn)。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計(jì)算任務(wù)提供了必要的帶寬保障。 800G光模塊如何解決DeepSeek大規(guī)模
    發(fā)表于 03-25 12:00

    兩大芯片廠商比拼側(cè)AI音頻芯片,高藍(lán)牙6.0成亮點(diǎn)

    (電子發(fā)燒友網(wǎng)綜合報(bào)道)隨著人工智能技術(shù)的飛速發(fā)展,AI芯片作為其核心硬件支撐,正逐漸從云端向側(cè)拓展。
    的頭像 發(fā)表于 03-24 08:51 ?1733次閱讀

    【一文看懂】什么是側(cè)?

    隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術(shù)的快速發(fā)展,側(cè)正逐漸成為智能設(shè)備性能提升和智能化應(yīng)
    的頭像 發(fā)表于 02-24 12:02 ?1338次閱讀
    【一文看懂】什么是<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>?

    廣和通發(fā)布Fibocom AI Stack,助力客戶快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的側(cè)AI部署

    模型及行業(yè)側(cè)模型,基于不同等級(jí)芯片平臺(tái)或模組,F(xiàn)ibocom AI Stack可將Ten
    發(fā)表于 01-08 11:38 ?275次閱讀
    廣和通發(fā)布Fibocom <b class='flag-5'>AI</b> Stack,助力客戶<b class='flag-5'>快速</b>實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>部署

    廣和通開(kāi)啟側(cè)AI時(shí)代

    AI發(fā)展正酣,隨著終端芯片越來(lái)越高、側(cè)模型能力
    的頭像 發(fā)表于 12-12 10:35 ?814次閱讀

    AI風(fēng)向標(biāo)|與通信的完美融合,SRM6690解鎖側(cè)AI的智能密碼

    當(dāng)前,5G技術(shù)已經(jīng)成為推動(dòng)數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的關(guān)鍵驅(qū)動(dòng)力,進(jìn)入5G發(fā)展的下半場(chǎng),5G與AI的融合正推動(dòng)諸多行業(yè)的數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展,終端側(cè)
    的頭像 發(fā)表于 11-15 01:01 ?571次閱讀
    <b class='flag-5'>AI</b>風(fēng)向標(biāo)|<b class='flag-5'>算</b><b class='flag-5'>力</b>與通信的完美融合,SRM6690解鎖<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>的智能密碼

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2417次閱讀

    側(cè)AI浪潮已來(lái)!炬芯科技發(fā)布新一代側(cè)AI音頻芯片,能效比和AI大幅度提升

    電子發(fā)燒友原創(chuàng) 章鷹 ? 11月5日,在深圳會(huì)展中心7號(hào)館內(nèi),炬芯科技董事長(zhǎng)兼CEO周正宇博士帶來(lái)了《側(cè)AI芯片的未來(lái)》演講,他對(duì)
    的頭像 發(fā)表于 11-06 09:11 ?4031次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來(lái)!炬芯科技發(fā)布新一代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>,能效比和<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大幅度<b class='flag-5'>提升</b>

    大模型時(shí)代需求

    現(xiàn)在AI進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)
    發(fā)表于 08-20 09:04