亞馬遜推出基于Inferentia芯片的Inf1實(shí)例

當(dāng)?shù)貢r(shí)間12月3日，亞馬遜在“AWS re：invent”大會(huì)上正式發(fā)布了自主研發(fā)的第二代基于Arm架構(gòu)的服務(wù)器芯片Graviton2，同時(shí)公布了去年發(fā)布的云端AI推理芯片Inferentia的最新進(jìn)展。

亞馬遜AWS在此次大會(huì)上推出了Inf1實(shí)例，該實(shí)例由Inferentia芯片提供支持，是一個(gè)在云端為AI推理提供支持的實(shí)例，AWS CEO Andy Jassy稱之為云中可用的成本最低的推理產(chǎn)品。

Andy Jassy 指出：使用云服務(wù)為AI解決方案提供動(dòng)力的運(yùn)營(yíng)成本絕大多數(shù)來(lái)自推理，而推理芯片可能會(huì)很昂貴，并且要求低延遲和高吞吐量。許多企業(yè)都在模型訓(xùn)練的定制芯片上投入了大量精力，盡管常規(guī) CPU 上已經(jīng)能夠較好地執(zhí)行推理運(yùn)算，但定制芯片的效率明顯更高?！芭cNvidia G4實(shí)例相比，Inf1具有更低的延遲，吞吐量將提高3倍，并且每個(gè)實(shí)例的成本降低40％?！?/p>

Inferentia芯片還將由Annapurna Labs提供支持，該芯片企業(yè)是2015年被以色列AWS收購(gòu)的。Inferentia芯片擁有4的個(gè)NeuronCore，可以提供128TOPS的算力，而每個(gè)Inf1實(shí)例可以提供2000 TOPS的算力。

與 EC4 上的常規(guī) G4 實(shí)例相比，Inferentia 能夠讓 AWS 帶來(lái)更低的延時(shí)、三倍的吞吐量、且降低 40% 單次的成本。

Inf1實(shí)例目前已經(jīng)上市，并將與PyTorch，MXNet和TensoRFlow集成。不過(guò)，目前其僅可在EC2計(jì)算服務(wù)中使用，但明年，Inf1將可以用于EKS實(shí)例和Amazon的SageMaker，來(lái)進(jìn)行機(jī)器學(xué)習(xí)的推理運(yùn)算。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

ARM

ARM

+關(guān)注

關(guān)注
134

文章
9349

瀏覽量
377301
AI

AI

+關(guān)注

關(guān)注
88

文章
35065

瀏覽量
279345
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2694

瀏覽量
84652

評(píng)論

精選推薦
更多

文章

資料

帖子

一文詳解NMOS與PMOS晶體管的區(qū)別

芯長(zhǎng)征科技
9小時(shí)前

330 閱讀

智能體浪潮里，豆包的崛起之路

腦極體
10小時(shí)前

300 閱讀

NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

麗臺(tái)科技
11小時(shí)前

255 閱讀

兆易創(chuàng)新加入RT-Thread高級(jí)會(huì)員合作伙伴計(jì)劃 | 戰(zhàn)略新篇

RT-Thread官方賬號(hào)
17小時(shí)前

381 閱讀

如何提高LED驅(qū)動(dòng)控制電路抗干擾能力

無(wú)錫中微愛(ài)芯電子有限公司
16小時(shí)前

485 閱讀

UPnP媒體播放器的研究與實(shí)現(xiàn)

費(fèi)加羅
656

5積分

24下載

無(wú)線LED照明系統(tǒng)的設(shè)計(jì)應(yīng)用

盧國(guó)藝
935KB

免費(fèi)

1789下載

witness開(kāi)源PHP監(jiān)控?cái)U(kuò)展

凌流浪
0.04 MB

免費(fèi)

0下載

SpringBlog開(kāi)源博客系統(tǒng)

李斌
0.15 MB

2積分

2下載

輸入選擇器開(kāi)源項(xiàng)目

康桃花
0.08 MB

2積分

2下載

【微五科技CF5010RBT60開(kāi)發(fā)板試用體驗(yàn)】+步進(jìn)電機(jī)的驅(qū)動(dòng)控制

jinglixixi
1天前

272 閱讀

【項(xiàng)目分享】Xii-Boy-Ultra 無(wú)線便攜式 Wii 游戲機(jī)

dianzi_0101
1天前

111 閱讀

【米爾RK3576開(kāi)發(fā)板免費(fèi)體驗(yàn)】1、開(kāi)發(fā)環(huán)境、鏡像燒錄、QT開(kāi)發(fā)環(huán)境搭建以及應(yīng)用部署

EPTmachine
1天前

150 閱讀

【社區(qū)之星】李靜：不斷學(xué)習(xí)，去追隨新技術(shù)的腳步，將知識(shí)通過(guò)實(shí)踐轉(zhuǎn)換為能力

dianzi_0101
4天前

879 閱讀

《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值第19期：2025.07.7--2025.07.11

電子人steve
4天前

888 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

亞馬遜推出基于Inferentia芯片的Inf1實(shí)例

評(píng)論