據(jù)悉,亞馬遜云服務(wù)部門于5月23日宣布,與人工智能新貴Hugging Face達(dá)成合作協(xié)議,在定制化計算芯片Inferentia2上以更優(yōu)惠價格運行上千種AI模型。
Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開發(fā)者分享Chatbot和相關(guān)軟件的核心平臺,受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。
據(jù)了解,Hugging Face是開發(fā)者獲取和調(diào)整諸如Meta Platforms的Llama 3等開源AI模型的首選平臺。
當(dāng)開發(fā)者完成對開源AI模型的調(diào)整后,往往希望能利用此模型驅(qū)動軟件。因此,亞馬遜和Hugging Face決定聯(lián)手,通過在Inferentia2定制化亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)芯片上實現(xiàn)這一目標(biāo)。
Hugging Face的產(chǎn)品及增長主管Jeff Boudier表示,對于他們而言,效率至關(guān)重要——即確保盡可能多的用戶能夠運行模型,且以最具性價比的方式進(jìn)行。
盡管英偉達(dá)在訓(xùn)練模型領(lǐng)域處于領(lǐng)先地位,但AWS堅信其芯片有能力以更低成本運行已訓(xùn)練好的模型。
AWS人工智能產(chǎn)品負(fù)責(zé)人Matt Wood指出,用戶可能每月僅需訓(xùn)練一次這些模型,而實際應(yīng)用中,可能需要每小時對其進(jìn)行數(shù)萬次推理,這正是Inferentia2的獨特優(yōu)勢所在。
-
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280169 -
模型
+關(guān)注
關(guān)注
1文章
3521瀏覽量
50445 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3953瀏覽量
93830 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2696瀏覽量
84694
發(fā)布評論請先 登錄
亞馬遜云科技在2025紐約峰會發(fā)布多項AI agent創(chuàng)新

Dify攜手亞馬遜云科技加速全球企業(yè)生成式AI應(yīng)用規(guī)?;涞?/a>
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......
行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案
聚云科技獲亞馬遜云科技生成式AI能力認(rèn)證
聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證
聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證 助力企業(yè)加速生成式AI應(yīng)用落地
Hugging Face推出最小AI視覺語言模型
LG AI Research使用亞馬遜云科技開發(fā)AI模型 加快癌癥診斷速度

評論