Google在最新一輪MLPerf基準(zhǔn)測(cè)試中推出最新的Tensor處理單元芯片

近日，?Google?AI負(fù)責(zé)人Jeff?Dean發(fā)推文表示，在最新一輪MLPerf基準(zhǔn)測(cè)試中，Google新的ML超級(jí)計(jì)算機(jī)和最新的Tensor處理單元（TPU）芯片，打破了6項(xiàng)MLPerf基準(zhǔn)測(cè)試記錄。

這6個(gè)模型分別是用于排名與推薦的DLRM模型;常用于自然語言處理的Transformer;還有Google搜尋所使用的BERT模型;廣泛用于圖像分類的ResNet-50模型;可在移動(dòng)設(shè)備上執(zhí)行的輕量級(jí)物體偵測(cè)模型SSD;以及圖像分割模型Mask?R-CNN。

谷歌在博客中披露，該超級(jí)計(jì)算機(jī)包括4096個(gè)TPU?V3芯片和CPU數(shù)百個(gè)主機(jī)上的，并提供超過430?PFLOPs的峰值性能。較前一代TPU?v3相比，擁有兩倍的矩陣乘法效能，而且存儲(chǔ)器頻寬大幅增加，內(nèi)部相連技術(shù)也獲得改善，利用MLPerf基準(zhǔn)測(cè)試比較TPU?v4和TPU?v3，TPU?v4平均效能提升2.7倍，最大的效能差異是用于訓(xùn)練Mask?R-CNN，TPU?v4的效能是TPU?v3的3.7倍。

Google使用TensorFlow、JAX和Lingvo中的機(jī)器學(xué)習(xí)模型實(shí)作，從零開始訓(xùn)練Transformer、SSD、BERT以及ResNet-50模型，訓(xùn)練時(shí)間皆在30秒之內(nèi)。而在2015年時(shí)，即便用最快的硬件加速器，訓(xùn)練其中一種模型，都需要花費(fèi)3個(gè)多星期，現(xiàn)今相當(dāng)于把相同模型的訓(xùn)練速度提升5個(gè)數(shù)量級(jí)。
責(zé)任編輯:pj

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

芯片

芯片

+關(guān)注

關(guān)注
460

文章
52520

瀏覽量
441158
Google

Google

+關(guān)注

關(guān)注
5

文章
1789

瀏覽量
59059
AI

AI

+關(guān)注

關(guān)注
88

文章
35168

瀏覽量
280117
MLPerf

MLPerf

+關(guān)注

關(guān)注
0

文章
36

瀏覽量
824

評(píng)論

精選推薦
更多

文章

資料

帖子

基于睿擎派輕松玩轉(zhuǎn)CANopen電機(jī)控制

RT-Thread官方賬號(hào)
1天前

151 閱讀

RK3568開發(fā)板暗藏32位兼容開關(guān)？飛凌嵌入式帶你一鍵解鎖！

飛凌嵌入式
1天前

178 閱讀

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
1天前

790 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
1天前

862 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
1天前

748 閱讀

諾基亞Nokia N95 8GB電路圖紙(68頁)

王超
1229

10積分

3398下載

電氣基礎(chǔ)培訓(xùn)資料

黃勝焱
415 KB

免費(fèi)

0下載

基于openharmony適配移植的徽標(biāo)案例教程

姚小熊27
1.87 MB

免費(fèi)

1下載

PolyORB Ada語言實(shí)現(xiàn)的分布式中間件

絕代雙驕
5.34 MB

2積分

3下載

高度集成的離線電流模式PWM電源開關(guān)U6107D規(guī)格書

蔡蔡
1.47 MB

免費(fèi)

0下載

【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章：探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

jf_83922529
19小時(shí)前

48 閱讀

【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】EASY-EAI-Toolkit人臉識(shí)別

1653149838.791300
19小時(shí)前

37 閱讀

【Banana Pi BPI-RV2開發(fā)板試用體驗(yàn)】從零編譯Banana Pi BPI-RV2開發(fā)板的openWRT

大菠蘿Alpha
19小時(shí)前

53 閱讀

【RA-Eco-RA6M4開發(fā)板評(píng)測(cè)】基于SHELL進(jìn)行ADC測(cè)試

jf_1137202360
19小時(shí)前

140 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語言模型部署

左岸cpx
1天前

335 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

Google在最新一輪MLPerf基準(zhǔn)測(cè)試中推出最新的Tensor處理單元芯片

評(píng)論