截止到2017年12月份,Arm的合作伙伴總計(jì)出貨了1200億臺(tái)基于Arm的設(shè)備,基于Arm的片上集成系統(tǒng)(SoC)僅2017年便出貨213億,占總體市場(chǎng)份額的39%。Arm一路見(jiàn)證和參與了科技世界的巨變,并且仍在不斷前進(jìn)。
發(fā)布《物聯(lián)網(wǎng)安全宣言》,同時(shí)在此基礎(chǔ)上宣布推出業(yè)界首個(gè)通用安全框架——平臺(tái)安全架構(gòu)(PSA)。
推出Project Trillium項(xiàng)目,這是一套包括新的高度可擴(kuò)展處理器的Arm IP組合,可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。
發(fā)布包含全新的視頻、顯示和圖像處理器的Mali多媒體套件,可與基于DynamIQ的CPU和其他Arm IP無(wú)縫集成,從而全面實(shí)現(xiàn)新一代針對(duì)主流移動(dòng)設(shè)備和數(shù)字電視的解決方案。
Cortex-M35P,通過(guò)授權(quán)SoC設(shè)計(jì)人員將更高級(jí)別的安全性納入到日益增長(zhǎng)的一系列需要抵御物理攻擊威脅的應(yīng)用。
是的,Arm創(chuàng)新的步伐從未停止,尤其是在移動(dòng)產(chǎn)業(yè)上,也進(jìn)一步帶動(dòng)了其他行業(yè)的增長(zhǎng)。這不,最近發(fā)布的三款新品,在處理器的“江湖”又掀起一陣新的“性能風(fēng)暴”。
Cortex-A76
基于DynamIQ技術(shù)的全新高性能CPU Cortex-A76震撼登場(chǎng),移動(dòng)處理器領(lǐng)域一直是Arm CPU的強(qiáng)項(xiàng),新一代“性能擔(dān)當(dāng)”Cortex-A76又將如何以移動(dòng)級(jí)的效率實(shí)現(xiàn)筆記本級(jí)的性能呢?
移動(dòng)級(jí)的效率,筆記本電腦級(jí)的性能
1、與Cortex-A75相比,Cortex-A76實(shí)現(xiàn)了35%的性能提升。
2、功耗降低了40%。
3、Cortex-A76能發(fā)揮比前一代產(chǎn)品高達(dá)4倍的終端機(jī)器學(xué)習(xí)性能。
強(qiáng)勁性能背后的“小秘密”
Cortex-A76在微架構(gòu)方面幾項(xiàng)重大改進(jìn)包括提升每周期處理指令數(shù)量,和更深度的內(nèi)存層級(jí)平行處理,達(dá)到更高的性能。
其中一些關(guān)鍵改進(jìn)包括:
解耦合分支預(yù)測(cè)(Decoupled branch prediction)與指令預(yù)取(instructionfetch):設(shè)計(jì)在高帶寬下隱藏延遲,Cortex-A76前端順序取指組件每個(gè)周期能預(yù)取4至8個(gè)指令,并使用多層式分支目標(biāo)快取緩存(multi-level branch targetcaches)以及混合式間接預(yù)測(cè)器(hybrid indirect predictor)來(lái)維持最高的處理量。
譯碼寬度更大:Cortex-A76是Arm首款采4譯碼寬度核心,每周期處理指令的最大數(shù)量進(jìn)一步增加。每周期高達(dá)8個(gè)處理作業(yè)可分派到亂序執(zhí)行(out-of-order)核心,支持更寬的空間與功耗優(yōu)化指令窗口。
更高的整數(shù)與向量執(zhí)行處理量:四指令管線(Quad-isue)整數(shù)處理單元內(nèi)建于核心中,包含3個(gè)簡(jiǎn)單ALU以及1個(gè)多周期整數(shù)處理組件。此外,Cortex-A76支持雙指令管線原生式16B(128位)向量與浮點(diǎn)運(yùn)算單元,其處理量是所有先前此代Arm CPU的兩倍。最重要的是,它提供如先前所述提高4倍的機(jī)器學(xué)習(xí)性能。
強(qiáng)化內(nèi)存系統(tǒng):登個(gè)緩存構(gòu)架除了針對(duì)延遲與帶寬進(jìn)行協(xié)同優(yōu)化,還配備精密的第四代預(yù)取器(prefetcher),以及深度內(nèi)存并行處理功能。
Mali-G76
作為Mali GPU家族的“新晉生力軍”,采用Bifrost架構(gòu),Mali-G76是如何再度將GPU性能提升至前所未有的高度呢?
如何滿足高品質(zhì)用戶體驗(yàn)的視覺(jué)需求?
1、高清手游的巨大市場(chǎng)以及帶來(lái)龐大收入的強(qiáng)力推動(dòng)。
2、VR/AR等新一代高品質(zhì)侵入式應(yīng)用的迫切需求。
3、移動(dòng)設(shè)備端也越來(lái)越有必要的機(jī)器學(xué)習(xí)能力。
視覺(jué)影像的全新境界
1、從高擬真動(dòng)作游戲到混合現(xiàn)實(shí)(MR),Mali-G76提升了30%的性能密度,以及30%的能源效率。
2、Mali-G76在機(jī)器學(xué)習(xí)上的表現(xiàn)是Mali-G72的2.7倍。
這些改進(jìn)讓畫(huà)面更“逼真”
1、Mali-G76支持int8 dot,配備雙材質(zhì)貼圖對(duì)映器(texture mapper),優(yōu)化緩存器,使用數(shù)量減半但容量較大的緩存器庫(kù)區(qū)(bank)。
2、在Mali-G76里盡早配置區(qū)塊深度緩沖區(qū)空間,以便及早執(zhí)行深度預(yù)載,能在算出法向片元(normal fragment)之前完成,因此避免相依延遲的狀況,進(jìn)而增進(jìn)GPU在處理復(fù)雜內(nèi)容時(shí)的性能。
3、Mali-G76建置了TLS地址交插(addressinterleaving),讓單線程的數(shù)據(jù)能集中配置在快取中的相同位置,與以往將數(shù)據(jù)少量散布在多個(gè)位置不同,從單一位置檢索數(shù)據(jù)不僅更有效率,還能改進(jìn)整體運(yùn)算性能。
Mali-V76
如果想要獲取不一樣的高清視覺(jué)體驗(yàn),除了高性能的GPU外,你還需要Mali-V76這樣的“解碼大師”。作為Arm最新最強(qiáng)的高端視頻處理器,實(shí)時(shí)呈現(xiàn)高性能 UHD 8k60fps 的內(nèi)容小case啦。
視頻處理哪家強(qiáng)?
1、支持8K60幀的視頻解碼,Mali-V76的速度是Mali-V61的兩倍。
2、提供同樣解碼能力的同時(shí),它實(shí)現(xiàn)了40%的面積節(jié)省。
3、跟Mail-V61視頻編解碼器的編碼質(zhì)量相比,在同樣的內(nèi)容、同樣的條件下,可以帶來(lái)25%的編碼質(zhì)量提升。
Arm是如何辦到的?
1、在Mali-V76中加入額外的AXI總線,使處理量增加一倍。
2、把整個(gè)視頻流水線的行緩沖區(qū)(line buffer)從4096個(gè)像素增加到8192個(gè)。
3、Mali-V76搭載了8K編碼功能。
Arm全新計(jì)算和多媒體IP套件“從小屏到大屏”,從新定義移動(dòng)設(shè)備!
-
處理器
+關(guān)注
關(guān)注
68文章
19893瀏覽量
235161 -
ARM
+關(guān)注
關(guān)注
134文章
9352瀏覽量
377474
原文標(biāo)題:新一輪“性能風(fēng)暴”來(lái)襲,Arm全新計(jì)算和多媒體IP套件多圖解讀!
文章出處:【微信號(hào):arm_china,微信公眾號(hào):Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論