99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm遲遲推出全新NPU系列的原因是什么

獨(dú)愛72H ? 來源:雷鋒網(wǎng) ? 作者:佚名 ? 2019-10-30 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:雷鋒網(wǎng))

Arm推出了一系列全新的IP,包括NPU、GPU以及DPU。NPU尤為值得關(guān)注,不僅因?yàn)镹PU系列同時(shí)發(fā)布了N57和N37兩款新品,還因?yàn)锳rm的ML處理器(Machine Learning Processor)系列名稱Ethos也正式公布。全新AI系列產(chǎn)品的亮相,意味著Arm的AI策略更加明晰。

實(shí)際上,Arm原計(jì)劃在2019年第一季度發(fā)布首款ML處理器。之所以選擇這個(gè)時(shí)間點(diǎn),Arm ML事業(yè)群商業(yè)與營(yíng)銷副總裁Dennis Laudick去年11月接受雷鋒網(wǎng)專訪時(shí)表示:“最近我們已經(jīng)看到機(jī)器學(xué)習(xí)技術(shù)正在穩(wěn)定和成熟,市場(chǎng)需求也正在不斷增加,我們認(rèn)為現(xiàn)在是進(jìn)入市場(chǎng)的最佳時(shí)機(jī)?!?/p>

不過,Arm首款ML處理器的發(fā)布時(shí)間是在今年5月,比計(jì)劃略晚一些。Dennis上周再次接受雷鋒網(wǎng)專訪時(shí)表示,發(fā)布推遲有很多原因,產(chǎn)品開發(fā)是主要的問題。ML處理器開發(fā)的過程中面臨很多挑戰(zhàn),其中一個(gè)很大的挑戰(zhàn)就是數(shù)據(jù)移動(dòng)處理不好就會(huì)消耗大量的電,另一個(gè)大的挑戰(zhàn)就是如何權(quán)衡效率和靈活性。

雖然產(chǎn)品的開發(fā)影響了首款ML處理器發(fā)布的時(shí)間,但Arm并沒有在首款ML產(chǎn)品發(fā)布時(shí)就公布其系列名稱和型號(hào)。而是直到面向主流市場(chǎng),提供性能、成本以及功耗均衡的N57和對(duì)成本極端敏感的N37發(fā)布,Arm才正式公布ML系列處理器的的名稱——Ethos(中文可翻譯為精神)。此時(shí),外界也才清楚5月發(fā)布的首款ML處理器型號(hào)為Ethos-N77,定位高端,面向高性能需求的市場(chǎng)。

這是為什么?Dennis解釋稱,其實(shí)有很多原因,Arm內(nèi)部也在重新思考命名系統(tǒng),如果推出第一款機(jī)器學(xué)習(xí)產(chǎn)品就立刻發(fā)布新的產(chǎn)品系列名稱,可能大家會(huì)把對(duì)這個(gè)系列品牌的印象和認(rèn)知捆綁在這一款產(chǎn)品身上,我們不希望造成這樣的效果。我們希望大家看到Ethos這個(gè)產(chǎn)品名下面的產(chǎn)品系列是廣泛而豐富的,這就是為什么要等到有針對(duì)三個(gè)不同市場(chǎng),三個(gè)不同檔次的產(chǎn)品都出來了,才正式的對(duì)外公布產(chǎn)品系列的名稱的主要原因。

但更為關(guān)鍵的是,市場(chǎng)上已經(jīng)有眾多競(jìng)爭(zhēng)者,此時(shí)推出Ethos還有競(jìng)爭(zhēng)力嗎?Dennis表示,Arm的成功一直以來都得益于生態(tài)系統(tǒng),對(duì)于NPU來說挑戰(zhàn)并不是能夠做出自己的NPU,而是NPU在市場(chǎng)上是不是真的好用。我們已經(jīng)聽到合作伙伴反饋說,希望在硬件上能夠標(biāo)準(zhǔn)化,他們不想支持15種不同的硬件,所以,他們期待有一個(gè)標(biāo)準(zhǔn)化的軟件平臺(tái)能夠支持。

以具體的產(chǎn)品看,Ethos-N57與Ethos-N37的設(shè)計(jì)理念包括一些基本原則,例如:針對(duì)Int8與Int16數(shù)據(jù)類型的支持性進(jìn)行優(yōu)化;先進(jìn)的數(shù)據(jù)管理技術(shù),以減少數(shù)據(jù)的移動(dòng)與相關(guān)的耗電;通過Winograd技術(shù)的落地,使性能比其他NPU提升超過200%。

AI處理器支持的數(shù)據(jù)類型非常關(guān)鍵,隨著算法和模型的逐步成熟,邊緣端的AI芯片很多都只支持Int8的數(shù)據(jù)類型,但Arm還選擇支持Int16。對(duì)此,Dennis表示,機(jī)器學(xué)習(xí)支持Int8數(shù)據(jù)類型基本就足夠了,我們之所以選擇也支持INT16是為了更好的應(yīng)對(duì)涉及到圖像處理的工作,因?yàn)橥ǔ碚f像素是10到12位,牽扯到顏色,支持INT16就省略了很多的數(shù)據(jù)轉(zhuǎn)換的工作,非常適合圖像處理。

但為何又沒有支持更高精度的FP16?“因?yàn)镕P16對(duì)帶寬的需求相當(dāng)高,這就意味著處理器的整個(gè)處理量和功耗就會(huì)提升。但消耗這么多的功耗和帶寬,準(zhǔn)確率與INT8比較卻沒有多少提升。” Dennis如此解釋。

雖然機(jī)器學(xué)習(xí)讓處理器的設(shè)計(jì)面臨著新的挑戰(zhàn),不過Dennis認(rèn)為機(jī)器學(xué)習(xí)本身并沒有改變最為根本的處理器的設(shè)計(jì)原則,只不過針對(duì)機(jī)器學(xué)習(xí)的處理器設(shè)計(jì)的重點(diǎn)可能和通用處理器有所不同。Arm一直強(qiáng)調(diào)的數(shù)據(jù)管理是我們的重點(diǎn),還有并行計(jì)算、矩陣乘法都是我們關(guān)注的重點(diǎn)。

硬件的獨(dú)特性之外,軟件也同樣重要,特別是在AI時(shí)代,軟硬一體化的重要性更加突顯。要實(shí)現(xiàn)理想的軟硬結(jié)合,Dennis認(rèn)為有兩大挑戰(zhàn),一個(gè)還是權(quán)衡的問題,也就是多少工作讓硬件完成以及多少工作給軟件完成。另一個(gè)是ML框架的支持,因?yàn)檫@個(gè)領(lǐng)域還很新,還會(huì)出現(xiàn)不同的框架。

除了軟硬一體化提升AI性能,在先進(jìn)半導(dǎo)體制程越來越昂貴的背景下,通過異構(gòu)系統(tǒng)提升處理器性能也受到了很大的關(guān)注。但異構(gòu)的系統(tǒng)給軟件帶來的更大的挑戰(zhàn),此時(shí),到底是用統(tǒng)一的軟件API去分配硬件資源實(shí)現(xiàn)易用性,還是對(duì)每個(gè)硬件單獨(dú)編程讓系統(tǒng)更加高效?

Arm采用的在硬件之上有特別優(yōu)化的Compute Library,它會(huì)把底層的硬件和驅(qū)動(dòng)進(jìn)行充分優(yōu)化,根據(jù)算子的不同需求驅(qū)動(dòng)硬件,可以提升幾倍到十幾倍的效率。再上一層是Arm nn,可以將TensorFlow、Caffe等神經(jīng)網(wǎng)絡(luò)框架轉(zhuǎn)換成Compute Library可以執(zhí)行的任務(wù),讓開發(fā)者不用關(guān)心底層的硬件,只需要使用標(biāo)準(zhǔn)架構(gòu)進(jìn)行開發(fā)就可以。

因此,Dennis表示Arm采用的方式是更加底層的方式,軟件直接與CPU、GPU或NPU進(jìn)行溝通,做最佳匹配。這其中最大的挑戰(zhàn)還是平衡的問題,軟件的架構(gòu)要做到根據(jù)具體的應(yīng)用,分配專用和通用的處理器,這個(gè)百分比還可以不斷調(diào)整,這是最難做的。

在框架的支持上,Arm是希望其硬件可以讓開發(fā)者不需要去特別選擇需要用哪一個(gè)框架。NPU軟硬件的獨(dú)特性和優(yōu)勢(shì)只有獲得市場(chǎng)的認(rèn)可才能成功,那么首先得滿足不同場(chǎng)景的算力需求。Ethos系列現(xiàn)有的三款ML處理器性能從1-4 TOP/s不等,但是即便是在邊緣端,也會(huì)有更高的性能需求,更不用說高性能計(jì)算的場(chǎng)景。

但是,隨著系統(tǒng)的復(fù)雜性增加,計(jì)算單元的增加并不意味著一直能夠帶來線性的性能提升。Arm如何應(yīng)對(duì)?Dennis表示,這種組裝確實(shí)有其局限性,到達(dá)某個(gè)性能后可能性能的提升就消失了,但Arm在GPU和CPU多處理器架構(gòu)上有很好的架構(gòu)設(shè)計(jì),能夠盡量實(shí)現(xiàn)比較長(zhǎng)的線性性能提升。

為應(yīng)對(duì)AIoT時(shí)代更激烈的競(jìng)爭(zhēng),特別是RISC-V的競(jìng)爭(zhēng),我們也看到Arm在本月初宣布推出全新的功能 Arm Custom instructions,允許客戶在特定的 CPU 內(nèi)核中加入自定義指令功能,能夠加速特定的用例、嵌入式物聯(lián)網(wǎng)應(yīng)用程序。

Dennis表示,我們會(huì)認(rèn)真的看待RISC-V在市場(chǎng)上的進(jìn)展和動(dòng)作,就像我們認(rèn)真看待其他架構(gòu)一樣。Arm的優(yōu)勢(shì)在于我們能夠提供最全面的、擁有靈活性、普遍性的解決方案和產(chǎn)品,與此同時(shí),我們還擁有強(qiáng)大豐富的生態(tài),能夠更好的滿足市場(chǎng)的需求。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235299
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9353

    瀏覽量

    377640
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ARMNPU,F(xiàn)PGA三種核心的開發(fā)板 — 米爾安路飛龍派開發(fā)板

    ,是A股首家專注于FPGA業(yè)務(wù)的上市公司。YM90X開發(fā)板用的就是安路的SALDRAGON1(飛龍1,以下簡(jiǎn)稱DR1)系列FPSoC。FPSoC就是將ARMNPU
    的頭像 發(fā)表于 06-13 08:03 ?619次閱讀
    有<b class='flag-5'>ARM</b>,<b class='flag-5'>NPU</b>,F(xiàn)PGA三種核心的開發(fā)板 — 米爾安路飛龍派開發(fā)板

    后摩智能NPU適配通義千問Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列模型(Qwen3 0.6B-14B)在端邊側(cè)的高效部署。這一成果充分彰顯了
    的頭像 發(fā)表于 05-07 16:46 ?572次閱讀

    靈動(dòng)微電子推出全新超值型MM32F0050系列MCU

    靈動(dòng)微電子推出全新超值型MM32F0050系列MCU。2018年,靈動(dòng)首次上市了其主打性價(jià)比的超值型MM32F00系列,目前已陸續(xù)推出了F0
    的頭像 發(fā)表于 04-01 09:36 ?790次閱讀
    靈動(dòng)微電子<b class='flag-5'>推出</b><b class='flag-5'>全新</b>超值型MM32F0050<b class='flag-5'>系列</b>MCU

    ADC的諧波產(chǎn)生的原因是什么?

    ADC的諧波產(chǎn)生的原因是什么
    發(fā)表于 02-08 08:25

    NPU的工作原理解析

    隨著人工智能技術(shù)的快速發(fā)展,深度學(xué)習(xí)算法在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。為了滿足日益增長(zhǎng)的計(jì)算需求,NPU應(yīng)運(yùn)而生。 NPU的基本概念 NPU是一種專用硬件加速器,專門為深度學(xué)習(xí)算法設(shè)計(jì)。它通過優(yōu)化
    的頭像 發(fā)表于 11-15 09:17 ?2941次閱讀

    什么是NPU芯片及其功能

    在人工智能(AI)技術(shù)迅猛發(fā)展的今天,NPU芯片已經(jīng)成為推動(dòng)這一領(lǐng)域進(jìn)步的關(guān)鍵技術(shù)之一。NPU芯片,即神經(jīng)網(wǎng)絡(luò)處理單元,是一種專門為深度學(xué)習(xí)算法設(shè)計(jì)的硬件加速器。 一、NPU芯片的概念 NPU
    的頭像 發(fā)表于 11-14 15:48 ?5279次閱讀

    恩智浦推出全新i.MX RT700跨界MCU系列

    高度集成的全新i.MX RT700跨界MCU旨在顯著節(jié)省功耗,配備eIQ Neutron神經(jīng)處理單(NPU),可在邊緣端提供高達(dá)172倍的AI加速。
    的頭像 發(fā)表于 10-12 11:41 ?1326次閱讀

    什么是NPU?什么場(chǎng)景需要配置NPU?

    在人工智能(AI)技術(shù)如火如荼的今天,NPU神經(jīng)處理單元(Neural Processing Unit)作為一種新興的硬件加速器,正在成為ARM主板配置中的新寵。與傳統(tǒng)的CPU和GPU相比,NPU
    的頭像 發(fā)表于 10-11 10:13 ?6403次閱讀
    什么是<b class='flag-5'>NPU</b>?什么場(chǎng)景需要配置<b class='flag-5'>NPU</b>?

    NXP推出集成NPU的MCU,支持AI邊緣設(shè)備!MCU實(shí)現(xiàn)AI功能的多種方式

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,恩智浦宣布推出全新i.MX RT700跨界MCU系列,支持智能AI的邊緣端設(shè)備,例如可穿戴設(shè)備、消費(fèi)醫(yī)療設(shè)備、智能家居設(shè)備和HMI平臺(tái)。據(jù)官方介紹,新款MCU
    的頭像 發(fā)表于 09-29 01:11 ?5293次閱讀

    AMD推出全新銳龍AI 300系列處理器

    在 Computex 2024 上,AMD 宣布了一系列突破性的、旨在開啟 AI 體驗(yàn)新時(shí)代的下一代架構(gòu)和產(chǎn)品。AMD為下一代 AI PC推出全新的 AMD 銳龍AI 300 系列
    的頭像 發(fā)表于 09-19 10:55 ?1414次閱讀
    AMD<b class='flag-5'>推出</b><b class='flag-5'>全新</b>銳龍AI 300<b class='flag-5'>系列</b>處理器

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止一個(gè)。削減成本通常被認(rèn)為是主要原因——但盡管通過云遷移降低成本無疑是一種誘人的可能性,但創(chuàng)新潛力才是更大的獎(jiǎng)勵(lì)。云計(jì)算通過支持企業(yè)創(chuàng)新而產(chǎn)生的價(jià)值是僅僅通過 降低 IT 成本所能實(shí)現(xiàn)的價(jià)值
    的頭像 發(fā)表于 09-14 17:38 ?530次閱讀

    如何利用ARMxy ARM嵌入式計(jì)算機(jī)的NPU進(jìn)行深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化?

    在正文開始前,我們先大致了解鋇錸的ARMxy ARM嵌入式計(jì)算機(jī),再來說說我們?nèi)绾卫肁RMxy ARM嵌入式計(jì)算機(jī)的NPU來實(shí)現(xiàn)深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化。 ARMxy系列
    的頭像 發(fā)表于 08-20 13:43 ?762次閱讀
    如何利用ARMxy <b class='flag-5'>ARM</b>嵌入式計(jì)算機(jī)的<b class='flag-5'>NPU</b>進(jìn)行深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化?

    ARMxy ARM嵌入式計(jì)算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計(jì)算機(jī)BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達(dá)一萬(wàn)億次的浮點(diǎn)運(yùn)算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計(jì)算資源。在產(chǎn)品缺陷檢測(cè)領(lǐng)域,ARMxy
    的頭像 發(fā)表于 08-20 11:53 ?857次閱讀
    ARMxy <b class='flag-5'>ARM</b>嵌入式計(jì)算機(jī)搭載 1 TOPS <b class='flag-5'>NPU</b>支持深度學(xué)習(xí)

    請(qǐng)求推薦無需NPU的OpenHarmony標(biāo)準(zhǔn)系統(tǒng)ARM開發(fā)板

    請(qǐng)教一下大佬們,目前的需求是在國(guó)產(chǎn)ARM開發(fā)板上跑OpenHarmony標(biāo)準(zhǔn)版系統(tǒng),無需NPU/GPU,其它配置(CPU、RAM等)可以盡量高點(diǎn),價(jià)位在2k以內(nèi),球球推薦!感謝大佬們!
    發(fā)表于 08-16 16:25

    OPA828ID發(fā)燙的原因是什么?

    你好,下面是我的DAC部分電路圖,運(yùn)放用的是OPA828ID,封裝SOIC-8,±15V供電,現(xiàn)在一上電就發(fā)燙,用紅外成像儀顯示能達(dá)到67℃,網(wǎng)上查詢了解到,運(yùn)放發(fā)熱的主要原因是自激振蕩和負(fù)載過大(電流過大),但電路功能目前正常,且工作電流最大6m 請(qǐng)問此電路中運(yùn)放發(fā)燙的原因
    發(fā)表于 08-09 08:10