99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文解讀人工智能芯片發(fā)展史

h1654155971.7596 ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-10-31 16:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在全球科技領(lǐng)域,人工智能無(wú)疑是最熱門的領(lǐng)域。這種并不算新的應(yīng)用場(chǎng)景將會(huì)帶動(dòng)新一輪的計(jì)算革命,這也將給人工智能芯片帶來(lái)新的需求,給半導(dǎo)體領(lǐng)域帶來(lái)新的機(jī)遇。人工智能芯片設(shè)計(jì)的目的是從加速深度學(xué)習(xí)算法到希望從底層結(jié)構(gòu)模擬人腦來(lái)更好實(shí)現(xiàn)智能。

目前人工智能芯片涵蓋了三個(gè)階段:

(1)基于 FPGA 的半定制。

(2)針對(duì)深度學(xué)習(xí)算法的全定制。

(3)類腦計(jì)算芯片。

我們來(lái)看一下安信證券給我們科普的人工智能芯片研發(fā)攻略。

深度學(xué)習(xí)推動(dòng)新一輪計(jì)算革命

深度學(xué)習(xí)作為新一代計(jì)算模式,近年來(lái),其所取得的前所未有的突破掀起了人工智能新一輪發(fā)展熱潮。深度學(xué)習(xí)本質(zhì)上是多層次的人工神經(jīng)網(wǎng)絡(luò)算法,即模仿人腦的神經(jīng)網(wǎng)絡(luò),從最基本的單元上模擬了人類大腦的運(yùn)行機(jī)制。由于人類大腦的運(yùn)行機(jī)制與計(jì)算機(jī)有著鮮明的不同,深度學(xué)習(xí)與傳統(tǒng)計(jì)算模式有非常大的差別。

大腦運(yùn)行機(jī)制和目前計(jì)算機(jī)的差別

深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)計(jì)算模式不同,它能夠從輸入的大量數(shù)據(jù)中自發(fā)的總結(jié)出規(guī)律,從而舉一反三,泛化至從未見(jiàn)過(guò)的案例中。因此,它不需要人為的提取所需解決問(wèn)題的特征或者總結(jié)規(guī)律來(lái)進(jìn)行編程。

人工神經(jīng)網(wǎng)絡(luò)算法實(shí)際上是通過(guò)大量樣本數(shù)據(jù)訓(xùn)練建立了輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的映射關(guān)系,其最直接的應(yīng)用是在分類識(shí)別方面。例如訓(xùn)練樣本的輸入是語(yǔ)音數(shù)據(jù),訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的功能就是語(yǔ)音識(shí)別,如果訓(xùn)練樣本輸入是人臉圖像數(shù)據(jù),訓(xùn)練后實(shí)現(xiàn)的功能就是人臉識(shí)別。

深度學(xué)習(xí)實(shí)際上是建立輸入和輸出數(shù)據(jù)之間的映射關(guān)系

傳統(tǒng)計(jì)算機(jī)軟件是程序員根據(jù)所需要實(shí)現(xiàn)的功能原理編程,輸入至計(jì)算機(jī)運(yùn)行即可,其計(jì)算過(guò)程主要體現(xiàn)在執(zhí)行指令這個(gè)環(huán)節(jié)。而深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)算法包含了兩個(gè)計(jì)算過(guò)程:

1、用已有的樣本數(shù)據(jù)去訓(xùn)練人工神經(jīng)網(wǎng)絡(luò);

2、用訓(xùn)練好的人工神經(jīng)網(wǎng)絡(luò)去運(yùn)行其他數(shù)據(jù)。

這種差別提升了對(duì)訓(xùn)練數(shù)據(jù)量和并行計(jì)算能力的需求,降低了對(duì)人工理解功能原理的要求。

人工神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)計(jì)算模式的不同

根據(jù)上文的分析我們可以看到,深度學(xué)習(xí)與傳統(tǒng)計(jì)算模式最大的區(qū)別就是不需要編程,但需要海量數(shù)據(jù)并行運(yùn)算。傳統(tǒng)處理器架構(gòu)(包括 x86 和 ARM 等)往往需要數(shù)百甚至上千條指令才能完成一個(gè)神經(jīng)元的處理,因此無(wú)法支撐深度學(xué)習(xí)的大 規(guī)模并行計(jì)算需求。

為什么傳統(tǒng)計(jì)算架構(gòu)無(wú)法支撐深度學(xué)習(xí)的大規(guī)模并行計(jì)算需求? 因?yàn)閭鹘y(tǒng)計(jì)算架構(gòu)計(jì)算資源有限。傳統(tǒng)計(jì)算架構(gòu)一般由中央運(yùn)算器(執(zhí)行指令計(jì)算)、中央控制器(讓指令有序執(zhí)行)、內(nèi)存(存儲(chǔ)指令)、輸入(輸入編程指令)和輸出(輸出結(jié)果)五個(gè)部分構(gòu)成,其中中央運(yùn)算器和中央控制器集成一塊芯片上構(gòu)成了我們今天通常所講的 CPU。

CPU 內(nèi)部結(jié)構(gòu)圖(僅 ALU 為主要計(jì)算模塊)

我們從 CPU 的內(nèi)部結(jié)構(gòu)可以看到:實(shí)質(zhì)上僅單獨(dú)的 ALU 模塊(邏輯運(yùn)算單元)是用來(lái)完成指令數(shù)據(jù)計(jì)算的,其他各個(gè)模塊的存在都是為了保證指令能夠一條接一條的有序執(zhí)行。這種通用性結(jié)構(gòu)對(duì)于傳統(tǒng)的編程計(jì)算模式非常適合,同時(shí)可以通過(guò)提升 CPU 主頻(提升單位時(shí)間執(zhí)行指令速度)來(lái)提升計(jì)算速度。但對(duì)于并不需要太多的程序指令,卻需要海量數(shù)據(jù)運(yùn)算的深度學(xué)習(xí)的計(jì)算需求,這種結(jié)構(gòu)就顯得非常笨拙。尤其是在目前功耗限制下無(wú)法通過(guò)提升CPU 主頻來(lái)加快指令執(zhí)行速度,這種矛盾愈發(fā)不可調(diào)和。

因此,深度學(xué)習(xí)需要更適應(yīng)此類算法的新的底層硬件來(lái)加速計(jì)算過(guò)程,也就是說(shuō),新的硬件對(duì)我們加速深度學(xué)習(xí)發(fā)揮著非常重要的作用。目前主要的方式是使用已有的 GPU、 FPGA 等通用芯片。

新計(jì)算平臺(tái)生態(tài)正在建立

GPU 作為應(yīng)對(duì)圖像處理需求而出現(xiàn)的芯片,其海量數(shù)據(jù)并行運(yùn)算的能力與深度學(xué)習(xí)需求不謀而合,因此,被最先引入深度學(xué)習(xí)。

運(yùn)算單元在 CPU 中占比很少,而 GPU 中絕大部分都是運(yùn)算單元

2011 年吳恩達(dá)率先將其應(yīng)用于谷歌大腦中便取得驚人效果,結(jié)果表明 12 顆 NVIDIAD 的 GPU 可以提供相當(dāng)于 2000 顆 CPU 的深度學(xué)習(xí)性能,之后紐約大學(xué)、多倫多大學(xué)以及瑞士人工智能實(shí)驗(yàn)室的研究人員紛紛在 GPU 上加速其深度神經(jīng)網(wǎng)絡(luò)。

英偉達(dá) GPU 使訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的速度提升了 50 倍

英偉達(dá)(Nvidia) 是全球可編程圖形處理技術(shù)的領(lǐng)軍企業(yè),公司的核心產(chǎn)品是 GPU 處理器。英偉達(dá)通過(guò) GPU 在深度學(xué)習(xí)中體現(xiàn)的出色性能迅速切入人工智能領(lǐng)域,又通過(guò)打造NVIDIA CUDA 平臺(tái)大大提升其編程效率、開(kāi)放性和豐富性,建立了包含 CNN、 DNN、深度感知網(wǎng)絡(luò)、 RNN、 LSTM 以及強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)等算法的平臺(tái)。

英偉達(dá)迅速建立了支撐科研機(jī)構(gòu)、行業(yè)巨頭和初創(chuàng)企業(yè)的通用 GPU 加速平臺(tái)

根據(jù)英偉達(dá)公開(kāi)宣布, 在短短兩年里,與 NVIDIA 在深度學(xué)習(xí)方面展開(kāi)合作的企業(yè)便激增了近 35 倍,增至 3,400 多家企業(yè),涉及醫(yī)療、生命科學(xué)、能源、金融服務(wù)、汽車、制造業(yè)以及娛樂(lè)業(yè)等多個(gè)領(lǐng)域。

與 NVIDIA 在深度學(xué)習(xí)方面展開(kāi)合作的企業(yè)兩年激增了近35 倍

英偉達(dá)針對(duì)各類智能計(jì)算設(shè)備開(kāi)發(fā)對(duì)應(yīng) GPU,使得深度學(xué)習(xí)可以滲透各種類型的智能機(jī)器

深度學(xué)習(xí)系統(tǒng)一方面需要利用龐大的數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練,另一方面系統(tǒng)中存在上萬(wàn)個(gè)參數(shù)需要調(diào)整。 IT 巨頭開(kāi)源人工智能平臺(tái),旨在調(diào)動(dòng)更多優(yōu)秀的工程師共同參與發(fā)展其人工智能系統(tǒng)。開(kāi)放的開(kāi)發(fā)平臺(tái)將帶來(lái)下游應(yīng)用的蓬勃發(fā)展。最典型的例子就是谷歌開(kāi)源安卓平臺(tái),直接促成下游移動(dòng)互聯(lián)網(wǎng)應(yīng)用的空前繁榮。

以谷歌為例,用戶使用開(kāi)源的 TensorFlow 平臺(tái)訓(xùn)練和導(dǎo)出自己所需要的人工智能模型,然后就可直接把模型導(dǎo)入 TensorFlow Serving 對(duì)外提供預(yù)測(cè)類云服務(wù),相當(dāng)于 TensorFlow 系列把整個(gè)用深度學(xué)習(xí)模型對(duì)外提供服務(wù)的方案全包了。實(shí)質(zhì)上是將開(kāi)源深度學(xué)習(xí)工具用戶直接變?yōu)槠?a href="http://www.socialnewsupdate.com/v/tag/475/" target="_blank">云計(jì)算服務(wù)的用戶,包括阿里、亞馬遜在內(nèi)的云計(jì)算服務(wù)商都將機(jī)器學(xué)習(xí)平臺(tái)嵌入其中作為增強(qiáng)其競(jìng)爭(zhēng)實(shí)力和吸引更多用戶的方式。

2015 年以來(lái),全球人工智能頂尖巨頭均爭(zhēng)向開(kāi)源自身最核心的人工智能平臺(tái),各種開(kāi)源深度學(xué)習(xí)框架層出不窮,其中包括: Caffe、 CNTK、 MXNet、 Neon、 TensorFlow、 Theano 和 Torch等。

各大巨頭爭(zhēng)相開(kāi)源人工智能平臺(tái)

人工智能催生新一代專用計(jì)算芯片

回顧計(jì)算機(jī)行業(yè)發(fā)展史,新的計(jì)算模式往往催生新的專用計(jì)算芯片。人工智能時(shí)代新計(jì)算的強(qiáng)大需求,正在催生出新的專用計(jì)算芯片。

目前以深度學(xué)習(xí)為代表的人工智能新計(jì)算需求,主要采用 GPU、 FPGA 等已有適合并行計(jì)算的通用芯片來(lái)實(shí)現(xiàn)加速。在產(chǎn)業(yè)應(yīng)用沒(méi)有大規(guī)模興起之時(shí),使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風(fēng)險(xiǎn),但是,由于這類通用芯片設(shè)計(jì)初衷并非專門針對(duì)深度學(xué)習(xí),因而,天然存在性能、功耗等方面的瓶頸。隨著人工智能應(yīng)用規(guī)模的擴(kuò)大,這類問(wèn)題將日益突出:

GPU 作為圖像處理器,設(shè)計(jì)初衷是為了應(yīng)對(duì)圖像處理中需要大規(guī)模并行計(jì)算。因此,其在應(yīng)用于深度學(xué)習(xí)算法時(shí),有三個(gè)方面的局限性:

第一, 應(yīng)用過(guò)程中無(wú)法充分發(fā)揮并行計(jì)算優(yōu)勢(shì)。 深度學(xué)習(xí)包含訓(xùn)練和應(yīng)用兩個(gè)計(jì)算環(huán)節(jié),GPU 在深度學(xué)習(xí)算法訓(xùn)練上非常高效,但在應(yīng)用時(shí)一次性只能對(duì)于一張輸入圖像進(jìn)行處理,并行度的優(yōu)勢(shì)不能完全發(fā)揮。

第二, 硬件結(jié)構(gòu)固定不具備可編程性。 深度學(xué)習(xí)算法還未完全穩(wěn)定,若深度學(xué)習(xí)算法發(fā)生大的變化, GPU 無(wú)法像 FPGA 一樣可以靈活的配臵硬件結(jié)構(gòu);

第三, 運(yùn)行深度學(xué)習(xí)算法能效遠(yuǎn)低于 FPGA。 學(xué)術(shù)界和產(chǎn)業(yè)界研究已經(jīng)證明,運(yùn)行深度學(xué)習(xí)算法中實(shí)現(xiàn)同樣的性能, GPU 所需功耗遠(yuǎn)大于FPGA,例如國(guó)內(nèi)初創(chuàng)企業(yè)深鑒科技基于FPGA 平臺(tái)的人工智能芯片在同樣開(kāi)發(fā)周期內(nèi)相對(duì) GPU 能效有一個(gè)數(shù)量級(jí)的提升。

另外還需要談一下FPGA,即現(xiàn)場(chǎng)可編輯門陣列,是一種新型的可編程邏輯器件。其設(shè)計(jì)初衷是為了實(shí)現(xiàn)半定制芯片的功能,即硬件結(jié)構(gòu)可根據(jù)需要實(shí)時(shí)配臵靈活改變。 根據(jù)賽靈思報(bào)告, 目前的 FPGA市場(chǎng)由 Xilinx 和 Altera 主導(dǎo),兩者共同占有 85%的市場(chǎng)份額,其中 Altera 在 2015 年被 intel以 167 億美元收購(gòu)(此交易為 intel 有史以來(lái)涉及金額最大的一次收購(gòu)案例),另一家 Xilinx則選擇與 IBM 進(jìn)行深度合作,背后都體現(xiàn)了 FPGA 在人工智能時(shí)代的重要地位。

FPGA 應(yīng)用于深度學(xué)習(xí)研究里程碑

盡管 FPGA 倍受看好,甚至新一代百度大腦也是基于 FPGA 平臺(tái)研發(fā),但其畢竟不是專門為了適用深度學(xué)習(xí)算法而研發(fā),實(shí)際仍然存在不少局限:

第一, 基本單元的計(jì)算能力有限。 為了實(shí)現(xiàn)可重構(gòu)特性, FPGA 內(nèi)部有大量極細(xì)粒度的基本單元,但是每個(gè)單元的計(jì)算能力(主要依靠 LUT 查找表)都遠(yuǎn)遠(yuǎn)低于 CPU 和 GPU 中的 ALU模塊。

FPGA 的內(nèi)部結(jié)構(gòu)

第二, 速度和功耗相對(duì)專用定制芯片(ASIC)仍然存在不小差距;

第三,F(xiàn)PGA價(jià)格較為昂貴,在規(guī)模放量的情況下單塊 FPGA的成本要遠(yuǎn)高于專用定制芯片。

從發(fā)展趨勢(shì)上看,人工智能定制芯片將是計(jì)算芯片發(fā)展的大方向:

第一, 定制芯片的性能提升非常明顯。 例如 NVIDIA 首款專門為深度學(xué)習(xí)從零開(kāi)始設(shè)計(jì)的芯片 Tesla P100 數(shù)據(jù)處理速度是其 2014 年推出 GPU 系列的 12 倍。谷歌為機(jī)器學(xué)習(xí)定制的芯片 TPU 將硬件性能提升至相當(dāng)于按照摩爾定律發(fā)展 7 年后的水平。

NVIDIA 為深度學(xué)習(xí)專門設(shè)計(jì)芯片 Tesla P100 比一年前發(fā)布的 GPU 快 12 倍

需要指出的是這種性能的飛速提升對(duì)于人工智能的發(fā)展意義重大。中國(guó)科學(xué)院計(jì)算所研究員、寒武紀(jì)深度學(xué)習(xí)處理器芯片創(chuàng)始人陳云霽博士在《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》上撰文指出:通過(guò)設(shè)計(jì)專門的指令集、微結(jié)構(gòu)、人工神經(jīng)元電路、存儲(chǔ)層次,有可能在 3~5 年內(nèi)將深度學(xué)習(xí)模型的類腦計(jì)算機(jī)的智能處理效率提升萬(wàn)倍(相對(duì)于谷歌大腦)。提升萬(wàn)倍的意義在于,可以把谷歌大腦這樣的深度學(xué)習(xí)超級(jí)計(jì)算機(jī)放到手機(jī)中,幫助我們本地、實(shí)時(shí)完成各種圖像、語(yǔ)音和文本的理解和識(shí)別;更重要的是,具備實(shí)時(shí)訓(xùn)練的能力之后,就可以不間斷地通過(guò)觀察人的行為不斷提升其能力,成為我們生活中離不開(kāi)的智能助理。

谷歌 TPU 相當(dāng)于將硬件性能實(shí)現(xiàn)了按照摩爾定律需要發(fā)展 7 年時(shí)間的跨越

第二, 下游需求量足夠攤薄定制芯片投入的成本。 人工智能的市場(chǎng)空間將不僅僅局限于計(jì)算機(jī)、手機(jī)等傳統(tǒng)計(jì)算平臺(tái),從無(wú)人駕駛汽車、無(wú)人機(jī)再到智能家居的各類家電,至少數(shù)十倍于智能手機(jī)體量的設(shè)備需要引入感知交互能力。而出于對(duì)實(shí)時(shí)性的要求以及訓(xùn)練數(shù)據(jù)隱私等考慮,這些能力不可能完全依賴云端,必須要有本地的軟硬件基礎(chǔ)平臺(tái)支撐。僅從這一角度考慮,人工智能定制芯片需求量就將數(shù)十倍于智能手機(jī)。

人工智能核心芯片下游應(yīng)用極為廣泛

人工智能將催生數(shù)十倍于智能手機(jī)的核心芯片需求

第三, 通過(guò)算法切入人工智能領(lǐng)域的公司希望通過(guò)芯片化、產(chǎn)品化來(lái)盈利。 目前通過(guò)算法切入人工智能領(lǐng)域的公司很多,包括采用語(yǔ)音識(shí)別、圖像識(shí)別、 ADAS(高級(jí)駕駛輔助系統(tǒng))等算法的公司。由于它們提供的都是高頻次、基礎(chǔ)性的功能服務(wù),因此,僅僅通過(guò)算法來(lái)實(shí)現(xiàn)商業(yè)盈利往往會(huì)遇到瓶頸。

Mobileye 發(fā)布第四代 ADAS 視覺(jué)處理器

通過(guò)將各自人工智能核心算法芯片化、產(chǎn)品化,則不但提升了原有性能,同時(shí)也有望為商業(yè)盈利鋪平道路。目前包括 Mobileye、商湯科技、地平線機(jī)器人等著名人工智能公司都在進(jìn)行核心算法芯片化的工作。

地平線機(jī)器人正在打造深度學(xué)習(xí)本地化芯片

目前為人工智能專門定制芯片的大潮已經(jīng)開(kāi)始逐步顯露,英偉達(dá)在今年宣布研發(fā)投入超過(guò) 20億美元用于深度學(xué)習(xí)專用芯片,而谷歌為深度學(xué)習(xí)定制的 TPU 芯片甚至已經(jīng)秘密運(yùn)行一年,該芯片直接支撐了震驚全球的人機(jī)圍棋大戰(zhàn)。

我國(guó)的寒武紀(jì)芯片也計(jì)劃于今年開(kāi)始產(chǎn)業(yè)化。 人機(jī)圍棋大戰(zhàn)中的谷歌“阿爾法狗”(AlphaGo)使用了約 170 個(gè)圖形處理器(GPU)和 1200 個(gè)中央處理器(CPU),這些設(shè)備需要占用一個(gè)機(jī)房,還要配備大功率的空調(diào),以及多名專家進(jìn)行系統(tǒng)維護(hù)。 AlphaGo 目前用的芯片數(shù)量,將來(lái)如果換成中國(guó)人研制的“寒武紀(jì)”架構(gòu)的芯片,估計(jì)一個(gè)小盒子就全裝下了。這意味著“阿爾法狗”將可以跑得更快些。人工智能專用芯片的涌現(xiàn)表明從芯片層面開(kāi)啟的新一輪計(jì)算模式變革拉開(kāi)帷幕,是人工智能產(chǎn)業(yè)正式走向成熟的拐點(diǎn)。

人工智能芯片發(fā)展路線圖

設(shè)計(jì)芯片的目的是從加速深度學(xué)習(xí)算法到希望從底層結(jié)構(gòu)模擬人腦來(lái)更好實(shí)現(xiàn)智能。目前人工智能芯片涵蓋了基于 FPGA 的半定制、針對(duì)深度學(xué)習(xí)算法的全定制、類腦計(jì)算芯片三個(gè)階段。

人工智能芯片發(fā)展階段

(一)基于 FPGA 的半定制人工智能芯片

在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定需要不斷迭代改進(jìn)的情況下,利用具備可重構(gòu)特性的 FPGA 芯片來(lái)實(shí)現(xiàn)半定制的人工智能芯片是最佳選擇。

這類芯片中的杰出代表是國(guó)內(nèi)初創(chuàng)公司深鑒科技,該公司設(shè)計(jì)了“深度學(xué)習(xí)處理單元”(DeepProcessing Unit, DPU)的芯片,希望以 ASIC 級(jí)別的功耗來(lái)達(dá)到優(yōu)于 GPU 的性能,其第一批產(chǎn)品就是基于 FPGA 平臺(tái)。這種半定制芯片雖然依托于 FPGA 平臺(tái),但是利用抽象出了指令集與編譯器,可以快速開(kāi)發(fā)、快速迭代,與專用的 FPGA 加速器產(chǎn)品相比,也具有非常明顯的優(yōu)勢(shì)。

深鑒科技 FPGA 平臺(tái) DPU 產(chǎn)品開(kāi)發(fā)板

(二)針對(duì)深度學(xué)習(xí)算法的全定制人工智能芯片

這類芯片是完全采用 ASIC 設(shè)計(jì)方法全定制,性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)算法都做到了最優(yōu)。谷歌的 TPU 芯片、我國(guó)中科院計(jì)算所的寒武紀(jì)深度學(xué)習(xí)處理器芯片就是這類芯片的典型代表。

寒武紀(jì)在國(guó)際上開(kāi)創(chuàng)了深度學(xué)習(xí)處理器方向

以寒武紀(jì)處理器為例,目前寒武紀(jì)系列已包含三種原型處理器結(jié)構(gòu):寒武紀(jì) 1 號(hào)(英文名DianNao,面向神經(jīng)網(wǎng)絡(luò)的原型處理器結(jié)構(gòu))、寒武紀(jì) 2 號(hào)(英文名 DaDianNao,面向大規(guī)模神經(jīng)網(wǎng)絡(luò))、寒武紀(jì) 3 號(hào)(英文名 PuDianNao,面向多種深度學(xué)習(xí)算法)。

寒武紀(jì)芯片計(jì)劃于今年內(nèi)實(shí)現(xiàn)產(chǎn)業(yè)化

其中寒武紀(jì) 2 號(hào)在 28nm 工藝下主頻為 606MHz,面積 67.7 mm2,功耗約 16W。其單芯片性能超過(guò)了主流 GPU 的 21 倍,而能耗僅為主流 GPU 的 1/330。 64 芯片組成的高效能計(jì)算系統(tǒng)較主流 GPU 的性能提升甚至可達(dá) 450 倍,但總能耗僅為 1/150。

(三)類腦計(jì)算芯片

這類芯片的設(shè)計(jì)目的不再局限于僅僅加速深度學(xué)習(xí)算法,而是在芯片基本結(jié)構(gòu)甚至器件層面上希望能夠開(kāi)發(fā)出新的類腦計(jì)算機(jī)體系結(jié)構(gòu),比如會(huì)采用憶阻器和 ReRAM 等新器件來(lái)提高存儲(chǔ)密度。這類芯片的研究離成為市場(chǎng)上可以大規(guī)模廣泛使用的成熟技術(shù)還有很大的差距,甚至有很大的風(fēng)險(xiǎn),但是長(zhǎng)期來(lái)看類腦芯片有可能會(huì)帶來(lái)計(jì)算體系的革命。

這類芯片的典型代表是 IBM 的 Truenorh 芯片。TrueNorth 處理器由 54 億個(gè)連結(jié)晶體管組成,構(gòu)成了包含 100 萬(wàn)個(gè)數(shù)字神經(jīng)元陣列,這些神經(jīng)元又可通過(guò) 2.56 億個(gè)電突觸彼此通信。

Truenorh 芯片集成神經(jīng)元數(shù)目迅速增長(zhǎng)

該芯片采用跟傳統(tǒng)馮諾依曼不一樣的結(jié)構(gòu),將內(nèi)存、處理器單元和通信部件完全集成在一起,因此信息的處理完全在本地進(jìn)行,而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與 CPU之間的瓶頸不復(fù)存在。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作實(shí)現(xiàn)事件驅(qū)動(dòng)的異步電路特性。由于不需要同步時(shí)鐘該芯片功耗極低: 16 個(gè) TrueNorth 芯片的功耗僅為 2.5 瓦,僅與平板電腦相當(dāng)。

美國(guó)勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室一臺(tái)價(jià)值 100 萬(wàn)美元的超級(jí)計(jì)算機(jī)中使用了 16 顆 Truenorh 芯片

類腦計(jì)算芯片市場(chǎng)空間巨大。 根據(jù) Markets- and-Markets 預(yù)測(cè),包含消費(fèi)終端的類腦計(jì)算芯片市場(chǎng)將在 2022 年以前達(dá)到千億美元的規(guī)模,其中消費(fèi)終端是最大市場(chǎng),占整體 98.17%,,其他需求包括工業(yè)檢測(cè)、航空、軍事與國(guó)防等領(lǐng)域。

2022 年類腦計(jì)算芯片市場(chǎng)份額預(yù)測(cè)

全球知名芯片公司的類腦芯片

核心芯片是人工智能時(shí)代的戰(zhàn)略制高點(diǎn)

核心芯片將決定一個(gè)新的計(jì)算時(shí)代的基礎(chǔ)架構(gòu)和未來(lái)生態(tài),因此,谷歌、微軟、 IBM、 Facebook等全球 IT 巨頭都投巨資加速人工智能核心芯片的研發(fā),旨在搶占新計(jì)算時(shí)代的戰(zhàn)略制高點(diǎn),掌控人工智能時(shí)代主導(dǎo)權(quán)。

回顧在 PC 和移動(dòng)互聯(lián)網(wǎng)時(shí)代分別處于霸主地位的 X86 架構(gòu)和 ARM 架構(gòu)的發(fā)展歷程,可以看到:從源頭上掌控核心芯片架構(gòu)取得先發(fā)優(yōu)勢(shì),對(duì)于取得一個(gè)新計(jì)算時(shí)代主導(dǎo)權(quán)有多么重要。

計(jì)算機(jī)指令集架構(gòu)可以分為復(fù)雜指令集(CISC)和精簡(jiǎn)指令集(RISC)兩種。 PC 時(shí)代處于壟斷地位的 X86 架構(gòu)就是屬于復(fù)雜指令集。復(fù)雜指令集在處理復(fù)雜指令上具備先天優(yōu)勢(shì),但同時(shí)也存在設(shè)計(jì)復(fù)雜、難以流水作業(yè)、高功耗的問(wèn)題。

PC 處理器市場(chǎng)格局(其中 Intel、 AMD、威盛均是X86 架構(gòu))

實(shí)質(zhì)上精簡(jiǎn)指令集正是上世紀(jì) 80 年代針對(duì)復(fù)雜指令集缺點(diǎn)設(shè)計(jì)出來(lái)的,學(xué)術(shù)界當(dāng)時(shí)一致認(rèn)為精簡(jiǎn)指令集更為領(lǐng)先。但是 PC 時(shí)代的芯片霸主英特爾早在精簡(jiǎn)指令集發(fā)明之前的處理器芯片 8086 就采用了復(fù)雜指令集的 X86架構(gòu),在后續(xù)的 80286、 80386 等系列處理器芯片繼續(xù)采用兼容的 X86 架構(gòu),同時(shí)加強(qiáng)每一代處理器對(duì)上層軟件的兼容,并與微軟建立了 Wintel 聯(lián)盟牢牢支撐整個(gè) PC 的應(yīng)用生態(tài)。

WINTEL 聯(lián)盟壟斷了 PC 市場(chǎng)的計(jì)算平臺(tái)

習(xí)慣了使用英特爾 X86 處理器的軟件公司不再愿意使用其他架構(gòu)的處理器,即使它們的性能更好。其結(jié)果就是:上世紀(jì) 90 年代幾乎只有英特爾一家公司堅(jiān)持開(kāi)發(fā) X86 架構(gòu)的處理器,卻戰(zhàn)勝了 MIPS、 PowerPC、 IBM、 HP、 DEC 等及其他各家精簡(jiǎn)指令集的處理器, X86 架構(gòu)牢牢掌控了 PC 時(shí)代的主導(dǎo)權(quán)。

移動(dòng)互聯(lián)網(wǎng)時(shí)代,英特爾并沒(méi)有延續(xù)其在 PC 時(shí)代的優(yōu)勢(shì),而是一家此前名不見(jiàn)經(jīng)傳的英國(guó)芯片設(shè)計(jì)公司 ARM 成為壟斷移動(dòng)處理器芯片的新霸主。

ARM 授權(quán)芯片設(shè)計(jì) IP 的商業(yè)模式

ARM 的成功有三方面的原因:

第一, ARM 在 20 世紀(jì) 90 年代初為蘋果公司設(shè)計(jì) CPU 起家(ARM 是由 Acorn、蘋果和VLSI Technology 聯(lián)合出資成立) ,因而其在智能手機(jī)革命開(kāi)啟之初就進(jìn)入了這個(gè)快速成長(zhǎng)的市場(chǎng),與蘋果的關(guān)系奠定了其架構(gòu)在移動(dòng)處理器市場(chǎng)先發(fā)優(yōu)勢(shì);

第二, ARM 處理器隸屬于精簡(jiǎn)指令架構(gòu),相對(duì)于復(fù)雜指令架構(gòu)的 X86 處理器天然具備低功耗優(yōu)勢(shì),而這在移動(dòng)市場(chǎng)極為重要;

第三, ARM 創(chuàng)造了只授權(quán)核心設(shè)計(jì) IP 不生產(chǎn)芯片的商業(yè)模式,迅速拉攏各大芯片巨頭建立自己的生態(tài)聯(lián)盟。

移動(dòng)處理器市場(chǎng)份額(高通、聯(lián)發(fā)科、蘋果、三星等均采用 ARM 授權(quán)的架構(gòu))

ARM 的成功給我們的啟示是:

一、新的計(jì)算時(shí)代來(lái)臨之時(shí)往往是新興企業(yè)彎道超車的絕佳機(jī)遇,再?gòu)?qiáng)勢(shì)的傳統(tǒng)巨頭也難免面臨重新洗牌的局面;

ARM 占據(jù)嵌入式處理器 IP 超過(guò)一半份額,其中占據(jù)移動(dòng)手機(jī)處理器超過(guò) 90%份額

二、把握核心芯片架構(gòu)的先發(fā)優(yōu)勢(shì),在此基礎(chǔ)上迅速建立生態(tài)體系是在一個(gè)新計(jì)算變革時(shí)代來(lái)臨時(shí)的成功關(guān)鍵。

三、目前使用的 GPU、 FPGA 均非人工智能定制芯片,天然存在局限性,人工智能專用芯片對(duì)于巨頭和初創(chuàng)企業(yè)都同一起跑線的藍(lán)海。

ARM 各系列移動(dòng)處理器銷售量,其中超過(guò)一半銷售量是在 2009 年移動(dòng)互聯(lián)網(wǎng)時(shí)代興起后取得

我們正處在從信息時(shí)代邁向智能時(shí)代的重要拐點(diǎn),人工智能將推動(dòng)新一輪計(jì)算革命,而芯片行業(yè)作為產(chǎn)業(yè)最上游,是人工智能時(shí)代的開(kāi)路先鋒:一方面具備行業(yè)先導(dǎo)指標(biāo)的意義,另一方面也是在人工智能產(chǎn)業(yè)發(fā)展初期率先啟動(dòng)、彈性最大的行業(yè)。信息時(shí)代產(chǎn)生了英特爾這樣的千億市值的芯片巨頭,擁有更大應(yīng)用市場(chǎng)的人工智能時(shí)代必將孕育出更多的“英特爾”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能芯片
    +關(guān)注

    關(guān)注

    1

    文章

    121

    瀏覽量

    29801

原文標(biāo)題:人工智能芯片的革命征程,研發(fā)必讀

文章出處:【微信號(hào):Anxin-360ic,微信公眾號(hào):芯師爺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    讀懂人工智能發(fā)展史:從誕生,到實(shí)現(xiàn)產(chǎn)業(yè)化

    電子發(fā)燒友網(wǎng)報(bào)道(/李彎彎)上個(gè)世紀(jì)50年代,人們提出了人工智能的概念,如今,人工智能已經(jīng)滲透進(jìn)各行各業(yè)。人工智能(Artificial Intelligence),英文縮寫為AI,
    的頭像 發(fā)表于 01-22 07:17 ?7799次閱讀

    恒壓變壓器的發(fā)展史

    本電子書匯集了各類恒壓變壓器原理、產(chǎn)品以及它的的發(fā)展史,它的各項(xiàng)特性在電子行業(yè)得到普遍認(rèn)可和廣泛使用。清版主刪除,以為附件超大了不能上傳[此貼子已經(jīng)被作者于2008-7-29 15:14:40編輯過(guò)]
    發(fā)表于 07-29 14:55

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能?人工智能是未來(lái)發(fā)展的必然趨勢(shì)嗎?以后人工智能技術(shù)真的能達(dá)到電影里機(jī)器人的
    發(fā)表于 09-16 15:40

    人工智能發(fā)展的好與壞

    `人工智能發(fā)展的好與壞何為人工智能人工智能門新的技術(shù)科學(xué)。說(shuō)是科學(xué)其實(shí)也是種擦邊球似的科學(xué),屬于自然科學(xué)、社會(huì)科學(xué)、技術(shù)科學(xué)三項(xiàng)交叉而
    發(fā)表于 06-24 14:47

    緊跟科技潮流,簡(jiǎn)述智能家居的發(fā)展史

    了今天的智能新生活。 下面,我們就來(lái)八一八智能家居的發(fā)展史,看看人們是經(jīng)過(guò)怎樣的努力,才享受到了如今美好愜意的新生活。 1932年:Alpha機(jī)器人 1939年:Elektro機(jī)器人 1950年:按鈕莊園
    發(fā)表于 12-04 14:09

    解讀人工智能的未來(lái)

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動(dòng)下,實(shí)現(xiàn)飛躍式的發(fā)展,并且迎來(lái)了第三個(gè)黃金周期。必優(yōu)傳感今天和大家解讀下關(guān)于人工智能的未
    發(fā)表于 11-14 10:43

    人工智能語(yǔ)音芯片行業(yè)的發(fā)展趨勢(shì)如何?

    人工智能是近三年來(lái)最受關(guān)注的核心基礎(chǔ)技術(shù),將深刻的改造各個(gè)傳統(tǒng)行業(yè)。人工智能在圖像識(shí)別、語(yǔ)音識(shí)別領(lǐng)域的應(yīng)用自2017年來(lái)高速發(fā)展,是人工智能最熱點(diǎn)的兩項(xiàng)落地應(yīng)用。手把手教你設(shè)計(jì)
    發(fā)表于 09-11 11:52

    Linux系統(tǒng)發(fā)展史及版本更迭

    運(yùn)維必知Linux系統(tǒng)發(fā)展史及版本更迭
    發(fā)表于 04-29 14:15

    5G的發(fā)展史

    5G到底是什么?為什么引得眾通訊巨頭相繼搶占先機(jī)?在這里,將用組圖帶您梳理下5G的發(fā)展史。在視頻、游戲霸屏移動(dòng)端的今天,4G已不能滿足龐大的流量需求。4G即將成為明日黃花,5G即
    發(fā)表于 12-24 06:25

    人工智能芯片人工智能發(fā)展

    ......無(wú)形之中,人工智能正以前所未有的發(fā)展速度滲透我們的日常生活。而作為人工智能的核心技術(shù)之,人工智能
    發(fā)表于 07-27 07:02

    看懂人工智能語(yǔ)音芯片 精選資料分享

    來(lái)源:內(nèi)容來(lái)自「九鼎投資」,作者:孟偉、馮卓,謝謝。 行業(yè)概況行業(yè)簡(jiǎn)介人工智能芯片(簡(jiǎn)稱AI芯片)是指含有專門處理人工智能應(yīng)用中大量計(jì)算任務(wù)模塊的
    發(fā)表于 07-29 08:42

    《移動(dòng)終端人工智能技術(shù)與應(yīng)用開(kāi)發(fā)》人工智能發(fā)展與AI技術(shù)的進(jìn)步

    人工智能發(fā)展是隨著人類生活需要,產(chǎn)業(yè)需求不斷提升的,其中人工智能發(fā)展很大程度上受到了計(jì)算機(jī)算力的影響,隨著數(shù)據(jù)處理量的增大,人工智能算法
    發(fā)表于 02-17 11:00

    聲卡的發(fā)展史

    聲卡的發(fā)展史    
    發(fā)表于 12-26 11:23 ?1472次閱讀

    帶你解讀全球人工智能產(chǎn)業(yè)發(fā)展現(xiàn)狀

    帶你解讀全球人工智能產(chǎn)業(yè)發(fā)展現(xiàn)狀,人工智能為人類進(jìn)行分析。工
    發(fā)表于 07-01 10:22 ?1033次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>帶你<b class='flag-5'>解讀</b>全球<b class='flag-5'>人工智能</b>產(chǎn)業(yè)<b class='flag-5'>發(fā)展</b>現(xiàn)狀

    自然語(yǔ)言處理和人工智能的概念及發(fā)展史 自然語(yǔ)言處理和人工智能的區(qū)別

    自然語(yǔ)言處理(Natural Language Processing, NLP)的定義是通過(guò)電腦軟件程序?qū)崿F(xiàn)人們?nèi)粘UZ(yǔ)言的機(jī)器自動(dòng)處理。為了幫助計(jì)算機(jī)理解,掌握自然語(yǔ)言處理的基本原理,需要涉及到自然語(yǔ)言處理的發(fā)展史人工智能的概念和發(fā)展
    發(fā)表于 08-23 18:22 ?1450次閱讀