99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能芯片發(fā)展的現(xiàn)狀及趨勢

牽手一起夢 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師郭婷 ? 2018-10-07 17:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自 1956年達特茅斯會議以來,關(guān)于人工智能(artificial intelligence, AI)的研究由于受到智能算法、計算速度、存儲水平等多方面因素的影響,經(jīng)歷了兩起兩落的發(fā)展,近年來在語音識別、計算機視覺等領(lǐng)域終于取得了重大突破。究其原因,業(yè)界普遍認為有三大要素合力促成了這次突破:豐富的數(shù)據(jù)資源、深度學習算法和充足的計算力支持。豐富的數(shù)據(jù)資源取決于互聯(lián)網(wǎng)的普及和隨之產(chǎn)生的海量信息;以深度學習為代表的機器學習算法的精確性和魯棒性越來越好,適用于不同場景的各類算法不斷優(yōu)化完善,具備了大規(guī)模商業(yè)化應用的潛力;而充足的算力則得益于摩爾定律的不斷演進發(fā)展,高性能芯片大幅降低了深度學習算法所需的計算時間和成本。

雖然當前摩爾定律逐漸放緩,但作為推動人工智能技術(shù)不斷進步的硬件基礎(chǔ),未來10年仍將是人工智能芯片(AI芯片)發(fā)展的重要時期,面對不斷增長的市場需求,各類專門針對人工智能應用的新穎設(shè)計理念和架構(gòu)創(chuàng)新將不斷涌現(xiàn)。

AI 芯片概述

當前對人工智能芯片的定義并沒有一個公認的標準。比較通用的看法是面向 AI應用的芯片都可以稱為AI芯片,按設(shè)計思路主要分為三大類:專用于機器學習尤其是深度神經(jīng)網(wǎng)絡算法的訓練和推理用加速芯片;受生物腦啟發(fā)設(shè)計的類腦仿生芯片;可高效計算各類人工智能算法的通用AI芯片。

為了支持多樣的 AI計算任務和性能要求,理想的AI芯片需要具備高度并行的處理能力,能夠支持各種數(shù)據(jù)長度的按位、固定和浮點計算;比當前大幾個數(shù)量級的存儲器帶寬,用于存儲海量數(shù)據(jù);低內(nèi)存延遲及新穎的架構(gòu),以實現(xiàn)計算元件和內(nèi)存之間靈活而豐富的連接。而且所有這些都需要在極低的功耗和極高的能量效率下完成。

在當前人工智能各領(lǐng)域的算法和應用還處在高速發(fā)展和快速迭代的階段,考慮到芯片的研發(fā)成本和生產(chǎn)周期,針對特定應用、算法或場景的定制化設(shè)計很難適應變化。針對特定領(lǐng)域而不針對特定應用的設(shè)計,將是 AI芯片設(shè)計的一個指導原則,具有可重構(gòu)能力的AI芯片可以在更多應用中廣泛使用,并且可以通過重新配置適應新的AI算法、架構(gòu)和任務。

AI 芯片類型及發(fā)展情況

加州理工學院 Carver Mead 最早開始了 AI 芯片的研究,在 20世紀 80年代開始研究神經(jīng)擬態(tài)系統(tǒng)(neuromorphic electronic systems),利用模擬電路模仿生物神經(jīng)系統(tǒng)結(jié)構(gòu)。經(jīng)過 30多年的發(fā)展,目前已經(jīng)誕生了不同特色的各類 AI 芯片,主要包括圖形處理器(graphics processing unit,GPU)、現(xiàn)場可編程門陣列(field-programmable gatearray,FPGA)、數(shù)字信號處理(digital signal processing,DSP)、專用集成電路(application specific integrated circuits,ASIC)、眾核處理器、神經(jīng)擬態(tài)芯片等。近年來基于深度學習的圖像識別算法和語音識別算法取得了出色的成績,引起了學術(shù)界和工業(yè)界的廣泛關(guān)注,隨著谷歌人工智能圍棋程序AlphaGo先后戰(zhàn)勝李世乭和柯潔,更是把人工智能的熱度推向全社會。谷歌這一成績離不開背后 AI加速芯片的貢獻,從初代AlphaGo采用 CPU+GPU 的搭建方案,到最新一代 AlphaGo Zero 采用專用高性能處理器(tensor processing unit,TPU),芯片的變化帶來了計算速度的巨大提升和功耗的大幅下降。由此可見針對不同的計算任務,不同類型的AI芯片往往各具優(yōu)勢。

AI加速芯片

簡單地說,AI 加速芯片是指以現(xiàn)有芯片架構(gòu)為基礎(chǔ),對某類特定算法或者場景進行加速,從而實現(xiàn)在這一特定場景下的計算速度、功耗和成本等方面的優(yōu)化。通常包括基于深度神經(jīng)網(wǎng)絡的各類算法,以及圖像識別、視頻檢索、語音識別、聲紋檢測、搜索引擎優(yōu)化、自動駕駛等任務。AI加速芯片的設(shè)計主要有兩種思路:利用已有的GPU、FPGA、DSP、眾核處理器等芯片以異構(gòu)計算的方式來實現(xiàn);設(shè)計專用的ASIC芯片。

GPU

GPU,即圖形處理器,是一種由大量核心組成的大規(guī)模并行計算架構(gòu),專為同時處理多重任務而設(shè)計,原本的功能是幫助 CPU處理圖形顯示的任務,尤其是3D圖形顯示。為了執(zhí)行復雜的并行計算,快速進行圖形渲染,GPU的核數(shù)遠超 CPU,但每個核擁有的緩存相對較小,數(shù)字邏輯運算單元也更簡單,更適合計算密集型的任務。Intel的GPU主要做為集成顯卡使用,應用于Intel 的主板和 CPU,而 Nvidia 和 AMD 則在獨立顯卡領(lǐng)域更具優(yōu)勢。

深度神經(jīng)網(wǎng)絡的訓練過程中計算量極大,而且數(shù)據(jù)和運算是可以高度并行的,GPU 具備進行海量數(shù)據(jù)并行運算的能力并且為浮點矢量運算配備了大量計算資源,與深度學習的需求不謀而合,因此最先被引入運行深度學習算法,成為高性能計算領(lǐng)域的主力芯片之一。但由于 GPU不能支持復雜程序邏輯控制,仍然需要使用高性能CPU配合來構(gòu)成完整的計算系統(tǒng)。

FPGA

FPGA 是在 PAL、GAL、CPLD 等可編程邏輯器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物。它作為專用集成電路領(lǐng)域中的一種半定制電路出現(xiàn),既解決了定制電路靈活性上的不足,又克服了原有可編程器件門電路數(shù)量有限的缺點。FPGA 利用門電路直接運算,速度快,而用戶可以自由定義這些門電路和存儲器之間的布線,改變執(zhí)行方案,以期得到最佳效果。FPGA 可以采用 OpenCL等更高效的編程語言,降低了硬件編程的難度,還可以集成重要的控制功能,整合系統(tǒng)模塊,提高了應用的靈活性,與 GPU相比,F(xiàn)PGA具備更強的計算能力和更低的功耗。

目前,F(xiàn)PGA的主要廠商Xilinx和被Intel收購的Altera 都推出了專門針對 AI 加速的FPGA 硬件和軟件工具。而各個主要的云服務廠商,比如亞馬遜、微軟、阿里云等都推出了專門的云端 FPGA 實例來支持 AI 應用。中國剛剛被 Xilinx 收購的北京深鑒科技有限公司也是基于FPGA來設(shè)計深度學習的加速器架構(gòu),可以靈活擴展用于服務器端和嵌入式端。

DSP

DSP是一種由大規(guī)模集成電路芯片組成的用來完成某種信號處理任務的處理器。DSP善于測量、計算、過濾或壓縮連續(xù)的真實模擬信號,廣泛應用于通信與信息系統(tǒng)、信號與信息處理、自動控制、雷達、航空航天、醫(yī)療、家用電器等領(lǐng)域。針對濾波、矩陣運算、FFT(fast Fourier transformation)等需要大量乘加法運算的特點,DSP內(nèi)部配有獨立的乘法器和加法器,從而大大提高了運算速率。

DSP 種類繁多,目前應用于 AI 領(lǐng)域的 DSP 主要用于處理視覺系統(tǒng)如圖像、視頻等方面的任務,在自動駕駛、安防監(jiān)控、無人機和移動終端等領(lǐng)域最為常見。這些 DSP 中加入了專為深度神經(jīng)網(wǎng)絡定制的加速部件,如矩陣乘和累加器、全連接的激活層和池化層等。由于 DSP 具有高速、靈活、體積小、低功耗、可編程的特點,非常適合被用在終端設(shè)備中,例如手機和攝像頭。

眾核處理器

眾核處理器采用將多個處理核心整合在一起的處理器架構(gòu),主要面向高性能計算領(lǐng)域,作為CPU的協(xié)處理器存在。眾核處理器適合處理并行程度高的計算密集型任務,如基因測序、氣象模擬等。比起 GPU,眾核處理器支持的計算任務的控制邏輯和數(shù)據(jù)類型要更加復雜。2000年后,該領(lǐng)域的芯片研究一直很活躍,例如IBM CELL和 Kalray MPPA。Intel 的至強融核處理器(Xeon Phi)是典型的眾核處理器,其中2017年發(fā)布的KNL代表了眾核處理器的領(lǐng)先水平。

眾核處理器的結(jié)構(gòu)能有效地利用現(xiàn)代網(wǎng)絡和服務器等應用中較高的線程并行度,雖然芯片面積和功耗會隨著內(nèi)核數(shù)量的增加而增加,但性能也隨之有效地增加。而增加運算部件和指令發(fā)射寬度等技術(shù)在增大芯片面積的同時,會拉長信號傳輸線路,顯著增加線延遲,因此眾核處理器更適用于數(shù)據(jù)中心部署的各類 AI訓練和推理任務。

ASIC

ASIC 是一種為專用目的設(shè)計的,面向特定用戶需求的定制芯片,在大規(guī)模量產(chǎn)的情況下具備性能更強、體積更小、功耗更低、成本更低、可靠性更髙等優(yōu)點。ASIC分為全定制和半定制。全定制設(shè)計需要設(shè)計者完成所有電路的設(shè)計,因此需要大量人力物力,靈活性好,但開發(fā)效率低下,時間成本高昂。如果設(shè)計較為理想,全定制能夠比半定制的 ASIC 芯片運行速度更快。半定制使用庫中標準邏輯單元,設(shè)計時可以從標準邏輯單元庫中選擇門電路、加法器、比較器、數(shù)據(jù)通路、存儲器甚至系統(tǒng)級模塊和 IP核,這些邏輯單元已經(jīng)布局完畢,而且設(shè)計得較為可靠,設(shè)計者可以較方便地完成系統(tǒng)設(shè)計。

近年來越來越多的公司開始采用ASIC芯片進行深度學習算法加速,其中表現(xiàn)最為突出的是 Google 的TPU。TPU 的主要模塊包括 24 MB 的局部內(nèi)存、6 MB的累加器內(nèi)存、256×256個矩陣乘法單元、非線性神經(jīng)元計算單元,以及用于歸一化和池化的計算單元。TPU比同時期的GPU或CPU平均提速15~30倍,能效比提升 30~80倍。中國的北京寒武紀科技有限公司、北京比特大陸科技有限公司、北京地平線信息技術(shù)有限公司等公司也都推出了用于深度神經(jīng)網(wǎng)絡加速的ASIC芯片。目前基于 DNN的算法還沒有統(tǒng)一標準,而且算法還在不斷快速演進,所以 ASIC的設(shè)計需要保持一定的可編程性,采取軟硬件協(xié)同設(shè)計。

類腦仿生芯片

當今類腦仿生芯片的主流理念是采用神經(jīng)擬態(tài)工程設(shè)計的神經(jīng)擬態(tài)芯片。神經(jīng)擬態(tài)芯片采用電子技術(shù)模擬已經(jīng)被證明的生物腦的運作規(guī)則,從而構(gòu)建類似于生物腦的電子芯片,即“仿生電子腦”。神經(jīng)擬態(tài)主要指用包括模擬、數(shù)字或模數(shù)混合超大規(guī)模集成電路VLSI(也包括神經(jīng)元或者神經(jīng)突觸模型的新型材料或者電子元器件研究)和軟件系統(tǒng)實現(xiàn)神經(jīng)網(wǎng)絡模型,并在此之上構(gòu)建智能系統(tǒng)的研究。神經(jīng)擬態(tài)工程發(fā)展成為一個囊括神經(jīng)生物學、物理學、數(shù)學、計算機科學和電子工程的交叉學科。神經(jīng)擬態(tài)研究陸續(xù)在全世界范圍內(nèi)開展,并且受到了各國政府的重視和支持,如美國的腦計劃、歐洲的人腦項目,以及中國的類腦計算計劃等。受到腦結(jié)構(gòu)研究的成果啟發(fā),復雜神經(jīng)網(wǎng)絡在計算上具有低功耗、低延遲、高速處理、時空聯(lián)合等特點。

目前神經(jīng)擬態(tài)芯片的設(shè)計方法主要分為非硅和硅技術(shù)。非硅主要指采用憶阻器等新型材料和器件搭建的神經(jīng)形態(tài)芯片,還處于研究階段。模擬集成電路的代表是瑞士蘇黎世聯(lián)邦理工學院的 ROLLS芯片和海德堡大學的BrainScales芯片。數(shù)字集成電路又分為異步同步混合和純同步兩種。其中異步(無全局時鐘)數(shù)字電路的代表是 IBM 的TrueNorth,純同步的數(shù)字電路代表是清華大學的天機系列芯片。另外,對于片上自學習能力,最近Intel推出了Loihi芯片,帶有自主片上學習能力,通過脈沖或尖峰傳遞信息,并自動調(diào)節(jié)突觸強度,能夠通過環(huán)境中的各種反饋信息進行自主學習。中國的上海西井信息科技有限公司也成功制備了帶有片上學習能力的芯片。

通用AI芯片

現(xiàn)今的 AI芯片在某些具體任務上可以大幅超越人的能力,但究其通用性與適應性,與人類智能相比差距甚遠,大多處于對特定算法的加速階段。而 AI芯片的最終成果將是通用 AI芯片,并且最好是淡化人工干預的自學習、自適應芯片。因此未來通用 AI芯片應包含以下特征。

1)可編程性:適應算法的演進和應用的多樣性。

2)架構(gòu)的動態(tài)可變性:能適應不同的算法,實現(xiàn)高效計算。

3)高效的架構(gòu)重構(gòu)能力或自學習能力。

4)高計算效率:避免使用指令這類低效率的架構(gòu)。

5)高能量效率:能耗比大于5 Tops/W(即每瓦特進行5×1012次運算)。

6)低成本低功耗:能夠進入物聯(lián)網(wǎng)設(shè)備及消費類電子中。

7)體積小:能夠加載在移動終端上。

8)應用開發(fā)簡便:不需要用戶具備芯片設(shè)計方面的知識。

目前尚沒有真正意義上的通用AI芯片誕生,而基于可重構(gòu)計算架構(gòu)的軟件定義芯片(software defined chip)或許是通用 AI芯片的出路。軟件定義芯片顧名思義就是讓芯片根據(jù)軟件進行適應與調(diào)整,簡單來說就是將軟件通過不同的管道輸送到硬件中來執(zhí)行功能,使芯片能夠?qū)崟r地根據(jù)軟件、產(chǎn)品、應用場景的需求改變架構(gòu)和功能,實現(xiàn)更加靈活的芯片設(shè)計。沿用這種架構(gòu)設(shè)計出來的芯片,可以讓芯片的計算能力按照軟件的需求來調(diào)整適應,而不是沿用傳統(tǒng)芯片設(shè)計的剛性架構(gòu),讓應用適應架構(gòu)。

可重構(gòu)計算技術(shù)允許硬件架構(gòu)和功能隨軟件變化而變化,兼具處理器的通用性和ASIC的高性能和低功耗,是實現(xiàn)軟件定義芯片的核心,被公認為是突破性的下一代集成電路技術(shù)。清華大學微電子學研究所設(shè)計的 AI 芯片 Thinker,采用可重構(gòu)計算架構(gòu),能夠支持卷積神經(jīng)網(wǎng)絡、全連接神經(jīng)網(wǎng)絡和遞歸神經(jīng)網(wǎng)絡等多種 AI算法。Thinker芯片通過以下 3個層面的可重構(gòu)計算技術(shù),實現(xiàn)軟件定義芯片。

1)計算陣列重構(gòu):Thinker芯片的計算陣列由多個并行計算單元互連而成。每個計算單元可以根據(jù)算法所需要的基本算子不同而進行功能重構(gòu)。此外,在復雜 AI 任務中,多種 AI 算法的計算資源需求不同,因此Thinker芯片支持計算陣列的按需資源劃分以提高資源利用率和能量效率。

2)存儲帶寬重構(gòu):Thinker芯片的片上存儲帶寬能夠根據(jù) AI算法的不同而進行重構(gòu)。存儲內(nèi)的數(shù)據(jù)分布會隨著帶寬的改變而調(diào)整,以提高數(shù)據(jù)復用性和計算并行度,提高了計算吞吐和能量效率。

3)數(shù)據(jù)位寬重構(gòu):16 bit數(shù)據(jù)位寬足以滿足絕大多數(shù)應用的精度需求,對于一些精度要求不高的場景,甚至 8 bit數(shù)據(jù)位寬就已經(jīng)足夠。為了滿足AI算法多樣的精度需求,Thinker芯片的計算單元支持高/低(16/8 bit)兩種數(shù)據(jù)位寬重構(gòu)。高比特模式下計算精度提升,低比特模式下計算單元吞吐量提升進而提高性能。

可重構(gòu)計算技術(shù)作為實現(xiàn)軟件定義芯片的重要技術(shù),非常適合應用于 AI芯片的設(shè)計當中。采用可重構(gòu)計算技術(shù)之后,軟件定義的層面不僅僅局限于功能這一層面,算法的計算精度、性能和能效等都可以納入軟件定義的范疇??芍貥?gòu)計算技術(shù)借助自身實時動態(tài)配置的特點,實現(xiàn)軟硬件協(xié)同設(shè)計,為 AI芯片帶來極高的靈活度和適用范圍。Thinker團隊最新推出的 Thinker 2人臉識別芯片,能夠做到 6 ms 人臉識別(iPhone X 為10 ms),準確率超過 98%;以及 Thinker S語音識別芯片,不僅功耗只有 200 μW,只需要節(jié) 7 號 AAA 電池就運行 1 年,而且可以進行聲紋識別。《MIT Technology Review》2018年初在一篇專稿中評論了 Thinker團隊的工作,認為這是中國取得的頂級成就。

AI 芯片市場現(xiàn)狀

2018 年全球 AI 芯片市場規(guī)模預計將超過 20億美元,隨著包括谷歌、Facebook、微軟、亞馬遜以及百度、阿里、騰訊在內(nèi)的互聯(lián)網(wǎng)巨頭相繼入局,預計到2020年全球市場規(guī)模將超過 100億美元,其中中國的市場規(guī)模近25億美元,增長非常迅猛,發(fā)展空間巨大。目前全球各大芯片公司都在積極進行AI芯片的布局。在云端,Nvidia的系列 GPU芯片被廣泛應用于深度神經(jīng)網(wǎng)絡的訓練和推理。Google TPU 通過云服務 Cloud TPU 的形式把 TPU 開放商用,處理能力達到 180 Tflop,提供64 GB的HBM內(nèi)存,2400 Gbit/s的存儲帶寬。老牌芯片巨頭 Intel推出了 Nervana? Neural Network Processors(NNP),該系列架構(gòu)還可以優(yōu)化 32 GB HBM2,1 Tbit/s帶寬和 8 Tbit/s訪問速度的神經(jīng)網(wǎng)絡計算。而初創(chuàng)公司如 Graph core、Cerebras、Wave computing、寒武紀、比特大陸等也加入了競爭的行列,陸續(xù)推出了針對 AI的芯片和硬件系統(tǒng)。

然而對于某些應用,由于網(wǎng)絡延遲、帶寬和隱私問題等各類原因,必須在邊緣節(jié)點上執(zhí)行推斷。例如,自動駕駛汽車的推斷,不能交由云端完成,否則如果出現(xiàn)網(wǎng)絡延時,則會發(fā)生災難性后果;大型城市動輒百萬的高清攝像頭,其人臉識別如果全部交由云端完成,高清錄像的數(shù)據(jù)傳輸會讓通信網(wǎng)絡不堪重負。未來相當一部分人工智能應用場景中,要求邊緣處的終端設(shè)備本身具備足夠的推斷計算能力。而目前邊緣處理器芯片的計算能力,并不能滿足在本地實現(xiàn)深度神經(jīng)網(wǎng)絡推斷的需求。業(yè)界需要專門設(shè)計的 AI芯片,賦予設(shè)備足夠的能力去應對未來越發(fā)增多的人工智能應用場景。除了計算性能的要求之外,功耗和成本是在邊緣節(jié)點工作的AI芯片必須面對的重要約束。

智能手機是目前應用最為廣泛的邊緣計算終端設(shè)備,包括三星、蘋果、華為、高通、聯(lián)發(fā)科在內(nèi)的手機芯片廠商紛紛推出或者正在研發(fā)專門適應AI應用的芯片產(chǎn)品。另外,也有很多初創(chuàng)公司加入這個領(lǐng)域,為邊緣計算設(shè)備提供芯片和系統(tǒng)方案,比如北京中科寒武紀科技有限公司的 1A處理器、北京地平線信息技術(shù)有限公司的旭日處理器 、北京深鑒科技有限公司的DPU等。傳統(tǒng)的 IP 廠商,包括 ARM、Synopsys、Cadence等公司也都為包括手機、平板電腦、智能攝像頭、無人機、工業(yè)和服務機器人智能音箱等邊緣計算設(shè)備開發(fā)專用 IP產(chǎn)品。此外在終端應用中還蘊藏著智慧物聯(lián)網(wǎng)這一金礦,AI芯片只有實現(xiàn)從云端走向終端,才能真正賦予“萬物智能”。

AI 芯片未來趨勢

在 AI芯片領(lǐng)域,目前還沒有出現(xiàn)一款 CPU類的通用AI芯片,人工智能想要像移動支付那樣深入人心,改變社會,可能還差一個“殺手”級別的應用。無論是圖像識別、語音識別、機器翻譯、安防監(jiān)控、交通規(guī)劃、自動駕駛、智能陪伴、智慧物聯(lián)網(wǎng)等,AI涵蓋了人們生產(chǎn)生活的方方面面,然而距離 AI應用落地和大規(guī)模商業(yè)化還有很長的路要走。而對于芯片從業(yè)者來講,當務之急是研究芯片架構(gòu)問題。軟件是實現(xiàn)智能的核心,芯片是支撐智能的基礎(chǔ)。當前 AI芯片發(fā)展,短期內(nèi)以異構(gòu)計算為主來加速各類應用算法的落地;中期要發(fā)展自重構(gòu)、自學習、自適應的芯片來支持算法的演進和類人的自然智能;長期則朝通用AI芯片的方向發(fā)展。

通用AI計算

AI的通用性實際包括2個層級:第一個層級是可以處理任意問題;第二個層級是同一時間處理任意問題。第一層級的目標是讓AI的算法可以通過不同的設(shè)計、數(shù)據(jù)和訓練方法來處理不同的問題。例如,利用現(xiàn)在流行的深度學習方法訓練AI下棋、圖像識別、語音識別、行為識別、運動導航等。但是,不同的任務使用不同的數(shù)據(jù)集來獨立訓練,模型一旦訓練完成,只適用于這種任務,而不能用于處理其他任務。所以,可以說這種 AI的算法和訓練方法是通用的,而它訓練出來用于執(zhí)行某個任務的模型是不通用的。第二層級的目標是讓訓練出來的模型可以同時處理多種任務,就像人一樣可以既會下棋,又會翻譯,還會駕駛汽車和做飯。這個目標更加困難,目前還沒有哪一個算法可以如此全能。

通用AI芯片

通用 AI 芯片就是能夠支持和加速通用 AI 計算的芯片。關(guān)于通用AI的研究希望通過一個通用的數(shù)學模型,能夠最大限度概括智能的本質(zhì)。目前比較主流的看法是系統(tǒng)能夠具有通用效用最大化能力:即系統(tǒng)擁有通用歸納能力,能夠逼近任意可逼近的模式,并能利用所識別到的模式取得一個效用函數(shù)的最大化效益。這是很學術(shù)化的語言,如果通俗地說,就是讓系統(tǒng)通過學習和訓練,能夠準確高效地處理任意智能主體能夠處理的任務。通用 AI的難點主要有 2個:通用性,包括算法和架構(gòu);實現(xiàn)復雜程度。當前,摩爾定律的逐漸失效和馮·諾伊曼架構(gòu)的瓶頸這2個巨大的技術(shù)挑戰(zhàn)也是通用AI芯片需要考慮的問題。想要解決這 2個問題僅通過芯片的設(shè)計理念和架構(gòu)創(chuàng)新是行不通的,還需要取決于更先進的制程工藝、新型半導體材料、新型存儲器件以及人類對于自身大腦更進一步的認知。

AI 芯片面臨的機遇與挑戰(zhàn)

目前全球人工智能產(chǎn)業(yè)還處在高速變化發(fā)展中,廣泛的行業(yè)分布為人工智能的應用提供了廣闊的市場前景,快速迭代的算法推動人工智能技術(shù)快速走向商用,AI芯片是算法實現(xiàn)的硬件基礎(chǔ),也是未來人工智能時代的戰(zhàn)略制高點,但由于目前的 AI算法往往都各具優(yōu)劣,只有給它們設(shè)定一個合適的場景才能最好地發(fā)揮其作用,因此,確定應用領(lǐng)域就成為發(fā)展AI芯片的重要前提。但遺憾的是,當前尚不存在適應多種應用的通用算法,人工智能的“殺手”級應用還未出現(xiàn),已經(jīng)存在的一些應用對于消費者的日常生活來說也非剛需,因此哪家芯片公司能夠抓住市場痛點,最先實現(xiàn)應用落地,就可以在人工智能芯片的賽道上取得較大優(yōu)勢。

架構(gòu)創(chuàng)新是 AI芯片面臨的一個不可回避的課題。需要回答一個重要問題:是否會出現(xiàn)像通用CPU那樣獨立存在的 AI處理器?如果存在的話,它的架構(gòu)是怎樣的?如果不存在,目前以滿足特定應用為主要目標的AI芯片就一定只能以 IP核的方式存在,最終被各種各樣的 SoC(system-on-a-chip)所集成。這無疑帶來了新的問題,芯片的體積和功耗是必須要考慮的重要因素,傳統(tǒng)芯片公司在 SoC的設(shè)計優(yōu)化和工程實現(xiàn)上無疑比以算法起家的初創(chuàng)AI芯片公司更具經(jīng)驗。

從芯片發(fā)展的大趨勢來看,現(xiàn)在還是 AI芯片的初級階段。無論是科研還是產(chǎn)業(yè)應用都有巨大的創(chuàng)新空間。從確定算法、應用場景的 AI加速芯片向具備更高靈活性、適應性的通用智能芯片發(fā)展是技術(shù)發(fā)展的必然方向。未來 2 年之內(nèi) AI 芯片產(chǎn)業(yè)將持續(xù)火熱,公司扎堆進入,但是到了2020年前后,則將會出現(xiàn)一批出局者,行業(yè)洗牌開始,最終的成功與否則將取決于各家公司技術(shù)路徑的選擇和產(chǎn)品落地的速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    440942
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7653

    瀏覽量

    167408
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249517
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術(shù)迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機視覺到自然語言處理,從自動駕駛到
    的頭像 發(fā)表于 07-16 15:01 ?167次閱讀

    工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析

    過大數(shù)據(jù)分析的部分觀點,可能對您的企業(yè)規(guī)劃有一定的參考價值。點擊附件查看全文*附件:工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析.doc 本文系網(wǎng)絡轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 03-31 14:35

    人工智能大模型年度發(fā)展趨勢報告

    2024年12月的中央經(jīng)濟工作會議明確把開展“人工智能+”行動作為2025年要抓好的重點任務。當前,以大模型為代表的人工智能正快速演進,激發(fā)全球科技之變、產(chǎn)業(yè)之變、時代之變,人工智能發(fā)展
    的頭像 發(fā)表于 02-13 10:57 ?794次閱讀
    <b class='flag-5'>人工智能</b>大模型年度<b class='flag-5'>發(fā)展趨勢</b>報告

    我國生成式人工智能發(fā)展現(xiàn)狀趨勢

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成式人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。2022年11月以來,隨著以ChatGPT為代表的大語言模型迅速發(fā)展,生成式人工智能
    的頭像 發(fā)表于 02-08 11:31 ?1487次閱讀

    智能駕駛傳感器發(fā)展現(xiàn)狀及發(fā)展趨勢

    隨著人工智能和自動駕駛技術(shù)的飛速發(fā)展,智能駕駛傳感器作為自動駕駛系統(tǒng)的核心硬件,正經(jīng)歷著前所未有的變革與創(chuàng)新。這些傳感器如同自動駕駛汽車的“眼睛”和“耳朵”,負責感知周圍環(huán)境,為車輛提供實時、準確
    的頭像 發(fā)表于 01-16 17:02 ?878次閱讀

    新型儲能產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢-2024年上半年數(shù)據(jù)發(fā)布簡版

    新型儲能產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢-2024年上半年數(shù)據(jù)發(fā)布 簡版
    發(fā)表于 01-03 15:14 ?0次下載

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計算機科學的一個分支,它研究如何使計算機具備像人類一樣思考、學習、推理和決策的能力。人工智能發(fā)展歷程可以追溯到上世紀50年代,經(jīng)
    發(fā)表于 11-14 16:39

    淺談自動駕駛技術(shù)的現(xiàn)狀及發(fā)展趨勢

    自動駕駛技術(shù),作為人工智能和計算機科學領(lǐng)域的一項重要應用,近年來取得了顯著的發(fā)展與進步。它不僅代表著汽車產(chǎn)業(yè)的未來方向,更預示著人類出行方式的深刻變革。 一、自動駕駛技術(shù)的現(xiàn)狀 自動駕駛技術(shù),也稱為
    的頭像 發(fā)表于 10-22 14:33 ?3447次閱讀

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動能源科學的進步,為未來的可持續(xù)發(fā)展提供了強大的支持。 首先,書中通過深入淺出的語言,介紹了人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    。 4. 對未來生命科學發(fā)展的展望 在閱讀這一章后,我對未來生命科學的發(fā)展充滿了期待。我相信,在人工智能技術(shù)的推動下,生命科學將取得更加顯著的進展。例如,在藥物研發(fā)領(lǐng)域,AI技術(shù)將幫助科學家們更加
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    的同時,確保其公正性、透明度和可持續(xù)性,是當前和未來科學研究必須面對的重要課題。此外,培養(yǎng)具備AI技能的科研人才,也是推動這一領(lǐng)域發(fā)展的關(guān)鍵。 4. 激發(fā)創(chuàng)新思維 閱讀這一章,我被深深啟發(fā)的是人工智能
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V和Arm內(nèi)核及其定制的機器學習和浮點運算單元,用于處理復雜的人工智能圖像處理任務。 四、未來發(fā)展趨勢 隨著人工智能技術(shù)的不斷發(fā)展和普及,RISC-V在
    發(fā)表于 09-28 11:00

    智能制造行業(yè)現(xiàn)狀發(fā)展趨勢

    智能制造行業(yè)作為現(xiàn)代制造業(yè)的重要組成部分,正經(jīng)歷著快速的發(fā)展與變革。以下是對智能制造行業(yè)現(xiàn)狀發(fā)展趨勢的詳細分析:
    的頭像 發(fā)表于 09-15 14:26 ?3032次閱讀

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    每個交叉領(lǐng)域,本書通過案例進行了詳盡的介紹,梳理了產(chǎn)業(yè)地圖,并給出了相關(guān)政策啟示。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》適合所有關(guān)注人工智能技術(shù)和產(chǎn)業(yè)發(fā)展的讀者閱讀,特別適合材料科學
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應用有哪些?

    定制化的硬件設(shè)計,提高了硬件的靈活性和適應性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應用前景廣闊,不僅可以用于深度學習的加速和云計算的加速,還可以針對特定應用場景進行定制化計算,為人工智能技術(shù)的發(fā)展提供有力支持。
    發(fā)表于 07-29 17:05