一、“光計(jì)算”背景
現(xiàn)如今,“大數(shù)據(jù)”(Big Data)時(shí)代提供了海量的數(shù)據(jù),人工智能(artificial intelligence,AI)在自動(dòng)駕駛,智能教育,語音識(shí)別等領(lǐng)域中的應(yīng)用越來越廣泛。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)算法相關(guān)的機(jī)器學(xué)習(xí)(Machine Learning,ML)技術(shù),作為AI領(lǐng)域中重要的計(jì)算模型,為AI的發(fā)展提供了動(dòng)力,推動(dòng)人類社會(huì)進(jìn)入智能化時(shí)代。
但人工神經(jīng)網(wǎng)絡(luò)強(qiáng)烈依賴于矩陣乘法,其訓(xùn)練和推理過程本質(zhì)上是對矩陣參數(shù)進(jìn)行調(diào)制、優(yōu)化后與外界傳輸?shù)臄?shù)據(jù)進(jìn)行數(shù)學(xué)乘法。但在目前,隨著神經(jīng)網(wǎng)絡(luò)的規(guī)模不斷擴(kuò)大(深度學(xué)習(xí)模型的規(guī)模每3.5個(gè)月就翻一番),訓(xùn)練量也不斷增大,需要更密集的矩陣計(jì)算,因而對算力的需求正在以驚人的速度增長。
圖1 人工智能應(yīng)用場景
圖2 神經(jīng)網(wǎng)絡(luò)架構(gòu)示意圖
而現(xiàn)階段應(yīng)用于神經(jīng)網(wǎng)絡(luò)的商用硬件主要包括兩類:一類是通用芯片,如中央處理器(CentralProcessing Unit,CPU)、圖形處理單元(GraphicProcessing Unit, GPU)等;另一類是一些神經(jīng)網(wǎng)絡(luò)加速器如張量處理單元(TensorProcessing Unit, TPU)和可編程門陣列(FieldProgrammable Gate Array, FPGA)等。
最初,普遍采用通用芯片(CPU)進(jìn)行矩陣運(yùn)算,然而隨著需要計(jì)算的數(shù)據(jù)量的不斷增長,由于CPU算術(shù)邏輯單元(Arithmeticand Logic Unit,ALU)的面積較小,并且CPU自身的邏輯運(yùn)算和控制電路也較為復(fù)雜,因而導(dǎo)致CPU已無法支撐大數(shù)據(jù)量帶來的大量重復(fù)性的矩陣乘法運(yùn)算。因而主流硬件廠商開始將注意力轉(zhuǎn)向GPU:GPU采用的是流處理的方式,利用空間并行性,可以大大提高運(yùn)算速度。
但隨著GPU的不斷迭代,其運(yùn)算速度已經(jīng)進(jìn)入了萬億次每秒(Teraflop)的范圍,也已接近其理論極限。為了進(jìn)一步提高硬件的算力,各大廠商開始了對神經(jīng)網(wǎng)絡(luò)加速器的研究。2016年,谷歌推出了TPU,采用了片上內(nèi)存以及脈動(dòng)陣列設(shè)計(jì),可在8位低精度下進(jìn)行整數(shù)運(yùn)算,相比于GPU具有更高的計(jì)算速度和更低的能耗。此外,在2017年,Intel也推出了面向數(shù)據(jù)中心的FPGA加速產(chǎn)品,可根據(jù)本身需求進(jìn)行編程。
圖3 典型的商用硬件
但是,上述這些架構(gòu)全部基于傳統(tǒng)的微電子芯片,隨著工藝技術(shù)向工藝尺寸的極限逼近,芯片的集成度不斷增加,“摩爾定律”將不再適用,即很難通過提升集成度提升芯片性能。另外,由于目前的電子計(jì)算硬件采用的處理器的邏輯單元和存儲(chǔ)單元是分立的馮·諾依曼(VonNeumann)結(jié)構(gòu),這種結(jié)構(gòu)存在馮·諾依曼“瓶頸”(vonNeumann bottleneck),即:當(dāng)算力達(dá)到一定量級(jí)時(shí),訪問存儲(chǔ)單元的速度遠(yuǎn)遠(yuǎn)小于邏輯單元處理數(shù)據(jù)的速度,即使采用多核并行架構(gòu)也無法突破速度的極限。
二、“電”向“光”的轉(zhuǎn)變
為了突破電子芯片的一系列弊端,相關(guān)研究者們開始考慮從“電”向“光”的轉(zhuǎn)化,利用光子(photon)作為硬件的載體,用光計(jì)算去代替?zhèn)鹘y(tǒng)電子計(jì)算中的計(jì)算密集型操作,從而提高算力,降低能耗。
光可以來做載體主要是因?yàn)槠溆幸韵聝?yōu)勢:首先,光子是玻色子,其物理特性決定了其不易被擾動(dòng);而電子是費(fèi)米子,容易被擾動(dòng)。其次,光信號(hào)具有高速率的特點(diǎn),可以保證足夠高的計(jì)算速度,幾乎沒有延遲。此外,光波可以通過時(shí)間、空間、波長、偏振、模式進(jìn)行復(fù)用,提供天然的并行計(jì)算能力。最后,光學(xué)器件(尤其是無源器件),幾乎不消耗任何能量,解決了困擾高性能計(jì)算的能耗問題。
圖4 光計(jì)算的主要優(yōu)勢
三、全光 VS 光電混合
目前,根據(jù)神經(jīng)元內(nèi)信號(hào)的物理表現(xiàn),光作為硬件的載體的方式可分為兩大類:光-電-光(光電混合)與全光。
全光的方式即依賴于許多材料中出現(xiàn)的半導(dǎo)體載流子或光敏性,不涉及將神經(jīng)元信號(hào)表表示為電流的過程。例如,德國明斯特大學(xué)Feldmann 在2019年提出了一種包含140個(gè)相變微環(huán)光開關(guān)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可實(shí)現(xiàn)簡單的英文字母識(shí)別。但從目前來看,相變材料自身通常有一定的使用壽命限制,從而導(dǎo)致該硬件難以長期工作;并且相變材料通常對應(yīng)的響應(yīng)速度也較慢,難以實(shí)現(xiàn)足夠高的計(jì)算速度;除此之外,利用光敏性的實(shí)現(xiàn)也存在著一系列問題。總的來說,由于光學(xué)元件的精度要求大,進(jìn)行邏輯運(yùn)算成本也高,在處理信號(hào)的方面沒有電信號(hào)來得方便,這些限制了全光運(yùn)算的發(fā)展,導(dǎo)致全光難以取代電成為計(jì)算硬件的主流。
圖5 光電混合計(jì)算示意圖
而光電混合計(jì)算更像是取光和電兩者所長的結(jié)果。舉例來說,一個(gè)具體的實(shí)現(xiàn)方式是保持輸入數(shù)據(jù)仍然是數(shù)字信號(hào),首先用數(shù)模轉(zhuǎn)換器轉(zhuǎn)成模擬電信號(hào)去驅(qū)動(dòng)光芯片上的光調(diào)制器,矩陣計(jì)算則是用光信號(hào)完成,之后的非線性運(yùn)算則需把光信號(hào)再轉(zhuǎn)回到數(shù)字信號(hào)進(jìn)行。事實(shí)上,雖然這樣的來回光電信號(hào)切換增加了功耗,但對于光芯片內(nèi)的距離來說,光損耗幾乎可以忽略不計(jì)。因此,光連接中不存在像電連接中與每個(gè)連接長度成正比的能量成本,而是預(yù)先耗費(fèi)從電領(lǐng)域轉(zhuǎn)換到光領(lǐng)域再返回的能量成本,因而只要E/O/E轉(zhuǎn)換的成本低于在相同距離上給金屬線充電的成本,光電混合計(jì)算就能在效率上擊敗電計(jì)算。綜上所述,現(xiàn)階段的商用硬件,光電混合計(jì)算仍是最佳選擇。
圖6 光子核架構(gòu)示意圖
四、硅基光電子計(jì)算
而要具體實(shí)現(xiàn)光電混合計(jì)算,首先要考慮光芯片的平臺(tái)。傳統(tǒng)光電子芯片主要基于InP等三五族平臺(tái),而大部分微電子器件基于硅的平臺(tái),如果要把這些不同材料平臺(tái)的器件集成到一起往往是非常困難的。因此,相關(guān)研究者們再次將目光投向了在微電子領(lǐng)域并取得了成功——具有一系列優(yōu)勢的硅材料:首先,硅材料的地表儲(chǔ)存量十分巨大,其材料成本十分低廉;其次,硅材料的折射率較大(約為3.5左右),可以獲得更小的彎曲半徑以實(shí)現(xiàn)結(jié)構(gòu)非常緊湊的集成光學(xué)器件;此外,硅材料的機(jī)械性能、耐高溫能力非常好,便于各種加工和封裝。最后,最重要的是相比于傳統(tǒng)的三五族器件,集成度更好,并且與互補(bǔ)金屬氧化物半導(dǎo)體(COMS)工藝兼容。
目前,硅基光電子技術(shù)不斷發(fā)展。國內(nèi)外眾多高校和企業(yè)都在研究硅基光子學(xué),并在技術(shù)優(yōu)勢和現(xiàn)實(shí)需求的推動(dòng)下,許多高性能的光學(xué)關(guān)鍵器件:波導(dǎo)(Waveguide)、光耦合器(Coupler)、偏振分束器、模式轉(zhuǎn)換器、高速電光調(diào)制器、濾波器(Filter)、鍺探測器、光開關(guān)均有報(bào)道,其中大部分部件的性能已經(jīng)達(dá)到甚至超過同期商業(yè)化的產(chǎn)品,為商用光電混合計(jì)算的實(shí)現(xiàn)提供了先決條件,進(jìn)而將由電芯片和硅光芯片通過2.5D或3D封裝堆疊組成光電混合計(jì)算的硬件推向市場。
圖7 硅基光電計(jì)算封裝示意圖
總結(jié)來說,硅基光電混合技術(shù)既利用了光技術(shù)的優(yōu)點(diǎn),同時(shí)又可以結(jié)合電領(lǐng)域的技術(shù)進(jìn)行數(shù)據(jù)處理,最終實(shí)現(xiàn)在提升計(jì)算速度的同時(shí)也可以降低運(yùn)行功耗。而在未來的發(fā)展過程中,硅基光電子混合集成芯片一定會(huì)為人工智能領(lǐng)域以及計(jì)算硬件帶來重大的產(chǎn)業(yè)升級(jí)。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103607 -
硬件
+關(guān)注
關(guān)注
11文章
3484瀏覽量
67497 -
人工智能
+關(guān)注
關(guān)注
1806文章
49018瀏覽量
249462
原文標(biāo)題:“曦”科技|計(jì)算范疇下硅光的優(yōu)勢
文章出處:【微信號(hào):曦智科技,微信公眾號(hào):曦智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
注塑PEEK光伏接線盒的高性能與工藝優(yōu)勢

GPU加速計(jì)算平臺(tái)的優(yōu)勢
光伏電站智能運(yùn)維管理系統(tǒng)的作用與優(yōu)勢

評論