使用光而非電的處理器有望成為實(shí)現(xiàn)人工智能的一種更快、更節(jié)能的方式。到目前為止,它們只用于運(yùn)行已經(jīng)訓(xùn)練過的模型,但新的研究首次證明了在光學(xué)芯片上訓(xùn)練人工智能的能力。
隨著人工智能模型越來越大,人們?cè)絹碓綋?dān)心它們消耗的能量,既是由于不斷膨脹的成本,也是對(duì)環(huán)境的潛在影響。這激發(fā)了人們對(duì)可以減少人工智能能源費(fèi)用的新方法的興趣,其中光子處理器成為了主要候選者。
這些芯片用光子取代了傳統(tǒng)處理器中的電子,并使用波導(dǎo)、濾波器和光探測(cè)器等光學(xué)組件來創(chuàng)建可以執(zhí)行計(jì)算任務(wù)的電路。它們?cè)谶\(yùn)行人工智能方面特別有前景,因?yàn)樗鼈冊(cè)趫?zhí)行矩陣乘法方面非常高效,這是所有深度學(xué)習(xí)模型的核心關(guān)鍵計(jì)算??偛课挥诓ㄊ款D的Lightmatter和馬薩諸塞州劍橋的Lightelligence等公司已經(jīng)在努力將光子人工智能芯片商業(yè)化。
然而,到目前為止,這些設(shè)備只用于推理,即已經(jīng)訓(xùn)練過的人工智能模型對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)。這是因?yàn)檫@些芯片一直在努力實(shí)現(xiàn)一種用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的關(guān)鍵算法——反向傳播。但在《科學(xué)》雜志的一篇新論文(https://www.science.org/doi/10.1126/science.ade8450)中,斯坦福大學(xué)的一個(gè)團(tuán)隊(duì)描述了這種訓(xùn)練方法首次在光子芯片上實(shí)現(xiàn)。
“我們的實(shí)驗(yàn)首次證明了原位反向傳播可以訓(xùn)練光子神經(jīng)網(wǎng)絡(luò)來解決任務(wù),這為訓(xùn)練神經(jīng)網(wǎng)絡(luò)提供了一種新的節(jié)能途徑,”Sunil Pai說,他在斯坦福大學(xué)領(lǐng)導(dǎo)了這項(xiàng)研究,但現(xiàn)在在加州的PsiQuantum工作,該公司正在制造光子量子計(jì)算機(jī)。
反向傳播包括反復(fù)將訓(xùn)練示例輸入神經(jīng)網(wǎng)絡(luò),并要求其對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。每次,算法都會(huì)測(cè)量預(yù)測(cè)的偏差,然后通過網(wǎng)絡(luò)將誤差信號(hào)反饋回來。這用于調(diào)整神經(jīng)元之間的連接強(qiáng)度或權(quán)重,以提高預(yù)測(cè)性能。這個(gè)過程重復(fù)多次,直到網(wǎng)絡(luò)能夠解決它所設(shè)置的任何任務(wù)。
麻省理工學(xué)院博士后Charles Roques-Carmes表示,這種方法很難在光子處理器上實(shí)現(xiàn),因?yàn)榕c標(biāo)準(zhǔn)芯片相比,這些設(shè)備只能執(zhí)行有限的操作。因此,計(jì)算光子神經(jīng)網(wǎng)絡(luò)的權(quán)重通常依賴于在傳統(tǒng)計(jì)算機(jī)上芯片外對(duì)處理器進(jìn)行的復(fù)雜物理模擬。
但在2018年,《科學(xué)》上新論文的一些作者提出了一種算法,理論上可以有效地在芯片上執(zhí)行這一關(guān)鍵步驟。該方案包括將訓(xùn)練數(shù)據(jù)編碼為光信號(hào),使其通過光子神經(jīng)網(wǎng)絡(luò),然后計(jì)算輸出的誤差。然后,該錯(cuò)誤信號(hào)通過網(wǎng)絡(luò)反向發(fā)送,并對(duì)原始輸入信號(hào)進(jìn)行光學(xué)干擾,其結(jié)果告訴您需要如何調(diào)整網(wǎng)絡(luò)連接以改進(jìn)預(yù)測(cè)。然而,該方案依賴于通過芯片向前和向后發(fā)送光信號(hào),并能夠測(cè)量通過單個(gè)芯片組件的光的強(qiáng)度,這在現(xiàn)有設(shè)計(jì)中是不可能的。
“This might open the way to fully photonic computing on-chip for applications in AI.”
—Charles Roques-Carmes, MIT
現(xiàn)在,Pai和他的同事已經(jīng)構(gòu)建了一種定制的光子芯片,可以成功地實(shí)現(xiàn)這種算法。它使用了一種被稱為“光子網(wǎng)格”的常見設(shè)計(jì),其特點(diǎn)是一組可編程光學(xué)元件,控制光信號(hào)如何在芯片上分裂。通過使光束相互混合和干涉,芯片能夠進(jìn)行矩陣乘法運(yùn)算,從而實(shí)現(xiàn)光子神經(jīng)網(wǎng)絡(luò)。
不過,新芯片的與眾不同之處在于,它的兩端都有光源和光探測(cè)器,允許信號(hào)在網(wǎng)絡(luò)中向前和向后傳遞。它還在網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)上都有小的“抽頭”,可以吸走少量的光信號(hào),將其重定向到測(cè)量光強(qiáng)度的紅外相機(jī)。這些變化共同使得實(shí)現(xiàn)光學(xué)反向傳播算法成為可能。研究人員表明,他們可以訓(xùn)練一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò),根據(jù)點(diǎn)的位置在圖上標(biāo)記點(diǎn),準(zhǔn)確率高達(dá)98%,與傳統(tǒng)方法相當(dāng)。
Pai說,在這種方法變得實(shí)用之前,還有很多工作要做。光學(xué)抽頭和相機(jī)對(duì)于實(shí)驗(yàn)裝置來說很好,但需要用商業(yè)芯片中的集成光電探測(cè)器來取代。Pai表示,他們需要使用相對(duì)較高的光功率才能獲得良好的性能,這表明在精度和能耗之間需要權(quán)衡。
Roques-Carmes說,同樣重要的是要認(rèn)識(shí)到斯坦福大學(xué)研究人員的系統(tǒng)實(shí)際上是一種混合設(shè)計(jì)。計(jì)算成本高昂的矩陣乘法是以光學(xué)方式進(jìn)行的,但被稱為非線性激活函數(shù)的更簡(jiǎn)單的計(jì)算是以數(shù)字方式在芯片外進(jìn)行的,非線性激活函數(shù)決定了每個(gè)神經(jīng)元的輸出。目前,這些技術(shù)的數(shù)字實(shí)現(xiàn)成本低廉,光學(xué)實(shí)現(xiàn)復(fù)雜,但Roques-Carmes表示,其他研究人員也在這個(gè)問題上取得了進(jìn)展。
“這項(xiàng)研究是在光子芯片上實(shí)現(xiàn)有用的機(jī)器學(xué)習(xí)算法的重要一步,”他說,“將其與目前正在開發(fā)的高效片上非線性運(yùn)算相結(jié)合,這可能為人工智能中的全光子片上計(jì)算開辟道路。”
-
探測(cè)器
+關(guān)注
關(guān)注
15文章
2706瀏覽量
74404 -
人工智能
+關(guān)注
關(guān)注
1807文章
49035瀏覽量
249741 -
光學(xué)芯片
+關(guān)注
關(guān)注
0文章
17瀏覽量
4643
原文標(biāo)題:斯坦福大學(xué)團(tuán)隊(duì)首次實(shí)現(xiàn)光學(xué)反向傳播里程碑
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論