世界正在朝著交互設備的智能和分布式計算模型發(fā)展。這些設備中的智能將由機器學習算法驅(qū)動。然而,將機器學習擴展到邊緣并非沒有挑戰(zhàn)。本文將討論這些挑戰(zhàn)的前景,然后描述神經(jīng)形態(tài) - 大腦啟發(fā) - 計算將如何實現(xiàn)廣泛的智能應用來應對這些挑戰(zhàn)。提供了該技術(shù)的示例,包括手寫識別和連續(xù)語音識別。
世界正在朝著智能和分布式計算模式發(fā)展,其中數(shù)百萬智能設備將直接與他們的世界以及彼此進行交互和通信,以實現(xiàn)更快,響應更快,更智能的未來。這個世界將使一種新型的邊緣設備和系統(tǒng)成為可能,從可穿戴設備、智能燈泡、智能鎖到智能汽車和建筑,對任何中央?yún)f(xié)調(diào)或處理實體(如云)的需求最小。這個智能世界的核心是機器學習算法,這些算法在處理器上運行,這些處理器直接對這些設備收集的數(shù)據(jù)進行操作,以學習進行智能推理,并在動態(tài)變化的環(huán)境中實時有效地對其世界采取行動。
圖 1.具有學習、推理和快速交互能力的智能邊緣模型將使未來的智能設備成為可能。
在邊緣設備中啟用智能的模型基于在邊緣設備與環(huán)境和其他設備交互期間感知-學習-推斷-行動的能力(圖 1)。我們相信,使這些智能邊緣設備既敏捷(即快速響應)又高效(即從電源角度來看)的解決方案將主導這個動態(tài)變化和分布式的網(wǎng)絡傳感器和對象世界。但是,與任何新技術(shù)一樣,在邊緣提供低功耗智能時需要解決一些挑戰(zhàn)。我們回顧了一些關(guān)鍵挑戰(zhàn),并討論了Eta計算如何努力解決這些問題。
圖 2.DIAL技術(shù)可實現(xiàn)電壓調(diào)節(jié),從而以無縫方式解決功耗和性能限制應用。
一個關(guān)鍵的挑戰(zhàn)是能夠在這些邊緣設備上使用非常有限的電源資源智能地處理數(shù)據(jù)。埃塔計算一直在開發(fā)一種名為DIAL的基礎(chǔ)技術(shù)。斷續(xù)器(即,延遲不敏感的異步邏輯)將傳統(tǒng)微處理器和數(shù)字信號處理器的操作從同步模式轉(zhuǎn)換為異步模式(即,沒有任何時鐘)。與傳統(tǒng)邏輯不同(參見圖 2),其基本原理是以事件驅(qū)動的方式運行處理器,在不通過握手協(xié)議使用時,可以按需喚醒以進行處理并進入睡眠狀態(tài)。此外,該處理器可以自動控制為以任務要求的最低頻率運行,并在該頻率下能夠?qū)⒐ぷ麟妷嚎s放到盡可能小的值以運行任務。DIAL的一項重要創(chuàng)新是,電路設計中沒有面積損失,同時還提供了一種可正式驗證的方法來驗證電路功能是否正確。這些重要特性使 Eta Compute 能夠以業(yè)界最低的功率水平提供微處理器技術(shù),并在工作頻率下提供約 10 μW/MHz 的擴展。執(zhí)行電壓調(diào)節(jié)還可以實現(xiàn)高能效(即低功耗)和性能高效(即高吞吐量)計算任務之間的無縫轉(zhuǎn)換。
另一個重要的挑戰(zhàn)是能夠支持ML模型,這些模型可以直接在內(nèi)存資源非常有限的設備上學習。此功能為許多應用程序提供了所需的隱私和安全性,同時還確保了與其環(huán)境的敏捷交互。今天解決這個問題的方法是使用深度學習模型和谷歌的TensorFlow等工具在云中訓練ML模型,然后將這些訓練的模型轉(zhuǎn)換為在邊緣運行的推理模型。
圖 3.SNN 模型中的核心思想。(a)從信息理論和能源效率的角度來看,基于事件的稀疏和離散的信號表示非常有效(b)興奮性(綠色)和抑制性(紅色)神經(jīng)元之間的循環(huán)結(jié)構(gòu)約束和平衡的峰值活動。
我們正在探索一種基于大腦計算或神經(jīng)形態(tài)計算原理的新方法[1],既能夠直接從數(shù)據(jù)流中學習,又可以通過有限數(shù)量的訓練示例和有限的記憶要求來存儲所學知識。這里的基本思想是明確地表示數(shù)據(jù)/信號(圖3),方法是以動作電位或尖峰的形式合并時間,然后將芯片操作的異步模式(如上所述)與使用尖峰學習的異步模式相結(jié)合。峰值神經(jīng)網(wǎng)絡 (SNN) 計算提供了非常稀疏的數(shù)據(jù)表示,并且使用 DIAL 實現(xiàn)起來非常節(jié)能,因為計算僅在出現(xiàn)峰值事件時才發(fā)生。此外,學習僅使用具有稀疏連接的本地學習規(guī)則來啟用,因此不像傳統(tǒng)的ML模型那樣參數(shù)密集,從而節(jié)省了存儲所需的內(nèi)存和訓練模型所需的時間[2]。SNN的最后一個但同樣重要的方面是利用結(jié)構(gòu)約束(圖3)對事件序列的存儲器進行編碼,以便快速學習,而無需在訓練期間進行多個數(shù)據(jù)演示。將模型的這些方面與由DIAL提供支持的處理器相結(jié)合,可以產(chǎn)生一個可以互換學習和推理的邊緣設備,從而實現(xiàn)敏捷的感知 - 學習 - 推斷 - 行為模型。
Eta Compute正在使用這項技術(shù)開發(fā)用于模式識別的實際應用程序,我們將討論兩個這樣的例子。首先是使用語音命令數(shù)據(jù)集 [3] 中的數(shù)據(jù)連續(xù)識別語音數(shù)字。此數(shù)據(jù)集由來自 2,300 個不同揚聲器的個位數(shù)音頻片段組成,總共 60000 個話語。我們的 SNN 使用每個訓練樣本的單次通過進行訓練,同時在測試集上實現(xiàn)了 95.2% 的準確率,可與其他 ML 模型相媲美。從模型效率的角度來看,我們的 SNN 模型的效率提高了幾個數(shù)量級(通過所需的訓練樣本數(shù)量和要學習的網(wǎng)絡參數(shù)數(shù)量來衡量),同時執(zhí)行的準確性相當。
SNN還能夠泛化以在連續(xù)模式下穩(wěn)健地識別數(shù)字,這是由于固有的短期記憶,可以可靠地檢測10位數(shù)話語的開頭,即使由于其他數(shù)字而重疊的頻譜圖也是如此。此模型已移植到我們的異步 Eta 核心芯片上。音頻從麥克風捕獲,并使用片上低功耗ADC進行數(shù)字化,數(shù)字化信號被轉(zhuǎn)換為頻譜圖,然后使用DSP編碼為尖峰。ARM M3 執(zhí)行 SNN 計算(圖 4(a))。該型號的總內(nèi)存為36 KB。從數(shù)據(jù)到?jīng)Q策(即包括I/O、DSP和M3)的總功耗為2 mW,推理速率為6-8字/秒。
同樣的原理應用于基于MNIST基準測試[4]的訓練數(shù)據(jù)的手寫數(shù)字識別問題。二進制圖像由 DSP 直接轉(zhuǎn)換為尖峰,同時在 M3 上執(zhí)行 SNN 學習(圖 4(b))。該芯片在MNIST測試設備上實現(xiàn)了98.3%的精度,需要64 KB的內(nèi)存。該解決方案需要 1 mW 的功率從數(shù)據(jù)到?jīng)Q策,吞吐量為 8 張圖像/秒。
圖 4.我們的連續(xù)語音數(shù)字和手寫數(shù)字識別芯片實現(xiàn)具有很高的功率和內(nèi)存效率,同時在準確性方面可與傳統(tǒng)ML模型相媲美。(a) 連續(xù)語音數(shù)字識別 (b) 手寫數(shù)字識別。
這些結(jié)果表明,正如 Gartner 集團所預測的那樣,實現(xiàn)智能、敏捷和高效的邊緣設備的潛力將推動快速擴張的物聯(lián)網(wǎng)市場,到 2020 年將有超過 250 億臺設備投入使用[5]。例如,其他基礎(chǔ)設施的共同開發(fā),如設備互操作性標準和5G無線技術(shù),可以使新的健身追蹤器能夠可靠地檢測用戶狀態(tài),例如入睡,然后自動關(guān)燈。未來似乎正在向由智能和高效邊緣設備提供支持的智能和分布式計算模型邁進,Eta Compute正在開發(fā)新技術(shù),以在其中發(fā)揮關(guān)鍵作用。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235227 -
機器學習
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134619
發(fā)布評論請先 登錄
評論