隨著消費、生物醫(yī)學(xué)和 IoT/IIoT 市場中始終監(jiān)聽設(shè)備的爆炸式增長,似乎每個人都在嘗試使用模擬來節(jié)省設(shè)計中的功耗。借助使用“模擬內(nèi)存計算”來降低處理器功率的新型機(jī)器學(xué)習(xí) (ML) 數(shù)字芯片,半導(dǎo)體供應(yīng)商正在發(fā)明新方法來利用模擬計算的固有功率和計算效率。那么,有什么問題呢?事實是,盡管這些芯片利用模擬電路的固有優(yōu)勢來節(jié)省芯片內(nèi)用于神經(jīng)網(wǎng)絡(luò)處理的功率,但它們最終是在數(shù)字域中對數(shù)字?jǐn)?shù)據(jù)進(jìn)行操作的數(shù)字處理芯片——這意味著它們只為系統(tǒng)提供有限的節(jié)能。幸運的是,模擬ML ) 內(nèi)核——現(xiàn)在可以在系統(tǒng)級實現(xiàn)更高的功率效率。
雖然模擬內(nèi)存計算和模擬ML 有時都被標(biāo)記為“模擬計算”,但它們絕不是一回事。設(shè)計人員需要了解模擬內(nèi)存計算和模擬ML 內(nèi)核之間的差異,以便他們能夠創(chuàng)建更節(jié)能的終端設(shè)備?
內(nèi)存模擬計算的芯片級效率
模擬內(nèi)存計算通常是指在其他數(shù)字機(jī)器學(xué)習(xí)處理器的神經(jīng)網(wǎng)絡(luò)中使用模擬電路,以便以較低的功率執(zhí)行乘法累加 (MAC) 功能。但是利用這種方法的芯片仍然是在標(biāo)準(zhǔn)數(shù)字處理范式內(nèi)運行的時鐘處理器,需要立即對所有模擬傳感器數(shù)據(jù)進(jìn)行數(shù)字化,無論是否相關(guān)。事實上,使用模擬內(nèi)存計算的芯片實際上需要三個單獨的數(shù)據(jù)轉(zhuǎn)換才能確定數(shù)據(jù)的重要性。傳感器數(shù)據(jù)立即轉(zhuǎn)換為數(shù)字進(jìn)行初始處理(數(shù)字化優(yōu)先架構(gòu)),然后將它們轉(zhuǎn)換為芯片內(nèi)的模擬數(shù)據(jù)以實現(xiàn) MAC 功能,最后,它們在芯片內(nèi)被轉(zhuǎn)換回數(shù)字,以進(jìn)行推理、分類和其他功能所需的額外數(shù)字處理。因此,大量的數(shù)據(jù)轉(zhuǎn)換,但沒有太多的實際模擬處理。
雖然模擬內(nèi)存計算可能會降低單個推理芯片的功率,但它僅以非常有限的方式使用模擬,因此它只能為整個系統(tǒng)提供同樣有限的功率降低。
AnalogML 的系統(tǒng)級效率
相比之下,analogML 內(nèi)核完全在模擬域內(nèi)運行,不需要時鐘,并且在對任何數(shù)據(jù)進(jìn)行數(shù)字化之前使用原始模擬傳感器數(shù)據(jù)進(jìn)行推理和分類。集成到始終監(jiān)聽的設(shè)備中,analogML 內(nèi)核在花費任何精力進(jìn)行單個數(shù)據(jù)轉(zhuǎn)換之前確定數(shù)據(jù)的重要性。我們稱其為“先分析”,因為analogML 核心保持?jǐn)?shù)字系統(tǒng)關(guān)閉,除非檢測到相關(guān)數(shù)據(jù)。
與包含模擬內(nèi)存計算的 ML 芯片相比,analogML 內(nèi)核處理模擬傳感器數(shù)據(jù)的更簡化方法對系統(tǒng)級效率產(chǎn)生重大影響。(見圖 1。)
圖 1:使用具有模擬內(nèi)存計算的 ML 芯片的數(shù)字化優(yōu)先系統(tǒng)架構(gòu)(頂部模塊)與使用模擬ML 內(nèi)核的分析優(yōu)先系統(tǒng)架構(gòu)(底部模塊)的比較
例如,在典型的語音優(yōu)先系統(tǒng)中,analogML 內(nèi)核 100% 的時間都處于開啟狀態(tài),在始終偵聽模式下消耗低至 10μA 的電流以確定哪些數(shù)據(jù)是重要的(分析優(yōu)先架構(gòu)),然后再消耗任何功率關(guān)于數(shù)字化。這會使系統(tǒng)的其余部分保持休眠狀態(tài),直到檢測到相關(guān)數(shù)據(jù)。與在數(shù)字域中 100% 的時間(數(shù)字化優(yōu)先架構(gòu))運行并消耗高達(dá) 3000-4000μA 的更傳統(tǒng)的 ML 芯片相比,使用模擬ML 的分析優(yōu)先方法可將電池壽命延長多達(dá) 10 倍。這就是持續(xù)數(shù)天而不是數(shù)小時的智能耳塞與一次充電即可持續(xù)數(shù)年而不是數(shù)月的聲控電視遙控器之間的區(qū)別。
AnalogML Core 中有什么?
深入analogML 核心的底層揭示了模擬內(nèi)存計算(模擬計算僅用于神經(jīng)網(wǎng)絡(luò))與analogML 核心(由多個軟件控制的模擬處理塊組成,我們可以啟用、重新配置)之間的區(qū)別,并針對各種分析優(yōu)先應(yīng)用程序進(jìn)行調(diào)整。這些模塊——可以在需要時獨立供電——實現(xiàn)了一系列功能。(見圖 2)。
圖 2:analogML 內(nèi)核的框圖
傳感器接口——可以為特定傳感器類型(麥克風(fēng)、加速度計等)合成接口電路
模擬特征提取——從原始的模擬傳感器數(shù)據(jù)中挑選出顯著特征,大大減少進(jìn)入神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)量
模擬神經(jīng)網(wǎng)絡(luò)——高效、小尺寸、可編程模擬推理模塊
模擬數(shù)據(jù)壓縮——模擬傳感器數(shù)據(jù)的連續(xù)收集和壓縮支持低功耗數(shù)據(jù)緩沖
模擬范式轉(zhuǎn)變
AnalogML 遠(yuǎn)遠(yuǎn)超出了在整個 ML 芯片計算的一小部分中使用一點點模擬計算來節(jié)省功耗。這是一個完整的模擬前端解決方案,它使用接近零的功率來確定信號鏈中最早點的數(shù)據(jù)的重要性——而數(shù)據(jù)仍然是模擬的——以最大限度地減少通過系統(tǒng)運行的數(shù)據(jù)量和數(shù)字系統(tǒng) (ADC/MCU/DSP) 開啟的時間量。在某些應(yīng)用中,例如玻璃破碎檢測,事件可能每十年發(fā)生一次(或從不發(fā)生),使用模擬ML 內(nèi)核使數(shù)字系統(tǒng)在 99% 以上的時間內(nèi)保持關(guān)閉可以將電池壽命延長數(shù)年。這開辟了新類別的持久遠(yuǎn)程應(yīng)用程序,如果所有相關(guān)或不相關(guān)的數(shù)據(jù)在處理之前都被數(shù)字化,這些應(yīng)用程序?qū)o法實現(xiàn)。
底線是所有模擬計算都不相等。無論芯片中包含多少模擬處理來降低其功耗,除非該芯片在模擬域中運行,在模擬數(shù)據(jù)上,它并沒有做我們所知道的最能節(jié)省系統(tǒng)功耗的一件事——減少數(shù)字處理數(shù)據(jù)。
審核編輯:郭婷
-
芯片
+關(guān)注
關(guān)注
459文章
52494瀏覽量
440658 -
mcu
+關(guān)注
關(guān)注
146文章
17978瀏覽量
366663 -
adc
+關(guān)注
關(guān)注
99文章
6705瀏覽量
549176
發(fā)布評論請先 登錄
世界電信日 | 數(shù)智綻放平等之花:讓技術(shù)溫暖擁抱她和他

電機(jī)泥泵軸系系統(tǒng)扭振設(shè)計計算
云 GPU 加速計算:突破傳統(tǒng)算力瓶頸的利刃
AFE0064芯片手冊中把所有的地引腳都表示為GND,是不是就意味著不分?jǐn)?shù)字地和模擬地呢?
ADS4129在250msps時,是所有的采樣都是延遲固定的10個時鐘周期嗎?是什么原因造成的這種延遲呢?
XC7A100T板卡設(shè)計原理圖:297-基于XC7A100T的PCIe千兆電口以太網(wǎng)收發(fā)卡

模擬計算板卡設(shè)計方案:429-基于XC7Z035+ADS5474的2路400Msps AD 光電脈沖采集處理卡

光刻工藝中分辨率增強(qiáng)技術(shù)詳解

是不是所有的運放都需要偏置回路?
并非所有抖動都是相同的:了解開關(guān)電源中的抖動

評論