在云計算接手了大部分計算任務的當下,邊緣計算也在萌芽。與計算資源和服務都放在數(shù)據(jù)中心的云計算相比,如果在算力和延遲得以保證的情況下,邊緣端的計算反而能給用戶帶來更好的體驗。為此,一眾半導體公司開始探索邊緣計算芯片,為AI/ML等技術提供邊緣端的計算助力。
谷歌Edge TPU

Edge TPU / 谷歌
Edge TPU是谷歌專為邊緣推理打造的ASIC芯片,這也是谷歌除了Cloud TPU和Google Cloud兩大云端產(chǎn)品外,主打邊緣計算的產(chǎn)品。在隱私/機密以及低延遲、小帶寬等因素的限制下,不少應用并不適合上云,所以為邊緣端提供AI推理計算就成了解決需求的思路。而Edge TPU的大小甚至不及一個硬幣,無疑可以用于廣泛的AI邊緣部署。

Coral加速器模組 / 谷歌
谷歌更是搭建了一個本地AI平臺Coral,提供一系列硬件、軟件工具和預編譯的模型,幫助開發(fā)者構建具備本地AI能力的設備。以Coral加速器模組為例,這是一個MCM模組,可以用于高速推理機器學習模型。該模組內(nèi)置了Edge TPU ML加速器,并集成了電源管理,支持PCIe 2.0x1或USB 2.0的接口,INT8精度下的最高算力可達4 Tops,功耗達到2W。最重要的是其大小只有15x10x1.5mm。
此外,谷歌已經(jīng)開始在手機芯片Tensor中集成TPU,而Tensor中的TPU已經(jīng)達到了5W的功耗??紤]到谷歌除了手機以外,已經(jīng)開始進軍智能穿戴和智能家居等一系列物聯(lián)網(wǎng)市場,在谷歌自己的AI生態(tài)下,想必也會進一步擴展Edge TPU的性能表現(xiàn)。
九天睿芯 ADA200
考慮到馮諾依曼架構在功耗與速度上的劣勢,現(xiàn)在不少半導體公司都開始探索存算一體的全新架構。九天睿芯也是其中一個參與者,其ADA系列芯片甚至加入了感知這一維度,做到了模擬感知前處理+模數(shù)混合存內(nèi)計算的感存算一體架構,直接在內(nèi)存中進行混合信號計算。

ADA100 / 九天睿芯
根據(jù)九天睿芯官網(wǎng)的描述,ADA100系列是主打超低功耗低算力的傳感器處理芯片,等效算力達到1Gops,最低功耗只有20μW,與其他數(shù)字芯片相比可以說是降維打擊了,適用于可穿戴等AIoT設備。ADA100已于去年11月量產(chǎn),將于今年批量出貨。

ADA200 / 九天睿芯
而ADA200系列則是九天睿芯主打的中低算力芯片,其算力范圍在1到2 Tops之間,可以用于低功耗無線攝像頭、AR/VR和手機平板這類對算力要求更高一截的場景,該芯片預計今年年底量產(chǎn)。
AIStorm Mantis
在AI掀起的潮流下,不少廠商打上了傳感器的主意。這點在TWS耳機、智能眼鏡等小型智能化設備中尤為明顯,畢竟如果在CMOS圖像傳感器或MEMS音頻傳感器上提供足夠的邊緣算力,就可以省去集成各類AI加速器的煩惱。
比如在傳統(tǒng)的CMOS圖像傳感器方案中,像素陣列傳輸給源極跟隨器,在經(jīng)過ADC、ISP和MIPI SerDes,將其輸出給數(shù)字AI,再經(jīng)過MCU、GPU、DSP或FPGA的處理才能生成事件,如此數(shù)字化的過程使得延遲、功耗和成本都高出了一截。

Mantis AIS SoC / AIStorm
為了解決這個問題,初創(chuàng)企業(yè)AIStorm的解決方案就是將AI集成到傳感器中。以他們的Mantis AIS SoC為例,該方案可將傳感器變?yōu)橐粋€模擬電荷域AI的輸入層,Mantis直接接受傳感器數(shù)據(jù)而無需數(shù)字化,再用ANN網(wǎng)絡中的模擬神經(jīng)元完成乘加等運算,最終生成一個決定輸出。
Mantis用不到多先進的工藝,現(xiàn)有的產(chǎn)品只用到了高塔半導體的180nm節(jié)點和Dongbu的90nm節(jié)點,卻依然可以在始終開啟的情況下做到15 μW的功耗。雖然Mantis圖像傳感器只有96x96的像素分辨率,但這對于某些小型化應用來說已經(jīng)足夠,何況AIStorm面向的市場也僅僅只是簡單低成本的物聯(lián)網(wǎng)設備。此外,AIStorm也在開發(fā)支持QVGA和全高清分辨率的升級版本。
去年AIStorm也宣布與樓氏電子達成合作,一同開發(fā)低功耗高性能的音頻解決方案,直接為模擬域接收音頻數(shù)據(jù),讓TWS之類的小型音頻設備在極低功率水平下也能完成AI降噪、算法聲音增強等高級信號處理任務。
小結
從以上這些邊緣計算芯片可以看出,傳統(tǒng)的架構在邊緣端已經(jīng)不再是主流。無論是延遲敏感還是高算力要求的應用,都在推進邊緣計算芯片在架構上做出創(chuàng)新。在這些芯片賦能的多接入邊緣計算下,邊緣計算將為云端計算分擔一部分任務,更好地服務終端用戶。
谷歌Edge TPU

Edge TPU / 谷歌
Edge TPU是谷歌專為邊緣推理打造的ASIC芯片,這也是谷歌除了Cloud TPU和Google Cloud兩大云端產(chǎn)品外,主打邊緣計算的產(chǎn)品。在隱私/機密以及低延遲、小帶寬等因素的限制下,不少應用并不適合上云,所以為邊緣端提供AI推理計算就成了解決需求的思路。而Edge TPU的大小甚至不及一個硬幣,無疑可以用于廣泛的AI邊緣部署。

Coral加速器模組 / 谷歌
谷歌更是搭建了一個本地AI平臺Coral,提供一系列硬件、軟件工具和預編譯的模型,幫助開發(fā)者構建具備本地AI能力的設備。以Coral加速器模組為例,這是一個MCM模組,可以用于高速推理機器學習模型。該模組內(nèi)置了Edge TPU ML加速器,并集成了電源管理,支持PCIe 2.0x1或USB 2.0的接口,INT8精度下的最高算力可達4 Tops,功耗達到2W。最重要的是其大小只有15x10x1.5mm。
此外,谷歌已經(jīng)開始在手機芯片Tensor中集成TPU,而Tensor中的TPU已經(jīng)達到了5W的功耗??紤]到谷歌除了手機以外,已經(jīng)開始進軍智能穿戴和智能家居等一系列物聯(lián)網(wǎng)市場,在谷歌自己的AI生態(tài)下,想必也會進一步擴展Edge TPU的性能表現(xiàn)。
九天睿芯 ADA200
考慮到馮諾依曼架構在功耗與速度上的劣勢,現(xiàn)在不少半導體公司都開始探索存算一體的全新架構。九天睿芯也是其中一個參與者,其ADA系列芯片甚至加入了感知這一維度,做到了模擬感知前處理+模數(shù)混合存內(nèi)計算的感存算一體架構,直接在內(nèi)存中進行混合信號計算。

ADA100 / 九天睿芯
根據(jù)九天睿芯官網(wǎng)的描述,ADA100系列是主打超低功耗低算力的傳感器處理芯片,等效算力達到1Gops,最低功耗只有20μW,與其他數(shù)字芯片相比可以說是降維打擊了,適用于可穿戴等AIoT設備。ADA100已于去年11月量產(chǎn),將于今年批量出貨。

ADA200 / 九天睿芯
而ADA200系列則是九天睿芯主打的中低算力芯片,其算力范圍在1到2 Tops之間,可以用于低功耗無線攝像頭、AR/VR和手機平板這類對算力要求更高一截的場景,該芯片預計今年年底量產(chǎn)。
AIStorm Mantis
在AI掀起的潮流下,不少廠商打上了傳感器的主意。這點在TWS耳機、智能眼鏡等小型智能化設備中尤為明顯,畢竟如果在CMOS圖像傳感器或MEMS音頻傳感器上提供足夠的邊緣算力,就可以省去集成各類AI加速器的煩惱。
比如在傳統(tǒng)的CMOS圖像傳感器方案中,像素陣列傳輸給源極跟隨器,在經(jīng)過ADC、ISP和MIPI SerDes,將其輸出給數(shù)字AI,再經(jīng)過MCU、GPU、DSP或FPGA的處理才能生成事件,如此數(shù)字化的過程使得延遲、功耗和成本都高出了一截。

Mantis AIS SoC / AIStorm
為了解決這個問題,初創(chuàng)企業(yè)AIStorm的解決方案就是將AI集成到傳感器中。以他們的Mantis AIS SoC為例,該方案可將傳感器變?yōu)橐粋€模擬電荷域AI的輸入層,Mantis直接接受傳感器數(shù)據(jù)而無需數(shù)字化,再用ANN網(wǎng)絡中的模擬神經(jīng)元完成乘加等運算,最終生成一個決定輸出。
Mantis用不到多先進的工藝,現(xiàn)有的產(chǎn)品只用到了高塔半導體的180nm節(jié)點和Dongbu的90nm節(jié)點,卻依然可以在始終開啟的情況下做到15 μW的功耗。雖然Mantis圖像傳感器只有96x96的像素分辨率,但這對于某些小型化應用來說已經(jīng)足夠,何況AIStorm面向的市場也僅僅只是簡單低成本的物聯(lián)網(wǎng)設備。此外,AIStorm也在開發(fā)支持QVGA和全高清分辨率的升級版本。
去年AIStorm也宣布與樓氏電子達成合作,一同開發(fā)低功耗高性能的音頻解決方案,直接為模擬域接收音頻數(shù)據(jù),讓TWS之類的小型音頻設備在極低功率水平下也能完成AI降噪、算法聲音增強等高級信號處理任務。
小結
從以上這些邊緣計算芯片可以看出,傳統(tǒng)的架構在邊緣端已經(jīng)不再是主流。無論是延遲敏感還是高算力要求的應用,都在推進邊緣計算芯片在架構上做出創(chuàng)新。在這些芯片賦能的多接入邊緣計算下,邊緣計算將為云端計算分擔一部分任務,更好地服務終端用戶。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
mcu
+關注
關注
146文章
17969瀏覽量
366486 -
AI芯片
+關注
關注
17文章
1983瀏覽量
35894 -
邊緣計算
+關注
關注
22文章
3324瀏覽量
50888
發(fā)布評論請先 登錄
相關推薦
熱點推薦
能效比達2TOPS/W!解密邊緣AI芯片低功耗設計之法
電子發(fā)燒友網(wǎng)報道(文/李彎彎)邊緣AI芯片低功耗設計是其在移動設備、物聯(lián)網(wǎng)終端等資源受限場景中落地的關鍵。在物聯(lián)網(wǎng)、可穿戴設備、智能家居等對功耗敏感的應用場景中,低
邊緣計算服務器
、傳感器等)的位置,實現(xiàn)低延遲響應和高效資源利用。它并非傳統(tǒng)集中式云計算的替代品,而是作為云端的延伸補充,形成分布式協(xié)同架構。 二、結構特點 硬件配置? 采用小型化、低功耗設計,適應工業(yè)網(wǎng)關、智能攝像頭等邊緣場
6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界
框架,如TensorFlow、PyTorch等。這種架構設計使得芯片在處理AI任務時能夠實現(xiàn)高效的并行計算,極大地提升了運算效率。在邊緣計算場景中,無論是智慧城市的交通大屏,還是工業(yè)產(chǎn)
發(fā)表于 04-18 15:32
輕量化、低功耗,邊緣計算芯片在儲能中大有可為
。 ? 在此背景下,邊緣計算芯片應運而生。在一些本地化智能決策場景中,例如電網(wǎng)通信中斷的情況,或者在偏遠地區(qū)(如無基站覆蓋的儲能電站),邊緣計算
物聯(lián)網(wǎng)邊緣計算網(wǎng)關的特點
物聯(lián)網(wǎng)邊緣計算網(wǎng)關作為連接物聯(lián)網(wǎng)設備與云端的關鍵樞紐,其重要性日益凸顯。它承擔著數(shù)據(jù)采集、處理、傳輸以及本地決策等多重任務,在提升物聯(lián)網(wǎng)系統(tǒng)整體性能方面發(fā)揮著不可替代的作用。以下將詳細闡述物聯(lián)網(wǎng)
DAC60508計算功耗的時遇到的兩個問題求解答
是否可以理解為如果8個輸出口都接入2kΩ 負載,但輸出電壓全為零時,該芯片的功耗可以達到3.3mW ?
2. 芯片工作時的功耗是否可以由
發(fā)表于 11-19 08:32
邊緣計算與邊緣設備的關系
邊緣計算與邊緣設備之間存在著密切的關系,它們是相互依存、相互促進的。以下是對這兩者關系的介紹: 一、定義與功能 邊緣計算
邊緣計算對網(wǎng)絡延遲的影響
邊緣計算對網(wǎng)絡延遲的影響是顯著的,它主要通過以下幾種方式降低網(wǎng)絡延遲: 一、縮短數(shù)據(jù)傳輸距離 在傳統(tǒng)的云計算架構中,數(shù)據(jù)需要通過網(wǎng)絡傳輸?shù)竭h離用戶的云端服務器進行處理,這種長距離的傳輸往往會帶來顯著
邊緣計算架構設計最佳實踐
。 邊緣網(wǎng)關 :作為中間層,聚合多個邊緣設備的數(shù)據(jù),執(zhí)行初步處理與過濾,有時還承擔設備管理、協(xié)議轉換等功能。 邊緣計算平臺 軟件環(huán)境 :運行
邊緣計算與云計算的區(qū)別
邊緣計算與云計算是兩種不同的計算模式,它們在計算資源的分布、應用場景和特點上存在顯著差異。以下是對兩者的對比: 一、
云計算與邊緣計算的結合
云計算與邊緣計算的結合是當前信息技術發(fā)展的重要趨勢,這種結合能夠充分發(fā)揮兩者的優(yōu)勢,實現(xiàn)更高效、更可靠的數(shù)據(jù)處理和分析。以下是對云計算與邊緣
一款4644芯片低功耗設計思路解析
能控制模塊供電,而使能控制模塊功耗很小,因此,預穩(wěn)壓模塊采用五管OTA運放結構的LDO來驅動,偏置電路也相對簡單,實現(xiàn)低功耗的同時也不會占用太大面積,電路具體結構如下。
圖3預穩(wěn)
發(fā)表于 08-16 14:44
天拓四方:邊緣計算網(wǎng)關的選擇策略
隨著物聯(lián)網(wǎng)技術的飛速發(fā)展,邊緣計算作為連接云端與終端設備的橋梁,其重要性日益凸顯。邊緣計算網(wǎng)關作為這一架構中的關鍵組件,不僅負責數(shù)據(jù)采集、預處理,還
評論