當(dāng)硬件傳感器接收到環(huán)境信息后,數(shù)據(jù)會(huì)被導(dǎo)入到計(jì)算平臺(tái),進(jìn)而由不同芯片進(jìn)行運(yùn)算。無人駕駛硬件平臺(tái)是多種技術(shù)、多個(gè)模塊的集成,主要包括:傳感器平臺(tái)、計(jì)算平臺(tái)、以及控制平臺(tái)。本文將詳細(xì)介紹計(jì)算平臺(tái)現(xiàn)有的解決方案。
無人駕駛硬件平臺(tái)是多種技術(shù)、多個(gè)模塊的集成,主要包括:傳感器平臺(tái)、計(jì)算平臺(tái)、以及控制平臺(tái)。本文將詳細(xì)介紹計(jì)算平臺(tái)現(xiàn)有的解決方案。
經(jīng)常看我們公眾號(hào)的朋友應(yīng)該知道,當(dāng)硬件傳感器接收到環(huán)境信息后,數(shù)據(jù)會(huì)被導(dǎo)入到計(jì)算平臺(tái),進(jìn)而由不同芯片進(jìn)行運(yùn)算。計(jì)算平臺(tái)的設(shè)計(jì)直接影響無人駕駛系統(tǒng)的實(shí)時(shí)性和魯棒性。
目前主流的自動(dòng)駕駛芯片解決方案主要包括GPU、FPGA、DSP和ASIC四種。本文除了列舉這四種之外,還列舉其他的一些應(yīng)用于汽車自動(dòng)駕駛的芯片。
1.英偉達(dá)基于GPU的計(jì)算解決方案——DRIVE PX
NVIDIA DRIVE PX 2自動(dòng)駕駛開發(fā)平臺(tái)
NVIDIA的PX平臺(tái)是目前領(lǐng)先的基于GPU的無人駕駛解決方案。2016年1月,搭載“Pascal顯卡”的DrivePX2自動(dòng)駕駛平臺(tái)正式問世。
DRIVE PX 2的一些基本性能參數(shù):
1.基于16nm FinFET工藝,功耗高達(dá)250W ,采用水冷散熱設(shè)計(jì)。支持12路攝像頭輸入、激光定位、雷達(dá)和超聲波傳感器;
2. CPU部分:兩顆新一代NVIDIA Tegra處理器,當(dāng)中包括了8個(gè)A57核心和4個(gè)Denver核心;
3. 首發(fā)NVIDIA的新一代GPU架構(gòu)Pascal(即帕斯卡,宣稱性能是上一代的麥克斯韋構(gòu)架的10倍),單精度計(jì)算能力達(dá)到8TFlops,超越TITAN X,有后者10倍以上的深度學(xué)習(xí)計(jì)算能力。
每個(gè)PX2由兩個(gè)Tegra SoC和兩個(gè)Pascal GPU圖形處理器組成,其中每個(gè)圖像處理器都有自己的專用內(nèi)存并配備有專用的指令以完成深度神經(jīng)網(wǎng)絡(luò)加速。為了提供高吞吐量,每個(gè)Tegra SOC使用PCI-E Gen 2 x4總線與Pascal GPU直接相連,其總帶寬為4 GB/s。此外,兩個(gè)CPU-GPU集群通過千兆以太網(wǎng)項(xiàng)鏈,數(shù)據(jù)傳輸速度可達(dá)70 Gigabit/s。借助于優(yōu)化的I/O架構(gòu)與深度神經(jīng)網(wǎng)絡(luò)的硬件加速,每個(gè)PX2能夠每秒執(zhí)行24兆次深度學(xué)習(xí)計(jì)算。這意味著當(dāng)運(yùn)行AlexNet深度學(xué)習(xí)典型應(yīng)用時(shí),PX2的處理能力可達(dá)2800幀/秒。
NVIDIA的DRIVE PX 2平臺(tái)到底如何在自動(dòng)駕駛汽車上發(fā)揮作用呢?這里要重點(diǎn)講一下它在高精度地圖繪制上發(fā)揮的優(yōu)勢(shì)。DRIVE PX 2能夠?qū)⑼獠總鞲衅鳙@取的圖像數(shù)據(jù)加工處理后制成單個(gè)的高精度點(diǎn)云。系統(tǒng)將所有DRIVE PX 2平臺(tái)的點(diǎn)云數(shù)據(jù)上傳至云端服務(wù)器,經(jīng)過DGX-1處理后,可融合為一副完整的高精度地圖。所以,車內(nèi)的DRIVE PX 2,云端的DGX-1配合發(fā)揮作用,形成了NVIDIA完整的自動(dòng)駕駛技術(shù)平臺(tái)解決方案。
Pegasus
NVIDIA于其今年的生態(tài)圈大會(huì)GTC Eurpoe上發(fā)表自動(dòng)駕駛運(yùn)算平臺(tái)Drive PX家族的新成員,其代號(hào)為「Pegasus」。 「Pegasus」預(yù)計(jì)從2018年第二季起提供給NVIDIA的自動(dòng)駕駛研發(fā)伙伴。
據(jù)稱「Pegasus」的運(yùn)算能力達(dá)到320 TOPS(Trillion OperaTIons Per Second),超越其前代平臺(tái)「Drive PX 2」之運(yùn)算能力高達(dá)10倍。 此運(yùn)算能力主要來自于4顆處理器-2顆為以NVIDIA目前最新GPU架構(gòu)「Volta」為核心的SoC「Xavier」、以及另外2顆為車用機(jī)械視覺與深度學(xué)習(xí)所準(zhǔn)備的專用GPU。
2.德州儀器基于DSP的解決方案——TDA2x SoC
TI TDA2x SoC
德州儀器提供了一種基于DSP的無人駕駛的解決方案。其TDA2x SoC擁有兩個(gè)浮點(diǎn)DSP內(nèi)核C66x和四個(gè)專為視覺處理設(shè)計(jì)的完全可編程的視覺加速器。相比ARM Cortex-15處理器,視覺加速器可提供八倍的視覺處理加速且功耗更低。類似設(shè)計(jì)有CEVA XM4。這是另一款基于DSP的無人駕駛計(jì)算解決方案,專門面向計(jì)算視覺任務(wù)中的視頻流分析計(jì)算。使用CEVA XM4每秒處理30幀1080p的視頻僅消耗功率30MW,是一種相對(duì)節(jié)能的解決方案。
TDA2x SoC 基于異構(gòu)可擴(kuò)展架構(gòu),該架構(gòu)包括 TI 定浮點(diǎn) C66x DSP 內(nèi)核、全面可編程Vision AccelerationPac、ARM? Cortex?-A15 MPCoreTM 處理器與兩個(gè) Cortex-M4 內(nèi)核,以及視頻及圖形內(nèi)核與大量的外設(shè)。
該 TDA2x 可實(shí)現(xiàn)各種前置攝像機(jī)應(yīng)用的同步運(yùn)行,其中包括遠(yuǎn)光燈輔助、車道保持輔助、高級(jí)巡航控制、交通信號(hào)識(shí)別、行人/對(duì)象檢測(cè)以及防碰撞等。此外,TDA2x 還支持智能 2D 及 3D 環(huán)繞視圖以及后方碰撞警告等泊車輔助應(yīng)用,并可運(yùn)行為前置攝像機(jī)開發(fā)的行人/對(duì)象算法。TI TDA2x 還可作為融合雷達(dá)與攝像機(jī)傳感器數(shù)據(jù)的中央處理器,幫助做出更穩(wěn)健的 ADAS 決定。
3.Altera基于FPGA的解決方案——CycloneV SoC
Altera Cyclone V芯片
Altera公司的Cyclone V SoC是一個(gè)基于FPGA的無人駕駛解決方案,CycloneV SoC FPGA 系列基于28nm低功耗(LP)工藝,提供需要5G收發(fā)器應(yīng)用的最低功耗,和以前的產(chǎn)品檢驗(yàn)相比,功耗降低40%.器件集成了基于ARM處理器的硬件處理器系統(tǒng)(HPS),具有更有效的邏輯綜合功能,收發(fā)器系列和SoC FPGA系列,從而降低系統(tǒng)功耗。主要用在工業(yè)無線和有線通信、軍用設(shè)備和汽車市場(chǎng)。
Cyclone V SoC現(xiàn)已應(yīng)用在奧迪無人車產(chǎn)品中。Altera公司的FPGA專為傳感器融合提供優(yōu)化,可結(jié)合分析來自多個(gè)傳感器的數(shù)據(jù)以完成高度可靠的物體檢測(cè)。類似的產(chǎn)品有Zynq專為無人駕駛設(shè)計(jì)的Ultra ScaleMPSoC。當(dāng)運(yùn)行卷積神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù)時(shí),Ultra ScaleMPSoC運(yùn)算效能為14幀/秒/瓦,優(yōu)于NVIDIA Tesla K40 GPU可達(dá)的4幀/秒/瓦。同時(shí),在目標(biāo)跟蹤計(jì)算方面,Ultra ScaleMPSoC在1080p視頻流上的處理能力可達(dá)60fps。
奧迪全新A8車型上搭載的zFAS域控制器就使用了Altera提供的FPGA芯片-Cyclonev Soc
4.Mobileye基于ASIC的解決方案——Eyeq5SOC
ASIC(Application SpecificIntegrated Circuits)即專用集成電路,是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。Mobileye是一家基于ASIC的無人駕駛解決方案提供商。
Mobileye EyeQ5芯片將裝備8枚多線程CPU內(nèi)核,同時(shí)還會(huì)搭載18枚Mobileye的下一代視覺處理器。“傳感器融合”是EyeQ5推出的主要目的。
其Eyeq5 SOC裝備有四種異構(gòu)的全編程加速器,分別對(duì)專有的算法進(jìn)行了優(yōu)化,包括有:計(jì)算機(jī)視覺、信號(hào)處理和機(jī)器學(xué)習(xí)等。Eyeq5 SOC同時(shí)實(shí)現(xiàn)了兩個(gè)PCI-E端口以支持多處理器間通信。這種加速器架構(gòu)嘗試為每一個(gè)計(jì)算任務(wù)適配最合適的計(jì)算單元,硬件資源的多樣性使應(yīng)用程序能夠節(jié)省計(jì)算時(shí)間并提高計(jì)算效能。
mobileyeEyeQ5 芯片的電路系統(tǒng)塊圖(block diagram)
5.其他
1)谷歌的計(jì)算平臺(tái)——TPU芯片
谷歌TPU芯片
谷歌公布了AlphaGo戰(zhàn)勝李世石的“秘密武器”就是芯片TPU(張亮處理單元,Tensor Processing Unit),TPU專門為谷歌TensorFlow等機(jī)器學(xué)習(xí)應(yīng)用打造,能夠降低運(yùn)算精度,在相同時(shí)間內(nèi)處理更復(fù)雜、更強(qiáng)大的機(jī)器學(xué)習(xí)模型并將其更快投入使用。其性能把人工智能技術(shù)往前推進(jìn)了7年左右,相當(dāng)于摩爾定律的3代時(shí)間。
TPU使得機(jī)器學(xué)習(xí)類深度神經(jīng)網(wǎng)絡(luò)模型在每瓦特性能上由于傳統(tǒng)硬件。TPU在2016谷歌I/O大會(huì)上首次被提及,然而谷歌早在2013年就已經(jīng)開始秘密研發(fā)TPU,并于2014年就應(yīng)用在了谷歌的數(shù)據(jù)中心。
相比GPU的適合訓(xùn)練,TPU更適合做訓(xùn)練后的分析決策。這一點(diǎn)在谷歌的官方生命中得到印證:TPU只在特定的機(jī)器學(xué)習(xí)應(yīng)用中起到輔助作用,公司將繼續(xù)使用其他廠商制造的CPU和GPU。
在2018谷歌I/O大會(huì)上,谷歌宣布新的張量處理單元(TPU)將幫助谷歌改進(jìn)使用AI的應(yīng)用程序,新版本TPU與它的前身類似,也將通過谷歌的公共云服務(wù)向第三方開發(fā)者開放,并表示,每個(gè)芯片的性能都是去年的8倍,遠(yuǎn)遠(yuǎn)超過了100Petaflops(Petaflops:每秒一千兆/一千萬億(10^15)次的浮點(diǎn)運(yùn)算)?!倍壳?,容納16個(gè)英偉達(dá)最新GPU的盒子僅能提供2Petaflops的計(jì)算能力。
2)恩智浦NXP自動(dòng)駕駛汽車的計(jì)算平臺(tái)BlueBox
BlueBox是一款基于Linux系統(tǒng)打造的開放式計(jì)算平臺(tái),可供主機(jī)廠和一級(jí)供應(yīng)商開發(fā)、試驗(yàn)自己的無人駕駛汽車。它的主要功能是將之前彼此隔離的單個(gè)傳感器節(jié)點(diǎn)和處理器進(jìn)行功能上的結(jié)合。BlueBox能夠在40W功率下實(shí)現(xiàn)90000 DMIPS(每秒百萬條指令)的計(jì)算速度。但相比其他競(jìng)爭(zhēng)對(duì)手提供的ADAS/自動(dòng)駕駛解決方案,BlueBox減少了對(duì)風(fēng)扇、液冷及不穩(wěn)定熱能管理系統(tǒng)等電器元件的使用。
BlueBox裝備了一枚恩智浦NXP S32V汽車視覺處理器和一枚LS2088A內(nèi)嵌式計(jì)算機(jī)處理器。S32V屬于安全控制器范疇,能夠分析駕駛環(huán)境,評(píng)估風(fēng)險(xiǎn)因素,然后指示汽車的行為,而LS2088則是為其保駕護(hù)航的高性能計(jì)算平臺(tái)。
S32V芯片包含有不同的圖形處理引擎,特制的高性能圖形處理加速器,高性能ARM內(nèi)核,高級(jí)APEX圖形處理和傳感器融合。它的功能包括了傳感器/執(zhí)行器管理和故障檢驗(yàn)。其中故障檢驗(yàn)除能夠?qū)?nèi)存、硬件配置和程序流實(shí)時(shí)檢測(cè)外,它還具備錯(cuò)誤管理能力。
而負(fù)責(zé)進(jìn)行高性能運(yùn)算的LS2088A內(nèi)嵌式處理器是由8個(gè)64位ARM Cortex-A72內(nèi)核組成,配合頻率2GHz的特制加速器、高性能通信接口和DDR4內(nèi)存控制器,延時(shí)極低。
除了S32V和LS2088A這兩枚核心的處理器之外,BlueBox還搭載了其他為實(shí)現(xiàn)不同傳感器節(jié)點(diǎn)功能的芯片,它們能夠處理從V2X、雷達(dá)、視覺系統(tǒng)、激光雷達(dá)以及車輛狀態(tài)獲取的信息。
3)概率芯片
“S1”概率芯片示意圖
2016年4月,MIT TechnologyReview報(bào)道,DARPA投資了一款由美國(guó)Singular Computing公司開發(fā)的“S1”概率芯片。其優(yōu)點(diǎn)包括:算法邏輯異常簡(jiǎn)單,不需要復(fù)雜的數(shù)據(jù)結(jié)構(gòu),不需要數(shù)值代數(shù)計(jì)算;計(jì)算精度可以模擬不同數(shù)目的隨機(jī)行走自如控制;不同的隨機(jī)行走相互獨(dú)立,可以大規(guī)模并行模擬;模擬過程中,不需要全局信息,只需要網(wǎng)絡(luò)局部信息即可。模擬測(cè)試中,使用S1追蹤視頻里的移動(dòng)物體,每幀處理速度比傳統(tǒng)處理器快了近100倍,而能耗還不到傳統(tǒng)處理器的2%。專用概率芯片可以發(fā)揮概率算法簡(jiǎn)單并行的特點(diǎn),極大提高系統(tǒng)性能。
早在2018年MIT Technology Review“十大科技突破技術(shù)”預(yù)測(cè)中,概率芯片就榜上有名。通過犧牲微小的計(jì)算精度換取能耗的顯著降低,概率芯片在歷來追求精準(zhǔn)的芯片領(lǐng)域獨(dú)樹一幟,但正因?yàn)槿绱?,概率芯片很可能后來居上?/p>
4)中國(guó)芯片解決方案
寒武紀(jì)的芯片
寒武紀(jì)1M處理器
“寒武紀(jì)”是中國(guó)科學(xué)院計(jì)算技術(shù)研究所發(fā)布的全球首個(gè)能夠“深度學(xué)習(xí)”的“神經(jīng)網(wǎng)絡(luò)”處理器芯片。2012年中科院計(jì)算所和法國(guó)Inria等機(jī)構(gòu)共同提出了國(guó)際上首個(gè)人工神經(jīng)網(wǎng)絡(luò)硬件的基準(zhǔn)測(cè)試集benchNN。此后,中科院計(jì)算所和法國(guó)Inria的研究人員共同推出了一系列不同結(jié)構(gòu)的DianNao神經(jīng)網(wǎng)絡(luò)硬件加速器結(jié)構(gòu)。當(dāng)前寒武紀(jì)系列包含四種處理器機(jī)構(gòu):DianNao(面向多種功能人工神經(jīng)網(wǎng)絡(luò)的原型處理器結(jié)構(gòu))、DaDianao(面向大規(guī)模人工神經(jīng)網(wǎng)絡(luò))和PuDianNao(面向多種機(jī)器學(xué)習(xí)算法),面向卷積神經(jīng)網(wǎng)絡(luò)的ShiDianNao。寒武紀(jì)進(jìn)入產(chǎn)業(yè)化運(yùn)營(yíng),其主要方向是高性能服務(wù)器芯片、高性能終端芯片和服務(wù)機(jī)器人芯片。
寒武紀(jì)1M處理器IP主打的是智能駕駛領(lǐng)域,后將應(yīng)用領(lǐng)域拓寬到了智能手機(jī)、智能音箱、攝像頭、自動(dòng)駕駛等方面。寒武紀(jì)官方數(shù)據(jù),1M的int 8(8位運(yùn)算)效能比高達(dá)達(dá)5Tops/watt(每瓦5萬億次運(yùn)算),并且提供了2Tops、4Tops、8Tops三種尺寸的處理器內(nèi)核,以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學(xué)習(xí)模型與機(jī)器學(xué)習(xí)算法的加速,能夠完成視覺、語音、自然語言處理等任務(wù)。
中星微的芯片——星光智能一號(hào)
“星光智能一號(hào)”芯片和主板
2016年6月,中星微率先推出了中國(guó)首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片“星光智能一號(hào)”,這也是全球首枚具備深度學(xué)習(xí)人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級(jí)芯片,并已實(shí)現(xiàn)量產(chǎn)。該芯片采用“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算的架構(gòu),單顆NPU(28nm)能耗僅為400mW,極大地提升了計(jì)算能力與功耗的比例,可以廣泛應(yīng)用于智能駕駛輔助、無人機(jī)機(jī)器人等嵌入式機(jī)器視覺領(lǐng)域。
地平線的芯片——征程和旭日
2017年 12月,地平線發(fā)布了兩款款嵌入式人工智能芯片——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。這兩款芯片屬于ASIC人工智能專用芯片。
地平線征程1.0處理器
征程1.0:面向智能駕駛,能夠同時(shí)對(duì)行人、機(jī)動(dòng)車、非機(jī)動(dòng)車、車道線、交通標(biāo)志牌、紅綠燈等多類目標(biāo)進(jìn)行精準(zhǔn)的實(shí)時(shí)監(jiān)測(cè)與識(shí)別,同時(shí)滿足車載嚴(yán)苛的環(huán)境要求以及不同環(huán)境下的視覺感知需求。征程1.0屬于工業(yè)級(jí)的處理器,不是車規(guī)級(jí)的。因此地平線一開始會(huì)去做ADAS的后裝市場(chǎng),不過他們有計(jì)劃,把他們的處理器推向車規(guī)級(jí)。
地平線旭日1.0處理器
旭日1.0:面向智能攝像頭,能夠在本地進(jìn)行大規(guī)模人臉抓拍與識(shí)別、視頻結(jié)構(gòu)化處理等,可廣泛用于商業(yè)、安防等多個(gè)實(shí)際應(yīng)用場(chǎng)景。
目前新一代自動(dòng)駕駛處理器征程2.0正在研發(fā)中,而未來在軟硬件的進(jìn)一步協(xié)同優(yōu)化后,是面向L3/L4的自動(dòng)駕駛解決方案,可滿足自動(dòng)駕駛場(chǎng)景下高性能和低功耗的需求。
-
芯片
+關(guān)注
關(guān)注
460文章
52522瀏覽量
441250 -
無人駕駛
+關(guān)注
關(guān)注
99文章
4177瀏覽量
123621 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
790文章
14324瀏覽量
170732
原文標(biāo)題:盤點(diǎn)自動(dòng)駕駛硬件計(jì)算平臺(tái)解決方案
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論