99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛攝像頭中的“目”是個(gè)啥?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-06-06 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的感知架構(gòu)中,攝像頭始終扮演著“眼睛”的角色,它以直觀的方式捕捉車外環(huán)境,將光學(xué)信號(hào)轉(zhuǎn)化為圖像數(shù)據(jù),供后端算法進(jìn)行物體檢測(cè)、分割、跟蹤與深度估計(jì)。隨著自動(dòng)駕駛技術(shù)從輔助駕駛(Level?1/2)向中高階自動(dòng)駕駛(Level?3?及以上)演進(jìn),對(duì)環(huán)境感知的精度、可靠性和冗余度也提出了更苛刻的要求。與此同時(shí),行業(yè)內(nèi)主流的視覺(jué)方案也在不斷豐富,從早期的單目攝像頭,到雙目立體視覺(jué),再到近年來(lái)開(kāi)始探索的三目甚至多目的多視角布局,自動(dòng)駕駛純視覺(jué)解決方案也更加豐富。

wKgZO2hCPd6ACZ3OAAAQo00DEvw439.jpg

單目攝像頭

單目攝像頭因其硬件結(jié)構(gòu)最為簡(jiǎn)單、成本最低廉、布置最為靈活而成為自動(dòng)駕駛感知系統(tǒng)的基礎(chǔ)配置。一臺(tái)普通攝像頭即可安裝于擋風(fēng)玻璃后方或車前格柵處,便可獲得寬視角的彩色圖像序列。單目深度估計(jì)主要依賴于圖像中的透視幾何線索(如遠(yuǎn)近關(guān)系產(chǎn)生的尺寸變化)、運(yùn)動(dòng)線索(雙幀或多幀光流)、以及深度學(xué)習(xí)模型對(duì)場(chǎng)景先驗(yàn)的學(xué)習(xí)。

基于單目圖像的深度估計(jì)方法可以分為監(jiān)督式與自監(jiān)督式。監(jiān)督式借助激光雷達(dá)(LiDAR)或結(jié)構(gòu)光相機(jī)標(biāo)定出的真深度進(jìn)行網(wǎng)絡(luò)訓(xùn)練,精度較高但對(duì)大規(guī)模標(biāo)注數(shù)據(jù)依賴嚴(yán)重;自監(jiān)督式則通過(guò)視差一致性、光度一致性約束和多視角幾何投影建立損失函數(shù),擺脫了稠密標(biāo)注的束縛,但在紋理匱乏和動(dòng)態(tài)遮擋場(chǎng)景下精度波動(dòng)明顯。單目攝像頭在弱光、強(qiáng)逆光條件下表現(xiàn)較好,且與毫米波雷達(dá)結(jié)合時(shí)能夠形成較為完善的檢測(cè)與跟蹤管線;但由于其固有的“視差盲區(qū)”,在深度估計(jì)誤差(數(shù)米級(jí))與目標(biāo)尺寸估計(jì)偏差(百分之十以內(nèi))的情況下,難以獨(dú)立支撐高階自動(dòng)駕駛對(duì)亞米級(jí)、甚至亞米級(jí)以下的深度精度需求。

wKgZO2hCPd-ADp11AAAR42n7O-I410.jpg

雙目攝像頭

雙目視覺(jué)系統(tǒng)通過(guò)兩臺(tái)同步標(biāo)定、具有固定基線的攝像機(jī)獲取左右兩路圖像,以視差(disparity)為橋梁直接計(jì)算場(chǎng)景深度,雙目視覺(jué)系統(tǒng)也更加近似于人眼。同一物點(diǎn)在左右圖像中的橫向偏移量與基線長(zhǎng)度和焦距共同決定了其絕對(duì)距離。經(jīng)典雙目深度重建分為四大步驟:立體校正(stereo rectification)、視差匹配(disparity estimation)、視差濾波與優(yōu)化(filtering & refinement)、以及點(diǎn)云重建(point cloud generation)。當(dāng)前主流的視差匹配算法既包括基于局部窗口的代價(jià)聚合方法(如SAD、SSD與Census Transform),也包括全局能量最小化方法(如Graph Cuts、Semi-Global Matching),以及最近幾年興起的端到端深度學(xué)習(xí)方法(如GC-Net、PSMNet)。

雙目視覺(jué)能夠在中短距離(0.5?米至50?米)內(nèi)提供亞米級(jí)的深度精度,并在靜態(tài)與高紋理場(chǎng)景中表現(xiàn)卓越;但當(dāng)面對(duì)低紋理、重復(fù)紋理、強(qiáng)光照不均或半透明遮擋時(shí),視差匹配的正確率會(huì)顯著下降,導(dǎo)致深度估計(jì)失真。此外,雙目系統(tǒng)對(duì)攝像頭外參(相對(duì)位置與姿態(tài))的標(biāo)定精度和時(shí)間同步提出了高要求,一旦標(biāo)定誤差超過(guò)千分之一(基線與焦距之比),就可能帶來(lái)數(shù)毫米至數(shù)厘米的深度偏離。雙目系統(tǒng)在算力消耗與數(shù)據(jù)帶寬方面也高于單目,兩路高分辨率圖像的拼接與匹配、對(duì)稱的圖像預(yù)處理與后處理,都需要更強(qiáng)的視覺(jué)處理單元(VPU)或GPU支持。

wKgZO2hCPeCATBg6AAASG3BOmsQ949.jpg

三目攝像頭

三目布局一般采用共面而非共線的設(shè)計(jì),三臺(tái)攝像頭按一定幾何形狀(如等邊三角形基線)分布,以獲得更豐富的視差信息。相較于雙目,三目系統(tǒng)能夠形成兩組或三組不同基線長(zhǎng)度、不同匹配對(duì)的深度估計(jì),從而在多種距離區(qū)間內(nèi)兼顧近、中、遠(yuǎn)距離的測(cè)量精度。例如,基線較短的一對(duì)攝像頭適合1至10?米范圍的高精度測(cè)距,而基線較長(zhǎng)的一對(duì)則能夠延伸到100?米的目標(biāo)探測(cè)。

在算法層面,三目視差匹配可同時(shí)在多對(duì)圖像間建立代價(jià)體(cost volume),并通過(guò)多視角一致性約束(multiview consistency)剔除錯(cuò)誤匹配,顯著提升了在低紋理與弱光場(chǎng)景下的魯棒性。三目系統(tǒng)還能夠利用不同視角下的遮擋信息(occlusion reasoning)進(jìn)行遮擋補(bǔ)償,彌補(bǔ)雙目在部分遮擋物體(如行人背后夾雜車輛或路牌)時(shí)深度估計(jì)的盲區(qū)。三目系統(tǒng)的一個(gè)挑戰(zhàn)是算法復(fù)雜度,如何高效構(gòu)建三維代價(jià)體、如何在保證實(shí)時(shí)性的前提下完成多對(duì)視差匹配、如何動(dòng)態(tài)選擇最優(yōu)基線對(duì)進(jìn)行深度融合,都是亟需解決的問(wèn)題。在硬件方面,為了減輕時(shí)間同步與數(shù)據(jù)帶寬壓力,通常會(huì)采用板載FPGA或?qū)S肐SP(Image Signal Processor)進(jìn)行初步預(yù)處理與視差計(jì)算,然后再將稀疏或半密集的深度信息傳輸給主算力單元。

wKgZO2hCPeGAFf9HAAASAJELks8763.jpg

技術(shù)方案

在更高階的自動(dòng)駕駛車輛上,為了實(shí)現(xiàn)360°無(wú)死角監(jiān)控與高精度三維重建,廠商往往會(huì)將前向雙目或三目視覺(jué)與側(cè)向、后向、俯瞰等多路攝像頭結(jié)合,構(gòu)成四目、六目甚至八目的多視角網(wǎng)絡(luò)。此時(shí),系統(tǒng)需要解決的關(guān)鍵問(wèn)題不僅僅是單對(duì)深度估計(jì),更包括跨視角的時(shí)空對(duì)齊(temporal-spatial synchronization)、全局標(biāo)定(global extrinsic calibration)、多視角深度融合(multiview depth fusion)與全景拼接(panorama stitching)。在全景感知中,車輛往往需要同時(shí)執(zhí)行多任務(wù),前方車輛與行人的距離測(cè)量、側(cè)向障礙物的實(shí)時(shí)告警、倒車時(shí)的俯視圖生成,以及自動(dòng)泊車中的全景軌跡規(guī)劃。多目布局能夠提供更豐富的冗余信息,即便某一路攝像頭因泥污、強(qiáng)逆光或物理?yè)p壞暫時(shí)失效,系統(tǒng)仍能依靠其它視角的深度信息維持基礎(chǔ)感知能力,從而滿足高安全等級(jí)(ASIL D)對(duì)感知冗余的要求。

單目方案憑借極低的硬件成本與成熟的深度學(xué)習(xí)生態(tài),成為市面上大量量產(chǎn)車型實(shí)現(xiàn)L2?級(jí)別自動(dòng)輔助駕駛的主流選擇;雙目方案在特定場(chǎng)景(如干式公路、高速公路集群貨運(yùn))中能夠提供亞米級(jí)精度,成為部分L3?級(jí)自動(dòng)駕駛示范區(qū)的首選;而三目及多目方案則主要出現(xiàn)在少數(shù)高端概念車與少量具備大量數(shù)據(jù)標(biāo)注與計(jì)算資源支持的示范車隊(duì)中。對(duì)于工程實(shí)現(xiàn)而言,還需考慮視覺(jué)傳感器與整車CAN總線、以太網(wǎng)交換機(jī)的帶寬匹配;車載算力單元(如NVIDIA DRIVE、Mobileye EyeQ)對(duì)并行視覺(jué)算法的部署能力;視覺(jué)算法與其他傳感器(LiDAR、毫米波雷達(dá)、超聲波雷達(dá))的融合策略以及在極端天氣(雨、雪、霧、夜間)下的抗干擾與抗閃爍能力。

當(dāng)前,為提升單目與雙目在復(fù)雜場(chǎng)景下的魯棒性,主流做法是將視覺(jué)深度估計(jì)與雷達(dá)或LiDAR點(diǎn)云進(jìn)行時(shí)空融合,通過(guò)深度校正網(wǎng)絡(luò)(depth correction network)對(duì)單目估計(jì)值進(jìn)行回歸補(bǔ)償,或利用Kalman濾波與圖優(yōu)化(graph optimization)框架將多源深度信息整合到同一幀時(shí)空參照系內(nèi)。對(duì)于三目與多目系統(tǒng),則往往采用多視角神經(jīng)網(wǎng)絡(luò)(multiview neural network),直接在稠密的多目代價(jià)體上進(jìn)行端到端訓(xùn)練,以統(tǒng)一的方式生成更高精度、更少噪聲的稠密深度圖。此外,利用自監(jiān)督式多視角重投影損失(photometric consistency)與幾何一致性約束(geometric consistency),進(jìn)一步優(yōu)化深度估計(jì)的精度和邊緣完整性。

wKgZO2hCPeKAOCxJAAARwcz1hbg350.jpg

結(jié)語(yǔ)

其實(shí)單目、雙目與三目乃至多目攝像頭方案各有千秋,單目以簡(jiǎn)馭繁、成本友好;雙目以立體、精度可控;三目以多基線、魯棒性更強(qiáng)。隨著算法的精進(jìn)與硬件的升級(jí),三目與多目系統(tǒng)在復(fù)雜場(chǎng)景下的優(yōu)勢(shì)將日益凸顯,但其算力與集成成本也需要工程團(tuán)隊(duì)在量產(chǎn)化中不斷權(quán)衡優(yōu)化。自動(dòng)駕駛視覺(jué)方案的選擇,從來(lái)不只是“目”數(shù)越多越好,而是要在安全冗余、深度精度、實(shí)時(shí)算力與成本之間找到最佳平衡,最終服務(wù)于可持續(xù)、大規(guī)模部署的智能出行愿景。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4978

    瀏覽量

    98344
  • 雷達(dá)
    +關(guān)注

    關(guān)注

    50

    文章

    3119

    瀏覽量

    120072
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    789

    文章

    14316

    瀏覽量

    170597
  • LIDAR
    +關(guān)注

    關(guān)注

    10

    文章

    349

    瀏覽量

    30356
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛汽車如何確保感知數(shù)據(jù)的一致性?

    自動(dòng)駕駛感知傳感器概述 [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛系統(tǒng)通常采用多種感知傳感器協(xié)同感知車輛周圍環(huán)境。攝像頭可獲取高分辨率的環(huán)境圖像,能夠識(shí)別車道線、交通標(biāo)志、信號(hào)燈以及物體的顏色和紋理信息
    的頭像 發(fā)表于 06-20 09:14 ?176次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>汽車如何確保感知數(shù)據(jù)的一致性?

    自動(dòng)駕駛中常提的“點(diǎn)云”是個(gè)?

    ?對(duì)自動(dòng)駕駛有何影響? 點(diǎn)云是個(gè)? 點(diǎn)云(Point Cloud)是一種在三維空間中由大量離散點(diǎn)組成的數(shù)據(jù)集合,每個(gè)點(diǎn)包含自身的笛卡爾坐標(biāo)(X、Y、Z),并可附帶顏色、強(qiáng)度、時(shí)間戳
    的頭像 發(fā)表于 05-21 09:04 ?303次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的“點(diǎn)云”是<b class='flag-5'>個(gè)</b><b class='flag-5'>啥</b>?

    索尼FCB-EV9520L攝像頭:賦能自動(dòng)駕駛新體驗(yàn)

    自動(dòng)駕駛技術(shù)飛速發(fā)展的當(dāng)下,索尼FCB-EV9520L攝像頭憑借其卓越性能,正成為眾多自動(dòng)駕駛解決方案中不可或缺的關(guān)鍵組件,為自動(dòng)駕駛車輛的安全、高效運(yùn)行提供有力支持。 索尼FCB-
    的頭像 發(fā)表于 05-09 11:51 ?185次閱讀

    一文聊聊自動(dòng)駕駛攝像頭

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛車輛的攝像頭是感知模塊的重要組成,其成本低、分辨率高且能捕捉豐富的語(yǔ)義信息,使其在車道識(shí)別、障礙物檢測(cè)、交通標(biāo)志和信號(hào)燈識(shí)別等任務(wù)中不可或缺。不同類型的攝像頭
    的頭像 發(fā)表于 05-05 09:59 ?274次閱讀
    一文聊聊<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>攝像頭</b>

    自動(dòng)駕駛中常提的“NOA”是個(gè)

    “Navigate on Autopilot”,即自動(dòng)導(dǎo)航駕駛,是一種依托高精度定位、多種傳感器數(shù)據(jù)融合以及先進(jìn)人工智能算法和實(shí)時(shí)決策規(guī)劃,實(shí)現(xiàn)車輛在高速公路和復(fù)雜城市道路上自主導(dǎo)航與駕駛的技術(shù)。該技術(shù)通過(guò)
    的頭像 發(fā)表于 04-09 09:03 ?772次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的“NOA”是<b class='flag-5'>個(gè)</b><b class='flag-5'>啥</b>?

    自動(dòng)駕駛大模型中常提的Token是個(gè)?對(duì)自動(dòng)駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實(shí)時(shí)處理與決策。在這一過(guò)程中,大模型以其強(qiáng)大的特征提取、信息融合和預(yù)測(cè)能力為自動(dòng)駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一個(gè)“Token”的概念,有些人看到后或許會(huì)問(wèn): Token是個(gè)
    的頭像 發(fā)表于 03-28 09:16 ?368次閱讀

    自動(dòng)駕駛中常提的魯棒性是個(gè)

    隨著自動(dòng)駕駛技術(shù)的快速發(fā)展,魯棒性(Robustness)成為評(píng)價(jià)自動(dòng)駕駛系統(tǒng)的重要指標(biāo)之一。很多小伙伴也會(huì)在自動(dòng)駕駛相關(guān)的介紹中,對(duì)某些功能用魯棒性進(jìn)行描述。一個(gè)魯棒的系統(tǒng)能夠在復(fù)雜
    的頭像 發(fā)表于 01-02 16:32 ?7293次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的魯棒性是<b class='flag-5'>個(gè)</b><b class='flag-5'>啥</b>?

    自動(dòng)駕駛中常提的SLAM到底是個(gè)?

    ?這兩個(gè)問(wèn)題。目前,自動(dòng)駕駛技術(shù)主要依賴高精地圖和RTK(實(shí)時(shí)動(dòng)態(tài)定位)系統(tǒng)完成高精度定位。然而,這種方法的實(shí)現(xiàn)成本高昂,需要依賴于完善的基礎(chǔ)設(shè)施,且在動(dòng)態(tài)環(huán)境中適應(yīng)性不足。為此自動(dòng)駕駛工程師提出了另一種更具靈活性和
    的頭像 發(fā)表于 11-21 15:17 ?1630次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的SLAM到底是<b class='flag-5'>個(gè)</b><b class='flag-5'>啥</b>?

    CMOS在安防攝像頭中的應(yīng)用

    ,成為了安防攝像頭中的核心組件。 CMOS傳感器的工作原理 CMOS傳感器是一種將光信號(hào)轉(zhuǎn)換為電信號(hào)的半導(dǎo)體器件。在安防攝像頭中,CMOS傳感器通常由數(shù)百萬(wàn)個(gè)像素組成,每個(gè)像素都包含一個(gè)
    的頭像 發(fā)表于 11-14 10:04 ?1173次閱讀

    自動(dòng)駕駛中一直說(shuō)的BEV+Transformer到底是個(gè)?

    在很多車企的自動(dòng)駕駛介紹中,都會(huì)聽(tīng)到一個(gè)關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是個(gè)?為什么很多車企在
    的頭像 發(fā)表于 11-07 11:19 ?1372次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中一直說(shuō)的BEV+Transformer到底是<b class='flag-5'>個(gè)</b><b class='flag-5'>啥</b>?

    智能駕駛自動(dòng)駕駛的關(guān)系

    駕駛的技術(shù)。 智能駕駛包含“單車”智能駕駛和“協(xié)作式”智能駕駛。前者通過(guò)攝像頭、雷達(dá)等傳感器以及高效準(zhǔn)確的算法,賦予車輛
    的頭像 發(fā)表于 10-23 16:02 ?1519次閱讀

    自動(dòng)駕駛HiL測(cè)試方案——攝像頭仿真之視頻注入#ADAS #自動(dòng)駕駛 #VTHiL

    自動(dòng)駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年10月17日 15:18:41

    邏輯和轉(zhuǎn)換器件在IP攝像頭中的應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《邏輯和轉(zhuǎn)換器件在IP攝像頭中的應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 08-30 11:13 ?0次下載
    邏輯和轉(zhuǎn)換器件在IP<b class='flag-5'>攝像頭中</b>的應(yīng)用

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列)在自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FPGA在自動(dòng)駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動(dòng)駕駛領(lǐng)域的主要應(yīng)用: 一、感知算法加速 圖像處理:自動(dòng)駕駛中需要通過(guò)攝像頭獲取并識(shí)別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA在處理圖像上的運(yùn)算速度快,可并行性強(qiáng),且功耗
    發(fā)表于 07-29 17:09