99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NeRF的研究目的是合成同一場景不同視角下的圖像

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-01-29 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeRF,即Neural Radiance Fields(神經輻射場)的縮寫。研究員來自UCB、Google和UCSD。

Title:NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Paper:https://arxiv.org/pdf/2003.08934.pdf

Code:https://github.com/bmild/nerf

寫這篇文章的動機是,一方面NeRF實在太重要了代表著計算機視覺、圖像學結合的未來重要方向;另一方面NeRF對于計算機視覺背景的同學有一定的理解門檻,這篇文章試圖以最小背景知識補充、最少理解成本為前提介紹NeRF。

整體介紹

NeRF的研究目的是合成同一場景不同視角下的圖像。方法很簡單,根據給定一個場景的若干張圖片,重構出這個場景的3D表示,然后推理的時候輸入不同視角就可以合成(渲染)這個視角下的圖像了。

「3D表示」有很多種形式,NeRF使用的是輻射場,然后用「體渲染」(Volume Rendering)技術,給定一個相機視角,把輻射場渲染成一張圖像。選用輻射場+體渲染的原因很簡單,全程可微分。這個過程很有意思,可以理解為把一個空間朝一個方向上拍扁,空間中的顏色加權求和得到平面上的顏色。

輻射場

7979651c-9f7f-11ed-bfe3-dac502259ad0.png

體渲染

所謂體渲染,直觀地說,我們知道相機的焦點,焦點和像素的連線可以連出來一條射線,我們可以對這條射線上所有的點的顏色做某種求和就可以得到這個像素的顏色值。

理論上,我們可以對這條射線經過空間上的每個點的密度(只和空間坐標相關)和顏色(同時依賴空間坐標和入射角)進行某種積分就可以得到每個像素的顏色。當每個像素的顏色都計算出來,那么這個視角下的圖像就被渲染出來了。如下圖所示:

7984c5e2-9f7f-11ed-bfe3-dac502259ad0.jpg

從相機焦點出發(fā),往一個像素連出一條射線,獲取射穿過空間中每個點的屬性,進行積分得到這個像素的顏色

為了順利完成上面過程,我們可能需要維護碩大無朋Tensor來表示輻射場,查表獲取RGB和密度。這里一個問題是空間有多大表就有多大,同時只能是離散表示的。NeRF要做的事情是用一個神經網絡來建模輻射場,這樣無論空間有多大,不影響我們表示輻射場的所需要的存儲量,而且這個輻射場表示是連續(xù)的:?Θ:(?,?,?,?,?)→(?,?,?,?

799646fa-9f7f-11ed-bfe3-dac502259ad0.png

79a2b46c-9f7f-11ed-bfe3-dac502259ad0.jpg

用神經網絡來代替查表的方式表示輻射場

整體過程

因為神經網絡是可微分的,選取的體渲染方法是可微分;體渲染得到的圖片和原圖計算MSE Loss。整個過程可端到端地用梯度回傳來優(yōu)化非常漂亮。整個訓練Pipeline如下圖所示:

79b9f91a-9f7f-11ed-bfe3-dac502259ad0.jpg

看到這,讀者就已經大致理解NeRF的原理了,后面章節(jié)是NeRF的具體細節(jié)。

用輻射場做體渲染

前面我們已經大致理解體渲染的過程是怎么做了??墒窃趺囱刂渚€對空間中的顏色進行積分呢?如果我們把射線看作是光線,可以直觀得到這個積分要滿足的兩個條件:

1、一個點的密度越高,射線通過它之后變得越弱,密度和透光度呈反比

2、一個點的密度越高,這點在這個射線下的顏色反應在像素上的權重越大

79c63be4-9f7f-11ed-bfe3-dac502259ad0.png

而實際渲染過程,我們只能把射線平均分成N個小區(qū)間,每個區(qū)間隨機采樣一個點,對采樣得到的點的顏色進行某種加權求和:

79d6a290-9f7f-11ed-bfe3-dac502259ad0.png

神經輻射場的兩項優(yōu)化點

Positional encoding

類似Transformer的做法,把坐標和視角用更高維度的表示作為網絡輸入,來解決渲染圖像比較糊的問題:

79e7de2a-9f7f-11ed-bfe3-dac502259ad0.png

Hierachical volume sampling

79f73cf8-9f7f-11ed-bfe3-dac502259ad0.png

Architecture

7a0404f6-9f7f-11ed-bfe3-dac502259ad0.png

私貨

無論從方法的開創(chuàng)性,還是發(fā)表后兩年多的影響力來看。在筆者心目中,ECCV 2020的Best Paper沒給NeRF,不得不說是一個遺憾。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2959

    瀏覽量

    110822
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103702
  • RGB
    RGB
    +關注

    關注

    4

    文章

    807

    瀏覽量

    59955

原文標題:都2023年了,我不允許你還不懂NeRF

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    火車車號圖像識別系統(tǒng)如何應對不同光照條件的識別問題?

    光譜成像技術的應用 先進的系統(tǒng)采用多光譜成像技術,能夠在不同光照條件捕捉車號信息。高動態(tài)范圍(HDR)攝像頭的應用,可同時獲取同一場景的多種曝光圖像,確保在強光直射或夜間低照度環(huán)境
    的頭像 發(fā)表于 07-15 11:37 ?138次閱讀
    火車車號<b class='flag-5'>圖像</b>識別系統(tǒng)如何應對不同光照條件<b class='flag-5'>下</b>的識別問題?

    航天科普|一場救援中的通信革命-衛(wèi)星通信(下篇)

    當福來哥在云南雨崩的原始森林迷路,手機信號完全消失時,他背包里的衛(wèi)星手機成為救命稻草—條包含坐標的求救短信穿透密林樹冠,直達3.6萬公里高空的天通衛(wèi)星,小時后救援隊精準抵達。這一場景背后,是一場
    的頭像 發(fā)表于 07-01 17:03 ?608次閱讀
    航天科普|<b class='flag-5'>一場</b>救援中的通信革命-衛(wèi)星通信(下篇)

    HarmonyOS NEXT意圖框架習慣推薦一場景說明

    、概述 意圖框架是HarmonyOS系統(tǒng)級的意圖標準體系。將應用和元服務的業(yè)務功能智慧分發(fā)給不同的系統(tǒng)入口,以“音樂播放”為例,HarmonyOS將業(yè)務分發(fā)給“小藝建議”,提供了桌面大流量曝光
    發(fā)表于 06-18 15:06

    LLSM流媒體傳輸模塊 高動態(tài)圖像帶寬穩(wěn)定技術突破

    高清實時視頻的能力。旦控制系統(tǒng)設定帶寬上限為500K,那么在多種場景,尤其是高動態(tài)圖像環(huán)境,帶寬的波動始終會控制在這個范圍內。我們在
    的頭像 發(fā)表于 05-27 17:58 ?519次閱讀
    LLSM流媒體傳輸模塊  高動態(tài)<b class='flag-5'>圖像</b>帶寬穩(wěn)定技術突破

    你以為的安全,真的安全嗎?——擬態(tài)安全,一場關于認知的博弈

    黑客的日常工作就像一場精心策劃的“入室盜竊”。首先“踩點”——掃描目標系統(tǒng)的端口、分析網絡流量、研究系統(tǒng)架構找出漏洞,但如果黑客發(fā)現系統(tǒng)會“變臉”,今天Windows,明天變成Linux,剛研究
    的頭像 發(fā)表于 04-14 10:45 ?173次閱讀
    你以為的安全,真的安全嗎?——擬態(tài)安全,<b class='flag-5'>一場</b>關于認知的博弈

    一場圓桌論壇揭曉AI落地智慧園區(qū)的發(fā)展趨勢

    日前,達實智能成立30周年慶典暨“AIoT平臺+國產AI大模型”新品發(fā)布會隆重舉辦,現場進行一場以“AI技術落地與園區(qū)智能化系統(tǒng)發(fā)展趨勢”為主題的圓桌論壇,備受關注。
    的頭像 發(fā)表于 03-31 10:11 ?345次閱讀

    普渡機器人核心技術全面升級

    隨著智能技術向更多元場景滲透,多類型機器人(如清潔、配送等)在同一場景的協同作業(yè)需求日益增長。然而,復雜環(huán)境中的地圖復用、電梯調度、路徑沖突及人機交互等問題,成為制約效率與用戶體驗的關鍵挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 16:17 ?489次閱讀

    VirtualLab Fusion應用:曲分析儀

    的分析器來研究這種影響。 曲,也稱為“的曲率”,是種常見的光學效應,它會使平面物體在畫面的某些部分看起來很銳利,而不是在整個幀上
    發(fā)表于 03-03 09:22

    敏捷合成器的技術原理和應用場景

    敏捷合成器,作為種高性能的信號發(fā)生器,其技術原理和應用場景值得深入探討。技術原理敏捷合成器的技術原理主要基于先進的頻率合成技術和數字信號處
    發(fā)表于 02-20 15:25

    DS878?數字合成器適合哪些應用場景

    DS878 數字合成器適合哪些應用場景?DS878 高速啁啾直接數字合成器是款由EUVIS推出的高性能直接數字合成器,DS878高速啁啾直
    發(fā)表于 02-10 09:20

    VirtualLab Fusion應用:曲分析儀

    的分析器來研究這種影響。 曲,也稱為“的曲率”,是種常見的光學效應,它會使平面物體在畫面的某些部分看起來很銳利,而不是在整個幀上
    發(fā)表于 01-02 16:36

    SSTF中脈沖前傾的仿真

    用透鏡聚焦以獲得在空間和時間域中尺寸最小的焦點。雖然在某些應用中這種影響是不必要的,但在某些光學領域,如非線性頻率轉換或太赫茲生成,它可能是有好處的。 2 場景 2.1場景:系統(tǒng)配置 2.2
    發(fā)表于 12-31 09:04

    全面總結動態(tài)NeRF

    1. 摘要 神經輻射NeRF)是種新穎的隱式方法,可以實現高分辨率的三維重建和表示。在首次提出NeRF研究之后,
    的頭像 發(fā)表于 11-14 16:48 ?1076次閱讀
    全面總結動態(tài)<b class='flag-5'>NeRF</b>

    大華股份鴻鵠智能物聯主機 賦能萬千場景數視升級

    和技術創(chuàng)新,重磅推出大華鴻鵠智能物聯主機(以下簡稱大華鴻鵠主機),賦能萬千場景數視升級。 作為全球首款采用全國產化硬件鴻蒙系統(tǒng)物聯主機,大華鴻鵠主機采用寬溫設計,雙板雙控,具備4000+海量協議和22Tops超高算力,可滿足各行業(yè)物聯數據接入,
    的頭像 發(fā)表于 08-15 16:01 ?646次閱讀
    大華股份鴻鵠智能物聯主機 賦能萬千<b class='flag-5'>場景</b>數視升級

    電壓放大器在合成射流高效摻混機理研究中的應用

    實驗名稱:功率放大器在合成射流高效摻混機理研究中的應用實驗內容:合成射流是種新型主動流動控制技術,其主要工作原理是利用振動薄膜或活塞周期性地吹/吸流體,在孔口外形成渦環(huán),這些渦環(huán)在自
    的頭像 發(fā)表于 08-14 17:54 ?1211次閱讀
    電壓放大器在<b class='flag-5'>合成</b>射流高效摻混機理<b class='flag-5'>研究</b>中的應用