99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

即插即用!百度提出S3IM:用于NeRF提點的Magic Loss

CVer ? 來源:CVer ? 2023-10-13 15:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹一下我組在ICCV2023的論文“S3IM: Stochastic Structural SIMilarity and Its Unreasonable Effectiveness for Neural Fields”。

S3IM這個工作背后的想法實際上很簡潔,從這個idea在腦海里形成到最后提交到ICCV2023不過2個月時間。

1540ffe0-699d-11ee-939d-92fbcf53809c.png

S3IM: Stochastic Structural SIMilarity and Its Unreasonable Effectiveness for Neural Fields

論文:arxiv.org/abs/2308.07032

代碼:github.com/Madaoer/S3IM-Neural-Fields

用一句話來總結(jié)這個工作就是——我們提出了一種即插即用的loss S3IM(隨機結(jié)構(gòu)相似性),可以近乎零成本地顯著提升現(xiàn)存NeRF類方法的性能指標。在幾個場景里,我們甚至可以把TensoRF和DVGO這些經(jīng)典模型的Test MSE Loss下降99%,同時把NeuS的幾何重建指標(比如Chamfer L1 Distance)改善超過60%。

這里我們先看幾組RGB和幾何重建的可視化結(jié)果。

1550279a-699d-11ee-939d-92fbcf53809c.png

15673c96-699d-11ee-939d-92fbcf53809c.png

不僅如此,還可以提高對圖像噪音的魯棒性。如下圖所示,S3IM的渲染結(jié)果明顯去掉了圖像里灰蒙蒙的噪音。

15778a4c-699d-11ee-939d-92fbcf53809c.png

毫無疑問,S3IM極大地增強了現(xiàn)有的NeRF類方法。

S3IM的精髓在于以兩個像素集合之間的相似性作為訓練損失;像素集合一般包含數(shù)千個像素,這些像素一起貢獻了互相關(guān)聯(lián)的、全局的結(jié)構(gòu)信息。

而NeRF傳統(tǒng)的MSE是一種以兩個獨立像素之間的point-wise error作為訓練損失;所以MSE只包含了像素點孤立的信息、完全沒有遠距離或者全局的信息。

上面這兩段話就是S3IM的motivation。

為什么有結(jié)構(gòu)信息更好?

這是一個很好的問題。

但我們先回答另一個相關(guān)的問題,為什么NeRF的性能指標要有3個——PSNR、SSIM和LPIPS?

PSNR就是像素之間point-wise的度量。很早大家就發(fā)現(xiàn),PSNR好不代表真的就好。

SSIM(結(jié)構(gòu)相似性)作為一種和人類視覺感知相關(guān)性更高的度量在2004年圖像評估領域應運而生。

LPIPS則是一種通過預訓練神經(jīng)網(wǎng)絡提取特征計算特征距離的指標(一般叫做感知指標)。

SSIM和LPIPS其實都具備衡量兩個像素集合之間相似性的能力,而且與人類視覺感知相關(guān)性都比PSNR高。

熟悉NeRF的讀者都知道,傳統(tǒng)NeRF訓練時是用MSE Loss。而PSNR和MSE其實就是一個簡單的對數(shù)關(guān)系。

MSE和PSNR這類point-wise指標都是不夠好的。一方面是和人類視覺感知相關(guān)性低,另一方面則是無法捕捉多個像素(像素集合)的整體信息。

那么SSIM和LPIPS可不可以直接作為NeRF的loss訓練呢?

其實也可以,但仍然不夠好。

因為SSIM和LPIPS都是基于卷積核的相似性度量,它們只能捕捉相近像素的局部信息,不能捕捉更遠的像素包含的結(jié)構(gòu)信息。

我們的ICCV工作就是把SSIM(Structural SIMilarity)這個經(jīng)典圖像質(zhì)量評估指標升級,變?yōu)镾3IM(Stochastic Structural SIMilarity)。

這個升級方式也很簡單。SSIM只能在圖像local patch用卷積核對吧。

那我們把NeRF訓練時每個minibatch的像素隨機拼接成一個patch(叫做stochastic patch),然后再用SSIM處理這些stochastic patch就行了。

有時候,真理就是這么樸實無華啊...

知名3D幾何重建開源框架SDFStudio也已經(jīng)把S3IM方法合并進去了。

最后再放一個量化的實驗結(jié)果。表里Multiplex即是我們的S3IM方法。

158c6322-699d-11ee-939d-92fbcf53809c.png

S3IM這個工作是我們Machine Learning for Fields系列工作的一環(huán)。我們在從機器學習的角度考慮場的問題。

無論是神經(jīng)輻射場還是其他什么場,廣義來說都是某個coordinate-wise的物理量。NeRF只是把輻射場的物理先驗知識(空間中包含發(fā)光氣體)嵌入了sampling的部分而已。這對3D場景表示不是完美的,但確實非常有用,也掀起了熱潮。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41284
  • Magic
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    10768
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1264

    瀏覽量

    21871

原文標題:ICCV 2023 | 即插即用!百度提出S3IM:用于NeRF提點的Magic Loss

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小米副總裁跳槽百度 出任百度資本CFO

    1月3日晚間消息,繼宣布攜程前CFO和CSO(首席戰(zhàn)略官)武文潔加盟出任管理合伙人后,百度資本今日向新浪科技確認,原小米副總裁張金玲加盟百度,出任百度資本CFO,兼任
    發(fā)表于 01-04 07:20 ?1174次閱讀

    即插即用和熱插拔的區(qū)別

    本帖最后由 eehome 于 2013-1-5 10:01 編輯 “即插即用”是指安裝了設備之后系統(tǒng)可以自動配置和管理設備,不需要人工處理即可使用?!盁岵灏巍笔侵缚梢栽陂_機狀態(tài)下將設備與主機
    發(fā)表于 10-23 10:26

    百度總裁:百度在人工智能領域已有重大突破

      隨著阿法狗大戰(zhàn)李世石,人工智能引發(fā)越來越多的關(guān)注。百度總裁張亞勤28日表示,百度長期堅持技術(shù)創(chuàng)新,2015年研發(fā)投入超過100億元,目前在人工智能領域已有重大突破?! 垇喦谠谔旖蛳募具_沃斯論壇
    發(fā)表于 07-01 15:22

    PCI與即插即用

    PCI與即插即用 即插即用 是從英文“Plug and Play”翻譯過來的,縮寫為 PnP 。即插即用功能只有在同時具備了符合以下4個條件時才可以:即插即
    發(fā)表于 12-09 13:51 ?2243次閱讀

    什么是即插即用

    什么是即插即用              支持即插即用是一種使您可以快速簡易安裝某硬件設備而無需安裝設備驅(qū)動程序或重新
    發(fā)表于 12-28 11:17 ?2411次閱讀

    數(shù)據(jù)庫-百度

    數(shù)據(jù)庫-百度科數(shù)據(jù)庫-百度科數(shù)據(jù)庫-百度
    發(fā)表于 05-04 11:09 ?0次下載

    百度“天智平臺”發(fā)布 開放百度大腦能力

    11月30日,2016百度云智峰會正式召開。百度云聯(lián)席總經(jīng)理劉煬發(fā)表了題為ABC時代的演講,并重點介紹了百度云人工智能平臺級解決方案天智,全面開放百度大腦能力,推動全行業(yè)的智能轉(zhuǎn)型,迎
    發(fā)表于 12-01 11:13 ?972次閱讀

    百度大數(shù)據(jù)怎么使用

    百度大數(shù)據(jù)+連接垂直行業(yè),深挖用戶價值精準拓展客戶,高效經(jīng)營管理百度大數(shù)據(jù)+,是百度開放的新商業(yè)“能源庫”,旨在面向行業(yè)關(guān)鍵訴求,開放百度大數(shù)據(jù)核心能力,幫助企業(yè)先人一步創(chuàng)造新商業(yè)機會
    的頭像 發(fā)表于 12-18 16:11 ?9931次閱讀

    新基建時代 百度如何加速百度智能云發(fā)展

    百度智能云事業(yè)群組(ACG)迎來了最新的組織架構(gòu)調(diào)整。3月11日,百度CTO王海峰發(fā)布了題為《新基建號角吹響 智能云一往無前》的內(nèi)部郵件,宣布對ACG進行組織架構(gòu)調(diào)整,通過扁平化管理,提升組織效能
    的頭像 發(fā)表于 11-11 16:42 ?2003次閱讀

    百度王海峰:自研云端AI通用芯片百度昆侖1已實現(xiàn)量產(chǎn)

    12月17日消息,在“ABC SUMMIT 2020百度云智峰會”上,百度CTO王海峰透露,百度自主研發(fā)了云端AI通用芯片—百度昆侖,其中百度
    的頭像 發(fā)表于 12-18 09:59 ?2943次閱讀

    百度股價大漲的底層邏輯

    從2018年5月陸奇出走百度,至今過去33個月,百度股價走出一個U型。在2020年3月,百度市值一徘徊至300億美元左右的低谷,而在2月9
    的頭像 發(fā)表于 02-24 11:42 ?2904次閱讀

    百度Create AI開發(fā)者大會:百度大腦位居中國市場第一

    百度Create AI開發(fā)者大會:在2021百度AI開發(fā)者大會上,百度推出了數(shù)字人平臺以及透露了百度AI技術(shù)和業(yè)務發(fā)展等,百度官方稱
    的頭像 發(fā)表于 12-28 11:33 ?2474次閱讀

    2022百度世界大會-百度智慧交管助力AI與交警共同成長

    2022百度世界大會-百度智慧交管助力AI與交警共同成長 ? ? ? 審核編輯:彭靜
    發(fā)表于 07-21 15:58 ?533次閱讀
    2022<b class='flag-5'>百度</b>世界大會-<b class='flag-5'>百度</b>智慧交管助力AI與交警共同成長

    2022百度世界大會—百度AI助力電力安全流淌

    2022百度世界大會—百度AI助力電力安全流淌 ? ? ? ? 審核編輯:彭靜
    發(fā)表于 07-21 16:06 ?732次閱讀
    2022<b class='flag-5'>百度</b>世界大會—<b class='flag-5'>百度</b>AI助力電力安全流淌

    2022百度世界大會—百度AI健身鏡成為居家運動新寵

    2022百度世界大會—百度AI健身鏡成為居家運動新寵 ? ? ? 審核編輯:彭靜
    的頭像 發(fā)表于 07-21 17:13 ?1901次閱讀
    2022<b class='flag-5'>百度</b>世界大會—<b class='flag-5'>百度</b>AI健身鏡成為居家運動新寵