99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型計算機視覺框架:GQN可以腦補出環(huán)境的另外部分

0wvm_ARchan_TT ? 來源:未知 ? 作者:胡薇 ? 2018-06-21 14:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)在的計算機視覺系統(tǒng)大多基于深度神經網(wǎng)絡,它們可以通過學習大量數(shù)據(jù)集從而得到將圖像投影到普通的場景描述的功能,簡單說就是見得多了習慣了。

然而和這種神經網(wǎng)絡相比,我們的大腦顯然更加智能,可以利用先前的知識來推理,并做出遠遠超出看到的物品的推論。例如,如果看到桌子的三條腿,那么可以推斷出第四條腿的存在和其位置,基本與實際情況相同;即使看不到房間里的所有東西,你也可以畫出它的布局、想象它的外觀。嬰兒在八九個月時就可以理解“形狀恒常性”的存在,即使用布蓋住他面前的玩具,他也可以腦補出布下面玩具的樣子,而這,恰是深度神經網(wǎng)絡不能識別的。

最近,通過模仿人大腦對環(huán)境的處理方法,DeepMind提出了一種新型計算機視覺框架:GQN (the Generative Query Network),這個框架實現(xiàn)了前面提到的功能,可以腦補出環(huán)境的另外部分,還可以將2D圖片渲染至3D。

GQN模型由兩部分組成:表示網(wǎng)絡和世代網(wǎng)絡。表示網(wǎng)絡將察結果輸入并對基礎場景產生描述性質的的矢量表示,然后世代網(wǎng)絡從以前未觀察過的角度預測場景的表現(xiàn)。

表示網(wǎng)絡通過以分布式表示捕獲對象位置,顏色和房間布局等元素來實現(xiàn)準確描述場景的真實布局。該網(wǎng)絡能夠以高度壓縮和抽象的方式描述場景,并將其留給世代網(wǎng)絡,從而可以在必要時加入詳細信息。

世代網(wǎng)絡就像是一個近似的3D渲染器,它可以以非常精確的方式從新視角預測以前未觀測到的場景。當給出場景和新的攝像機視點時,無需事先規(guī)定透視法,遮擋法或照明法,它就可以生成清晰的圖像。

那么,GQN的可行性如何?

為了評估該框架的可行性,研究人員在模擬的3D環(huán)境中進行了一系列嘗試。在第一組實驗中,研究人員采用了包含各種對象的方形房間中的場景,墻面紋理、物體和燈的形狀、位置和顏色都是隨機的,以此有效地實現(xiàn)無限數(shù)量的總場景配置;隨后,研究人員使用有限數(shù)據(jù)集來訓練和測試模型。訓練結束后,GQN通過觀察一個先前未學習的測試場景的圖像來計算其場景表示,隨后的結果顯示,發(fā)生器在視點處的預測是高度準確的,大部分與地面事實并沒有區(qū)別。

在這個實驗中,GQN不可能通過隨機的方式準確預測結果,它只能通過在場景感知和編碼物體的數(shù)量、位置、顏色,還有墻壁的顏色以及光源的間接觀察位置的方式來學習。與傳統(tǒng)的神經網(wǎng)絡學習不同,GQN學習如何從圖像中進行推理,而不需要對場景內容進行任何明確的人為標注。實驗過程中,當場景的內容重度遮擋的情況時,預測模型就會出現(xiàn)不確定的情況,這種情況反映在最終結果的的變化性上。

隨后研究人員還采用了更復雜,程序化的迷宮環(huán)境來測試GQN的縮放屬性。迷宮由通過走廊連接的多個房間組成,不同場景中迷宮的布局和墻壁的顏色都是隨機的。在這個實驗中,任何一次觀察都會提供有關當前迷宮的少量信息。在進行多次識別觀測后, GQN已經可以在新的攝像機視點做出對迷宮環(huán)境正確的預測;在進一步的訓練中,模型甚至還可以高度準確地預測迷宮自上而下的視圖。

在這個實驗中,預測模型的不確定性隨著觀測數(shù)量的增大而降低,經過大約五次觀察后,GQN的不確定性幾乎完全消失。

現(xiàn)在的GQN還只能在實驗室實現(xiàn),主要是因為需要受控分析、真實數(shù)據(jù)集的可用性有限、不足以生成復雜的模型等原因,但它的確可以處理視覺的遮擋、場景的組合等問題。隨著新的數(shù)據(jù)集可用化和建模能力的增強,GQN也會逐漸實現(xiàn)應用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:計算機視覺也可以腦補了?

文章出處:【微信號:ARchan_TT,微信公眾號:AR醬】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產品或其部件。工業(yè)自動化的目的是提高生產率、增加靈活性,并提升制造過程的質量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?134次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?183次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    AR和VR中的計算機視覺

    ):計算機視覺引領混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1580次閱讀
    AR和VR中的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>

    工業(yè)中使用哪種計算機?

    在工業(yè)環(huán)境中,工控機被廣泛使用。這些計算機的設計可承受極端溫度、灰塵和振動等惡劣條件。它們比標準消費類計算機更耐用、更可靠。工業(yè)計算機可控制機器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結構和
    的頭像 發(fā)表于 11-29 14:07 ?715次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1500次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉換
    的頭像 發(fā)表于 10-31 17:00 ?1247次閱讀
    【小白入門必看】一文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    計算機接口位于什么之間

    地傳輸。計算機接口可以分為內部接口和外部接口兩大類。 內部接口位于計算機內部各個部件之間,如CPU、內存、主板、硬盤、顯卡等。外部接口則位于
    的頭像 發(fā)表于 10-14 14:02 ?1322次閱讀

    計算機存儲系統(tǒng)的工作原理和功能

    計算機存儲系統(tǒng)作為計算機系統(tǒng)中至關重要的組成部分,其原理和功能對于理解計算機的運行機制具有關鍵意義。以下將詳細闡述計算機存儲系統(tǒng)的原理和功能
    的頭像 發(fā)表于 09-26 16:42 ?2965次閱讀

    計算機存儲器的分類及其區(qū)別

    計算機存儲器是計算機系統(tǒng)中不可或缺的重要部分,用于存放程序和數(shù)據(jù)。隨著科技的進步,存儲器的種類越來越多,功能和性能也日益豐富。一般來說,計算機存儲器
    的頭像 發(fā)表于 09-05 10:40 ?4021次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?2053次閱讀

    圖像處理器與計算機視覺有什么關系和區(qū)別

    圖像處理器與計算機視覺是兩個在圖像處理領域緊密相連但又有所區(qū)別的概念。它們之間的關系和區(qū)別可以從多個維度進行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1048次閱讀

    計算機視覺中的圖像融合

    在許多計算機視覺應用中(例如機器人運動和醫(yī)學成像),需要將多個圖像的相關信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準確性和數(shù)據(jù)質量。多視圖融合可以提高圖像分辨率,并恢復場
    的頭像 發(fā)表于 08-01 08:28 ?1143次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國際計算機視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計算機視覺頂會ECCV 2024,自動駕駛算法技術再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1466次閱讀
    地平線科研論文入選國際<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    DRAM在計算機中的應用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機存取存儲器)在計算機系統(tǒng)中扮演著至關重要的角色。它是一種半導體存儲器,用于存儲和快速訪問數(shù)據(jù),是計算機主內存的主要組成部分。以下是對DRAM在
    的頭像 發(fā)表于 07-24 17:04 ?3018次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1819次閱讀