99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能系統(tǒng)VON,生成最逼真3D圖像

DPVg_AI_era ? 來(lái)源:lq ? 2018-12-07 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能合成的3D物體模型不夠逼真?谷歌團(tuán)隊(duì)最近開發(fā)了一個(gè)AI系統(tǒng)——視覺(jué)對(duì)象網(wǎng)絡(luò)(VON),不僅生成的圖像比當(dāng)前最先進(jìn)的方法還要逼真,而且還可以做一系列3D操作。

合成現(xiàn)實(shí)3D物體模型的人工智能,看上去并沒(méi)有那么遙不可及。

在2018年蒙特利爾NeurIPS大會(huì)上,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)和谷歌的研究人員發(fā)表了一篇論文,描述了一個(gè)能夠生成具有逼真紋理的人工智能系統(tǒng)。

論文名稱:

Visual Object Networks: Image Generation with Disentangled 3D Representation

論文地址:

https://papers.nips.cc/paper/7297-visual-object-networks-image-generation-with-disentangled-3d-representations.pdf

人工智能系統(tǒng)VON,生成最逼真3D圖像

該人工智能系統(tǒng)——視覺(jué)對(duì)象網(wǎng)絡(luò)(Visual Object Networks,VON),不僅生成的圖像比當(dāng)前最先進(jìn)的方法還要逼真,還可以進(jìn)行形狀和紋理編輯、視角轉(zhuǎn)換以及其它3D調(diào)整。

研究人員寫到:“現(xiàn)代深層生成模型學(xué)會(huì)了合成較為逼真的圖像。大多數(shù)計(jì)算模型只專注于生成2D圖像,忽略了世界是3D的本質(zhì)。這種2D視角不可避免地限制了它們?cè)谠S多領(lǐng)域的實(shí)際應(yīng)用,比如合成數(shù)據(jù)生成、機(jī)器人學(xué)習(xí)、視覺(jué)現(xiàn)實(shí)和游戲行業(yè)。”

VON通過(guò)聯(lián)合合成三維形狀和二維圖像來(lái)解決這個(gè)問(wèn)題,研究人員將其稱為“disentangled object representation”。圖像生成模型被分解為形狀、視點(diǎn)和紋理三個(gè)要素,在計(jì)算“2.5D”草圖和添加紋理之前,首先學(xué)習(xí)三維形狀的合成。

重要的是,因?yàn)檫@三個(gè)要素是條件獨(dú)立的,模型不需要在二維和三維形狀之間配對(duì)數(shù)據(jù)。這使得該團(tuán)隊(duì)能夠?qū)ΧS圖像和三維形狀的大規(guī)模集合進(jìn)行訓(xùn)練,比如Pix3D、谷歌圖像搜索和ShapeNet,后者包含了55個(gè)對(duì)象類別的數(shù)千個(gè)CAD模型。

為了讓VON學(xué)習(xí)如何生成自己的形狀,該團(tuán)隊(duì)訓(xùn)練了一個(gè)生成對(duì)抗網(wǎng)絡(luò)(GAN),試圖在上述三維形狀數(shù)據(jù)集上區(qū)分生成樣本和真實(shí)樣本。紋理生成被“降級(jí)”到另一個(gè)基于GAN的神經(jīng)網(wǎng)絡(luò)。

經(jīng)過(guò)大約兩到三天的訓(xùn)練,人工智能系統(tǒng)產(chǎn)生了逼真的128×128×128模型,具有真實(shí)的反射率、環(huán)境照度和反照率。

為了評(píng)估圖像生成模型,團(tuán)隊(duì)計(jì)算了用于生成三維模型的Fréchet初始距離 。此外,他們還向亞馬遜的Mechanical Turk上展示了200對(duì)由VON和最先進(jìn)的模型生成的圖像,被試者的任務(wù)是在每對(duì)圖像中選擇更加真實(shí)的結(jié)果。

VON的性能表現(xiàn)非常突出。與其它AI模型相比,它的Fréchet初始距離最低。Mechanical Turk被試者更喜歡VON生成的圖像,比例高達(dá)74%至85%。

研究人員將專注于更加精細(xì)化的建模,以更高的分辨率生成形狀和圖像,將紋理分解為光照和外觀,并合成自然場(chǎng)景。

研究團(tuán)隊(duì)寫道:“我們的關(guān)鍵思想是將圖像生成過(guò)程分解為三個(gè)要素:形狀、視角和紋理,這種分離的3D表示方式使我們能夠在對(duì)抗學(xué)習(xí)框架下從3D和2D視覺(jué)數(shù)據(jù)收集中學(xué)習(xí)模型。與現(xiàn)有的2D生成模型相比,我們的模型合成的圖像更加逼真;它還允許3D操作,這用以前的2D方法是無(wú)法實(shí)現(xiàn)的?!?/p>

突飛猛進(jìn)的GAN

近年來(lái),對(duì)GAN的研究突飛猛進(jìn),尤其是在機(jī)器視覺(jué)領(lǐng)域:

Google旗下的DeepMind去年10月推出了一個(gè)基于GAN的系統(tǒng),可以創(chuàng)建非常逼真的食物、風(fēng)景、動(dòng)物等照片;

今年9月,英偉達(dá)的研究人員開發(fā)了一種AI模型,可以對(duì)腦癌進(jìn)行合成掃描;

今年8月,卡內(nèi)基梅隆大學(xué)(Carnegie Mellon)的一個(gè)研究小組展示了如何利用人工智能將一個(gè)人錄制下來(lái)的動(dòng)作和面部表情在轉(zhuǎn)移到另一張照片或視頻中的目標(biāo)對(duì)象;

最近,愛(ài)丁堡大學(xué)感知研究所和天文學(xué)研究所的科學(xué)家設(shè)計(jì)了一種可以產(chǎn)生高分辨率的星系圖像。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249365
  • 3D圖像
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    10945

原文標(biāo)題:谷歌NeurIPS 2018論文:GAN生成3D模型,圖像自帶逼真效果

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過(guò)多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺(jué)效果。即使取得了如此飛躍,仍然存在一個(gè)
    的頭像 發(fā)表于 06-05 09:24 ?380次閱讀

    生成人工智能認(rèn)證:重構(gòu)AI時(shí)代的人才培養(yǎng)與職業(yè)躍遷路徑

    ,恰似一座連接技術(shù)前沿與個(gè)體成長(zhǎng)的橋梁,既承載著時(shí)代對(duì)人才的迫切需求,也指向著未來(lái)職場(chǎng)的核心競(jìng)爭(zhēng)力。 一、技術(shù)革命的雙重性:賦能與失衡并存 生成人工智能的突破性,在于其首次讓機(jī)器具備了“無(wú)中生有”的創(chuàng)造力。從文本生成
    的頭像 發(fā)表于 05-23 09:29 ?269次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級(jí)

    。在 NVIDIA Omniverse 平臺(tái)、OpenUSD 以及 Isaac Lab 解決方案的助力下,影眸科技實(shí)現(xiàn)了 Rodin 平臺(tái)的升級(jí),顯著提升了 3D 資產(chǎn)生成的速度、質(zhì)量與用戶體驗(yàn),推動(dòng)具身智能進(jìn)一步發(fā)展。
    的頭像 發(fā)表于 04-27 15:09 ?520次閱讀

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成
    的頭像 發(fā)表于 03-17 13:44 ?468次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    我國(guó)生成人工智能的發(fā)展現(xiàn)狀與趨勢(shì)

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成人工智能對(duì)于提升國(guó)家戰(zhàn)略地位與國(guó)際競(jìng)爭(zhēng)力具有重要意義。2022年11月以來(lái),隨著以ChatGPT為代表的大語(yǔ)言模型迅速發(fā)展,生成
    的頭像 發(fā)表于 02-08 11:31 ?1479次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI創(chuàng)作引擎的核心功能極為強(qiáng)大,用戶只需通
    的頭像 發(fā)表于 01-22 10:26 ?584次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,以實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識(shí)。特別是書中提到的基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的能源管理系統(tǒng),通過(guò)實(shí)時(shí)監(jiān)測(cè)和分析能源數(shù)據(jù),實(shí)現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過(guò)多個(gè)案例展示了人工智能在能源科學(xué)中
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,還促進(jìn)了新理論、新技術(shù)的誕生。 3. 挑戰(zhàn)與機(jī)遇并存 盡管人工智能為科學(xué)創(chuàng)新帶來(lái)了巨大潛力,但第一章也誠(chéng)實(shí)地討論了伴隨而來(lái)的挑戰(zhàn)。數(shù)據(jù)隱私、算法偏見(jiàn)、倫理道德等問(wèn)題不容忽視。如何在利用AI提升科研效率
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    人工智能推薦系統(tǒng)中強(qiáng)大的圖形處理器(GPU)一爭(zhēng)高下。其獨(dú)特的設(shè)計(jì)使得該處理器在功耗受限的條件下仍能實(shí)現(xiàn)高性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開發(fā)的分層學(xué)習(xí)處理器結(jié)合了
    發(fā)表于 09-28 11:00

    生成人工智能在教育中的應(yīng)用

    生成人工智能在教育中的應(yīng)用日益廣泛,為教育領(lǐng)域帶來(lái)了諸多變革和創(chuàng)新。以下是對(duì)生成人工智能在教育中的幾個(gè)主要應(yīng)用方面的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 16:07 ?2833次閱讀

    生成人工智能的概念_生成人工智能主要應(yīng)用場(chǎng)景

    生成人工智能(Generative Artificial Intelligence,簡(jiǎn)稱GAI)是一種先進(jìn)的人工智能技術(shù),其核心在于利用計(jì)算機(jī)算法和大量數(shù)據(jù)來(lái)生成新的、具有實(shí)際價(jià)值的
    的頭像 發(fā)表于 09-16 16:05 ?4757次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對(duì)AI for Science的技術(shù)支撐進(jìn)行解讀。 第3章介紹了在
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    App。 騰訊元寶APP發(fā)布時(shí),就圍繞工作效率場(chǎng)景、日常生活等場(chǎng)景提供了豐富的應(yīng)用,并有創(chuàng)建個(gè)人智能體等個(gè)性化體驗(yàn),“3D角色夢(mèng)工廠”則將大模型生成技術(shù)和3D應(yīng)用結(jié)合,進(jìn)一步創(chuàng)新了元寶
    的頭像 發(fā)表于 07-18 11:39 ?1225次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應(yīng)用