99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DVD-GAN機器人用AI生成高度逼真視頻的一次重要的嘗試

BFv1_robovideo ? 來源:陳年麗 ? 2019-07-29 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,DeepMind的研究人員研發(fā)了一個名叫Dual Video Discriminator GAN(DVD-GAN)的人工智能模型,該模型通過能夠通過學(xué)習(xí)一系列的YouTube視頻數(shù)據(jù)集,生成高度逼真且連貫的256 x 256像素視頻,最長可達48幀。

目前,DVD-GAN的研究成果已于美國時間2019年7月15日發(fā)表在arxiv上,名為《在復(fù)雜數(shù)據(jù)集上的高效視頻生成(Efficient Video Generation on Complex Datasets)》。

AI造假視頻比造假圖片更難

最近,俄羅斯AI研究人員開發(fā)的FaceApp著實大火了一把,這款應(yīng)用通過人工智能技術(shù)能夠改變用戶自拍照的年齡、外貌、發(fā)色和性別,甚至可以生成虛構(gòu)的人物照片。這直接讓人們近距離地感受了人工智能技術(shù)給我們的生活帶來的樂趣。

但是否有人想過,有朝一日這些技術(shù)也能應(yīng)用在視頻領(lǐng)域呢?

如果說BigGAN是DeepMind在圖像領(lǐng)域開發(fā)的能夠生成高度逼真圖像的圖像生成器,那么DeepMind研究人員們開發(fā)的DVD-GAN,就是人工智能在視頻剪輯生成領(lǐng)域的最新突破。

研究人員在論文中表示,生成自然視頻對生成式建模來說是一個較大的挑戰(zhàn),同時還會受到數(shù)據(jù)復(fù)雜性和計算需求增加的困擾。

因此,之前業(yè)界的研究人員們在研究視頻生成領(lǐng)域時,幾乎都圍繞著相對簡單的數(shù)據(jù)集,或者采用有限的時間信息來降低任務(wù)的復(fù)雜程度。

而這次,DeepMind的研究人員們主要針對視頻合成和視頻預(yù)測的任務(wù),將生成圖像模型的強大功能和逼真效果擴展到視頻領(lǐng)域。

DVD-GAN:基于BigGAN模型結(jié)構(gòu)

研究人員們基于BigGAN的模型結(jié)構(gòu),構(gòu)建了DVD-GAN的系統(tǒng),并引入了一系列用于視頻生成的調(diào)整,使DVD-GAN能夠在Kinetics-600上進行訓(xùn)練。

Kinetics-600是一組由50萬段10秒高分辨率的YouTube視頻剪輯匯編而成的訓(xùn)練數(shù)據(jù)集,它最初是為識別人類動作而制作的,比目前其他常用的語料庫還大一個數(shù)量級。

同時,研究人員們表示,Kinetics-600具有多樣化特征,能消除他們對過擬合(Overfitting)的擔(dān)憂。過擬合主要是指機器學(xué)習(xí)時選擇的模型所包含的參數(shù)過多,以至出現(xiàn)這一模型對已知數(shù)據(jù)預(yù)測得很好,但對未知數(shù)據(jù)預(yù)測得很差的現(xiàn)象。

另一方面,DeepMind的研究人員們利用生成對抗以提供一個能生成動作的學(xué)習(xí)信號

此外,DVD-GAN還有一個單獨的Transformer模塊,它可以讓學(xué)習(xí)信息在整合AI模型中傳播。

訓(xùn)練12至96小時即可生成視頻

研究論文表明,在經(jīng)過Google第三代TPU訓(xùn)練了12至96個小時后,DVD-GAN可以成功地生成視頻,這些視頻內(nèi)容包含了物體的組成和運動,以及各種復(fù)雜的紋理。

不足的是,DVD-GAN生成的視頻內(nèi)容有時較為“詭異”,例如生成的物體和人形奇形怪狀,甚至人體忽長忽短地變化。

但研究人員指出,當(dāng)把DVD-GAN放在UCF-101(一個包含13320個人類動作視頻的較小數(shù)據(jù)集)上進行評估后,DVD-GAN生成的樣本初始值最高為32.97。

DeepMind的研究人員們希望能進一步強調(diào)在大型復(fù)雜視頻數(shù)據(jù)集上訓(xùn)練生成模型的好處,例如Kinetics-600。

“我們設(shè)想通過DVD-GAN在這個數(shù)據(jù)集上建立強大的基線,該基線將被用作未來建模生成領(lǐng)域的參考點?!毖芯咳藛T表示,“盡管在不受約束的環(huán)境下持續(xù)生成逼真的視頻還需要進行很多工作,但我們相信DVD-GAN是我們朝這個方向邁出的重要一步?!?/p>

網(wǎng)絡(luò)(GANs)來區(qū)分生成樣本和真實世界樣本,該網(wǎng)絡(luò)主要由生成器和判別器兩部分組成。

GANs曾被應(yīng)用在把文字轉(zhuǎn)換成一幕幕的場景故事,或生成人造星系圖像等任務(wù)中。而研究人員們這次使用的是名為BigGANs的生成對抗網(wǎng)絡(luò),該網(wǎng)絡(luò)以大批量和數(shù)百萬個參數(shù)而得名。

值得一提的是,DVD-GAN包含兩個判別器。一個是空間判別器(Spatial Discriminator:D_S),該判別器通過隨機采樣全分辨率幀并單獨處理,以評估單個幀的內(nèi)容和結(jié)構(gòu);另一個是時間判別器(Temporal Discriminator:D_T),它可以提供一個能生成動作的學(xué)習(xí)信號。

此外,DVD-GAN還有一個單獨的Transformer模塊,它可以讓學(xué)習(xí)信息在整合AI模型中傳播。

結(jié)語:用AI生成高度逼真視頻的一次嘗試

不管是BigGAN還是FaceApp,以往的研究人員們在人工智能生成圖像領(lǐng)域進行了許多具有突破性的研究,但在視頻領(lǐng)域,除了AI換臉曾火了一把之外,并沒有更多的突破性進展。

而DeepMind的研究人員們基于BigGAN架構(gòu)和Kinetics-600訓(xùn)練數(shù)據(jù)集開發(fā)的DVD-GAN,利用計算高效的判別器分解,擴展到時間更長、分辨率更高的視頻。就目前來說,雖然這一成果還有些許不足,但這無疑是研究人員們利用AI生成高度逼真視頻的一次重要嘗試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DVD
    DVD
    +關(guān)注

    關(guān)注

    3

    文章

    134

    瀏覽量

    62751
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249694

原文標(biāo)題:[機器人頻道|大事記]你擔(dān)心的就要成真,AI換臉不算啥,現(xiàn)在新AI可生成逼真視頻

文章出處:【微信號:robovideo,微信公眾號:機器人頻道】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深圳人形機器人行走視頻震驚英偉達科學(xué)家,下個劃時代產(chǎn)品是AI機器人

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,深圳特區(qū)報發(fā)布了則國產(chǎn)人形機器人行走的視頻,該視頻引起了包括英偉達高級AI研究科學(xué)家Jim Fan在內(nèi)
    的頭像 發(fā)表于 01-14 00:53 ?3254次閱讀
    深圳人形<b class='flag-5'>機器人</b>行走<b class='flag-5'>視頻</b>震驚英偉達科學(xué)家,下<b class='flag-5'>一</b>個劃時代產(chǎn)品是<b class='flag-5'>AI</b><b class='flag-5'>機器人</b>?

    NVIDIA 通過云端至機器人計算平臺驅(qū)動人形機器人技術(shù),賦能物理 AI

    機器人推理與技能基礎(chǔ)模型的首次更新;用于合成運動生成的 NVIDIA Isaac GR00T-Dreams Blueprint;以及用于加速人形機器人開發(fā)的 NVIDIA Blackwell 系統(tǒng)
    發(fā)表于 05-19 17:53 ?1034次閱讀
    NVIDIA 通過云端至<b class='flag-5'>機器人</b>計算平臺驅(qū)動人形<b class='flag-5'>機器人</b>技術(shù),賦能物理 <b class='flag-5'>AI</b>

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    的非常好的,特別是些流程圖,很清晰的闡釋了概念 很適合作為初學(xué)者入門的引路書 還能了解很多技術(shù)和框架,破除初學(xué)者的自負(fù)困境,讓初學(xué)者知道功能是由很多開發(fā)者維護的,前人已經(jīng)為各種產(chǎn)品搭建了完善的框架。避免陷入得一個人單打獨斗的錯覺
    發(fā)表于 04-30 01:05

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    識別聯(lián)調(diào)。 進迭時空致力于為智能機器人提供完整全棧優(yōu)化的RISC-V AI軟硬件解決方案,第代RISC-V AI CPU芯片K1已完成AI
    發(fā)表于 04-25 17:59

    AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成式代理

    繼續(xù)分享第2篇閱讀心得。 傳統(tǒng)客服系統(tǒng)在知識庫更新和多輪對話管理方面存在諸多技術(shù)瓶頸,本書第3章中提出的AI課程客服機器人架構(gòu)巧妙地解決了這些問題。該架構(gòu)采用Replit作為開發(fā)環(huán)境
    發(fā)表于 02-25 21:59

    探討 GaN FET 在人形機器人中的應(yīng)用優(yōu)勢

    德州儀器的 Eason Tian 和 Kyle Wolf 撰寫,主要探討了 GaN FET(氮化鎵場效應(yīng)晶體管)在人形機器人中的應(yīng)用優(yōu)勢,旨在說明其如何解決人形機器人伺服系統(tǒng)面臨的挑戰(zhàn)。 *附件
    的頭像 發(fā)表于 02-14 14:33 ?824次閱讀
    探討 <b class='flag-5'>GaN</b> FET 在人形<b class='flag-5'>機器人</b>中的應(yīng)用優(yōu)勢

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    ,一次生成深度信息。 自主機器人定位任務(wù)的本質(zhì)是對機器人自身狀態(tài)的估計問題,包括位置,朝向,速度等問題。 路徑規(guī)劃旨在找到從起點到目標(biāo)區(qū)域的路徑,確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法包括變分方法,圖搜
    發(fā)表于 01-04 19:22

    開源項目!能夠精確地行走、跳舞和執(zhí)行復(fù)雜動作的機器人—Tillu

    的語音識別系統(tǒng)響應(yīng)語音指令 為什么打造Tillu? 打造Tillu不僅是個項目,更是一次學(xué)習(xí)體驗。通過深入探索機器人技術(shù)、編程細節(jié)以及自定義動作和表情,釋放你的創(chuàng)造力。無論你是學(xué)生、愛好者還是創(chuàng)
    發(fā)表于 01-02 17:24

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    指令和當(dāng)前機器人靜態(tài)圖像,生成段預(yù)測的未來狀態(tài)視頻。從這些預(yù)測視頻中,可以提取機器人的位姿信息
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

    重大數(shù)據(jù)瓶頸的嚴(yán)重阻礙。與主要由用戶生成的輸入組成且相對容易收集和匯總的 Internet 數(shù)據(jù)不同,EAI 的數(shù)據(jù)涉及機器人與其動態(tài)環(huán)境之間的復(fù)雜交互。這根本差異意味著,雖然可以從跨數(shù)字平臺的用戶
    發(fā)表于 12-24 00:33

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

    要給AI這個聰明的“頭腦”裝上副“身體”。這個“身體”可以是部手機,可以是臺自動駕駛汽車。而人形機器人則是集各類核心尖端技術(shù)于
    發(fā)表于 12-19 22:26

    首例AI機器人致死案震驚全球

    AI機器人的安全性、友好性、是否符合積極正面的價值導(dǎo)向直被質(zhì)疑,現(xiàn)在在佛羅里達州出現(xiàn)了AI聊天機器
    的頭像 發(fā)表于 10-25 16:32 ?1559次閱讀

    開源項目!ESP32做個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了個他直想做的機器人——可愛無用機器人。 無用機器人原理是
    發(fā)表于 09-03 09:34

    開源項目!ESP32做個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了個他直想做的機器人——可愛無用機器人。 無用機器人原理是
    發(fā)表于 08-30 14:50