99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從AI作畫(huà)到AI做視頻,這一跳改變了什么?

腦極體 ? 來(lái)源:腦極體 ? 作者:腦極體 ? 2022-10-18 20:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

九月初的時(shí)候,AI繪畫(huà)作品《太空歌劇院》在美國(guó)獲得了人類(lèi)藝術(shù)競(jìng)賽一等獎(jiǎng)的新聞讓許多人震驚不已。學(xué)多人沒(méi)有想到,畫(huà)沙雕圖的AI竟然這么快就技能進(jìn)步到超越了人類(lèi)。AI作畫(huà)的時(shí)間從年初以小時(shí)為單位到現(xiàn)在短到秒級(jí)別,并且繪出的圖像質(zhì)量越來(lái)越高,幾乎接近人類(lèi)專(zhuān)業(yè)畫(huà)家的水平。我們?cè)谏缃幻襟w中也看到越來(lái)越多的人分享他們?cè)诟鞣NAI作畫(huà)平臺(tái)上的作品。

AI作畫(huà)的風(fēng)頭正盛,用AI做視頻的應(yīng)用也悄然而至。九月底Meta小扎公布了自家Make-A-Video的AI視頻制作工具。這款工具可以生成高質(zhì)量的短視頻。Meta AI做視頻的新聞還沒(méi)有焐熱,谷歌也不甘示弱,推出了兩款A(yù)I生成視頻的工具:Imagen Video 和 Phenaki。前者傾向于打造視頻質(zhì)量,后者傾向于視頻的邏輯與時(shí)長(zhǎng)。這幾款A(yù)I視頻制作工具各有特色。

文本生成圖像的AI技術(shù)大火才不過(guò)幾個(gè)月,就直接躍升至文本生成動(dòng)態(tài)視頻。從畫(huà)圖到做視頻,AI的發(fā)展速度令人訝異,同時(shí)令人對(duì)未來(lái)的數(shù)字媒體憧憬。那么,這種跨越到底會(huì)給未來(lái)帶來(lái)什么呢?

AI做視頻是AI作圖的延伸

在討論AI生成視頻會(huì)給未來(lái)帶來(lái)哪些改變前,我們先梳理下,AI生成視頻的技術(shù)原理和應(yīng)用場(chǎng)景。

先從Meta家的Make-A-Video看起。在小扎公布的視頻中,我們可以看到一場(chǎng)AI制作的視頻秀,其中一幕是泰迪熊正在畫(huà)自畫(huà)像。僅僅通過(guò)文本描述,Make-A-Video就可以生成一段視頻。官網(wǎng)的案例中,我們會(huì)發(fā)現(xiàn)還有一些會(huì)飛的超人狗狗、喝水的馬等,這些視頻都是由AI生成的。

谷歌的Phenaki工具也類(lèi)似Make-A-Video,可以通過(guò)一系列的文本提示生成有故事性的連貫視頻。如官網(wǎng)展示的騎馬太空人、游泳的小熊等。

從AI作畫(huà)到AI制作視頻,靜態(tài)的圖像創(chuàng)作又轉(zhuǎn)化為動(dòng)態(tài)的視頻演繹一些簡(jiǎn)單的情節(jié)片段,這些是如何依靠技術(shù)達(dá)成的呢?

AI繪畫(huà)的原理,簡(jiǎn)單來(lái)說(shuō)是通過(guò)神經(jīng)網(wǎng)絡(luò)模型將圖像與文本連接,基于大規(guī)模的圖文訓(xùn)練集對(duì)比學(xué)習(xí)訓(xùn)練,提取文本與圖像特征互相匹配,最終生成關(guān)聯(lián)程度較高的圖像。

與AI作畫(huà)相比,AI生成視頻需要多個(gè)AI模型的配合來(lái)完成視頻的制作。作畫(huà)與做視頻的第一步都需要預(yù)訓(xùn)練文本-圖像模型,先由文本生成大量的圖像。而后續(xù)的步驟就出現(xiàn)較大的差別。AI生成視頻,在完成基本的圖像生成之后,還需要將這些圖片連起來(lái),變成動(dòng)態(tài)清晰有邏輯的視頻。這就需要額外增加插值模型來(lái)處理圖片變成一幀幀流暢的視頻動(dòng)作,用超分辨率模型來(lái)提升圖像的像素。通過(guò)這些模型的處理,讓前后幀之間的過(guò)渡動(dòng)作更加平滑,畫(huà)質(zhì)的像素質(zhì)量更高,最終生成高分辨率和幀率的視頻。

相較于AI作畫(huà),從技術(shù)上來(lái)看,視頻可以認(rèn)為是多張“圖片”有邏輯、連貫的組成。視頻幀是一張張圖像,各幀之間有畫(huà)面、邏輯等層面的關(guān)聯(lián)。因此,由文生圖與由文生視頻完全是兩種難度級(jí)別。AI生成視頻,是AI生成圖像的深度延伸。

AI生成視頻相對(duì)更難實(shí)現(xiàn)。為什么AI研究人員會(huì)向視頻領(lǐng)域的創(chuàng)作進(jìn)發(fā)?AI做視頻到底有什么應(yīng)用價(jià)值呢?

AI做視頻價(jià)值幾何?

移動(dòng)互聯(lián)網(wǎng)的繁榮,催生出了各類(lèi)社交和流媒體平臺(tái)。這些平臺(tái)中豐富的圖文、視頻內(nèi)容,成為當(dāng)代人碎片時(shí)間的精神食糧。伴隨短視頻平臺(tái)和直播行業(yè)的興起,人們對(duì)內(nèi)容的需求越來(lái)越旺盛。這也筑造了規(guī)模龐大的泛內(nèi)容產(chǎn)業(yè)。

對(duì)于內(nèi)容的創(chuàng)作,核心的是創(chuàng)意與效率。但以人為核心模式的創(chuàng)作模式在高速迭代的內(nèi)容產(chǎn)業(yè)中似乎越來(lái)越趕不上趟。應(yīng)用AI技術(shù)來(lái)輔助內(nèi)容創(chuàng)作的AIGC模式,開(kāi)始滲入到泛內(nèi)容領(lǐng)域中。

從視頻的創(chuàng)作角度來(lái)說(shuō),在腳本外,尋找匹配適合的視頻素材是創(chuàng)作的核心。雖然行業(yè)內(nèi)有大量的素材庫(kù),但尋覓素材的過(guò)程耗費(fèi)時(shí)間,并且也不一定能找到符合腳本內(nèi)容的視頻素材。

面對(duì)提升效率與貼合腳本內(nèi)容的需求,AI生成視頻工具可以很好地解決這類(lèi)問(wèn)題。谷歌和Meta的AI視頻工具都可以基于文本描述生成視頻。

Make-A-Video目前可以實(shí)現(xiàn)文字轉(zhuǎn)視頻、圖片轉(zhuǎn)視頻、視頻生成視頻三種功能場(chǎng)景。谷歌Imagen Video不僅能生成高清視頻,而且能理解并生成不同藝術(shù)風(fēng)格的作品。而谷歌Phenaki目前可以做到文字轉(zhuǎn)視頻,并且根據(jù)文字描述可以生成較長(zhǎng)、情節(jié)連貫的作品。Phenaki瞄準(zhǔn)的是長(zhǎng)視頻的制作。

無(wú)論是短視頻領(lǐng)域,還是長(zhǎng)視頻領(lǐng)域,面向這些行業(yè),AI生成視頻都會(huì)為視頻內(nèi)容行業(yè)的發(fā)展賦予價(jià)值。

1.提升視頻制作效率的同時(shí)降低制作成本。傳統(tǒng)的視頻制作需要腳本、收集素材、剪輯等流程,每一項(xiàng)工作都需要耗費(fèi)大量的時(shí)間與成本。AI生成視頻可以通過(guò)文本生成視頻,或者由圖片、視頻等素材生成視頻,可以降低拍攝或搜集視頻素材的成本。AI可以對(duì)應(yīng)著腳本文本的描述,就能生成視頻,大幅提高視頻制作的效率。

2.增加豐富的創(chuàng)意。AI大模型可以遍歷學(xué)習(xí)所有的創(chuàng)意與風(fēng)格。從內(nèi)容的豐富度來(lái)說(shuō),人類(lèi)無(wú)法企及。通過(guò)不同風(fēng)格、創(chuàng)意素材的喂養(yǎng),AI視頻生成可以創(chuàng)作出多種風(fēng)格融合的作品,補(bǔ)充人類(lèi)制作視頻的創(chuàng)意。

3.增加內(nèi)容產(chǎn)業(yè)價(jià)值。AI視頻生成對(duì)視頻內(nèi)容領(lǐng)域的革新,為行業(yè)帶來(lái)新的應(yīng)用場(chǎng)景與新工種。AI作畫(huà)已經(jīng)誕生出了新的職業(yè)AI畫(huà)師。類(lèi)似AI作圖,AI做視頻也會(huì)誕生出新的職業(yè),AI剪輯師,應(yīng)用AI工具創(chuàng)作視頻。未來(lái)AI生成視頻將會(huì)與游戲、影視、媒體等多行業(yè)結(jié)合,與元宇宙、AR、VR等場(chǎng)景碰撞,創(chuàng)造出更多的場(chǎng)景與產(chǎn)業(yè)價(jià)值。

不過(guò)現(xiàn)下AI生成視頻的發(fā)展處于非常初級(jí)的階段,并不能完全生成出較完善的視頻。我們?cè)诠雀韬蚆eta中看到的視頻,仍然存在許多問(wèn)題。比如視頻動(dòng)作過(guò)渡不自然、理解角度詭異、視頻分辨率不高等。這些情況的出現(xiàn)原因在于AI工具模型的能力不高,對(duì)模型投喂的素材數(shù)據(jù)質(zhì)量有一定的要求。如果這些問(wèn)題得不到較好的解決,也會(huì)限制未來(lái)一些場(chǎng)景的應(yīng)用可能,如對(duì)于像素和邏輯要求較高的商業(yè)影視劇。而短平快的小視頻根據(jù)分發(fā)渠道的不同,質(zhì)量的參差帶來(lái)的影響不同。但歸根結(jié)底,高質(zhì)量的視頻內(nèi)容商業(yè)化的可能性會(huì)更大。

未來(lái)的商業(yè)模式

AI生成視頻,未來(lái)的商業(yè)模式取決于不同的應(yīng)用場(chǎng)景。面對(duì)一些制作短視頻為主的小B端企業(yè),如媒體、廣告、電商等行業(yè)。谷歌、Meta等AI企業(yè)會(huì)為這些小B端企業(yè)提供AI視頻制作應(yīng)用服務(wù)。類(lèi)似AI作畫(huà)的商業(yè)邏輯,可能提供按次收費(fèi)、按時(shí)長(zhǎng)付費(fèi)或者是按照不同功能與需求的制作收費(fèi),助力這些行業(yè)提升內(nèi)容創(chuàng)造的效率,增加在線(xiàn)視頻領(lǐng)域的流量。不過(guò)這種商業(yè)模式的發(fā)展必須以規(guī)模化支撐,這樣才能有可持續(xù)發(fā)展的可能,畢竟AI廠商的視頻工具開(kāi)發(fā)與運(yùn)維成本較高。

對(duì)于以流媒體平臺(tái)分發(fā)為主,制作中長(zhǎng)視頻的影視行業(yè)來(lái)說(shuō),需求的頻次與質(zhì)量要求較高,因此AI廠商需要提供的是解決方案為主的服務(wù),甚至是定制化的服務(wù),提供專(zhuān)屬的創(chuàng)作模塊,比如特效、運(yùn)鏡、轉(zhuǎn)場(chǎng)等模塊化工具。這種商業(yè)模式的價(jià)值高,但對(duì)于整個(gè)影視行業(yè)以及上下游產(chǎn)業(yè)鏈來(lái)說(shuō),是巨大的變革。產(chǎn)業(yè)需要花費(fèi)較長(zhǎng)時(shí)間地過(guò)渡與適應(yīng)。

除了影視企業(yè)以外,游戲行業(yè)與AI視頻制作也會(huì)有可能碰撞出火花。游戲行業(yè)的視頻內(nèi)容開(kāi)發(fā)可以借助AI生成視頻來(lái)提高創(chuàng)意與效率,降低開(kāi)發(fā)的成本。對(duì)于游戲行業(yè)的商業(yè)模式也會(huì)類(lèi)似影視行業(yè)提供專(zhuān)門(mén)的行業(yè)解決方案。

當(dāng)然,整個(gè)產(chǎn)業(yè)領(lǐng)域中,也有一些企業(yè)對(duì)視頻生成的需求并不高,但也不是完全沒(méi)有需求。比如大多數(shù)小企業(yè)都需要簡(jiǎn)單的企業(yè)宣傳視頻,或是年度的幾場(chǎng)活動(dòng)需要視頻內(nèi)容宣傳支持。一年可能就兩三次的需求,頻次較低。這些企業(yè)并沒(méi)有專(zhuān)業(yè)的視頻制作人員,可能會(huì)選擇應(yīng)用AI生成視頻工具。

如果觀察的視角從企業(yè)轉(zhuǎn)向個(gè)體的話(huà),大部分個(gè)人消費(fèi)者也可以應(yīng)用AI生成視頻來(lái)娛樂(lè)。就像AI作圖一般,AI生成的視頻也會(huì)成為新的社交媒體話(huà)題。網(wǎng)友可以通過(guò)輸入文本指令生成各種各樣的視頻,交流創(chuàng)意。我們或許會(huì)從被投喂的角色,轉(zhuǎn)化為創(chuàng)作者互相分享,交流創(chuàng)意與思想。

這些商業(yè)模式的可能性建立在視頻內(nèi)容優(yōu)良與成本合理的前提下。未來(lái)AI視頻商業(yè)化的過(guò)程中,可能依然會(huì)面臨版權(quán)和倫理的問(wèn)題。無(wú)論是素材庫(kù)還是AI生成視頻的風(fēng)格養(yǎng)成,都離不開(kāi)人類(lèi)創(chuàng)作的圖像、視頻等內(nèi)容。AI工具需要這些人類(lèi)創(chuàng)作的圖像數(shù)據(jù)訓(xùn)練迭代。這也意味著在版權(quán)方面依然存在歸屬爭(zhēng)議的灰色地帶。倫理方面,當(dāng)輸入暴力、血腥、黃色等敏感信息,生成的內(nèi)容可能會(huì)陷入倫理道德的困境。這些問(wèn)題會(huì)伴隨著視頻生成長(zhǎng)期存在,需要設(shè)置更好的機(jī)制與模式去減少這類(lèi)事情的發(fā)生。

與AI做視頻不同,AI作圖最終內(nèi)容可以抽象。這種圖像內(nèi)容可能藝術(shù)價(jià)值更高。但對(duì)于視頻來(lái)說(shuō),內(nèi)容必須連貫、有邏輯。這也對(duì)AI生成視頻的能力提出了要求。AI生成長(zhǎng)視頻是否有邏輯,可以根據(jù)文本表達(dá)出故事性,仍然是個(gè)未知數(shù)。尤其是一些深度的內(nèi)容制作,AI是否能夠創(chuàng)作出這類(lèi)內(nèi)容需要打個(gè)問(wèn)號(hào)。而這些AI到達(dá)不了的領(lǐng)域,就是人類(lèi)創(chuàng)作的價(jià)值地所在。

內(nèi)容的創(chuàng)作,藝術(shù)的創(chuàng)作最終導(dǎo)向的是連接,或者是連接智慧,或者是連接靈魂。人們借由藝術(shù)表達(dá)共鳴,而這些都是AI去不了的場(chǎng)域。未來(lái),或許在AI的內(nèi)卷下,是人類(lèi)高質(zhì)量?jī)?nèi)容創(chuàng)作的高峰。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35168

    瀏覽量

    280179
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249695
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦下?

    大家都在用什么AI軟件?有沒(méi)有好用的免費(fèi)的AI軟件推薦下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    AI將如何改變自動(dòng)駕駛?

    [首發(fā)于智駕最前沿微信公眾號(hào)]五一假期繼續(xù)閑聊下,還歡迎大家隨意留言,隨著人工智能(AI)的發(fā)展,很多車(chē)企及自動(dòng)駕駛供應(yīng)商正嘗試將AI融入自動(dòng)駕駛系統(tǒng),為何大家都在積極推動(dòng)這一技術(shù)?
    的頭像 發(fā)表于 05-04 09:58 ?273次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    猛增50倍,將訓(xùn)練時(shí)間從整天縮短至半小時(shí)。更快的端側(cè)LoRA訓(xùn)練,讓端側(cè)AI基于用戶(hù)端側(cè)數(shù)據(jù)提升個(gè)性化體驗(yàn),讓終端成為更懂用戶(hù)的個(gè)性化智慧伙伴。 智能體用戶(hù)體驗(yàn)的進(jìn)化,生態(tài)整合與攜手躍遷開(kāi)始 本次
    發(fā)表于 04-13 19:52

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    ,包括 PCIe Gen3(2 Lanes)、USB 3.2、雙 USB 2.0 及 2x GbE,支持 MIPI CSI 攝像頭輸入和 MIPI DSI/LVDS 視頻輸出,為 AI 視覺(jué)應(yīng)用和工業(yè)物
    發(fā)表于 03-19 17:54

    《零基礎(chǔ)開(kāi)發(fā)AI Agent——手把手教你用扣子智能體》

    《零基礎(chǔ)開(kāi)發(fā)AI Agent——手把手教你用扣子智能體》是本為普通人量身打造的AI開(kāi)發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過(guò)詳細(xì)的工具介紹和實(shí)戰(zhàn)案例,幫助讀者快
    發(fā)表于 03-18 12:03

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書(shū)學(xué)習(xí)如何構(gòu)建開(kāi)發(fā)個(gè)視頻應(yīng)用。AI Agent是種智能
    發(fā)表于 03-05 19:52

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    的引入徹底改變了這一局面。通過(guò)在邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實(shí)時(shí)數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場(chǎng)景中,搭載AI算法的邊緣網(wǎng)關(guān)能夠?qū)崟r(shí)識(shí)別產(chǎn)品缺陷,將檢測(cè)效率
    發(fā)表于 02-15 11:41

    NVIDIA RTX AI PC如何解鎖AI智能體

    生成式 AI 改變了人們將創(chuàng)意變?yōu)楝F(xiàn)實(shí)的方式。代理式 AI 進(jìn)步推進(jìn)了這一進(jìn)程 — 利用復(fù)雜的自主因果推理和迭代式規(guī)劃來(lái)幫助解決復(fù)雜的多步
    的頭像 發(fā)表于 01-18 10:10 ?611次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b> PC如何解鎖<b class='flag-5'>AI</b>智能體

    企業(yè)AI模型托管怎么

    當(dāng)下,越來(lái)越多的企業(yè)選擇將AI模型托管給專(zhuān)業(yè)的第三方平臺(tái),以實(shí)現(xiàn)高效、靈活和安全的模型運(yùn)行。下面,AI部落小編為您介紹企業(yè)AI模型托管是怎么的。
    的頭像 發(fā)表于 01-15 10:10 ?409次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的
    的頭像 發(fā)表于 12-12 09:40 ?721次閱讀

    可靈AI全球首發(fā)視頻模型定制功能,助力AI視頻創(chuàng)作

    近日,快手旗下的可靈AI在全球范圍內(nèi)率先推出了視頻模型定制功能,這一創(chuàng)新之舉成功解決了AI視頻生成過(guò)程中人物IP穩(wěn)定性不足的難題。 據(jù)了解,
    的頭像 發(fā)表于 11-26 14:02 ?1253次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)大量數(shù)據(jù)中提取有價(jià)值的信息
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    for Science的技術(shù)支撐”的學(xué)習(xí)心得,可以以下幾個(gè)方面進(jìn)行歸納和總結(jié): 1. 技術(shù)基礎(chǔ)的深入理解 在閱讀第二章的過(guò)程中,我對(duì)于AI for Science所需的技術(shù)基礎(chǔ)有了更加深入的理解。這一章詳細(xì)闡述了
    發(fā)表于 10-14 09:16

    STAR AI進(jìn)軍美股科技星智能領(lǐng)跑生成式AI賽道

    自ChatGPT問(wèn)世以來(lái),文字chatbot到視頻生成和機(jī)器人,生成式人工智能(Generative AI)的商業(yè)應(yīng)用已經(jīng)成為全球最具爆炸性效應(yīng)的賽道,生成式AI不僅
    的頭像 發(fā)表于 08-22 08:56 ?647次閱讀
    STAR <b class='flag-5'>AI</b>進(jìn)軍美股科技星智能領(lǐng)跑生成式<b class='flag-5'>AI</b>賽道