谷歌發(fā)布VLOGGER AI模型，實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

3 月 19 日，Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容，使人物生動(dòng)地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來(lái)說(shuō)，VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型，通過(guò) MENTOR 數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練，涵蓋了超80萬(wàn)個(gè)人物肖像及超過(guò)2200小時(shí)的視頻數(shù)據(jù)。得益于此，VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團(tuán)隊(duì)指出，相較于之前的同類產(chǎn)品，VLOGGER 的獨(dú)特之處在于無(wú)需針對(duì)每個(gè)使用者進(jìn)行單獨(dú)培訓(xùn)，且不受限于人臉檢測(cè)和裁剪，能產(chǎn)出完整的圖像，且能夠處理更多元化的情境如可見(jiàn)的身軀或者其他身份特征，這對(duì)于真實(shí)再現(xiàn)人物交流過(guò)程至關(guān)重要。

谷歌將 VLOGGER 視為通往“通用聊天機(jī)器人”未來(lái)的關(guān)鍵一步，使人工智能能以自然的語(yǔ)音、手勢(shì)和眼神等方式與人類交互。除此之外，VLOGGER 還可用作報(bào)告、教育領(lǐng)域以及旁白等方面的輔助工具，并能對(duì)已有的電影進(jìn)行剪輯和表情調(diào)整。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

Google

Google

+關(guān)注

關(guān)注
5

文章
1789

瀏覽量
59047
模型

模型

+關(guān)注

關(guān)注
1

文章
3521

瀏覽量
50427
VLogger

VLogger

+關(guān)注

關(guān)注
0

文章
5

瀏覽量
8422

評(píng)論

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot 對(duì)比各家主流MCU指標(biāo)，國(guó)產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號(hào)和數(shù)字信號(hào)的區(qū)別和特點(diǎn)

New 方正電機(jī)成為小鵬汽車驅(qū)動(dòng)電機(jī)供應(yīng)商，總需求量預(yù)計(jì)達(dá)35萬(wàn)臺(tái)
New 雷諾-吉利動(dòng)力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
16小時(shí)前

404 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
4小時(shí)前

217 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
4小時(shí)前

229 閱讀

英飛凌TLD7002-16 OTP PRG的常見(jiàn)問(wèn)題解析

駿龍電子
4小時(shí)前

208 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過(guò)程中的焊接技巧與導(dǎo)通檢查要點(diǎn)

駿龍電子
4小時(shí)前

233 閱讀

4x4鍵盤程序集錦

李娜
3

10積分

120下載

sostart開(kāi)聽(tīng)電臺(tái)mac版

ah此生不換
0.10 MB

免費(fèi)

0下載

YSHYClipImageController iOS圖片裁剪

劉娟
1.54 MB

免費(fèi)

0下載

Diy ESP32智能手表

卓?jī)S漢
0.05 MB

2積分

5下載

用于WLCSP-34封裝的SmartBond? DA14585低功耗藍(lán)牙Pro開(kāi)發(fā)套件子板數(shù)據(jù)手冊(cè)

1.13 MB

免費(fèi)

0下載

省錢+環(huán)保+個(gè)性：打造一臺(tái)永不“過(guò)時(shí)”的自定義電腦！

早知
1天前

331 閱讀

【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】+溫度大氣壓檢測(cè)及顯示

jinglixixi
1天前

546 閱讀

【RA-Eco-RA6M4開(kāi)發(fā)板評(píng)測(cè)】+01+開(kāi)箱測(cè)評(píng)+UART+PWM+LED

jf_18702540
2天前

514 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】2、打造復(fù)古游戲機(jī)（Batocera鏡像+FBNeo虛擬機(jī)，多款游戲ROM分享）

左岸cpx
2天前

537 閱讀

【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】+兩種開(kāi)發(fā)板間的比較

jinglixixi
2天前

479 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

谷歌發(fā)布VLOGGER AI模型，實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

評(píng)論

谷歌發(fā)布VLOGGER AI模型，實(shí)現(xiàn)肖像朗讀音頻內(nèi)容