99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布VLOGGER AI模型,實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 14:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3 月 19 日,Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容,使人物生動(dòng)地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來(lái)說(shuō),VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過(guò) MENTOR 數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練,涵蓋了超80萬(wàn)個(gè)人物肖像及超過(guò)2200小時(shí)的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團(tuán)隊(duì)指出,相較于之前的同類產(chǎn)品,VLOGGER 的獨(dú)特之處在于無(wú)需針對(duì)每個(gè)使用者進(jìn)行單獨(dú)培訓(xùn),且不受限于人臉檢測(cè)和裁剪,能產(chǎn)出完整的圖像,且能夠處理更多元化的情境如可見(jiàn)的身軀或者其他身份特征,這對(duì)于真實(shí)再現(xiàn)人物交流過(guò)程至關(guān)重要。

谷歌將 VLOGGER 視為通往“通用聊天機(jī)器人”未來(lái)的關(guān)鍵一步,使人工智能能以自然的語(yǔ)音、手勢(shì)和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報(bào)告、教育領(lǐng)域以及旁白等方面的輔助工具,并能對(duì)已有的電影進(jìn)行剪輯和表情調(diào)整。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    59047
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50427
  • VLogger
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8422
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英語(yǔ)單詞學(xué)習(xí)頁(yè)面+單詞朗讀實(shí)現(xiàn) -- 【2】單詞朗讀實(shí)現(xiàn) ##HarmonyOS SDK AI##

    的原理是通過(guò)文字轉(zhuǎn)語(yǔ)音的形式實(shí)現(xiàn)的,之前也寫(xiě)過(guò)文章分享過(guò)在API9下如何進(jìn)行文字轉(zhuǎn)語(yǔ)音,那是通過(guò)第三方的API實(shí)現(xiàn)的,需要申請(qǐng)token,請(qǐng)求接口,然后再通過(guò)media去播放,整體流程較為復(fù)雜,還必須
    發(fā)表于 06-29 23:26

    英語(yǔ)單詞學(xué)習(xí)頁(yè)面+單詞朗讀實(shí)現(xiàn) -- 【1】頁(yè)面實(shí)現(xiàn) ##HarmonyOS SDK AI##

    ?先看一下頁(yè)面效果 ? 整體頁(yè)面是一個(gè)比較簡(jiǎn)潔的頁(yè)面,其中有兩個(gè)特色功能 對(duì)于例句中,能夠實(shí)現(xiàn)將當(dāng)前的單詞從句子中進(jìn)行識(shí)別并突出顯示 對(duì)于單詞和句子,可以進(jìn)行朗讀,這個(gè)朗讀使用的是Core
    發(fā)表于 06-29 23:24

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強(qiáng)大的端側(cè)運(yùn)行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開(kāi)發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)圈,實(shí)現(xiàn)TAO
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動(dòng)式” 的范式轉(zhuǎn)變,未來(lái) AI 代理將能夠主動(dòng)檢索并
    的頭像 發(fā)表于 04-12 00:57 ?2439次閱讀

    谷歌“減法”新動(dòng)作:砍掉耳機(jī)按鍵喚醒朗讀功能

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近期,谷歌宣布將對(duì)耳機(jī)上的 Google Assistant語(yǔ)音助手功能進(jìn)行調(diào)整,取消通過(guò)觸控喚醒助理“自動(dòng)朗讀未讀通知”的功能。谷歌表示,要想完成該功能可以通過(guò)語(yǔ)音
    的頭像 發(fā)表于 02-22 22:56 ?2467次閱讀
    <b class='flag-5'>谷歌</b>“減法”新動(dòng)作:砍掉耳機(jī)按鍵喚醒<b class='flag-5'>朗讀</b>功能

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開(kāi)發(fā)提供強(qiáng)大助力。
    的頭像 發(fā)表于 01-08 11:01 ?551次閱讀

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語(yǔ)言模型,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)信息的高效檢索與
    的頭像 發(fā)表于 12-16 09:35 ?725次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時(shí)代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實(shí)現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和
    的頭像 發(fā)表于 12-12 14:22 ?825次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫(xiě)輔助。 Gemini 2.0通過(guò)高級(jí)推理和長(zhǎng)上
    的頭像 發(fā)表于 12-12 10:13 ?645次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1139次閱讀

    HarmonyOS NEXT應(yīng)用元服務(wù)開(kāi)發(fā)標(biāo)注屏幕朗讀內(nèi)容的場(chǎng)景

    控件包含顯示文本(text)、無(wú)障礙文本(accessibilityText)2個(gè)屬性,其中,顯示文本為用戶界面上呈現(xiàn)的信息,無(wú)障礙文本為無(wú)障礙專有的朗讀信息,不在界面上顯示。屏幕朗讀提取信息進(jìn)行
    發(fā)表于 10-12 15:52

    谷歌Pixel 9系列發(fā)布會(huì):AI技術(shù)領(lǐng)先,Gemini AI成焦點(diǎn)

    8月14日,谷歌在景山城總部舉行了一場(chǎng)備受矚目的新品發(fā)布會(huì),提前于蘋(píng)果iPhone 16系列發(fā)布,展示了Pixel 9系列手機(jī)及其搭載的全新AI功能,這一舉措迅速吸引了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 08-15 15:22 ?1606次閱讀

    谷歌獲Character.AI模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達(dá)成了一項(xiàng)重要合作,非獨(dú)家授權(quán)谷歌使用其先進(jìn)的大型語(yǔ)言模型技術(shù)。此次合
    的頭像 發(fā)表于 08-05 14:35 ?761次閱讀

    蘋(píng)果AI模型訓(xùn)練新動(dòng)向:攜手谷歌,未選英偉達(dá)

    近日,蘋(píng)果公司發(fā)布的最新研究報(bào)告揭示了其在人工智能領(lǐng)域的又一重要戰(zhàn)略選擇——采用谷歌設(shè)計(jì)的芯片來(lái)訓(xùn)練其AI模型,而非行業(yè)巨頭英偉達(dá)的產(chǎn)品。這一決定在業(yè)界引起了廣泛關(guān)注,尤其是在當(dāng)前英偉
    的頭像 發(fā)表于 08-01 18:11 ?1144次閱讀

    谷歌發(fā)布革命性AI天氣預(yù)測(cè)模型NeuralGCM

    在科技與自然科學(xué)的交匯點(diǎn)上,谷歌公司于7月23日宣布了一項(xiàng)重大突破——全新的人工智能天氣預(yù)測(cè)模型NeuralGCM。這一創(chuàng)新成果不僅融合了機(jī)器學(xué)習(xí)的前沿技術(shù),還巧妙結(jié)合了傳統(tǒng)氣象學(xué)的精髓,其研究成果已在國(guó)際權(quán)威科學(xué)期刊《Nature》上
    的頭像 發(fā)表于 07-23 14:24 ?819次閱讀