99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)開發(fā)新AI算法,視頻通話的流量最高壓縮90%以上

工程師鄧生 ? 來源:量子位 ? 作者:凹非寺 ? 2020-12-02 14:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了讓網(wǎng)速慢的用戶用上高清通話,英偉達(dá)可謂絞盡腦汁。他們開發(fā)的新AI算法,可以將視頻通話的流量最高壓縮90%以上。

和其他視頻相比,通話的場(chǎng)景比較單一,基本上只有人的頭部在運(yùn)動(dòng)。因此只要能把頭像數(shù)據(jù)大規(guī)模壓縮,就能大大節(jié)約流量。

英偉達(dá)的新算法face vid2vid正是從這一點(diǎn)出發(fā)。只要一張圖片,就能實(shí)現(xiàn)重建各種頭部姿勢(shì)圖片。

H.264視頻所需的帶寬是這種新算法的2~12倍,從前面的演示也能看出,如果讓二者使用相同比特率,那么H.264視頻幾乎不可用。

轉(zhuǎn)動(dòng)面部不扭曲

英偉達(dá)提供了一個(gè)試用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滾角)三個(gè)方向上任意旋轉(zhuǎn)。

輸入一張人臉,最多可以在每個(gè)方向上最多旋轉(zhuǎn)30度。以下是三個(gè)方向上旋轉(zhuǎn)到最大角度生成的圖片。

與相比之前的方法,英偉達(dá)的這種技術(shù)即使在面部轉(zhuǎn)動(dòng)幅度較大時(shí),人臉也不會(huì)扭曲變形。

然而,圖片終究是不動(dòng)的,要把生成的人臉放在運(yùn)動(dòng)的視頻中還要多一個(gè)步驟。

合成面部視頻

我們把上傳的清晰照片作為源圖像,從中獲取外貌特征。然后把視頻中一幀幀畫面作為重構(gòu)視頻的依據(jù),從中提取出面部表情和頭部姿勢(shì)等信息。

而表情和姿勢(shì)這兩個(gè)數(shù)據(jù)可以通過關(guān)鍵點(diǎn)進(jìn)行編碼,這樣就分離了人物身份信息和運(yùn)動(dòng)信息。在傳輸視頻時(shí)只要有運(yùn)動(dòng)信息即可,從而節(jié)約了流量。

從源圖像s中,我們得到了兩組數(shù)據(jù):關(guān)鍵點(diǎn)坐標(biāo)x和雅可比矩陣J。這兩組參數(shù)與面部的具體特征無關(guān),只包含人的幾何特征。

其中,雅可比矩陣表示如何通過仿射變換將關(guān)鍵點(diǎn)周圍的局部補(bǔ)丁轉(zhuǎn)換為另一幅圖像中的補(bǔ)丁。如果是恒等雅可比矩陣,則補(bǔ)丁將直接復(fù)制并粘貼到新位置。

下圖展示了計(jì)算前5個(gè)關(guān)鍵點(diǎn)的流程。給定源圖像以及模型預(yù)測(cè)的規(guī)范關(guān)鍵點(diǎn)。

從運(yùn)動(dòng)視頻估計(jì)的旋轉(zhuǎn)和平移應(yīng)用于關(guān)鍵點(diǎn),帶動(dòng)頭部姿勢(shì)的變化。然后可以感知表情的變形將關(guān)鍵點(diǎn)調(diào)整為目標(biāo)表情。

接下來開始合成視頻。使用源和運(yùn)動(dòng)的關(guān)鍵點(diǎn)與其雅可比矩陣來估計(jì)流wk,從生成流組合成掩碼m,將這兩組進(jìn)行線性組合即可產(chǎn)生合成流場(chǎng)w。

接著輸入人臉面部特征f,即可生成輸出圖像y。

這種方法不僅能用于視頻通話,也有其他“新玩法”。

比如覺得人物頭像有點(diǎn)歪,可以手動(dòng)輸入糾正后的數(shù)據(jù),從而將面部轉(zhuǎn)正。

又或者是,把一個(gè)人的面部特征點(diǎn)和雅可比矩陣用于另一個(gè)人,實(shí)現(xiàn)面部視頻動(dòng)作的遷移。

團(tuán)隊(duì)簡介

這篇文章的第一作者是來自英偉達(dá)的高級(jí)研究員Ting-Chun Wang。

文章的通訊作者是英偉達(dá)的著名研究員劉洺堉。

如果你長期關(guān)注CV領(lǐng)域,一定對(duì)這兩位作者非常熟悉。他們?cè)趫D像風(fēng)格遷移、GAN等方面做出了大量的工作。

△ GauGAN

兩人之前已經(jīng)有過多次合作。比如。無監(jiān)督圖像遷移網(wǎng)絡(luò)(NIPS 2017),還有從涂鴉生成照片的GauGAN(CVPR 2019),都是出自這二位之手。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95399
  • 開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    373

    瀏覽量

    41520
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279989
  • 視頻通話
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    12079
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93793
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺(tái)參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?240次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)
    發(fā)表于 03-05 19:52

    美銀分析師:英偉達(dá)加大“物理AI”投入為明智之舉

    近日,美國銀行的分析師對(duì)英偉達(dá)在“物理AI”領(lǐng)域的最新動(dòng)向發(fā)表了評(píng)論。分析師指出,英偉達(dá)決定加大對(duì)“物理
    的頭像 發(fā)表于 01-08 10:51 ?488次閱讀

    英偉達(dá)收購AI初創(chuàng)公司Run:ai

    :ai作為一家專注于AI云計(jì)算軟件平臺(tái)開發(fā)的初創(chuàng)公司,其產(chǎn)品以高效利用高性能GPU資源為核心,致力于為用戶提供更快速、更便捷的機(jī)器學(xué)習(xí)加速方案。通過此次收購,英偉
    的頭像 發(fā)表于 12-31 10:46 ?541次閱讀

    英偉達(dá)與軟銀攜手共建日本AI基礎(chǔ)設(shè)施

    近日,英偉達(dá)創(chuàng)始人兼CEO黃仁勛宣布,英偉達(dá)將與軟銀集團(tuán)合作,在日本共同建設(shè)AI基礎(chǔ)設(shè)施,其中包括日本最大的
    的頭像 發(fā)表于 11-13 14:41 ?746次閱讀

    英偉達(dá)超越蘋果成為市值最高 英偉達(dá)取代英特爾加入道指

    蘋果公司的市值,重新成為全球市值最高的公司。 在AI領(lǐng)域,英偉達(dá)正瘋狂奔跑,我們看到有外媒報(bào)道英偉達(dá)
    的頭像 發(fā)表于 11-05 15:22 ?782次閱讀

    成全球最高!英偉達(dá)市值超蘋果

    近日,全球圖形處理器(GPU)巨頭英偉達(dá)公司的股價(jià)在當(dāng)日交易中上漲了1.4%,使其總市值達(dá)到了驚人的3.37萬億美元,成功超越了蘋果公司,重新成為全球市值最高的公司。 這一里程碑式的成就凸顯了
    的頭像 發(fā)表于 11-05 14:53 ?680次閱讀

    英偉達(dá)AI服務(wù)器將革新采用插槽式設(shè)計(jì)

    英偉達(dá)AI服務(wù)器領(lǐng)域即將迎來重大變革。據(jù)里昂證券最新發(fā)布的報(bào)告預(yù)測(cè),從明年下半年起,英偉達(dá)的旗艦級(jí)AI
    的頭像 發(fā)表于 09-27 11:47 ?700次閱讀

    英偉達(dá)與阿聯(lián)酋G42合作開發(fā)天氣預(yù)測(cè)AI模型

    英偉達(dá)近期宣布與阿聯(lián)酋的領(lǐng)先AI應(yīng)用開發(fā)企業(yè)G42達(dá)成戰(zhàn)略合作,共同探索天氣預(yù)測(cè)技術(shù)的新前沿。雙方將整合各自的技術(shù)優(yōu)勢(shì),依托英偉
    的頭像 發(fā)表于 09-24 15:41 ?529次閱讀

    英偉達(dá)投資日本AI公司Sakana AI

    英偉達(dá)現(xiàn)身日本人工智能研發(fā)初創(chuàng)公司Sakana AI的A輪融資名單中;據(jù)悉;Sakana AI的A輪融資而完成超過1億美元,此次融資由New Enterprise Associates
    的頭像 發(fā)表于 09-05 15:46 ?963次閱讀

    英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

    英偉達(dá)行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500億

    誰是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉達(dá)肯定有一席之地,特別是現(xiàn)在全球資本市場(chǎng)動(dòng)蕩之際,業(yè)界分析師多認(rèn)為英偉達(dá)是最佳“反彈股”
    的頭像 發(fā)表于 08-13 15:33 ?1451次閱讀

    英偉達(dá)Cosmos AI項(xiàng)目曝光:構(gòu)建先進(jìn)視頻模型

    近日,英偉達(dá)內(nèi)部一項(xiàng)名為Cosmos的AI項(xiàng)目浮出水面,引起了業(yè)界的廣泛關(guān)注。該項(xiàng)目尚處于保密階段,未向公眾正式發(fā)布,但其雄心勃勃的目標(biāo)已初露端倪。Cosmos旨在構(gòu)建一個(gè)集光傳輸、物理和智能模擬
    的頭像 發(fā)表于 08-07 16:51 ?840次閱讀

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28