99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌提出了一種稱(chēng)為時(shí)間循環(huán)一致性學(xué)習(xí)的自監(jiān)督方法

nlfO_thejiangme ? 來(lái)源:lq ? 2019-10-01 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

視頻理解是計(jì)算機(jī)視覺(jué)中的重要任務(wù),近年來(lái)隨著深度學(xué)習(xí)特別是監(jiān)督學(xué)習(xí)的應(yīng)用視頻理解取得了飛速的發(fā)展,例如視頻行為分類(lèi)和視頻片段總結(jié)等任務(wù)都取得了令人矚目的成果。

不過(guò),現(xiàn)實(shí)生活中很多場(chǎng)景的應(yīng)用視頻片段需要不止一個(gè)標(biāo)簽來(lái)提供足夠的信息。舉個(gè)例子,機(jī)器人往杯子里倒水,一個(gè)簡(jiǎn)單的“傾倒液體”標(biāo)簽不足以預(yù)測(cè)出杯子何時(shí)倒?jié)M,機(jī)器人需要逐幀追蹤杯中的水量。再比如說(shuō),在運(yùn)動(dòng)分析領(lǐng)域,棒球教練不僅僅想要看到投球的動(dòng)作,而是想精確地分析投手投出棒球離手的一瞬間,單一的視頻標(biāo)簽不足以完成這樣的視頻檢索任務(wù)。這意味著視頻理解模型需要逐幀理解視頻的能力。

然而如果使用監(jiān)督學(xué)習(xí)的方法將會(huì)使學(xué)習(xí)成本變得非常昂貴,這需要針對(duì)視頻里每一幀的動(dòng)作進(jìn)行細(xì)粒度的標(biāo)注,訓(xùn)練不同的動(dòng)作還需要新的標(biāo)注來(lái)提供監(jiān)督信號(hào)。但從機(jī)器人到運(yùn)動(dòng)分析等領(lǐng)域,細(xì)粒度的視頻理解有著很強(qiáng)的需求,那么如何在不需要大量標(biāo)簽的情況下對(duì)視頻進(jìn)行學(xué)習(xí)以理解細(xì)粒度的信息呢?

來(lái)自谷歌的研究人員們提出了一種稱(chēng)為時(shí)間循環(huán)一致性學(xué)習(xí)(Temporal Cycle-Consistency Learning,TCC)的自監(jiān)督方法。通過(guò)學(xué)習(xí)不同樣本相似過(guò)程的表示來(lái)實(shí)現(xiàn)細(xì)粒度的時(shí)域視頻理解,為逐幀視頻檢索、動(dòng)作分析、視頻同步和多模態(tài)遷移提供了新的解決方案。

基于TCC的視頻表示學(xué)習(xí)

世間的萬(wàn)事萬(wàn)物發(fā)展的過(guò)程都有特定的規(guī)律,從嫩芽到參天大樹(shù)的植物生長(zhǎng)到起床上班回家兩點(diǎn)一線的996工作,再到簡(jiǎn)單倒水的動(dòng)作都在時(shí)間上滿足一定的順序。

多個(gè)不同實(shí)例的相同過(guò)程可以從視頻捕捉到的信息中找到對(duì)應(yīng)的聯(lián)系。全世界的人往容器中倒水動(dòng)作都差不多,無(wú)論對(duì)象是茶壺、酒瓶、水壺都有著相似的過(guò)程。其中傾倒液體的關(guān)鍵時(shí)刻在多個(gè)不同的視頻中都有著相同的特性——都需要舉起起一個(gè)容器向另一個(gè)容器中傾倒,而視頻中的其他特性則與拍攝的視角、光照、環(huán)境、尺度、容器以及速度有關(guān)。TCC的關(guān)鍵在于通過(guò)循環(huán)一致性的原則,從多個(gè)視頻中尋找出對(duì)應(yīng)的相同動(dòng)作。

算法的目標(biāo)在于訓(xùn)練出一個(gè)有效的幀編碼器來(lái)獲取對(duì)應(yīng)動(dòng)作的表示編碼。研究人員首先將兩個(gè)待配準(zhǔn)的視頻傳入編碼器中獲取對(duì)應(yīng)的嵌入信息,而后選擇兩個(gè)視頻來(lái)進(jìn)行TCC的訓(xùn)練,其中video1作為參考視頻,從中取出一幀并利用最鄰近方法在嵌入空間中找到video2中最為近似的一幀;而后以video2中找到的這一幀作為輸入,從新到嵌入空間中尋找video中對(duì)應(yīng)的幀(circle過(guò)程)。如果學(xué)習(xí)出的嵌入空間具有循環(huán)一致性的話,這一幀和先前輸入video1的參考幀應(yīng)該是同一幀。

上圖中可以看到,左邊的嵌入在循環(huán)檢索后對(duì)應(yīng)原來(lái)的幀,說(shuō)明循環(huán)一致性得到滿足;而右邊的嵌入在循環(huán)檢索后獲取的幀與輸入的幀有差異,則表示這一嵌入的循環(huán)一致性沒(méi)有得到滿足,他們?cè)谇度肟臻g中的差值就表示為循環(huán)一致性損失。模型的訓(xùn)練過(guò)程通過(guò)不斷提高對(duì)于每個(gè)視頻幀的語(yǔ)義理解來(lái)減小循環(huán)一致性誤差。充分訓(xùn)練后的TCC可以學(xué)習(xí)出時(shí)域的細(xì)粒度理解能力,并能夠有效對(duì)齊相關(guān)的視頻。

TCC學(xué)習(xí)到的表達(dá)

研究人員隨后驗(yàn)證了TCC學(xué)習(xí)到的表達(dá),是否有效理解了多個(gè)視頻中的相似動(dòng)作。實(shí)驗(yàn)在Penn Action數(shù)據(jù)集上進(jìn)行,研究人員將多個(gè)包含人體深蹲訓(xùn)練的視頻利用T后發(fā)現(xiàn)了空間可視化學(xué)習(xí)到的隱含特征。

左圖中亮度較高的點(diǎn)是當(dāng)前幀對(duì)應(yīng)的表示。紫色為輸入的參考視頻,其余為其他視頻中檢索到的最鄰近幀??梢钥吹诫m然各個(gè)視頻的角度、場(chǎng)景、主體不同,但對(duì)應(yīng)的嵌入表示和對(duì)應(yīng)的視頻幀卻以相同的趨勢(shì)在運(yùn)動(dòng),TCC有效地將深蹲動(dòng)作的不同過(guò)程進(jìn)行了編碼而無(wú)需顯式的人工標(biāo)注。

TCC的潛在應(yīng)用

由于這種方法可以有效學(xué)習(xí)逐幀視頻的遷移表達(dá)可廣泛應(yīng)用于小樣本視頻動(dòng)作分類(lèi)、無(wú)監(jiān)督視頻對(duì)齊、多模態(tài)遷移和逐幀視頻檢索。

小樣本動(dòng)作階段分類(lèi)。當(dāng)只有很少的標(biāo)注視頻樣本時(shí),TCC方法可以有效地將不同動(dòng)作階段進(jìn)行分類(lèi)。研究人員將基于TCC的方法與監(jiān)督學(xué)習(xí)方法進(jìn)行比較,可以發(fā)現(xiàn)只用一個(gè)完全標(biāo)記的視頻樣本訓(xùn)練就可與監(jiān)督學(xué)習(xí)需要五十個(gè)標(biāo)注的視頻樣本訓(xùn)練獲得同樣的效果。下圖中可以看到TCC方法在兩種動(dòng)作識(shí)別中小樣本學(xué)習(xí)的良好表現(xiàn)。

對(duì)齊或同步視頻。當(dāng)視頻的數(shù)量增加時(shí)對(duì)齊或同步不同視頻間的動(dòng)作將會(huì)是耗時(shí)耗力的工作,但利用TCC多個(gè)視頻的同步可以利用參考視頻的幀來(lái)在每個(gè)目標(biāo)視頻中尋找最鄰近的幀實(shí)現(xiàn)對(duì)齊:

視頻標(biāo)簽/模態(tài)遷移。由于TCC可以在嵌入空間中找到每一幀對(duì)應(yīng)的最鄰近幀進(jìn)行視頻匹配,所以這種方法還可以將視頻對(duì)應(yīng)的元數(shù)據(jù)進(jìn)行遷移,包括時(shí)域語(yǔ)義標(biāo)簽或者音頻數(shù)據(jù)。研究人員展示了一個(gè)可以把倒水的聲音遷移到一段沒(méi)有聲音的視頻上,倒水的聲音別成功遷移到了倒牛奶的視頻上了,甚至放瓶子的聲音也很逼真!

逐幀視頻檢索。TCC還可以作為關(guān)鍵幀在嵌入空間中用于視頻中相似幀的檢索。學(xué)習(xí)出的嵌入表達(dá)具有很強(qiáng)的分辨能力,可以區(qū)分出某一個(gè)動(dòng)作前后的相鄰幀。

研究人員還將整個(gè)工作的代碼開(kāi)源,不僅包括了TCC,還包括了多個(gè)先進(jìn)自監(jiān)督方法的實(shí)現(xiàn),將為會(huì)視頻理解的研究以及藝術(shù)家利用視頻同步進(jìn)行創(chuàng)作帶來(lái)很大的幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108114
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1972

    瀏覽量

    73915
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25445

原文標(biāo)題:讀懂視頻的每分每秒,谷歌提出自監(jiān)督方法提升視頻細(xì)粒度理解能力

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    車(chē)用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究

    車(chē)用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究
    發(fā)表于 05-16 21:02

    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性

    及稀釋程度等關(guān)鍵參數(shù)對(duì)焊層質(zhì)量有直接影響,實(shí)時(shí)監(jiān)控熔池輪廓和溫度分布可及時(shí)預(yù)警缺陷并指導(dǎo)參數(shù)優(yōu)化,以保證焊層一致性與工藝穩(wěn)定性。今天起了解堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性。 堆焊簡(jiǎn)介 堆焊,又
    的頭像 發(fā)表于 04-24 17:15 ?251次閱讀
    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫<b class='flag-5'>一致性</b>

    一致性校正與邊緣融合拼接

    電子發(fā)燒友網(wǎng)站提供《差一致性校正與邊緣融合拼接.pdf》資料免費(fèi)下載
    發(fā)表于 04-10 18:02 ?0次下載

    請(qǐng)問(wèn)如何保證多片AD1278的通道之間相位一致性?

    讀取手冊(cè),發(fā)現(xiàn)要保證多片AD1278的通道之間相位一致性需要兩點(diǎn):1、CLK一致;2、SYNC_N同時(shí)拉高。 我的情況: 1、各個(gè)AD1278的CLK來(lái)著不同的時(shí)鐘源,即分別采用10ppm
    發(fā)表于 01-14 06:02

    FCB-EV9520L光軸一致性的典范,焦距變換精準(zhǔn)如初

    索尼FCB-EV9520L出色的光軸一致性在多個(gè)應(yīng)用場(chǎng)景中展現(xiàn)出了其獨(dú)特的優(yōu)勢(shì)和價(jià)值。通過(guò)提高圖像的準(zhǔn)確、減少圖像畸變以及增強(qiáng)應(yīng)用場(chǎng)景的適應(yīng),F(xiàn)CB-EV9520L成為了市場(chǎng)上備受
    的頭像 發(fā)表于 12-09 09:45 ?643次閱讀
    FCB-EV9520L光軸<b class='flag-5'>一致性</b>的典范,焦距變換精準(zhǔn)如初

    時(shí)空引導(dǎo)下的時(shí)間序列監(jiān)督學(xué)習(xí)框架

    【導(dǎo)讀】最近,香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了時(shí)間序列無(wú)監(jiān)督預(yù)訓(xùn)練的文章,相比原來(lái)的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作
    的頭像 發(fā)表于 11-15 11:41 ?762次閱讀
    時(shí)空引導(dǎo)下的<b class='flag-5'>時(shí)間</b>序列<b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

    一致性測(cè)試系統(tǒng)的技術(shù)原理和也應(yīng)用場(chǎng)景

    出現(xiàn)遠(yuǎn)程調(diào)用失敗、消息發(fā)送失敗、并發(fā)bug等問(wèn)題,這些問(wèn)題最終會(huì)導(dǎo)致系統(tǒng)間的數(shù)據(jù)不一致,導(dǎo)致用戶體驗(yàn)受損、用戶利益受損。因此,需要一種在線的校驗(yàn)?zāi)J絹?lái)實(shí)時(shí)發(fā)現(xiàn)數(shù)據(jù)不一致問(wèn)題,而一致性測(cè)
    發(fā)表于 11-01 15:35

    異構(gòu)計(jì)算下緩存一致性的重要

    在眾多回復(fù)中,李博杰同學(xué)的回答被認(rèn)為質(zhì)量最高。他首先將緩存一致性分為兩個(gè)主要場(chǎng)景:是主機(jī)內(nèi)CPU與設(shè)備間的一致性;二是跨主機(jī)的一致性。
    的頭像 發(fā)表于 10-24 17:00 ?1708次閱讀
    異構(gòu)計(jì)算下緩存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    LMK05318的ITU-T G.8262一致性測(cè)試結(jié)果

    電子發(fā)燒友網(wǎng)站提供《LMK05318的ITU-T G.8262一致性測(cè)試結(jié)果.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:21 ?0次下載
    LMK05318的ITU-T G.8262<b class='flag-5'>一致性</b>測(cè)試結(jié)果

    TPS23882B SIFOs IEEE802.3bt 一致性測(cè)試報(bào)告

    電子發(fā)燒友網(wǎng)站提供《TPS23882B SIFOs IEEE802.3bt 一致性測(cè)試報(bào)告.pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:48 ?1次下載
    TPS23882B SIFOs IEEE802.3bt <b class='flag-5'>一致性</b>測(cè)試報(bào)告

    級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 08-29 10:48 ?0次下載
    級(jí)聯(lián)<b class='flag-5'>一致性</b>和移相器校準(zhǔn)應(yīng)用手冊(cè)

    電感值和直流電阻的一致性如何提高?

    提高電感值和直流電阻的一致性,可以從以下幾個(gè)方面入手: 、提高電感值的一致性 優(yōu)化磁芯選擇 : 磁芯是電感器的關(guān)鍵組成部分,其材料特性和尺寸直接影響電感值。選擇具有高磁導(dǎo)率、低磁阻和穩(wěn)定性能的材料
    的頭像 發(fā)表于 08-19 15:27 ?714次閱讀

    LIN一致性測(cè)試規(guī)范2.1

    電子發(fā)燒友網(wǎng)站提供《LIN一致性測(cè)試規(guī)范2.1.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 17:14 ?8次下載

    OPA569過(guò)溫信號(hào)一致性差是什么原因?qū)е碌模?/a>

    OPA569作為輸出級(jí),輸出短路的時(shí)候,OPA569溫度上升較快。 同款產(chǎn)品,均輸出短路,有些產(chǎn)品短路僅幾秒鐘就采集到OPA569的7腳的過(guò)溫信號(hào)了。而有些產(chǎn)品需要過(guò)2-3分鐘才發(fā)出過(guò)溫信號(hào)。這是什么原因呢,一致性差別太大了。
    發(fā)表于 08-08 08:14

    是德科技通過(guò)NB-IoT NTN一致性測(cè)試

    近日,知名電子測(cè)量?jī)x器制造商是德科技(Keysight Technologies, Inc.)欣然宣布,其針對(duì)3GPP Rel-17標(biāo)準(zhǔn)中關(guān)于NB-IoT NTN技術(shù)的全新一致性測(cè)試用例已順利通過(guò)
    的頭像 發(fā)表于 07-31 13:07 ?1485次閱讀