99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

誰才是真正的C位 讓AI告訴你

人工智能與大數(shù)據(jù)技術(shù) ? 來源:yxw ? 2019-06-20 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

C位是近年網(wǎng)絡(luò)上一個比較熱門的詞,最早來源于DOTA等游戲領(lǐng)域,是核心位置(Carry位)的簡稱,代表的是能夠在游戲前中期打錢發(fā)育并在游戲后期帶領(lǐng)隊伍力挽狂瀾的角色?,F(xiàn)在C位一詞逐漸擴大到了娛樂圈乃至我們的生活中,在社交、表演、比賽以及各種日?;顒訄鼍爸?,只要當(dāng)某一個人在人群中處于中心位置,即最重要的人,大家便稱呼他是C位(Center位)。

在包含眾多人像的照片中,由于每個人的穿著和動作各異,同時人與人之間存在各種交互信息,以及所處的場景不同,我們通過肉眼來確定C位的時候可能會出現(xiàn)各種偏差。在人工智能快速發(fā)展的今天,我們能否可以通過AI來自動找出C位呢?答案當(dāng)然是肯定的。在這篇文章中,我們將介紹如何利用計算機視覺深度學(xué)習(xí)技術(shù)構(gòu)建一個性能優(yōu)異的C位檢測器,從而快速準(zhǔn)確地在一群人中發(fā)現(xiàn)真正站C位的那個最重要的人。

C位檢測器前傳

C位檢測器的目標(biāo)是檢測出一群人中最重要的人。一般來說,C位檢測器主要由兩部分組成,第一部分是人臉/全身檢測模型,通過該模型首先檢測出照片中的所有人像;第二部分是人像重要性預(yù)測模型,通過該模型對檢測出的每個人像計算重要性得分,重要性得分最高的人即為C位。

當(dāng)前的人臉/全身檢測模型的性能已經(jīng)比較理想,而人像重要性預(yù)測模型還處在研究和探索階段,所以下面我們的內(nèi)容將主要圍繞如何量化一群人中每個人的重要性展開。

最直接的人像重要性計算可以基于照片中人像所處的位置和面積進(jìn)行設(shè)計,例如,離照片中心點越近則重要性越高,人像的面積越大則重要性越高等等。然而我們判斷一個人是不是C位,除了利用照片中人像所處的位置和面積這類人像自身的幾何信息外,還會根據(jù)照片上的各種信息綜合判斷:人像自身的外表信息(上圖(a))、與其他人之間的關(guān)系信息(上圖(b))以及所處的全局場景信息(上圖(c))。

人與人之間的關(guān)系和人與場景之間的關(guān)系對C位的判斷起到關(guān)鍵性作用。如果我們只利用人像的自身特征進(jìn)行重要性計算,例如上圖(a)中的紅框女性,我們其實無法知道她是否是照片中最重要的人。但我們通過她與周圍人之間和與整體場景之間的關(guān)系信息分析便可以得出她是C位的結(jié)論。

一個理想的人像重要性預(yù)測模型應(yīng)根據(jù)上面提到的各方面信息進(jìn)行聯(lián)合計算。如何提取照片上豐富的多元化信息?如何對人與人之間和人與場景之間的關(guān)系建模,從而獲取高層次的語義信息?如何最終根據(jù)照片上人像的多元化信息和高層次語義信息的特征進(jìn)行重要性評估?這些都是擺在我們面前的問題,需要我們?nèi)ヒ灰唤鉀Q。

一個出色的C位檢測器

為了解決上節(jié)末提出的三個問題,我們實驗室的小伙伴們攻堅克難,提出了一種全新而高效的人像重要性預(yù)測模型,構(gòu)建了一個出色的C位檢測器,相關(guān)工作發(fā)表在CVPR 2019。下面我們對其中的模型框架和建模思路進(jìn)行一一介紹,希望給大家?guī)砀嗟膯l(fā)和思考。

整個人像重要性預(yù)測模型分為三個模塊,分別是特征表達(dá)模塊、關(guān)系計算模塊和重要性分類模塊。特征表達(dá)模塊能夠有效地提取照片中每個人的自身特征和整張照片的全局場景特征。關(guān)系計算模塊能夠?qū)θ伺c人之間和人與場景之間的關(guān)系進(jìn)行建模。重要性分類模塊能夠計算每個人像的重要性得分,從而最終識別出最重要的C位人選。完整的模型框架如下圖所示。

特征表達(dá)模塊針對上節(jié)末“如何提取照片上豐富的多元化信息?”這一問題進(jìn)行設(shè)計。為了充分地獲取人像自身豐富的特征表達(dá),人像的外表信息和幾何信息都會進(jìn)行特征提取。深度卷積神經(jīng)網(wǎng)絡(luò)被用來實現(xiàn)提取流程,如下圖所示。其中,外表信息被分為內(nèi)在(綠框)和外在(藍(lán)框)兩部分,內(nèi)在區(qū)域更多提取人像固有的外表信息,外在區(qū)域更多用于提取人像外表以及與周圍環(huán)境的上下文信息,從而保證了人像信息的多元化。此外整張照片的全局場景信息(黃框)也會通過卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)特征提取。

關(guān)系計算模塊針對上節(jié)末“如何對人與人之間和人與場景之間的關(guān)系建模,從而獲取高層次的語義信息?”這一問題進(jìn)行設(shè)計,是整個模型中最關(guān)鍵的模塊。在該模塊中,關(guān)系網(wǎng)絡(luò)(Relation Networks)被用來對在特征表達(dá)模塊中提取的人像特征和場景特征進(jìn)行關(guān)系建模。關(guān)系網(wǎng)絡(luò)能夠在沒有額外監(jiān)督信息的前提下,自動學(xué)習(xí)人與人之間和人與場景之間的關(guān)系,從而提取更高層次的語義信息以表征人在場景中的重要性。具體會分別建立人與人之間的關(guān)系圖和人與場景之間的關(guān)系圖,通過多個并行的關(guān)系網(wǎng)絡(luò)提取關(guān)系特征并連接,再與原有的人像特征相加,得到最終的特征表達(dá)。

重要性分類模塊針對上節(jié)末“如何最終根據(jù)照片上人像的多元化信息以及高層次語義信息的特征進(jìn)行重要性評估?”這一問題進(jìn)行設(shè)計。通過對在關(guān)系計算模型中提取的每個人像的最終特征表達(dá)進(jìn)行重要/不重要的二分類,將每個人像被分為重要這個類別的概率作為重要性得分,得分最高的人像就是模型認(rèn)定的C位。

以上三個模塊一起實現(xiàn)了端到端的人像重要性訓(xùn)練和預(yù)測。最后我們來看一看利用上述模型進(jìn)行C位檢測的可視化結(jié)果。紅框代表的是模型檢測出來的C位,綠框代表的是當(dāng)前其他最好方法的檢測結(jié)果,可以看出在充分考慮了照片中人與人之間和人與場景之間的關(guān)系信息后,在各種復(fù)雜場景下,AI均能夠準(zhǔn)確地檢測出真正的C位。

C位檢測可以自動快速地在人群中找出最重要的那個人。通過這篇文章,我們介紹了利用AI進(jìn)行C位檢測的一般流程和遇到的挑戰(zhàn),也進(jìn)一步分享了一種優(yōu)秀的C位檢測器的構(gòu)建思路與過程。其中的更多細(xì)節(jié)大家可以在arXiv上搜索《Learning to Learn Relation for Important People Detection in Still Images》進(jìn)行查看。最后祝大家都能在各自的領(lǐng)域內(nèi)不斷進(jìn)步,實現(xiàn)自我價值,站上屬于自己的C位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    163

    文章

    4598

    瀏覽量

    122945
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49035

    瀏覽量

    249739
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122820

原文標(biāo)題:誰才是真正的C位,讓AI告訴你

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    樂橙亮相2025廣州建博會:用AI重新定義家庭安全與技術(shù)邊界

    在智能鎖邁入AI新時代的關(guān)鍵節(jié)點,才是真正的技術(shù)引領(lǐng)者?2025年廣州建博會,樂橙用一場“不炫技、重本質(zhì)”的深度展演給出了答案。智哪兒在現(xiàn)場了解到,在A區(qū)3.1-28展位,樂橙圍繞“
    的頭像 發(fā)表于 07-09 21:10 ?312次閱讀
    樂橙亮相2025廣州建博會:用<b class='flag-5'>AI</b>重新定義家庭安全與技術(shù)邊界

    淘寶 vs 京東電商 API 接口,才是數(shù)據(jù)王者?

    API進(jìn)行客觀比較,幫助您判斷才是真正的“數(shù)據(jù)王者”。 1.API功能覆蓋范圍 API的功能范圍決定了開發(fā)者能獲取的數(shù)據(jù)類型。淘寶API通過阿里巴巴開放平臺提供,覆蓋商品、訂單、用戶、物流等多個模塊。例如,商品API支持搜索、
    的頭像 發(fā)表于 07-08 15:51 ?189次閱讀
    淘寶 vs 京東電商 API 接口,<b class='flag-5'>誰</b><b class='flag-5'>才是</b>數(shù)據(jù)王者?

    日常設(shè)備真正的距離感知Bluetooth? Channel Sounding

    日常設(shè)備真正的距離感知Bluetooth? Channel Sounding
    的頭像 發(fā)表于 06-19 16:38 ?470次閱讀
    <b class='flag-5'>讓</b>日常設(shè)備<b class='flag-5'>真正</b>的距離感知Bluetooth? Channel Sounding

    聲紋解鎖個性化!啟明云端硅思物語AI平臺設(shè)備“認(rèn)準(zhǔn)的聲音”

    的設(shè)備能“聽聲識人”嗎?>小明對著設(shè)備問:“猜猜我是?”>設(shè)備秒答:“是啟明云端的程序員小明!”>換人提問,設(shè)備立刻回應(yīng):“是小美,小明的女朋友!”——這不是科幻電影,而是
    的頭像 發(fā)表于 06-17 18:02 ?462次閱讀
    聲紋解鎖個性化!啟明云端硅思物語<b class='flag-5'>AI</b>平臺<b class='flag-5'>讓</b>設(shè)備“認(rèn)準(zhǔn)<b class='flag-5'>你</b>的聲音”

    神眸引領(lǐng)AI智能視覺新范式,科技更有溫度

    AI能力矩陣,更是通過情感化交互與場景化服務(wù),用戶真正感受到科技帶來的溫暖陪伴。神眸以“云、網(wǎng)、邊、端、芯”全鏈路自研架構(gòu)為基石,從芯片級性能突破到云端智能服
    的頭像 發(fā)表于 05-23 13:24 ?427次閱讀
    神眸引領(lǐng)<b class='flag-5'>AI</b>智能視覺新范式,<b class='flag-5'>讓</b>科技更有溫度

    聯(lián)想,AI計算發(fā)生“鐘擺革命”

    AI基礎(chǔ)設(shè)施革新,智能化越過山丘
    的頭像 發(fā)表于 05-15 19:12 ?1443次閱讀
    聯(lián)想,<b class='flag-5'>讓</b><b class='flag-5'>AI</b>計算發(fā)生“鐘擺革命”

    失去工作不是因為AI,而是因為使用AI的人

    當(dāng)算法能精準(zhǔn)預(yù)測消費者需求時,當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時,當(dāng)自動化系統(tǒng)開始取代基礎(chǔ)決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握
    的頭像 發(fā)表于 05-13 12:05 ?249次閱讀
    <b class='flag-5'>你</b>失去工作不是因為<b class='flag-5'>AI</b>,而是因為使用<b class='flag-5'>AI</b>的人

    最討厭AI的人選了特朗普

    魔幻的“川普美國”,只是果,選了特朗普,才是
    的頭像 發(fā)表于 04-22 16:42 ?764次閱讀
    最討厭<b class='flag-5'>AI</b>的人選了特朗普

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會上,聯(lián)發(fā)科定義了“智能體化用戶體驗”的五大特征:主動及時、知懂你、互動協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個
    發(fā)表于 04-13 19:52

    利爾達(dá)AI豆系列C出道!快來Pick的智能新頂流

    //3月22日,由扣子Coze與火山引擎聯(lián)合主辦的“扣子AI工坊·硬件專場”在深圳、北京、杭州、成都四城圓滿落幕。利爾達(dá)作為Coze與火山引擎的重要合作伙伴受邀出席,不僅全面展示了最新推出的AI
    的頭像 發(fā)表于 03-28 16:43 ?577次閱讀
    利爾達(dá)<b class='flag-5'>AI</b>豆系列<b class='flag-5'>C</b><b class='flag-5'>位</b>出道!快來Pick<b class='flag-5'>你</b>的智能新頂流

    AnyDesk vs. Raspberry Pi Connect,才是“遠(yuǎn)程霸主”?

    在樹莓派的世界里,遠(yuǎn)程控制就像是一場魔法對決,而今天,我們的主角是兩遠(yuǎn)程控制界的“魔法師”——AnyDesk和RaspberryPiConnect。它們都聲稱自己是遠(yuǎn)程控制的最佳選擇,那么,才是
    的頭像 發(fā)表于 03-25 09:24 ?368次閱讀
    AnyDesk vs. Raspberry Pi Connect,<b class='flag-5'>誰</b><b class='flag-5'>才是</b>“遠(yuǎn)程霸主”?

    AI全能助手 三星Galaxy S25系列生活更高效便捷

    生成式AI技術(shù)為智能手機開啟全新的進(jìn)化路徑。如何更高效地管理行程,如何更快速地獲取信息,如何設(shè)備真正理解用戶的需求,成為廣大用戶對智能手機新的期待。三星Galaxy S25系列憑借全面升級
    的頭像 發(fā)表于 03-24 16:05 ?417次閱讀

    啟明智顯AI服務(wù)機器人解決方案:智能硬件方案的佼佼者

    啟明智顯AI服務(wù)機器人解決方案,以多模態(tài)感知+全棧AI能力,打造真正“會思考、能辦事”的服務(wù)伙伴,機器人在家用與商用場景中真正“活”起來!
    的頭像 發(fā)表于 03-11 17:15 ?740次閱讀
    啟明智顯<b class='flag-5'>AI</b>服務(wù)機器人解決方案:智能硬件方案的佼佼者

    【「AI Agent應(yīng)用與項目實戰(zhàn)」閱讀體驗】書籍介紹

    會追根溯源,有種“大徹大悟”的感覺。 這本書主要講大語言模型的內(nèi)容,教我們做一個AI Agent應(yīng)用出來,其實這個東西現(xiàn)在也叫智能體了,他跟我們平常使用大語言模型有個不同點在于他會專注某個領(lǐng)域
    發(fā)表于 03-05 20:40

    如何在STM32f4系列開發(fā)板上部署STM32Cube.AI

    已下載STM32Cube.AI擴展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經(jīng)過開發(fā)板處理器進(jìn)行AI模型處理識別過后,告訴我識別結(jié)果,顯示在TFL
    發(fā)表于 11-18 09:39