99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多倫多大學(xué)&NVIDIA最新成果 圖像標注速度提升10倍

ml8z_IV_Technol ? 來源:fqj ? 2019-05-05 09:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖像標注速度提升10倍!

這是多倫多大學(xué)與英偉達聯(lián)合公布的一項最新研究:Curve-GCN的應(yīng)用結(jié)果。

Curve-GCN是一種高效交互式圖像標注方法,其性能優(yōu)于Polygon-RNN++。在自動模式下運行時間為29.3ms,在交互模式下運行時間為2.6ms,比Polygon-RNN ++分別快10倍和100倍。

數(shù)據(jù)標注是人工智能產(chǎn)業(yè)的基礎(chǔ),在機器的世界里,圖像與語音、視頻等一樣,是數(shù)據(jù)的一個種類。

對象實例分割是在圖像中概括給定類的所有對象的問題,這一任務(wù)在過去幾年受到了越來越多的關(guān)注,傳統(tǒng)標記工具通常需要人工先在圖片上點擊光標描記物體邊緣來進行標記。

然而,手動跟蹤對象邊界是一個費力的過程,每個對象大概需要30-60秒的時間。

為了緩解這個問題,已經(jīng)提出了許多交互式圖像分割技術(shù),其通過重要因素加速注釋。但是交互式分割方法大多是逐像素的(比如DEXTR),在顏色均勻的區(qū)域很難控制,所以最壞的情況下仍然需要很多點擊。

Polygon-RNN將humans-in-the-loop(人機回圈)過程進行構(gòu)架,在此過程中模型按順序預(yù)測多邊形的頂點。通過糾正錯誤的頂點,注釋器可以在發(fā)生錯誤時進行干預(yù)。該模型通過調(diào)整校正來繼續(xù)其預(yù)測。 Polygon-RNN顯示在人類協(xié)議水平上產(chǎn)生注釋,每個對象實例只需點擊幾下。這里最糟糕的情況是多邊形頂點的數(shù)量,大多數(shù)對象的范圍最多為30-40個點。

然而,模型的重復(fù)性將可擴展性限制為更復(fù)雜的形狀,導(dǎo)致更難的訓(xùn)練和更長的推理。此外,期望注釋器按順序糾正錯誤,這在實踐中通常是具有挑戰(zhàn)性的。

最新研究成果中,研究人員將對象注釋框架化為回歸問題,其中所有頂點的位置被同時預(yù)測。

在Curve-GCN中,注釋器會選擇一個對象,然后選擇多邊形或樣條輪廓。

Curve-GCN自動地勾勒出對象的輪廓

Curve-GCN允許交互式更正,并且可以自動重新預(yù)測多邊形/樣條

與Polygon-RNN + +相比:

Curve-GCN具有多邊形或樣條曲線參數(shù)

Curve-GCN可同時預(yù)測控制點(更快)

初始化預(yù)測

人工校正

模型校正

模型是在CityScapes數(shù)據(jù)集上訓(xùn)練的

自動模式下的比較。從左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自動模式。(上)cityscaps訓(xùn)練模型的開箱即用輸出,(下)使用來自新領(lǐng)域的10%的數(shù)據(jù)進行微調(diào)。

多倫多大學(xué)&NVIDIA最新成果 圖像標注速度提升10倍

多倫多大學(xué)&NVIDIA最新成果 圖像標注速度提升10倍

將Polygon和Spline-GCN與Polygon-RNN ++和PSP-DeepLab進行比較

模型在最先進的基礎(chǔ)上進行了改進,速度顯著加快,允許只具有局部效果的交互式更正,從而為注釋器提供了更多的控制。這將導(dǎo)致更好的整體注釋策略。

論文摘要

通過邊界跟蹤來手動標記對象是一個繁重的過程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架構(gòu)以循環(huán)方式產(chǎn)生多邊形注釋,允許通過humans-in-the-loop(人機回圈)的方式進行交互式校正。

我們提出了一個新的框架,通過使用圖形卷積網(wǎng)絡(luò)(GCN)同時預(yù)測所有頂點,減輕了Polygon-RNN的時序性。我們的模型是端到端訓(xùn)練的。它支持多邊形或樣條對對象進行標注,從而提高了基于線和曲線對象的標注效率。結(jié)果表明,在自動模式下,Curve-GCN的性能優(yōu)于現(xiàn)有的所有方法,包括功能強大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明顯高于Polygon-RNN++。我們的模型在自動模式下運行29.3ms,在交互模式下運行2.6ms,比Polygon-RNN ++分別快10倍和100倍。

多倫多大學(xué)&NVIDIA最新成果 圖像標注速度提升10倍

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91891
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249582
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93804

原文標題:多倫多大學(xué)&NVIDIA最新成果:圖像標注速度提升10倍!

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DeepSeek最新論文:訓(xùn)練速度提升9,推理速度快11!

    是上一代Grok2的15左右。在Benchmarks中,Grok3毫無懸念成功地領(lǐng)先Deepseek R1、o3 mini等對手。 ? 不過用如此大規(guī)模的算力集群,花費上一代15的計算資源投入,業(yè)界認為
    的頭像 發(fā)表于 02-20 11:25 ?2073次閱讀
    DeepSeek最新論文:訓(xùn)練<b class='flag-5'>速度</b><b class='flag-5'>提升</b>9<b class='flag-5'>倍</b>,推理<b class='flag-5'>速度</b>快11<b class='flag-5'>倍</b>!

    什么是自動駕駛數(shù)據(jù)標注?如何好做數(shù)據(jù)標注

    、精準且高效的數(shù)據(jù)標注流程顯得尤為關(guān)鍵。那什么是數(shù)據(jù)標注?如何做數(shù)據(jù)標注? 自動駕駛數(shù)據(jù)標注是指在自動駕駛系統(tǒng)所采集的感知數(shù)據(jù)(如攝像頭圖像
    的頭像 發(fā)表于 07-09 09:19 ?234次閱讀
    什么是自動駕駛數(shù)據(jù)<b class='flag-5'>標注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標注</b>?

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    前將 67 token / 秒 (TPS) 的速度提升至 253 TPS(提速 3.7 ),而目前這一速度已達 368 TPS(提速 5.5
    的頭像 發(fā)表于 07-02 19:31 ?1865次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    NVIDIA在ICRA 2025展示多項最新研究成果

    在亞特蘭大舉行的國際機器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?607次閱讀

    AI時代 圖像標注不要沒苦硬吃

    識別算法的性能提升依靠大量的圖像標注,傳統(tǒng)模式下,需要人工對同類型數(shù)據(jù)集進行一步步手動拉框,這個過程的痛苦只有做過的人才知道。越多素材的數(shù)據(jù)集對于算法的提升越有幫助,常規(guī)情況下,一個2
    的頭像 發(fā)表于 05-20 17:54 ?201次閱讀
    AI時代   <b class='flag-5'>圖像</b><b class='flag-5'>標注</b>不要沒苦硬吃

    意法半導(dǎo)體收購多倫多初創(chuàng)公司Deeplite,助力邊緣AI技術(shù)發(fā)展!

    近日,意法半導(dǎo)體(STMicroelectronics,簡稱ST)宣布已成功收購加拿大多倫多的初創(chuàng)公司Deeplite。這一戰(zhàn)略性收購旨在加強意法半導(dǎo)體在邊緣人工智能(AI)技術(shù)領(lǐng)域的布局,并將
    的頭像 發(fā)表于 04-28 11:28 ?509次閱讀
    意法半導(dǎo)體收購<b class='flag-5'>多倫多</b>初創(chuàng)公司Deeplite,助力邊緣AI技術(shù)發(fā)展!

    大模型預(yù)標注和自動化標注在OCR標注場景的應(yīng)用

    OCR,即光學(xué)字符識別,簡單來說就是利用光學(xué)設(shè)備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學(xué)字符識別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標注
    的頭像 發(fā)表于 04-15 15:18 ?378次閱讀

    開源軟件的價值解讀 哈佛商學(xué)院和多倫多大學(xué)聯(lián)合撰寫

    “ ?周末分享一篇關(guān)于開源軟件價值的論文,由哈佛商學(xué)院和多倫多大學(xué)聯(lián)合撰寫,量化地闡述了開源軟件對經(jīng)濟及企業(yè)的影響。? ” 原文在這里,大家有時間可以仔細閱讀: https
    的頭像 發(fā)表于 03-24 11:11 ?416次閱讀

    自動化標注技術(shù)推動AI數(shù)據(jù)訓(xùn)練革新

    標貝自動化數(shù)據(jù)標注平臺在全棧數(shù)據(jù)標注場景式中搭載了大模型預(yù)標注和自動化標注能力,并應(yīng)用于3D點云、2D圖像、音頻、文本等數(shù)據(jù)場景的大規(guī)模、復(fù)
    的頭像 發(fā)表于 03-14 16:46 ?678次閱讀

    NVIDIA技術(shù)助力Pantheon Lab數(shù)字人實時交互解決方案

    、NVIDIA Triton,Pantheon Lab 訓(xùn)練速度提高 10 、推理延遲降低 50%,以及用戶參與度提升 30%。這些進步使
    的頭像 發(fā)表于 01-14 11:19 ?630次閱讀

    AI自動圖像標注工具SpeedDP將是數(shù)據(jù)標注行業(yè)發(fā)展的重要引擎

    AI大浪潮下,許多企業(yè)都在不斷借助AI來提升自己的行業(yè)競爭力,數(shù)據(jù)標注企業(yè)也不例外,傳統(tǒng)人工標注效率不足的弊端困擾了多年,如今新的“引擎”就在眼前,他們當(dāng)然不會放過這個機會。針對這樣的需求,慧視光電
    的頭像 發(fā)表于 01-02 17:53 ?811次閱讀
    AI自動<b class='flag-5'>圖像</b><b class='flag-5'>標注</b>工具SpeedDP將是數(shù)據(jù)<b class='flag-5'>標注</b>行業(yè)發(fā)展的重要引擎

    盤點NVIDIA 2024年的創(chuàng)新成果

    在2024年,AI 的影響力已經(jīng)擴展到加速計算和數(shù)據(jù)科學(xué)等多個關(guān)鍵領(lǐng)域,成為驅(qū)動各行各業(yè)技術(shù)革新和產(chǎn)業(yè)升級的關(guān)鍵因素。在這一年里,NVIDIA 又帶來了哪些創(chuàng)新成果,實現(xiàn)了哪些突破?跟隨本文一起盤點 NVIDIA 2024 年重
    的頭像 發(fā)表于 01-02 14:32 ?682次閱讀

    標貝數(shù)據(jù)標注在智能駕駛訓(xùn)練中的落地案例

    標貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點云標注以及3D&amp;2D融合等標注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標注
    的頭像 發(fā)表于 12-24 15:17 ?1578次閱讀
    標貝數(shù)據(jù)<b class='flag-5'>標注</b>在智能駕駛訓(xùn)練中的落地案例

    NVIDIA Research在ECCV 2024上展示多項創(chuàng)新成果

    在米蘭舉行的歐洲計算機視覺國際會議 (ECCV) 上,NVIDIA Research 展示了多項突破性的創(chuàng)新成果,共發(fā)表了 14 篇論文。
    的頭像 發(fā)表于 11-19 15:07 ?771次閱讀

    極端數(shù)據(jù)采集引領(lǐng)計算機視覺應(yīng)用新篇章

    多倫多大學(xué)的計算成像研究人員用他們獨特的相機捕捉到了奇怪的信號。多倫多計算機成像小組在實驗室中使用單光子雪崩二極管 (SPAD) 相機檢測到無法解釋的 80 千赫 (kHz) 閃爍。 他們利用強大
    的頭像 發(fā)表于 11-18 10:56 ?546次閱讀