99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個(gè)SOTA!

CVer ? 來(lái)源:CVer ? 2024-01-30 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們近期的工作:3D視覺大模型Uni3D在ICLR 2024的評(píng)審中獲得了688分,被選為Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我們第一次將3D基礎(chǔ)模型成功scale up到了十億(1B)級(jí)別參數(shù)量,并使用一個(gè)模型在諸多3D下游應(yīng)用中取得SoTA結(jié)果。代碼和各個(gè)scale的模型(從6M-1B)均已開源,歡迎大家關(guān)注和使用:

論文:https://https://arxiv.org/pdf/2310.06773

代碼:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive的結(jié)果,但是在3D視覺中模型的scale up始終沒(méi)有成功。我們旨在將NLP/2D中scale up的成功復(fù)現(xiàn)到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在這項(xiàng)工作中,我們提出了一個(gè)3D基礎(chǔ)大模型Uni3D,直接將3D backbone統(tǒng)一為ViT(Vision Transformer),以此利用豐富和強(qiáng)大的2D預(yù)訓(xùn)練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓(xùn)練目標(biāo),通過(guò)學(xué)習(xí)三個(gè)模態(tài)的表征對(duì)齊(點(diǎn)云-圖像-文本)實(shí)現(xiàn)3D點(diǎn)云對(duì)圖像和文本的感知。同時(shí),通過(guò)使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓(xùn)練了從Tiny到giant的5個(gè)不同scale的Uni3D模型,成功地將Uni3D擴(kuò)展到10億級(jí)別參數(shù)。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的參數(shù)量和zero-shot分類結(jié)果

Uni3D在多個(gè)3D任務(wù)上達(dá)到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于學(xué)到了強(qiáng)大的多模態(tài)表征能力,Uni3D還能夠做一些有意思的應(yīng)用,如point cloud painting(點(diǎn)云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點(diǎn)云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D視覺
    +關(guān)注

    關(guān)注

    4

    文章

    452

    瀏覽量

    28246
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3141

    瀏覽量

    4064

原文標(biāo)題:ICLR 2024 | 高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個(gè)SOTA!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?5次下載

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢(shì),本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?1047次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研究?jī)r(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?468次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知<b class='flag-5'>模型</b>BIP<b class='flag-5'>3D</b>

    使用海爾曼太通/HellermannTyton 3D CAD 模型進(jìn)行快速高效的設(shè)計(jì)

    提供 3D 和 2D CAD 數(shù)據(jù),可供免費(fèi)下載。 直接嵌入三維設(shè)計(jì)環(huán)境的模型下載功能 在海爾曼太通官網(wǎng)上點(diǎn)擊【產(chǎn)品】選項(xiàng),工程師現(xiàn)在可以查看和下載眾多產(chǎn)品的 3D CAD
    發(fā)表于 03-14 16:55

    3D打印可以打印那種柔韌性好,能隨意變形的模型嗎?

    當(dāng)然可以! 一般來(lái)講,市面上常見的樹脂材料是比較脆的,一旦受力過(guò)大就很容易斷裂,因此不能隨意掰折或扭曲,這就導(dǎo)致很多人對(duì)3D打印的認(rèn)知還停留在它只能制造硬性模型。 但3D打印其實(shí)是可以打印出柔韌性好
    發(fā)表于 03-13 11:41

    SciChart 3D for WPF圖表庫(kù)

    DirectX 支持的 WPF 3D 圖表和廣泛的 API 完成工作。 WPF 3D 圖表性能 我們傳奇的 WPF 3D 圖表性能由廣泛的端到端性能優(yōu)化、不安全代碼、C++ 互操作、
    的頭像 發(fā)表于 01-23 13:49 ?621次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫(kù)

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    的AI技術(shù),能夠根據(jù)用戶提供的提示詞或圖片,直接生成高質(zhì)量的3D模型。這一功能極大地降低了3D內(nèi)容創(chuàng)作的門檻,使得即使是缺乏專業(yè)3D建模技能的用戶也能輕松創(chuàng)作出令人驚嘆的
    的頭像 發(fā)表于 01-23 10:33 ?594次閱讀

    高分子微納米功能復(fù)合材料3D打印加工介紹

    四川大學(xué)科學(xué)技術(shù)發(fā)展研究院最近公布了該??蒲袌F(tuán)隊(duì)的一項(xiàng)3D打印成果:高分子微納米功能復(fù)合材料實(shí)現(xiàn)規(guī)模化制備。據(jù)悉,功能復(fù)合材料3D打印成果由王琪、陳寧完成,目前處于實(shí)驗(yàn)室階段,已授權(quán)發(fā)明專利12件
    的頭像 發(fā)表于 01-22 11:13 ?574次閱讀
    <b class='flag-5'>高分</b>子微納米功能復(fù)合材料<b class='flag-5'>3D</b>打印加工介紹

    騰訊混元3D AI創(chuàng)作引擎正式上線

    或上傳一張圖片,該引擎便能迅速生成與之對(duì)應(yīng)的3D模型。這一功能極大地降低了3D內(nèi)容創(chuàng)作的門檻,使得更多用戶能夠輕松涉足這一領(lǐng)域。 除了基礎(chǔ)的3D模型
    的頭像 發(fā)表于 01-22 10:26 ?585次閱讀

    uvled光固化3d打印技術(shù)

    說(shuō)到UVLED光固化3D打印技術(shù),那可是當(dāng)下3D打印領(lǐng)域的一股清流啊!這項(xiàng)技術(shù)利用紫外線和光固化樹脂來(lái)制造3D打印模型,原理簡(jiǎn)單又高效。UVLED光固化
    的頭像 發(fā)表于 12-24 13:13 ?737次閱讀
    uvled光固化<b class='flag-5'>3d</b>打印技術(shù)

    透明塑料件噴粉3D掃描CAV全尺寸檢測(cè)逆向3D建模設(shè)計(jì)服務(wù)-CASAIM

    3D建模
    中科院廣州電子
    發(fā)布于 :2024年08月30日 10:04:53

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級(jí)分析工具

    安寶特3D Analyzer包含多種實(shí)用的3D CAD高級(jí)分析工具,包括自動(dòng)比對(duì)模型、碰撞檢測(cè)、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD
    的頭像 發(fā)表于 08-07 10:13 ?783次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級(jí)分析工具

    安寶特產(chǎn)品 3D Evolution : 基于特征實(shí)現(xiàn)無(wú)損CAD格式轉(zhuǎn)換

    安寶特3D Evolution具有強(qiáng)大的3D CAD模型轉(zhuǎn)換功能,可在保留模型特征參數(shù)、注釋、約束的前提下,完成不同格式3D CAD
    的頭像 發(fā)表于 08-06 17:26 ?643次閱讀
    安寶特產(chǎn)品   <b class='flag-5'>3D</b> Evolution : 基于特征實(shí)現(xiàn)無(wú)損CAD格式轉(zhuǎn)換

    廣東3D掃描鈑金件外觀尺寸測(cè)量3D偏差檢測(cè)對(duì)比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年07月22日 16:13:45

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    App。 騰訊元寶APP發(fā)布時(shí),就圍繞工作效率場(chǎng)景、日常生活等場(chǎng)景提供了豐富的應(yīng)用,并有創(chuàng)建個(gè)人智能體等個(gè)性化體驗(yàn),“3D角色夢(mèng)工廠”則將大模型生成技術(shù)和3D應(yīng)用結(jié)合,進(jìn)一步創(chuàng)新了元寶
    的頭像 發(fā)表于 07-18 11:39 ?1227次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b>生成應(yīng)用