如何去使用深度學習的model SLAM位姿估計的自訓練方法

一、背景

Object-based SLAM: SLAM就是機器人同步定位與建圖，通過一些傳感器的測量數(shù)據(jù)同時去建立環(huán)境的地圖，且利用這個地圖對于機器人的狀態(tài)進行估計，機器人的狀態(tài)包括機器人的位姿、速度和機器人的參數(shù)，比如內(nèi)參。環(huán)境地圖包括比如點的位置，線的位置，面的位置。常見的SLAM系統(tǒng)由前端和后端組成，如圖1所示，前端一般從一些原始的傳感器數(shù)據(jù)中采集一些特征，后端利用概率的推斷模型對采集的模型進行融合生成全局一致的環(huán)境地圖。

圖1 SLAM結(jié)構(gòu)

要知道環(huán)境中有哪些物體，就需要進行物體級SLAM，簡單而言就是以物體為目標的SLAM系統(tǒng)，對物體和機器人的狀態(tài)進行估計，如圖2所示。一個是對空間中的幾何體加上語義信息，對下游的任務有作用，另一個是非常節(jié)省存儲空間的表示。如果用稠密點云就需要用很多的存儲空間，但是基于物體級的SLAM形成的表示是非常輕量化的描述。

圖2 物體級SLAM

如何做Object SLAM? 和廣泛SLAM類似，首先要在原始的測量數(shù)據(jù)中提取特征，使用物體的感知模型，包括二維的目標檢測，也包括實例分割。今天涉及的是六自由度物體估計目標檢測，后端也是用概率推斷模型對于多幀進行融合生成全局一致的地圖。圖3列舉了一些目標SLAM的文章和方法。

圖3 相關(guān)SLAM方法和文章

為什么object SLAM是比較困難的問題？因為有一些廣泛的SLAM具有的挑戰(zhàn)，也面臨一些新的挑戰(zhàn)。廣泛的challenge包括ambiguous data assosiation的問題，比如在一個停車場檢測到一輛車，那么怎么把真的觀測和地圖里面的進行關(guān)聯(lián)，那么哪一輛車是當前被觀測的車呢？另外一個問題就是動態(tài)的問題，比如有一個車在行進，如何判斷這輛車是在行進，如何防止這個行進的車對相機跟蹤產(chǎn)生影響，然后如何根據(jù)這個車的行進去不斷地更新地圖，這些問題是比較難解決的。新的挑戰(zhàn)主要是源于引入了object perception model，這兩個模型結(jié)合的過程中就會產(chǎn)生一些information瓶頸，比如在deep learning model做出一些預測的時候，很難對不確定性進行量化，很難知道預測是好是壞。在這種情況下如何去使用深度學習的model，如何給觀測賦權(quán)重是一個比較困難的問題。

另外，一個比較重要的在object SLAM領(lǐng)域中的問題就是domain gap問題，在新的環(huán)境中會有性能下降的問題。就是在訓練perception model的時候，一般在特定環(huán)境中采取數(shù)據(jù)，給數(shù)據(jù)添加標注，用這些標注的數(shù)據(jù)訓練網(wǎng)絡。但當使用或測試這個網(wǎng)絡時，往往在一個新環(huán)境中測試，訓練和測試環(huán)境之間很可能有一些區(qū)別，比如光照的不同，背景的不同，噪聲情況的不同，這個差異會使測試數(shù)據(jù)和訓練數(shù)據(jù)造成分布不匹配的問題，這個問題就是一個domain gap的問題。還會導致perception model性能下降的問題。合成數(shù)據(jù)在真實情況中使用時，它的效果會大打折扣。希望能夠做到的表現(xiàn)是機器人在探索不同環(huán)境的時候，能夠自動的適應當前的環(huán)境，把它的perception model調(diào)整到比較好的性能狀態(tài)。這里對于object SLAM的介紹告一段落，如果感興趣可以在面4的主頁中關(guān)注。

圖4 主頁

二、方法介紹

什么是6自由度物體位姿估計？如圖5所示，圖片中有物體，然后通過模型計算物體相對于相機的位姿，這個位姿包括3自由度的旋轉(zhuǎn)和3自由度的平移，所以稱它為6自由度的物體位姿估計。具有代表性的工作，比如說CNN和今天會涉及到的方法。

圖5 6自由度的物體位姿估計

今天要探討的不是如何去設(shè)計一個更好的6自由度位姿估計，而是在真實場景中的表現(xiàn)如何，把它從文章中拿出來，和其他的位姿模型在同樣的benchmark中進行對比它們的表現(xiàn)最終如何。 BOP方法進行6自由度位姿估計，然后這個benchmark它的目標就是這樣的表現(xiàn)，模型對應的物體是剛性物體，它們的輸入是RGB和RGBD的圖像。BOP challenge根據(jù)指標對不同的model進行打分，然后分數(shù)比較高的就可以獲得獎項，每年的會議上都有BOP challenge的workshop，介紹如圖6所示。

圖6 BOP六維物體位姿估計 BOP challenge在2019年的結(jié)果，在這一年有很多方法在一些task上去競爭，表1列舉了不同方法的性能比較，按照性能從高到低排列?？梢钥吹竭@一年的經(jīng)典方法就是基于這種特征的方法是由于基于深度學習方法的。表1 BOP challenge性能比較

針對上面的問題給出解釋，首先缺乏在真實世界中訓練的圖片，還有真實的測試圖片和通常使用的合成的訓練圖片之間有比較大的domain gap。這兩個原因?qū)儆谝粋€問題，就是缺少在真實環(huán)境或者測試環(huán)境中帶有6自由度物體標注的數(shù)據(jù)。為了解決這個問題，有哪些方案呢？一種解決方案就是去提高合成數(shù)據(jù)的真實性，生成更加成熟的數(shù)據(jù)，另一種方案是可以利用test devirament沒有標注的數(shù)據(jù)去提高表現(xiàn)。需要用到文章使用的self-training。Semi-supervised learning結(jié)合一些帶有標簽和數(shù)據(jù)和不帶有標簽的數(shù)據(jù)去提高模型的預測性能。為什么這樣的事情能夠成功呢？

為什么能夠用不帶有標簽的數(shù)據(jù)去提高性能呢？因為不帶標簽的數(shù)據(jù)上往往攜帶了對于預測的task有用的一些信息。比如霧天的數(shù)據(jù)是不帶標簽的數(shù)據(jù)的話，那它就攜帶了這種background的信息，這樣的信息有可能被提出的semi-supervised learning的方法學習到，提高模型的表現(xiàn)。不幸的是，Semi-supervised learning大部分的方法都沒有對于收斂的一個保證，很可能越去訓練它這個模型的表現(xiàn)越差，因為預報的一些錯誤的在這個訓練過程中會不斷的加強自身導致的。

什么是self-training？ self-training是比較早期的方法，用學習模型的預測去提高模型預測的能力。圖7是具體的流程圖，首先從一些帶有標簽的數(shù)據(jù)開始去訓練Deep CNN model，然后用模型在不帶標簽的數(shù)據(jù)上預測，再把這些預測當做新的標簽，這些標簽就叫做偽標簽，并不是真實的標簽，是模型的預測。這些偽標簽可能會有好有壞，為了選出好的偽標簽，需要使用selection algorithm選出里面高質(zhì)量的label形成一些帶有偽標簽的數(shù)據(jù)。把這些帶有偽標簽的數(shù)據(jù)和原始的帶有真實標簽的預訓練的數(shù)據(jù)結(jié)合在一起，微調(diào)或重新訓練網(wǎng)絡。可以看到，整個流程圖中比較重要的一環(huán)就是選擇算法，如果通過這個算法能夠成功的選擇出高質(zhì)量的數(shù)據(jù)的話，就可以提高性能表現(xiàn)，反之可能會降低性能表現(xiàn)。

圖7 self-training流程圖對于文章SLAM-supported self-training for 6D object pose estimation，首先是一些動機，為什么要做6自由度物體的位姿估計，因為它可以給出這些環(huán)境中的幾何和語義的信息，如圖8所示。

圖8 環(huán)境的幾何和語義信息

在一個環(huán)境中訓練，在另外一個環(huán)境中測試，就會存在domain gap問題。這個問題的表現(xiàn)展示了一個video可視化問題，在合成數(shù)據(jù)上訓練，有了真實數(shù)據(jù)再測試，可以看到它很難對這些物體進行正確的預測。那么如何去解決這樣的問題呢？一種最簡單的方式就是在測試數(shù)據(jù)中采集一些數(shù)據(jù)，給這些數(shù)據(jù)加上物體位姿的標注，然后微調(diào)6自由度位姿估計器。

但是，整個6自由度物體位姿標注的過程非常費時費力，更重要的一點是希望機器人在探索不同環(huán)境的時候是不被打斷的，假如機器人進入到新的環(huán)境，還要去標注這個新環(huán)境的數(shù)據(jù)，那它對機器人的自主運行就是一個很不利的事情。所以希望做的就是機器人能夠自己去給它采集到的數(shù)據(jù)進行標注，做一個self label。

圖9 domain gap問題

應運而生，有一些方法來解決問題，一般用合成帶有標簽的數(shù)據(jù)和一些真實不帶標簽的數(shù)據(jù)一起去提高位姿估計的性能。如圖10所示，它們可以分為single-view methods和Multi-view methods，前者輸入的數(shù)據(jù)是無序的，但是一般機器人采集的數(shù)據(jù)都是按照一定的次序采集的，會有時間和空間上的連續(xù)性。single-view不能利用連續(xù)性，于是利用Multi-view方法，融合不同視角對于物體位姿的估計來形成更加可靠的對于物體的理解，用這個更加可靠的位姿對一些數(shù)據(jù)做標注，再微調(diào)，但大部分需要高精度相機的運動信息。

圖10 single-view方法和multi-view方法

于是，提出了一種用SLAM來支持的方法，通過機器人采集的數(shù)據(jù)把它放到一個這種魯棒的物體級SLAM的系統(tǒng)里面，然后生成一個全局一致的，包括相機的位姿和物體的位姿，然后生成一些偽標簽，利用一致性的標簽作為新的訓練數(shù)據(jù)去微調(diào)位姿估計模型，如圖11所示。

圖11 SLAM支持的方法

方法的流程圖如圖12所示，從帶有標簽的圖片數(shù)據(jù)入手，預訓練一個6D的物體位姿估計器，把這個估計器放在機器人上，在行進過程中對物體的位姿進行估計，然后聯(lián)合物體的位姿估計和機器人的里程計形成位姿圖。用提出的一些魯棒的優(yōu)化方法求解SLAM估計，包括機器人的位姿和物體的位姿，從這些模型所預測的物體位姿和優(yōu)化的位姿物體之中選出比較高質(zhì)量的物體位姿作為偽標簽，把它和原始的帶有真實標簽的數(shù)據(jù)進行融合。整個流程圖和self-training是一樣的過程，從宏觀上來看，方法左半邊是在做一個魯棒的狀態(tài)估計，形成全局一致的場景地圖，右半邊實際上是在用semi-supervised learning提高物體位姿估計的性能，方法結(jié)合了兩方面的一個成果。

圖12 方法流程圖

如何進行魯棒的位姿圖優(yōu)化來得到比較可靠的SLAM估計？提出了一種自動協(xié)方差調(diào)整的位姿圖優(yōu)化，這里如果展開講可能需要很長時間，在這邊只做一個比較宏觀的介紹。如果大家有興趣，可以去文章中的相關(guān)章節(jié)看到比較細節(jié)的公式推導。首先要考慮為什么要做這樣一個自動協(xié)方差的調(diào)整，一般在做位姿圖估計的過程中會假設(shè)觀測是符合高斯分布的，這樣就能把問題轉(zhuǎn)換為一個非線性最小二乘問題去求解，為了指定這樣的高斯分布，需要兩個量，一個是期望，一個是方差，對于高維的高斯分布需要一個期望和一個協(xié)方差矩陣。

期望很好得到，可以通過SLAM估計還有測量模型計算每個測量的期望值，但協(xié)方差一般都是經(jīng)驗性的給出一個值，在實際中根據(jù)對于傳感器噪聲大小的一個理解去制定這樣的協(xié)方差值，比如傳感器的噪聲比較大，給一個比較大的協(xié)方差矩陣，反之給一個比較小的協(xié)方差矩陣。現(xiàn)在對于物體位姿的估計都是從深度學習模型得到的，也就是說傳感器變成了模型，對噪聲沒有非?？煽康睦斫猓A測沒有辦法很好的量化。

在這種情況下，如何指定協(xié)方差矩陣？提出的方案是不指定協(xié)方差矩陣，把協(xié)方差矩陣和SLAM的變量進行聯(lián)合優(yōu)化，如圖13所示，在公式里展示。第一項代表物體位姿的損失值，最后一項是機器人里程計的損失值，第一項是正則化項，目的是防止值跑到正無窮，像零這個方向去正則化。求解聯(lián)合優(yōu)化的問題是用的alternating minimization方法，這個方法有兩個優(yōu)勢，第一個優(yōu)勢是對最優(yōu)的協(xié)方差矩陣有一個解析解，第二個好處是可以在分量級別對協(xié)方差矩陣進行擬合。得到位姿預測時，對六個自由度的分量進行不同程度的擬合，與傳統(tǒng)方法相比更加靈活，也能夠擬合更廣泛的噪聲模型。

圖13 自動協(xié)方差調(diào)整公式推導

如圖14所示是hybrid pseudo-labeling方法，在兩種位姿中選取高質(zhì)量的偽標簽。

圖14 hybrid pseudo-labeling方法

如圖15所示，Hybrid model利用了兩種數(shù)據(jù)，一種數(shù)據(jù)是模型直接在圖片上預測的物體位姿，另一種是通過優(yōu)化得到的物體位姿，為了對位姿進行好壞的評估，有兩種評估方法，一種利用幾何信息，另一種利用視覺信息，幾何信息使用卡方測試，預測的物體位姿是否和優(yōu)化的物體位姿有顯著的差異，如果有顯著差異可能是比較差的位姿估計，反之是比較好的位姿估計。視覺檢查根據(jù)物體位姿估計生成一個渲染圖片，把渲染物體和真實物體對比，轉(zhuǎn)換到特征空間，在特征空間上的向量看它們是不是相似。經(jīng)過這兩個check，就能得到比較高質(zhì)量的位姿標簽數(shù)據(jù)。

圖15 Hybrid model 提出方法的結(jié)果

如圖16所示，在兩個數(shù)據(jù)集上進行實驗，并測試方法。第一個數(shù)據(jù)集是一個公開數(shù)據(jù)集，叫做YCB video experiment。首先用一些合成數(shù)據(jù)去預訓練，然后拿到模型上進行self-training。值得強調(diào)的是，在進行self-training時，不去使用這些label標注，完全通過self-training生成標注，最后一步就是把self-training后的放在上面去評估表現(xiàn)。Video展示的是它們在測試集的表現(xiàn)，就是在self-training之前和之后進行的對比，可以看到self-training后性能更加穩(wěn)定，能夠檢測出更多物體，也有更少離群的位姿估計。

圖16 提出方法的結(jié)果

如圖17所示，第二個實驗是在真實車上面做的實驗，把相機放在機器人上，圍繞物體進行導航。做真實機器人實驗的目的就是為了測試方法對于挑戰(zhàn)的可行性，提出方法在運動模糊等情況下依然可以得到比較好的性能，比較多的提高訓練后的表現(xiàn)，離群值很少。

圖17 真實車實驗

三、總結(jié)和未來展望

提出的方法是魯棒性SLAM所支持的6自由度物體位姿估計的自訓練方法，目的是希望做優(yōu)化，方法能夠適應新的環(huán)境。最重要的一環(huán)是提出的自動協(xié)方差調(diào)整的位姿圖優(yōu)化方法，最后通過實驗驗證了方法的表現(xiàn)。如圖18所示，右上角有文章和代碼的鏈接，感興趣可以去看一下。

?最后就是如何去延伸工作，首先可以給系統(tǒng)加入對動態(tài)物體的處理，如何考慮它的影響，或者某些物體有對稱性的物體位姿如何處理，以及魯棒性的半監(jiān)督學習，還有很多更新的方法進一步提高表現(xiàn)，最后可以把對于物體級別的性能提升擴展到對于物體位姿形狀和類別進行估計，用更加可靠的結(jié)果訓練，然后估計。當然可以很多其他的方面，由于時間的分享，討論告一段落。

四、問題：

1.深度學習對于堆疊物體位姿估計有什么建議嗎？可以看一些對于這塊研究的設(shè)計方法的文章，如果對這塊理解的不是特別深入，也可以看一下深藍學院的相關(guān)課程。

2.在利用深度學習的方法進行6自由度物體位姿估計時，如果要建立RGBD數(shù)據(jù)集的話，有什么好的方法推薦嗎？我的理解是如何選擇采集到的RGBD圖片對不對，可以在網(wǎng)上找一些圖，然后放在tool中進行學習產(chǎn)生標注?？梢允褂脙?yōu)化方法只采用標注關(guān)鍵幀的方法，利用優(yōu)化進行復制，有效快速的標注。

3.得到偽標簽以后，再訓練網(wǎng)絡是不是需要離線進行？這樣SLAM是否就要停下了？是的，這個說法是正確的，采集到偽標簽數(shù)據(jù)時，需要訓練位姿估計的模型，需要較長的時間，當前大多數(shù)模型都需要較長時間，如果未來有更好的方法在短時間內(nèi)進行訓練，也希望可以在線進行。

4.實驗小車的處理器什么配置？方法實現(xiàn)在線實時嗎？在實驗中采取的小車是jerk robot，只是去用它作為一個相機支架圍繞物體變成目標，如果要了解的話可以了解這個機器人的內(nèi)部構(gòu)造。

5.實現(xiàn)的方法是單目還是rgbd的？方法是單目的。

6.如果SLAM需要停止的話，那么SLAM的作用不就相當于收集數(shù)據(jù)集嗎？是的，這個方法的提出自動收集數(shù)據(jù)集的過程，可能傳到云端，有服務的話可以很快的訓練，也就不需要停止很久。

7.最后檢測的物體仍然是預訓練里面已有的物體嗎？是的。

8.即使不使用SLAM，手動收集數(shù)據(jù)集也可以，另外方法對SLAM的過程有哪些提高？手動收集是可以的，但大部分都是在公開數(shù)據(jù)集中進行分析，然后對它進行使用。它的問題在于在真實環(huán)境中對機器人環(huán)境探索，很難有人一直跟著機器人，希望機器人自主做label的。提高主要是自動的產(chǎn)生標簽，可以用這個過程優(yōu)化協(xié)方差模型。

編輯：黃飛

閱讀全文

SLAM(31569) SLAM(31569)
深度學習(119798) 深度學習(119798)

如何才能高效地進行深度學習模型訓練？

分布式深度學習框架中，包括數(shù)據(jù)/模型切分、本地單機優(yōu)化算法訓練、通信機制、和數(shù)據(jù)/模型聚合等模塊?，F(xiàn)有的算法一般采用隨機置亂切分的數(shù)據(jù)分配方式，隨機優(yōu)化算法（例如隨機梯度法）的本地訓練算法，同步或者異步通信機制，以及參數(shù)平均的模型聚合方式。

2018-07-09 08:48:22

13609

基于深度學習的三維點云配準方法

基于深度學習的三維點云配準方法成為研究的主流，并隨之誕生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

深入分析深度學習三維重建的網(wǎng)絡架構(gòu)和訓練技巧

本文章專注于從RGB圖像估計三維物體形狀的深度學習方法。除此之外我們還回顧了關(guān)于特定物體（如人臉）的近期研究。

2023-03-10 10:20:45

609

2017全國深度學習技術(shù)應用大會

學習的手寫文字識別新方法，介紹面向文字識別的DropSample、DropSegment等深度學習訓練技術(shù)，并展示我們基于深度學習的幾個應用演示系統(tǒng)，包括在線大類別文字識別、人臉美麗顏值打分、面向特定

2017-03-22 17:16:00

SLAM大法之回環(huán)檢測

主動式的閉環(huán)檢測。當發(fā)現(xiàn)了新的閉環(huán)信息后，SLAM 3.0使用Bundle Adjuestment(BA)等算法對原先的位姿拓撲地圖進行修正（即進行圖優(yōu)化），從而能有效的進行閉環(huán)后地圖的修正，實現(xiàn)更加

2019-03-06 15:38:04

SLAM技術(shù)的應用及發(fā)展現(xiàn)狀

結(jié)合激光雷達或者攝像頭的方法，讓掃地機可以高效繪制室內(nèi)地圖，智能分析和規(guī)劃掃地環(huán)境，成功讓自己步入了智能導航的陣列。除了掃地機之外，SLAM技術(shù)在其他服務機器人（例如商場導購機器人、銀行機器人

2018-12-06 10:25:32

深度學習與數(shù)據(jù)挖掘的關(guān)系

;而深度學習使用獨立的層、連接，還有數(shù)據(jù)傳播方向，比如最近大火的卷積神經(jīng)網(wǎng)絡是第一個真正多層結(jié)構(gòu)學習算法，它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓練性能，讓機器認知過程逐層進行，逐步抽象，從而大幅度提升

2018-07-04 16:07:53

深度學習中過擬合/欠擬合的問題及解決方案

的數(shù)據(jù)可以對未來的數(shù)據(jù)進行推測與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經(jīng)產(chǎn)生的數(shù)據(jù)去訓練，然后使用該模型去擬合未來的數(shù)據(jù)。在我們機器學習和深度學習的訓練過程中，經(jīng)常會出現(xiàn)過擬合和欠擬合的現(xiàn)象。訓練一開始，模型通常會欠擬合，所以會對模型進行優(yōu)化，然而等到訓練到一定程度的時候，就需要解決過擬合的問題了。

2021-01-28 06:57:47

深度學習介紹

在未來的某個時候，人們必定能夠相對自如地運用人工智能，安全地駕車出行。這個時刻何時到來我無法預見；但我相信，彼時“智能”會顯現(xiàn)出更“切實”的意義。與此同時，通過深度學習方法，人工智能的實際應用能夠在

2022-11-11 07:55:50

深度學習入門之中根據(jù)源代碼下載到mnist數(shù)據(jù)集,訓練識別率超級低問題

深度學習入門中根據(jù)源代碼下載到mnist數(shù)據(jù)集,訓練識別率超級低問題

2020-07-08 16:53:17

深度學習在醫(yī)學圖像分割與病變識別中的應用實戰(zhàn)

等方面具有重要意義。本文將介紹這一領(lǐng)域的背景、挑戰(zhàn)，以及通過一個代碼實例展示如何利用深度學習方法進行醫(yī)學圖像分割與病變識別。背景與挑戰(zhàn)醫(yī)學圖像分割是將醫(yī)學影像中的結(jié)構(gòu)區(qū)域分離出來，以便醫(yī)生能夠更清晰

2023-09-04 11:11:23

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習技術(shù)的開發(fā)與應用

時間安排大綱具體內(nèi)容實操案例三天關(guān)鍵點1.強化學習的發(fā)展歷程2.馬爾可夫決策過程3.動態(tài)規(guī)劃4.無模型預測學習5.無模型控制學習6.價值函數(shù)逼近7.策略梯度方法8.深度強化學習-DQN算法系列9.

2022-04-21 14:57:39

深度學習模型是如何創(chuàng)建的？

到準備模型，然后再在邊緣的嵌入式系統(tǒng)上運行。訓練深度學習模型是過程的工作量和時間密集型部分，其中通過提供需要時間和

2021-10-27 06:34:15

AGV激光雷達SLAM定位導航技術(shù)

地實現(xiàn)多AGV小車的協(xié)調(diào)控制?！　　黾す饫走_在AGV小車中的使用　　SLAM中可以進行環(huán)境信息感知的主要傳感器有激光雷達、攝像頭等。其中，基于激光雷達的AGV小車自主定位與建圖的方法，由于其測量精度高

2018-11-09 15:59:01

AI工程師 10 個深度學習方法

學到了大量關(guān)于深度學習的相關(guān)知識。在這里，我想分享人工智能工程師 10 個用于解決機器學習問題的強大的深度學習方法。但是，我們首先需要定義什么是深度學習。如何定義深度學習是很多人面臨的一個挑戰(zhàn)，因為它

2019-03-07 20:17:28

AlphaGo為何精通圍棋？圍棋論文曝光【中文翻譯】-原來它是這樣深度學習和思考的，難怪老贏！

算法實現(xiàn)。這些深度神經(jīng)網(wǎng)絡創(chuàng)造性的通過合并了監(jiān)督式學習（通過人類專家棋手的棋譜學習）和強化式學習（通過自我對弈的方式）來訓練。沒有任何的超前搜索，這些神經(jīng)網(wǎng)絡已經(jīng)通過自我對弈的方式模擬成千上萬的對局并使

2017-06-06 18:25:55

Gaudi Training系統(tǒng)介紹

，這就轉(zhuǎn)化為對訓練系統(tǒng)高效擴展的日益增長的需求。典型的深度學習訓練算法包括多種類型的算子，這些算子加起來要進行數(shù)十億次運算。這些大量的操作可以通過使用先進GPU提供的固有并行處理來加速。然而，GPU主要

2023-08-04 06:48:48

LabVIEW自帶深度學習，凍結(jié)Tensorflow完成深度學習。資料下載

本帖最后由 wcl86 于 2021-5-14 15:26 編輯概述這個例子演示了在Vision開發(fā)模塊中使用Model Importer API來使用深度學習為缺陷檢查應用程序執(zhí)行對象檢測

2020-07-29 17:41:31

Nanopi深度學習之路(1)深度學習框架分析

著手，使用Nanopi2部署已訓練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應用，會在復雜的深度學習歷程中有些成就感。目前已有幾十種流行的深度學習算法庫，參考網(wǎng)址：https

2018-06-04 22:32:12

gensim增量訓練方法

使用gensim訓練詞向量

2019-07-31 14:12:54

labview深度學習應用于缺陷檢測

標注產(chǎn)品后通過訓練平臺完成模型訓練經(jīng)過少量樣品訓練得到測試結(jié)果，表明深度學習對傳統(tǒng)視覺算法比較棘手的缺陷檢測方面，能簡單粗暴的解決問題，后續(xù)就是增加缺陷樣品的收集，標注，以及模型的訓練。龍哥手把手教

2020-08-16 18:12:01

labview實現(xiàn)深度學習，還在用python？

如何使用labview實現(xiàn)深度學習應用。ok樣本ng樣本這些圖片的特征是：ok與ok，ng與ng之間都有差異，傳統(tǒng)的方法要實現(xiàn)，就需要復雜的算法編程實現(xiàn)，如果用深度學習，則非常簡單。1.準備好樣本庫

2020-07-23 20:33:10

　　華為云深度學習服務，讓企業(yè)智能從此不求人

　　近日，華為云發(fā)布了深度學習服務，要讓企業(yè)智能從此不求人。那么企業(yè)云的深度學習服務有哪些能力，為什么能夠做到讓企業(yè)智能從此不求人呢?！　　　』睘楹啞獰o需編程，自動訓練企業(yè)業(yè)務模型　　　　企業(yè)進行

2018-08-02 20:44:09

【NanoPi K1 Plus試用體驗】深度學習---快速開始函數(shù)式（Functional）

今天開始繼續(xù)研究深度學習keras的模型Functional。起初將Functional一詞譯作泛型，想要表達該類模型能夠表達任意張量映射的含義，但表達的不是很精確，在Keras 2里我們將這個詞改

2018-07-23 11:15:51

【NanoPi K1 Plus試用體驗】深度學習---快速開始序貫（Sequential）模型

.add(Dense(32, input_shape=(784,)))model.add(Activation('relu'))在訓練模型之前，我們需要通過compile來對學習過程進行配置。開始訓練，Keras以

2018-07-20 15:55:35

【詳解】FPGA：深度學習的未來？

的model zoo庫，也很容易用預先訓練好的模型進行試驗。4.2. 增加訓練自由度有人或許以為訓練機器學習算法的過程是完全自動的，實際上有一些超參數(shù)需要調(diào)整。對于深度學習尤為如此，模型在參數(shù)量上的復雜

2018-08-13 09:33:30

什么是深度學習？使用FPGA進行深度學習的好處？

，即使使用具有一定低位寬的數(shù)據(jù)，深度學習推理也不會降低最終精度。目前據(jù)說8位左右可以提供穩(wěn)定的準確率，但最新的研究表明，已經(jīng)出現(xiàn)了即使降低到4位或2位也能獲得很好準確率的模型和學習方法，越來越多的正在

2023-02-17 16:56:59

優(yōu)化神經(jīng)網(wǎng)絡訓練方法有哪些？

優(yōu)化神經(jīng)網(wǎng)絡訓練方法有哪些？

2022-09-06 09:52:36

全網(wǎng)唯一一套labview深度學習教程：tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程

，labview訓練和調(diào)用的編程方法，還講解了大量的案例，手把手幫助學員學會如何在labview中應用深度學習6、課程贈送相關(guān)工業(yè)圖像數(shù)據(jù)集，其價值遠遠大于課程本身。2、用戶購買后，將會獲得哪些收益？1

2020-08-10 10:38:12

基于深度學習的異常檢測的研究方法

ABSTRACT1.基于深度學習的異常檢測的研究方法進行結(jié)構(gòu)化和全面的概述2.回顧這些方法在各個領(lǐng)域這個中的應用情況，并評估他們的有效性。3.根據(jù)基本假設(shè)和采用的方法將最先進的深度異常檢測技術(shù)分為

2021-07-12 06:36:22

基于深度學習的異常檢測的研究方法

異常檢測的深度學習研究綜述原文：arXiv:1901.03407摘要異常檢測是一個重要的問題，在不同的研究領(lǐng)域和應用領(lǐng)域都得到了很好的研究。本文的研究目的有兩個：首先，我們對基于深度學習的異常檢測

2021-07-12 07:10:19

基于小波去噪與變換域的信道估計方法

之后加入小波閾值去噪過程,再通過變換域低通濾波插值估計進行雙重去噪處理。計算機仿真結(jié)果表明,該估計方法能夠有效地去除加性高斯白噪聲,比一般的LS估計算法性能要好,在一定程度上彌補了LS估計算法對噪聲

2010-05-06 09:01:31

嵌入式AI的相關(guān)資料下載

，小網(wǎng)絡是一個學生讓小網(wǎng)絡逐漸學習到大網(wǎng)絡的能力三、邊緣側(cè)的訓練方法傳統(tǒng)的機器學習訓練方法是把數(shù)據(jù)在服務器上訓練好，然后使用聯(lián)邦學習是用戶不把數(shù)據(jù)上傳，而是把模型下發(fā)到對應的用戶那里用戶訓練以后用戶會把訓練好的模型上傳到服務器，服務器再把訓練的模型進行合成，

2021-12-14 06:57:15

我想學習SLAM技術(shù)有老師愿意教我嗎？

大家好，我想學習SLAM技術(shù)有資深的老師愿意教我嗎？qq：496397940

2018-11-09 13:42:27

探討一下深度學習在嵌入式設(shè)備上的應用

的高層表示( 屬性類別或特征) ，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。BP算法是訓練多層網(wǎng)絡的典型算法，但實際上對于僅含幾層的網(wǎng)絡，該訓練方法就已很不理想。深度結(jié)構(gòu)( 涉及多個非線性處理單元層) 非凸目標代價函...

2021-10-27 08:02:31

機器學習簡介與經(jīng)典機器學習算法人才培養(yǎng)

神經(jīng)網(wǎng)絡訓練方法卷積神經(jīng)網(wǎng)絡介紹經(jīng)典網(wǎng)絡結(jié)構(gòu)介紹章節(jié)目標：深入了解神經(jīng)網(wǎng)絡的組成、訓練和實現(xiàn)，掌握深度空間特征分布等關(guān)鍵概念，為深度遷移學習奠定知識基礎(chǔ)三、遷移學習基礎(chǔ)遷移學習緒論基于樣本的遷移學習

2022-04-28 18:56:07

匯總 |計算機視覺系統(tǒng)學習資料下載精選資料分享

計算機視覺干貨資料，涉及相機標定、三維重建、立體視覺、SLAM、深度學習、點云后處理、姿態(tài)估計、多視圖幾何、多傳感器融合等方向【計算...

2021-07-27 07:51:42

淺談SLAM的回環(huán)檢測技術(shù)

什么是回環(huán)檢測？在講解回環(huán)檢測前，我們先來了解下回環(huán)的概念。在視覺SLAM問題中，位姿的估計往往是一個遞推的過程，即由上一幀位姿解算當前幀位姿，因此其中的誤差便這樣一幀一幀的傳遞下去，也就是我們

2018-10-23 17:47:22

淺談深度學習之TensorFlow

機器學習 API（tf.contrib.learn），可以更容易地配置、訓練和評估大量的機器學習模型?？梢栽?TensorFlow 上使用高級深度學習庫 Keras。Keras 非常便于用戶使用，并且

2020-07-28 14:34:04

計算機視覺應用深度學習

怎樣從傳統(tǒng)機器學習方法過渡到深度學習？

2021-10-14 06:51:23

討論紋理分析在圖像分類中的重要性及其在深度學習中使用紋理分析

地執(zhí)行基于紋理特征的分類任務。為了讓深度學習在基于紋理的數(shù)據(jù)上更好地工作，需要有一種方法，可以從圖像中提取紋理特定的特征，并將其傳遞給全連接層，同時保留全局特征。這樣的架構(gòu)設(shè)置將使全連接的層具有信息紋理特征，并有助于更有效地估計類邊界。原作者：Trapti Kalra

2022-10-26 16:57:26

讓機器人完美建圖的SLAM 3.0到底是何方神圣？

過程中調(diào)整了圖結(jié)構(gòu)中每個節(jié)點的pose和對應的傳感器信息以及所有關(guān)鍵點構(gòu)建的位姿關(guān)系圖，利用全部的機器人位姿信息和對應傳感器數(shù)據(jù)生成環(huán)境地圖?！　　　?b class="flag-6" style="color: red">SLAM 3.0 編碼了機器人在SLAM過程中的位

2019-01-21 10:57:46

遷移學習

神經(jīng)網(wǎng)絡訓練方法卷積神經(jīng)網(wǎng)絡介紹經(jīng)典網(wǎng)絡結(jié)構(gòu)介紹章節(jié)目標：深入了解神經(jīng)網(wǎng)絡的組成、訓練和實現(xiàn)，掌握深度空間特征分布等關(guān)鍵概念，為深度遷移學習奠定知識基礎(chǔ) 三、遷移學習基礎(chǔ) 遷移學習緒論基于樣本的遷移學習

2022-04-21 15:15:11

龍哥手把手教你學視覺-深度學習YOLOV5篇

步數(shù)的課程，希望學員學習后能在實際工業(yè)項目中落地應用。本次課程將重點講解《YOLOv5》篇，讓沒有任何深度學習基礎(chǔ)的小白學員，通過視頻課程能動手配置好yolov5環(huán)境，能利用自己的數(shù)據(jù)集訓練模型，能

2021-09-03 09:39:28

基于單目深度估計的紅外圖像彩色化方法_戈曼

2017-03-17 10:13:01

改進深度學習算法的光伏出力預測方法

為提高光伏出力的預測精度，提出了一種改進深度學習算法的光伏出力預測方法。首先，針對傳統(tǒng)的深度學習算法采用批量梯度下降（batch gradient descent，BGD）法訓練模型參數(shù)速度慢

2017-12-17 10:42:45

深度學習中最核心的問題之一：訓練數(shù)據(jù)

今天我們將討論深度學習中最核心的問題之一：訓練數(shù)據(jù)。深度學習已經(jīng)在現(xiàn)實世界得到了廣泛運用，例如：無人駕駛汽車，收據(jù)識別，道路缺陷自動檢測，以及交互式電影推薦等等。

2017-12-25 10:34:28

10255

基于粒子群優(yōu)化的條件概率神經(jīng)網(wǎng)絡的訓練方法

的訓練方法。我們將這種基于粒子群優(yōu)化的條件概率神經(jīng)網(wǎng)絡用于人臉年齡估計，實驗結(jié)果表明這種網(wǎng)絡能夠顯著地提高識別的準確率。

2018-01-08 16:35:50

研究人員提出一種基于哈希的二值網(wǎng)絡訓練方法比當前方法的精度提高了3%

程健研究員團隊最近提出了一種基于哈希的二值網(wǎng)絡訓練方法，揭示了保持內(nèi)積哈希和二值權(quán)重網(wǎng)絡之間的緊密關(guān)系。

2018-02-08 15:38:13

4940

機器人SLAM實現(xiàn)

、幀間配準、位姿變換估計以及閉環(huán)檢測對SLAM系統(tǒng)的影響，建立了關(guān)鍵幀閉環(huán)匹配算法和SLAM實時性與魯棒性之間的關(guān)系，提出了一種基于ORB關(guān)鍵幀匹配算法的SLAM方法。運用改進ORB算法加快了圖像特征點提取與描述符建立速度；結(jié)合相機模型與深度信息，

2018-03-26 10:57:32

深度學習和機器學習深度的不同之處淺談深度學習的訓練和調(diào)參

近年來，深度學習作為機器學習中比較火的一種方法出現(xiàn)在我們面前，但是和非深度學習的機器學習相比（我將深度學習歸于機器學習的領(lǐng)域內(nèi)），還存在著幾點很大的不同，具體來說，有以下幾點.

2018-05-02 10:30:00

4135

高仙SLAM具體的技術(shù)是什么？SLAM2.0有哪些優(yōu)勢？

高仙的SLAM2.0技術(shù)體系核心，是基于多傳感器融合+深度學習的架構(gòu)，即語義SLAM。高仙SLAM2.0技術(shù)方案以語義分析、機器學習為基礎(chǔ)，結(jié)合云端實時信息處理以及專為多傳感器融合而開發(fā)的專業(yè)算法體系，真正實現(xiàn)了SLAM在建圖和導航兩個環(huán)節(jié)的完整應用。

2018-05-15 16:48:30

8535

UC Berkeley大學的研究人員們利用深度姿態(tài)估計和深度學習技術(shù)

給定一段視頻，我們用基于視覺的動作估計器預測每一幀演員的動作qt。該動作預測器是建立在人類網(wǎng)格復原這一工作之上的（akanazawa.github.io/hmr/），它用弱監(jiān)督對抗的方法訓練動作估計

2018-10-12 09:06:29

2561

NVIDIA遷移學習工具包：用于特定領(lǐng)域深度學習模型快速訓練的高級SDK

對于設(shè)計和集成智能視頻分析（IVA）端應用程序（如停車管理、安全基礎(chǔ)設(shè)施、零售分析、物流管理和訪問控制等）的開發(fā)人員，NVIDIA 的遷移學習工具包提供了端到端的深度學習工作流，可以加速深度學習訓練

2018-12-07 14:45:47

2848

深度學習網(wǎng)絡訓練技巧的詳細資料匯總

本文檔的主要內(nèi)容詳細介紹的是深度學習網(wǎng)絡訓練技巧匯總，總結(jié)訓練網(wǎng)絡的各種經(jīng)驗和技巧

2019-03-07 08:00:00

針對線性回歸模型和深度學習模型，介紹了確定訓練數(shù)據(jù)集規(guī)模的方法

學習模型的表現(xiàn)會按照冪定律持續(xù)提升。例如，有人曾用深度學習方法對三億張圖像進行分類，發(fā)現(xiàn)模型的表現(xiàn)隨著訓練數(shù)據(jù)規(guī)模的增長按對數(shù)關(guān)系提升。

2019-05-05 11:03:31

5747

微軟在ICML 2019上提出了一個全新的通用預訓練方法MASS

專門針對序列到序列的自然語言生成任務，微軟亞洲研究院提出了新的預訓練方法：屏蔽序列到序列預訓練（MASS: Masked Sequence to Sequence Pre-training

2019-05-11 09:19:04

3238

新的預訓練方法——MASS！MASS預訓練幾大優(yōu)勢！

專門針對序列到序列的自然語言生成任務，微軟亞洲研究院提出了新的預訓練方法：屏蔽序列到序列預訓練（MASS: Masked Sequence to Sequence Pre-training）。MASS對句子隨機屏蔽一個長度為k的連續(xù)片段，然后通過編碼器-注意力-解碼器模型預測生成該片段。

2019-05-11 09:34:02

6767

谷歌深度神經(jīng)網(wǎng)絡基于數(shù)據(jù)共享的快速訓練方法

在算法層面實現(xiàn)對訓練過程加速的方法

2019-07-18 09:25:48

2001

如何使用MATLAB實現(xiàn)深度學習的方法研究分析

訓練 CNN 需要相當大量的數(shù)據(jù)，因為對于典型的圖像分類問題，其需要學習幾百萬個權(quán)值。從頭開始訓練 CNN 的另一個常見做法是使用預先訓練好的模型自動從新的數(shù)據(jù)集提取特征。這種方法稱為遷移學習，是一種應用深度學習的便捷方式，其無需龐大的數(shù)據(jù)集以及長時間的訓練。

2019-09-16 15:11:20

5433

視覺SLAM深度解讀

不能確切的得到深度。一方面是由于絕對深度未知，單目SLAM不能得到機器人運動軌跡及地圖的真實大小，如果把軌跡和房間同時放大兩倍，單目看到的像是一樣的，因此，單目SLAM只能估計一個相對深度。另一方面

2019-09-11 22:01:35

1759

Intel實驗室聯(lián)合美國萊斯大學宣布深度學習新算法SLIDE CPU深度學習訓練效率大大提升

AI（人工智能）是當今科技圈的熱門話題，深度學習則是AI訓練的重要手段之一。如何學習要靠硬件和算法支撐，這方面，Intel力挺CPU，NVIDIA則力挺GPU。

2020-03-06 10:36:04

3423

機器和深度學習增強SLAM技術(shù)，有助于感知時代的到來

機器和深度學習的最新進展已改進了SLAM技術(shù)，從而導致地圖的豐富性增加，語義場景理解提高了定位，地圖質(zhì)量和堅固性。

2020-08-12 11:35:10

1143

膠囊機器人是如何完成深度學習與算法訓練的？

通俗一點講，機器人不是人，它的視覺和決策能力，都需要研制者通過一些方法賦予給它。通過深度學習獲得的能力相當于膠囊機器人的大腦，而通過SLAM機器視覺獲得的就相當于膠囊機器人的“火眼金睛”。

2020-08-28 15:23:06

2320

機器學習和深度學習有什么區(qū)別？

深度學習算法現(xiàn)在是圖像處理軟件庫的組成部分。在他們的幫助下，可以學習和訓練復雜的功能;但他們的應用也不是萬能的。 “機器學習”和“深度學習”有什么區(qū)別？在機器視覺和深度學習中，人類視覺的力量和對視

2021-03-12 16:11:00

7763

一種采用深度殘差網(wǎng)絡的頭部姿態(tài)估計方法

為提高真實場景下頭部姿態(tài)估計的準確性，提出一種采用深度殘差網(wǎng)絡的頭部姿態(tài)估計方法。將深度殘差網(wǎng)絡 Restnetl01作為主干網(wǎng)絡，引入優(yōu)化器提高深層卷積網(wǎng)絡訓練時的梯度穩(wěn)定性，使用RGB圖像并采用

2021-03-16 11:27:44

基于深度學習的二維人體姿態(tài)估計方法

基于深度學習的二維人體姿態(tài)估計方法通過構(gòu)建特定的神經(jīng)網(wǎng)絡架構(gòu)，將提取的特征信息根據(jù)相應的特征融合方法進行信息關(guān)聯(lián)處理，最終獲得人體姿態(tài)估計結(jié)果，因其具有廣泛的應用價值而受到研究人員的關(guān)注。從數(shù)據(jù)

2021-03-22 15:51:15

一種側(cè)重于學習情感特征的預訓練方法

transformers編碼表示）的基礎(chǔ)上，提岀了一種側(cè)重學習情感特征的預訓練方法。在目標領(lǐng)域的預練階段，利用情感詞典改進了BERT的預訓練任務。同時，使用基于上下文的詞粒度情感預測任務對掩蓋詞情感極性進行分類，獲取偏向情感特征的文本表

2021-04-13 11:40:51

實時SLAM的未來以及深度學習與SLAM的比較

SLAM問題可以描述為: 機器人在未知環(huán)境中從一個未知位置開始移動,在移動過程中根據(jù)位置估計和地圖進行自身定位,同時在自身定位的基礎(chǔ)上建造增量式地圖，實現(xiàn)機器人的自主定位和導航。

2021-04-18 10:15:20

4643

基于預訓練模型和長短期記憶網(wǎng)絡的深度學習模型

語義槽填充是對話系統(tǒng)中一項非常重要的任務，旨在為輸入句子的毎個單詞標注正確的標簽，其性能的妤壞極大地影響著后續(xù)的對話管理模塊。目前，使用深度學習方法解決該任務時，一般利用隨機詞向量或者預訓練詞向量

2021-04-20 14:29:06

采用自監(jiān)督CNN進行單圖像深度估計的方法

為了提高利用深度神經(jīng)網(wǎng)絡預測單圖像深度信息的精確度，提出了一種采用自監(jiān)督卷積神經(jīng)網(wǎng)絡進行單圖像深度估計的方法。首先，該方法通過在編解碼結(jié)構(gòu)中引入殘差結(jié)構(gòu)、密集連接結(jié)構(gòu)和跳躍連接等方式改進了單圖像深度

2021-04-27 16:06:35

基于深度學習的二維人體姿態(tài)估計算法

，更能充分地提取圖像信息，獲取更具有魯棒性的特征，因此基于深度學習的方法已成為二維人體姿態(tài)估計算法研究的主流方向。然而，深度學習尚在發(fā)展中，仍存在訓練規(guī)模大等問題，研究者們主要從設(shè)絡以及訓練方式入手對人體姿態(tài)

2021-04-27 16:16:07

虛擬乒乓球手的強化學習模仿訓練方法

沉浸感是虛擬現(xiàn)實應用的重要特征之一，而虛擬場景中角色行為的智能性與真實性對虛擬現(xiàn)實應用的沉浸感有著顯著影響。利用強化學習方法對球拍的擊球策略進行訓練，根據(jù)乒乓球游戲規(guī)則設(shè)計了一系列獎勵函數(shù)，使之能

2021-05-12 14:55:05

可消除變壓器漏油檢測的循環(huán)訓練方法

檢測問題帶來了挑戰(zhàn)。陰影是自然界中的一種普遍存在的物理現(xiàn)象。對漏油檢測的影響是不可避免的。為了消除陰影對漏油檢測的影響、提出一種循環(huán)訓練方法。通過直方圖均衡化以增強困難樣本油污和陰影之間的對比度循環(huán)地訓練

2021-06-07 14:44:05

現(xiàn)代交互技術(shù)下的兒童語言表達訓練方法

現(xiàn)代交互技術(shù)下的兒童語言表達訓練方法

2021-06-27 11:27:20

結(jié)合基擴展模型和深度學習的信道估計方法

2021-06-30 10:43:39

深度學習在嵌入式設(shè)備上的應用

2021-10-20 17:51:05

如何使用框架訓練網(wǎng)絡加速深度學習推理

TensorRT ，第二個例子是在 Cityscapes 數(shù)據(jù)集上訓練的基于?英偉達數(shù)據(jù)中心深度學習產(chǎn)品性能?的語義分割。

2022-04-01 15:45:04

2473

用NVIDIA遷移學習工具箱如何訓練二維姿態(tài)估計模型

　　本系列的第一篇文章介紹了在 NVIDIA 遷移學習工具箱中使用開源 COCO 數(shù)據(jù)集和 BodyPoseNet 應用程序的如何訓練二維姿態(tài)估計模型。

2022-04-10 09:41:20

1445

人工智能學習遷移學習實戰(zhàn)進階

問題的分類經(jīng)典機器學習算法介紹章節(jié)目標：機器學習是人工智能的重要技術(shù)之一，詳細了解機器學習的原理、機制和方法，為學習深度學習與遷移學習打下堅實的基礎(chǔ)。二、深度學習簡介與經(jīng)典網(wǎng)絡結(jié)構(gòu)介紹神經(jīng)網(wǎng)絡簡介神經(jīng)網(wǎng)絡組件簡介神經(jīng)網(wǎng)絡訓練方法 卷積神經(jīng)網(wǎng)絡介

2022-04-28 17:13:01

1345

時識科技提出新脈沖神經(jīng)網(wǎng)絡訓練方法助推類腦智能產(chǎn)業(yè)落地

近日，SynSense時識科技技術(shù)團隊發(fā)表題為“EXODUS： Stable and Efficient Training of Spiking Neural Networks”的文章，在文章中提出了新的脈沖神經(jīng)網(wǎng)絡訓練方法EXODUS。

2022-06-20 14:21:20

1088

超詳細配置教程：用Windows電腦訓練深度學習模型

雖然大多數(shù)深度學習模型都是在 Linux 系統(tǒng)上訓練的，但 Windows 也是一個非常重要的系統(tǒng)，也可能是很多機器學習初學者更為熟悉的系統(tǒng)。要在 Windows 上開發(fā)模型，首先當然是配置開發(fā)環(huán)境

2022-11-08 10:57:44

1101

基于視覺傳感器的SLAM系統(tǒng)學習

視覺SLAM是一種基于視覺傳感器的 SLAM 系統(tǒng)，與激光傳感器相比，視覺傳感器具有成本低、保留環(huán)境語義信息的優(yōu)點，能夠與深度學習進行大量結(jié)合。

2022-11-29 21:38:37

627

基于深度學習的視覺SLAM綜述

SLAM本質(zhì)上是一個狀態(tài)估計問題，根據(jù)傳感器做劃分，主要是激光、視覺兩大類。激光SLAM的研究在理論和工程上都比較成熟，現(xiàn)有的很多行業(yè)已經(jīng)開始使用激光SLAM完成工業(yè)工作；而視覺SLAM

2022-12-02 15:00:28

1149

密集單目SLAM的概率體積融合概述

我們提出了一種利用深度密集單目 SLAM 和快速不確定性傳播從圖像重建 3D 場景的新方法。所提出的方法能夠密集、準確、實時地 3D 重建場景，同時對來自密集單目 SLAM 的極其嘈雜的深度估計具有魯棒性。

2023-01-30 11:34:22

449

深度學習框架區(qū)分訓練還是推理嗎

深度學習框架區(qū)分訓練還是推理嗎深度學習框架是一個非常重要的技術(shù)，它們能夠加速深度學習的開發(fā)與部署過程。在深度學習中，我們通常需要進行兩個關(guān)鍵的任務，即訓練和推理。訓練是指使用訓練數(shù)據(jù)訓練神經(jīng)網(wǎng)絡

2023-08-17 16:03:11

906

深度學習框架和深度學習算法教程

了基于神經(jīng)網(wǎng)絡的機器學習方法。深度學習算法可以分為兩大類：監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習的基本任務是訓練模型去學習輸入數(shù)據(jù)的特征和其對應的標簽，然后用于新數(shù)據(jù)的預測。而無監(jiān)督學習通常用于聚類、降維和生成模型等任務中

2023-08-17 16:11:26

638

視覺深度學習遷移學習訓練框架Torchvision介紹

Torchvision是基于Pytorch的視覺深度學習遷移學習訓練框架，當前支持的圖像分類、對象檢測、實例分割、語義分割、姿態(tài)評估模型的遷移學習訓練與評估。支持對數(shù)據(jù)集的合成、變換、增強等，此外還支持預訓練模型庫下載相關(guān)的模型，直接預測推理。

2023-09-22 09:49:51

391

動態(tài)場景下的自監(jiān)督單目深度估計方案

自監(jiān)督單目深度估計的訓練可以在大量無標簽視頻序列來進行，訓練集獲取很方便。但問題是，實際采集的視頻序列往往會有很多動態(tài)物體，而自監(jiān)督訓練本身就是基于靜態(tài)環(huán)境假設(shè)，動態(tài)環(huán)境下會失效。

2023-11-28 09:21:34

173

GPU在深度學習中的應用與優(yōu)勢

學習中究竟擔當了什么樣的角色？又有哪些優(yōu)勢呢？一、GPU加速深度學習訓練并行處理GPU的核心理念在于并行處理。在深度學習訓練過程中，需要處理大量的數(shù)據(jù)。GPU通過

2023-12-06 08:27:37

610

深度學習如何訓練出好的模型

算法工程、數(shù)據(jù)派THU深度學習在近年來得到了廣泛的應用，從圖像識別、語音識別到自然語言處理等領(lǐng)域都有了卓越的表現(xiàn)。但是，要訓練出一個高效準確的深度學習模型并不容易。不僅需要有高質(zhì)量的數(shù)據(jù)、合適的模型

2023-12-07 12:38:24

547

單目深度估計開源方案分享

可以看一下單目深度估計效果，這個深度圖的分辨率是真的高，物體邊界分割的非常干凈！這里也推薦工坊推出的新課程《單目深度估計方法：算法梳理與代碼實現(xiàn)》。

2023-12-17 10:01:16

404

如何基于深度學習模型訓練實現(xiàn)圓檢測與圓心位置預測

Hello大家好，今天給大家分享一下如何基于深度學習模型訓練實現(xiàn)圓檢測與圓心位置預測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓練，生成一個自定義的圓檢測與圓心定位預測模型

2023-12-21 10:50:05

529

如何基于深度學習模型訓練實現(xiàn)工件切割點位置預測

Hello大家好，今天給大家分享一下如何基于深度學習模型訓練實現(xiàn)工件切割點位置預測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓練，生成一個工件切割分離點預測模型

2023-12-22 11:07:46

259

基于深度學習的LiDAR SLAM框架（DeepPointMap）

定位準確性：與六種最新的里程計和SLAM方法進行比較，包括KISS-ICP、LeGO-LOAM、SC-LeGO-LOAM、MULLS、CT-ICP和GeoTransformer。在SemanticKITTI、KITTI-360和MulRan數(shù)據(jù)集上比較了DeepPointMap與這些方法的定位準確性。

2023-12-29 11:48:09

239

混合專家模型 (MoE)核心組件和訓練方法介紹

) 的 Transformer 模型在開源人工智能社區(qū)引起了廣泛關(guān)注。在本篇博文中，我們將深入探討 MoEs 的核心組件、訓練方法，以及在推理過程中需要考量的各種因素。讓我們開始吧！簡短總結(jié) 混合專家模型 (MoEs

2024-01-13 09:37:33

315

已全部加載完成

搜索歷史

如何去使用深度學習的model SLAM位姿估計的自訓練方法

評論