宜家家具有多種不同的組裝方法。在理想情況下,每種方法都可以組裝出完整的沙發(fā)或椅子。但是,根據(jù)細節(jié)的不同,每種產(chǎn)品的組裝都有最適用的方法。如果拿到說明手冊和所有正確的零件,就只需按照指示操作即可。如果你已經(jīng)找到了竅門,不妨把手冊扔到一邊,試試獨自操作。
深度學習也是如此。基于可用數(shù)據(jù)的類型和正在研究的問題,科學家將選擇特定的學習模型來訓(xùn)練算法。
在監(jiān)督式學習模型中,算法基于有標記的數(shù)據(jù)集進行學習,同時數(shù)據(jù)集提供答案,算法可利用該答案來評估其在訓(xùn)練數(shù)據(jù)方面的準確性。相比之下,無監(jiān)督式模型使用的是無標記數(shù)據(jù),算法需要自行提取特征和規(guī)律來理解這些數(shù)據(jù)。半監(jiān)督式學習居于二者之間:這種方法使用少量有標記的數(shù)據(jù)來支持大量無標記數(shù)據(jù)。
增強學習模型一般用來訓(xùn)練帶有獎勵系統(tǒng)的算法。在特定情況下,如果AI Agent執(zhí)行了最佳的操作,增強學習模型會提供一定反饋。
下面我們來了解一下適用于每種學習模式的數(shù)據(jù)集和問題類型。
什么是監(jiān)督式學習?
如果您在別人的監(jiān)督之下學習,有人會當場評判您是否得出了正確答案。同樣,在監(jiān)督式學習中,訓(xùn)練算法時同樣需要一整套帶有標記的數(shù)據(jù)。
完全標記意味著訓(xùn)練數(shù)據(jù)集中的每個示例都標記相對應(yīng)的答案。因此,一個由花朵圖像組成的有標記數(shù)據(jù)集會告知模型哪些圖片是玫瑰、哪些圖片是雛菊或者水仙。在“看到”新圖像時,模型會將其與訓(xùn)練示例進行比較,以給出正確的標記。
在監(jiān)督式機器學習中,算法需要通過有標記的數(shù)據(jù)進行學習。
監(jiān)督式學習有兩個主要的應(yīng)用領(lǐng)域:分類問題和回歸問題。
分類問題要求算法可以預(yù)測離散值,將輸入數(shù)據(jù)標識為特定類或組的成員。在由動物圖像組成的訓(xùn)練數(shù)據(jù)集中,這意味著每張照片已被預(yù)先標記為貓、考拉或海龜?shù)取H缓?,算法的評估標準為,算法對其他考拉和海龜?shù)男聢D像進行分類的準確程度。
上圖顯示的是貓、考拉還是海龜?分類算法可以區(qū)分差異。
回歸問題則要求算法基于連續(xù)數(shù)據(jù)。比如線性回歸:給出一個特定的x值,求y變量的值。
更貼近現(xiàn)實的機器學習示例涉及許多變量,例如根據(jù)建筑面積、位置和距離公共交通的遠近來預(yù)測舊金山公寓價格的算法。
因此,監(jiān)督式學習最適合具有一系列可用參考點或真實值來訓(xùn)練算法的問題。但那些數(shù)據(jù)并不總是現(xiàn)成可用的。
什么是無監(jiān)督式學習?
清晰、完美標記的數(shù)據(jù)集并不容易獲得。有時,研究人員會向算法詢問一些他們未知的問題。而這正是無監(jiān)督式學習可以發(fā)揮作用的地方。
在無監(jiān)督式學習中,深度學習模型會收到某個數(shù)據(jù)集,但對于如何處理該數(shù)據(jù)集卻未獲得明確的指示。訓(xùn)練數(shù)據(jù)集是沒有特定預(yù)期結(jié)果或正確答案的示例的集合。然后,神經(jīng)網(wǎng)絡(luò)嘗試通過提取有用的特征并分析其結(jié)構(gòu)來自動發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)。
無監(jiān)督式學習模型自動提取特征并在數(shù)據(jù)中找到規(guī)律。
根據(jù)所研究的問題,無監(jiān)督式學習模型可以用不同的方式組織數(shù)據(jù)。
聚類:即使不是專業(yè)的鳥類學家,我們也可以觀察一系列鳥類照片,并根據(jù)其羽毛的顏色、體態(tài)的大小或喙形等線索,對照片進行粗略的對比分類。這正是聚類這一無監(jiān)督式學習的最常見應(yīng)用類型的運作方式:深度學習模型尋找相似的訓(xùn)練數(shù)據(jù)并將它們分為一組。
異常檢測:銀行通過尋找客戶購買行為中不尋常的模式來偵查欺詐交易。例如,如果同一張信用卡于同一天在加利福尼亞和丹麥使用,那就會引起懷疑。同理,無監(jiān)督式學習還可用來標記數(shù)據(jù)集中的異常值。
關(guān)聯(lián):如果您的網(wǎng)上購物車里有尿布、蘋果醬和吸管杯,網(wǎng)站可能會建議您在訂單中添加圍嘴和嬰兒監(jiān)視器。這是一個關(guān)聯(lián)示例,其中數(shù)據(jù)樣本的某些特征與其他特征相關(guān)聯(lián)。通過查看某個數(shù)據(jù)的幾個關(guān)鍵屬性,無監(jiān)督式學習模型可以預(yù)測它們通常關(guān)聯(lián)的其他屬性。
自動編碼器:自動編碼器會接收輸入數(shù)據(jù),將其壓縮為代碼,然后設(shè)法使用這些匯總結(jié)的代碼重新創(chuàng)建輸入數(shù)據(jù)。這就像從《白鯨記》開始,創(chuàng)建SparkNotes版本,然后設(shè)法使用SparkNotes重寫原始故事,并作為參考。雖然這是一項簡便易行的深度學習技巧,但讓簡單的自動編碼器發(fā)揮作用的現(xiàn)實用例卻很少。但是,如果增添一層復(fù)雜性,自動編碼器的使用效果就會成倍增加:通過在訓(xùn)練期間同時使用雜亂版本和整潔版本的圖像,自動編碼器可以消除圖像、視頻或醫(yī)學掃描圖等視覺數(shù)據(jù)中的雜點,從而提高圖像質(zhì)量。
由于數(shù)據(jù)中不存在“真值”元素,因此很難衡量使用無監(jiān)督式學習訓(xùn)練的算法的準確性。但在許多研究領(lǐng)域中,有標記數(shù)據(jù)要么難以獲得,要么過于昂貴。在這些情況下,允許深度學習模型完全自由地尋找相關(guān)規(guī)律,可以產(chǎn)生高質(zhì)量的結(jié)果。
什么是半監(jiān)督式學習?
可以將半監(jiān)督式學習視為一種折衷辦法。
在很大程度上,半監(jiān)督式學習的含義正如其名:同時含有標記數(shù)據(jù)和無標記數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集。在從數(shù)據(jù)中提取相關(guān)特征存在困難以及標記示例對專家來說非常耗時的情況下,這種方法特別有用。
半監(jiān)督式學習對于醫(yī)學影像尤其有用,在此類影像中,少量有標記數(shù)據(jù)可以顯著提高準確性。
這類學習的常見應(yīng)用情境是CT掃描或核磁共振成像 (MRI) 等醫(yī)學影像。受過培訓(xùn)的放射科醫(yī)生可以檢查并標記腫瘤或疾病的一小部分掃描結(jié)果。但是,手動標記所有掃描結(jié)果會花費大量的時間和成本。不過與完全無監(jiān)督式模型相比,半監(jiān)督式學習中的深度學習網(wǎng)絡(luò)仍然可以從小比例的有標記數(shù)據(jù)中受益,并提高其數(shù)據(jù)的準確性。
一種熱門的訓(xùn)練方法是從一小組有標記數(shù)據(jù)開始訓(xùn)練,并使用生成式對抗網(wǎng)絡(luò) (GAN)。
處于競爭狀態(tài)的兩個深度學習網(wǎng)絡(luò)都試圖超越對方,這就是 GAN。其中一個網(wǎng)絡(luò)名為生成器(generator),試圖創(chuàng)建新數(shù)據(jù)點來模擬訓(xùn)練數(shù)據(jù)。另一個網(wǎng)絡(luò)名為鑒別器(discriminator),它會接收這些新生成的數(shù)據(jù),并評估它們是訓(xùn)練數(shù)據(jù)的一部分還是虛假數(shù)據(jù)。由于鑒別器可越來越準確地區(qū)分虛假數(shù)據(jù)和原始數(shù)據(jù),生成器則提高了其生成令人信服的虛假數(shù)據(jù)的能力,兩種網(wǎng)絡(luò)在正反饋回路中得到改善。
這就是 GAN 的工作原理:標記為“D”的鑒別器顯示來自生成器“G”和訓(xùn)練數(shù)據(jù)集的圖像。鑒別器的任務(wù)是確定來自生成器的圖像哪些是真實的、哪些是虛假的。
什么是增強學習?
視頻游戲中充滿了增強提示:通過一關(guān)即可獲得一個徽章;使用一定數(shù)量的動作擊敗壞人即可贏得獎金;倘若不慎落入陷阱,則游戲結(jié)束。
這些提示可幫助玩家學習如何在下一局游戲中有更好的表現(xiàn)。如果沒有這些反饋,他們只會在游戲環(huán)境中采取隨機行動。
增強學習的運作原理與此相同,而視頻游戲則是這類研究的日常測試環(huán)境。
在這種機器學習中,AI Agent試圖找到實現(xiàn)特定目標的最佳方式或改進特定任務(wù)的最優(yōu)方法。當Agent采取的行動有助實現(xiàn)目標時,它會獲得獎勵??傮w目標是預(yù)測下一步要采取的最佳措施以獲得最終大獎。
Agent可以從過去的反饋中吸取教訓(xùn),并探索可能帶來更大收益的新策略,從而做出選擇。當然,正如國際象棋比賽中短期的移動可能無法助您長遠獲得勝利一樣,Agent也會制定長期戰(zhàn)略計劃,最大限度地提高累積的獎勵。
這是一個迭代的過程:反饋次數(shù)越多,Agent制定的策略就會越好。這種技術(shù)對于訓(xùn)練機器人特別有用,機器人要在諸如控制自動駕駛汽車或管理倉庫中的庫存等任務(wù)中做出一系列決策。
其實每種算法都有不同的學習方式,您只需選擇最佳方式來幫助神經(jīng)網(wǎng)絡(luò)掌握訣竅即可。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103596 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25446 -
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122794
原文標題:監(jiān)督式學習、無監(jiān)督式學習、半監(jiān)督式學習和增強學習之間有何區(qū)別?
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
了解一下每種開關(guān)中存在的不同電路

適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學習數(shù)據(jù)增強技術(shù)

適用于STM32芯片的開發(fā)教程
適用于NFC和驗證的子系統(tǒng)設(shè)計
鈕扣電池都有哪些類型分別適用于哪些設(shè)備?
科普一下:機器學習和深度學習的區(qū)別和關(guān)系

了解一下機器學習中的基礎(chǔ)知識
適用于命名數(shù)據(jù)網(wǎng)絡(luò)的緩存內(nèi)容分類模型
一種適用于模式識別的新型神經(jīng)網(wǎng)絡(luò)
分享一下嵌入式 HarmonyOS 的學習思路

適用于汽車應(yīng)用的開關(guān)峰值電流模式控制電路優(yōu)化技術(shù)

增量式編碼器3大特點,工作模式,精度,輸出脈沖信號 一起了解一下嗎

評論