99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。

半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是要比單獨(dú)使用有標(biāo)記數(shù)據(jù)訓(xùn)練的監(jiān)督學(xué)習(xí)技術(shù)得到更好的結(jié)果。這是半監(jiān)督學(xué)習(xí)系列文章的第1部分,對(duì)這個(gè)機(jī)器學(xué)習(xí)的重要子領(lǐng)域進(jìn)行了簡(jiǎn)要的介紹。

區(qū)分半監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)

整個(gè)數(shù)據(jù)集中可用于訓(xùn)練的有標(biāo)記數(shù)據(jù)的范圍區(qū)分了機(jī)器學(xué)習(xí)的這三個(gè)相關(guān)領(lǐng)域。

監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最流行的模式,在這種模式中,可以通過(guò)標(biāo)簽的形式獲得完整的監(jiān)督。整個(gè)數(shù)據(jù)集都有標(biāo)記,即一個(gè)標(biāo)簽與訓(xùn)練數(shù)據(jù)集中的每個(gè)樣本相關(guān)聯(lián)。機(jī)器學(xué)習(xí)模型使用這個(gè)標(biāo)簽數(shù)據(jù)集訓(xùn)練,并期望對(duì)新的樣本預(yù)測(cè)一個(gè)標(biāo)簽。監(jiān)督學(xué)習(xí)主要包括兩類任務(wù):分類和回歸。分類問(wèn)題要求算法預(yù)測(cè)一個(gè)離散值,而回歸任務(wù)是需要從輸入變量(X)逼近一個(gè)映射函數(shù)(f)到連續(xù)輸出變量(y)。

手寫數(shù)字識(shí)別使用(MNIST)數(shù)據(jù)集。每個(gè)樣本都有一個(gè)圖像和對(duì)應(yīng)的數(shù)字作為標(biāo)簽。任務(wù)是學(xué)習(xí)從圖像中預(yù)測(cè)標(biāo)簽(即數(shù)字)。

另一個(gè)例子是情感分類,使用IMDB數(shù)據(jù)集。每條記錄都包含一個(gè)評(píng)論和一個(gè)相應(yīng)的標(biāo)簽(正面的或負(fù)面的)。這里的任務(wù)是預(yù)測(cè)給定評(píng)論的情緒。

房?jī)r(jià)預(yù)測(cè)是一個(gè)回歸任務(wù),其中標(biāo)簽(房?jī)r(jià))是一個(gè)連續(xù)變量。

在無(wú)監(jiān)督學(xué)習(xí)中,沒(méi)有標(biāo)記數(shù)據(jù)可用。訓(xùn)練數(shù)據(jù)集包含樣本,但沒(méi)有特定的期望結(jié)果或標(biāo)簽。機(jī)器學(xué)習(xí)模型試圖通過(guò)提取有用的特征并對(duì)其進(jìn)行分析來(lái)自動(dòng)地在數(shù)據(jù)中找到結(jié)構(gòu)。像聚類、異常檢測(cè)、關(guān)聯(lián)等任務(wù)屬于無(wú)監(jiān)督學(xué)習(xí)。

聚類是將數(shù)據(jù)集劃分為多個(gè)簇,使同一簇中的數(shù)據(jù)點(diǎn)與同一簇中的其他數(shù)據(jù)點(diǎn)更相似,與其他簇中的數(shù)據(jù)點(diǎn)不相似。例如,下圖(左)中的數(shù)據(jù)點(diǎn)可以分成3個(gè)簇,如圖(右)所示。注意,簇可以是任何形狀。

半監(jiān)督式學(xué)習(xí)(SSL),正如其名稱所示,介于兩個(gè)極端之間(監(jiān)督式是指整個(gè)數(shù)據(jù)集被標(biāo)記,而非監(jiān)督式是指沒(méi)有標(biāo)記)。半監(jiān)督學(xué)習(xí)任務(wù)具有一個(gè)標(biāo)記和一個(gè)未標(biāo)記的數(shù)據(jù)集。它使用未標(biāo)記的數(shù)據(jù)來(lái)獲得對(duì)數(shù)據(jù)結(jié)構(gòu)的更多理解。通常,SSL使用小的帶標(biāo)簽數(shù)據(jù)集和較大的未帶標(biāo)簽數(shù)據(jù)集來(lái)進(jìn)行學(xué)習(xí)。

我們的目標(biāo)是學(xué)習(xí)一個(gè)預(yù)測(cè)器來(lái)預(yù)測(cè)未來(lái)的測(cè)試數(shù)據(jù),這個(gè)預(yù)測(cè)器比單獨(dú)從有標(biāo)記的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的預(yù)測(cè)器更好。

監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)在標(biāo)記數(shù)據(jù)上的差別可視化

為什么要關(guān)注半監(jiān)督學(xué)習(xí)

在許多實(shí)際應(yīng)用中,收集大的有標(biāo)簽數(shù)據(jù)集太昂貴或者不可行,但是有大量的無(wú)標(biāo)簽數(shù)據(jù)可用。對(duì)于這種情況,半監(jiān)督學(xué)習(xí)是一個(gè)完美的方案。SSL技術(shù)可以利用帶標(biāo)簽的數(shù)據(jù),也可以從未帶標(biāo)簽的數(shù)據(jù)派生結(jié)構(gòu),從而更好地解決總體任務(wù)。

典型的監(jiān)督學(xué)習(xí)算法在標(biāo)記數(shù)據(jù)集較小的情況下,容易出現(xiàn)過(guò)擬合問(wèn)題。SSL通過(guò)在訓(xùn)練過(guò)程中理解未標(biāo)記數(shù)據(jù)的結(jié)構(gòu)來(lái)緩解這個(gè)問(wèn)題。

此外,這種學(xué)習(xí)技術(shù)減輕了構(gòu)建大量標(biāo)記數(shù)據(jù)集來(lái)學(xué)習(xí)任務(wù)的負(fù)擔(dān)。SSL方法更接近我們?nèi)祟惖膶W(xué)習(xí)方式。

讓我們舉個(gè)例子來(lái)直觀地看看半監(jiān)督學(xué)習(xí)的效果。在下面的圖中,當(dāng)只對(duì)標(biāo)記數(shù)據(jù)(大的黑點(diǎn)和白點(diǎn))進(jìn)行訓(xùn)練(即對(duì)標(biāo)記數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí))時(shí),決策邊界(虛線)并不遵循數(shù)據(jù)“流形”的輪廓,這可以由額外的未標(biāo)記數(shù)據(jù)(小灰點(diǎn))來(lái)表示。

因此,SSL的目標(biāo)是利用未標(biāo)記數(shù)據(jù)來(lái)生成決策邊界,從而更好地反映數(shù)據(jù)的底層結(jié)構(gòu)。

由不同的半監(jiān)督學(xué)習(xí)方法生成的決策邊界

半監(jiān)督學(xué)習(xí)的任務(wù)舉例

CIFAR-10— 它是由10個(gè)類的32×32像素的RGB圖像組成的數(shù)據(jù)集,任務(wù)是圖像分類。通常使用Tiny Images數(shù)據(jù)集中的隨機(jī)圖像來(lái)形成未標(biāo)記數(shù)據(jù)集。

SVHN— 街景門牌號(hào)數(shù)據(jù)集由真實(shí)門牌號(hào)的32×32像素的RGB圖像組成,任務(wù)是分類最中間的數(shù)字。它附帶一個(gè)“SVHN-extra”數(shù)據(jù)集,該數(shù)據(jù)集由531,131個(gè)額外的數(shù)字圖像組成,可以用作未標(biāo)記數(shù)據(jù)。

Text-Classification Tasks— 亞馬遜評(píng)論數(shù)據(jù)庫(kù),Yelp評(píng)論數(shù)據(jù)集。

總結(jié)

半監(jiān)督學(xué)習(xí)是一種有趣的方法,用于解決機(jī)器學(xué)習(xí)中缺乏標(biāo)記數(shù)據(jù)的問(wèn)題。SSL算法還利用未標(biāo)記數(shù)據(jù)來(lái)提高監(jiān)督學(xué)習(xí)算法的性能。SSL算法通常提供了一種從無(wú)標(biāo)簽示例中了解數(shù)據(jù)結(jié)構(gòu)的方法,減輕了對(duì)標(biāo)簽的需求。

本系列的第2部分會(huì)介紹了一些具體的SSL技術(shù),未完待續(xù)。

責(zé)任編輯:xj

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSL
    SSL
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    26156
  • 半監(jiān)督
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6392
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134361
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5557

    瀏覽量

    122670

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無(wú)監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討異常檢測(cè)技術(shù)的理論基礎(chǔ)與實(shí)踐應(yīng)用,通過(guò)IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?568次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    使用MATLAB進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

    無(wú)監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無(wú)監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無(wú)需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?636次閱讀
    使用MATLAB進(jìn)行無(wú)<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    橋LLC諧振電路的工作原理與模態(tài)分析

    前言:本文參考橋LLC諧振轉(zhuǎn)換器工作原理并結(jié)合自己想法整理而成,本人在查找一些AC-DC開關(guān)電源方面的知識(shí)時(shí),沒(méi)有在國(guó)內(nèi)網(wǎng)站找到很詳細(xì)的介紹全橋的拓?fù)湟约肮ぷ髟斫榻B,于是打算自己在學(xué)習(xí)過(guò)程中
    的頭像 發(fā)表于 02-12 11:03 ?3049次閱讀
    <b class='flag-5'>半</b>橋LLC諧振電路的工作原理與模態(tài)分析

    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

    【導(dǎo)讀】最近,香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了一篇時(shí)間序列無(wú)監(jiān)督預(yù)訓(xùn)練的文章,相比原來(lái)的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作,核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段,即在預(yù)訓(xùn)練階段
    的頭像 發(fā)表于 11-15 11:41 ?722次閱讀
    時(shí)空引導(dǎo)下的時(shí)間序列自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

    曙光公司成都云中心助力提升監(jiān)督質(zhì)效

    數(shù)字化時(shí)代,用好大數(shù)據(jù),推動(dòng)數(shù)字技術(shù)深度融入紀(jì)檢監(jiān)察各項(xiàng)業(yè)務(wù),是大勢(shì)所趨。當(dāng)前,各地正在探索推進(jìn)大數(shù)據(jù)監(jiān)督,借助海量數(shù)據(jù)、算力、算法,不斷延伸監(jiān)督的觸角,拓展發(fā)現(xiàn)問(wèn)題的渠道。以“算力”補(bǔ)“人力”,“人去看”加“云端算”,大數(shù)據(jù)在類案分析、預(yù)警糾治、溯源治理等方面,正發(fā)揮越
    的頭像 發(fā)表于 11-05 10:05 ?512次閱讀

    加器和全加器的功能特點(diǎn)

    加器和全加器是數(shù)字電路中的基本組件,用于執(zhí)行二進(jìn)制數(shù)的加法運(yùn)算。它們?cè)谟?jì)算機(jī)、微處理器和其他數(shù)字系統(tǒng)中扮演著重要角色。 加器的功能特點(diǎn) 加器是一種簡(jiǎn)單的數(shù)字電路,它能夠?qū)崿F(xiàn)兩個(gè)一位二進(jìn)制數(shù)
    的頭像 發(fā)表于 10-18 11:10 ?3599次閱讀

    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    近日,哈爾濱工業(yè)大學(xué)儀器學(xué)院先進(jìn)光電成像技術(shù)研究室(IPIC)李浩宇教授團(tuán)隊(duì)在生物醫(yī)學(xué)超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展。針對(duì)目前活體細(xì)胞超分辨成像領(lǐng)域中光子效率不足的難題,團(tuán)隊(duì)提出一種基于無(wú)監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 09-27 06:33 ?546次閱讀
    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    電容補(bǔ)償和全補(bǔ)償?shù)膮^(qū)別

    電容補(bǔ)償和全補(bǔ)償是兩種不同的無(wú)功補(bǔ)償方式,主要區(qū)別在于補(bǔ)償?shù)某潭群托Ч?。以下是它們的具體區(qū)別: 1、補(bǔ)償程度 : 補(bǔ)償 :電容補(bǔ)償只補(bǔ)償一部分無(wú)功功率。通常設(shè)計(jì)為補(bǔ)償?shù)焦β室驍?shù)達(dá)到0.9左右
    的頭像 發(fā)表于 08-14 14:08 ?1668次閱讀
    電容<b class='flag-5'>半</b>補(bǔ)償和全補(bǔ)償?shù)膮^(qū)別

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語(yǔ)法結(jié)構(gòu)的學(xué)習(xí),還包括對(duì)語(yǔ)言的深層次理解,如文化背景、語(yǔ)境含義和情感色彩等。 自監(jiān)督學(xué)習(xí):模型采用自監(jiān)督學(xué)習(xí)策略,在大量無(wú)標(biāo)簽文本數(shù)據(jù)上學(xué)習(xí)
    發(fā)表于 08-02 11:03

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    章節(jié)最后總結(jié)了機(jī)器學(xué)習(xí)的分類:有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)、自監(jiān)督學(xué)習(xí)和強(qiáng)化
    發(fā)表于 07-25 14:33

    旗晟機(jī)器人人員行為監(jiān)督AI智慧算法

    ,以實(shí)現(xiàn)對(duì)工業(yè)場(chǎng)景巡檢運(yùn)維的高效化目標(biāo)。那么,下面我們來(lái)談?wù)勂礻蓹C(jī)器人AI智慧算法之一——人員行為監(jiān)督AI智慧算法。 旗晟人員行為監(jiān)督AI智慧算法是通過(guò)各類采集設(shè)備與AI服務(wù)器,結(jié)合行業(yè)大數(shù)據(jù)庫(kù)積累以及自研AI深度學(xué)習(xí)算法模
    的頭像 發(fā)表于 07-24 17:05 ?505次閱讀
    旗晟機(jī)器人人員行為<b class='flag-5'>監(jiān)督</b>AI智慧算法

    三位和四位萬(wàn)用表的區(qū)別

    三位和四位萬(wàn)用表是電子測(cè)量領(lǐng)域中常用的兩種數(shù)字萬(wàn)用表,它們?cè)跍y(cè)量精度、顯示方式、應(yīng)用范圍等方面存在一定的差異。本文將從多個(gè)方面詳細(xì)分析這兩種萬(wàn)用表的區(qū)別。 一、基本概念 三位萬(wàn)用表 三位
    的頭像 發(fā)表于 07-14 14:23 ?9893次閱讀

    神經(jīng)網(wǎng)絡(luò)如何用無(wú)監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,其訓(xùn)練方式多樣,其中無(wú)監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無(wú)監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模式或規(guī)律,從而提取有用的特征表示。這種訓(xùn)練方式對(duì)于大規(guī)模未
    的頭像 發(fā)表于 07-09 18:06 ?1450次閱讀

    深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,無(wú)監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來(lái)越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法,包括自編碼器、生成對(duì)抗網(wǎng)絡(luò)、聚類算法等,并分析它們的原理、應(yīng)用場(chǎng)景以及優(yōu)
    的頭像 發(fā)表于 07-09 10:50 ?1654次閱讀

    前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和常見(jiàn)激活函數(shù)

    和激活函數(shù)的非線性變換,能夠學(xué)習(xí)和模擬復(fù)雜的函數(shù)映射,從而解決各種監(jiān)督學(xué)習(xí)任務(wù)。本文將詳細(xì)闡述前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),包括其組成層、權(quán)重和偏置、激活函數(shù)等,并介紹幾種常見(jiàn)的激活函數(shù)及其特性。
    的頭像 發(fā)表于 07-09 10:31 ?1817次閱讀