91在线无码精品秘密桃,波多野结衣在线视频夜本色

在過(guò)去十年中，機(jī)器學(xué)習(xí)在圖像識(shí)別、自動(dòng)駕駛汽車和圍棋等領(lǐng)域取得了前所未有的進(jìn)步。這些成功在很大程度上是靠監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)來(lái)實(shí)現(xiàn)的。

這兩種方法都要求由人設(shè)計(jì)訓(xùn)練信號(hào)并傳遞給計(jì)算機(jī)。在監(jiān)督學(xué)習(xí)的情況下，這些是“目標(biāo)”（例如圖像的正確標(biāo)簽）;在強(qiáng)化學(xué)習(xí)的情況下，它們是成功行為的“獎(jiǎng)勵(lì)”（例如在Atari游戲中獲得高分）。因此，機(jī)器學(xué)習(xí)的極限是由人類訓(xùn)練師決定的。

但是學(xué)習(xí)知識(shí)還應(yīng)該有其他的策略，就像讓幼兒學(xué)習(xí)，不僅有指導(dǎo)（監(jiān)督學(xué)習(xí)）和鼓勵(lì)（強(qiáng)化學(xué)習(xí)），還應(yīng)該有自由探索世界（無(wú)監(jiān)督學(xué)習(xí)）。如果要讓AI脫離人類發(fā)展成出通用智能，必須要讓它掌握無(wú)監(jiān)督學(xué)習(xí)的技能。

DeepMind今天在官方博客中對(duì)無(wú)監(jiān)督學(xué)習(xí)的原理、近年來(lái)取得的成果、發(fā)展前景進(jìn)行了綜述。

無(wú)監(jiān)督學(xué)習(xí)關(guān)鍵的特點(diǎn)是，傳遞給算法的數(shù)據(jù)在內(nèi)部結(jié)構(gòu)中非常豐富，而用于訓(xùn)練的目標(biāo)和獎(jiǎng)勵(lì)非常稀少。無(wú)監(jiān)督學(xué)習(xí)算法學(xué)到的大部分內(nèi)容必須包括理解數(shù)據(jù)本身，而不是將這種理解應(yīng)用于特定任務(wù)。

解碼視覺(jué)元素

2012年是深度學(xué)習(xí)的里程碑，AlexNet席卷了ImageNet圖像分類競(jìng)賽，但是更引人注目的是藏在AlexNet之下的事情。

研究人員在分析AlexNet時(shí)發(fā)現(xiàn)，它通過(guò)為輸入構(gòu)建復(fù)雜的內(nèi)部表示來(lái)解釋圖像，低層次的特征，如紋理和邊緣在底層中表示，然后將它們組合在一起形成高級(jí)概念，例如更高層次中的輪子和狗。

這與我們的大腦中處理信息的方式非常相似，其中初級(jí)感官處理區(qū)域中的簡(jiǎn)單邊緣和紋理，然后組裝成復(fù)雜對(duì)象。因此復(fù)雜場(chǎng)景的表示可以由“視覺(jué)基元”所構(gòu)建，這種方式與單詞構(gòu)成句子大致相同。

在沒(méi)有人類明確的指導(dǎo)的情況下，研究人員發(fā)現(xiàn)AlexNet的層可以通過(guò)基本的“視覺(jué)詞匯”來(lái)解決任務(wù)。

遷移學(xué)習(xí)

AlexNet還可以被遷移到訓(xùn)練之外的視覺(jué)任務(wù)中，例如識(shí)別整個(gè)場(chǎng)景而不是單個(gè)圖像。

人類就非常擅長(zhǎng)這種學(xué)習(xí)方法，我們能迅速調(diào)整自己的經(jīng)驗(yàn)，以適應(yīng)新的技能和理解收集到的信息。例如，經(jīng)過(guò)專業(yè)訓(xùn)練的鋼琴家可以相對(duì)輕松地掌握彈奏爵士鋼琴的方法。

理論上，構(gòu)成世界正確內(nèi)部表征的智能體應(yīng)該能夠做同樣的事情。

但是AlexNet等分類器所學(xué)到的表示仍具有局限性，特別是網(wǎng)絡(luò)只用單一類別標(biāo)記圖像訓(xùn)練時(shí)，那些推斷標(biāo)簽時(shí)用不上的信息，無(wú)論它在其他任務(wù)中用處多大，都可能被網(wǎng)絡(luò)所忽略。如果標(biāo)簽總是指向前景，則表示可能無(wú)法獲取圖像的背景。

一種可能的解決方案是提供更全面的訓(xùn)練信號(hào)，比如描述圖像的詳細(xì)內(nèi)容，不單單把圖像描述成“狗”，而是“柯基犬在陽(yáng)光明媚的公園里叼飛盤”。

但是，這些信息很難大規(guī)模提供，而且這樣做仍然有可能不足以捕獲完成任務(wù)所需的全部信息。

無(wú)監(jiān)督學(xué)習(xí)的基本前提是學(xué)習(xí)豐富、可廣泛轉(zhuǎn)移表示的最佳方式，這種方式可以學(xué)習(xí)關(guān)于數(shù)據(jù)的全部?jī)?nèi)容。

如果你覺(jué)得轉(zhuǎn)移的概念看起來(lái)過(guò)于抽象，那么請(qǐng)想象一個(gè)學(xué)習(xí)簡(jiǎn)筆畫的孩子。她發(fā)現(xiàn)了人體形態(tài)的特征。通過(guò)增加具體細(xì)節(jié)，她可以為她的所有同學(xué)繪制肖像，加上眼鏡、紅色T恤的同桌等等。

她發(fā)展出這項(xiàng)技能不是為了完成一項(xiàng)特定任務(wù)或獲得獎(jiǎng)勵(lì)，而是為了反映她描繪周圍世界的基本要求。

生成模型和GAN

無(wú)監(jiān)督學(xué)習(xí)的最簡(jiǎn)單目標(biāo)是訓(xùn)練算法生成自己的數(shù)據(jù)實(shí)例，但是模型不應(yīng)該簡(jiǎn)單地重現(xiàn)之前訓(xùn)練的數(shù)據(jù)，否則就是簡(jiǎn)單的記憶行為。

它必須是建立一個(gè)從數(shù)據(jù)中的基礎(chǔ)類模型。不是生成特定的馬或彩虹照片，而是生成馬和彩虹的圖片集；不是來(lái)自特定發(fā)言者的特定話語(yǔ)，而是說(shuō)出話語(yǔ)的一般分布。

生成模型的指導(dǎo)原則是，能夠構(gòu)建一個(gè)令人信服的數(shù)據(jù)示例是理解它的最有力證據(jù)。正如物理學(xué)家理查德·費(fèi)曼所說(shuō)：“我不能創(chuàng)造的東西，我就不能了解”（WhatI cannotcreate,Idonotunderstand.）。

對(duì)于圖像來(lái)說(shuō)，迄今為止最成功的生成模型是生成對(duì)抗網(wǎng)絡(luò)（GAN）。它由兩個(gè)網(wǎng)絡(luò)組成：一個(gè)生成器和一個(gè)鑒別器，分別負(fù)責(zé)偽造圖片和識(shí)別真假。

生成器產(chǎn)生圖像的目的是誘使鑒別者相信它們是真實(shí)的，同時(shí)，鑒別者會(huì)因?yàn)榘l(fā)現(xiàn)假圖片而獲得獎(jiǎng)勵(lì)。

GAN開(kāi)始生成的圖像是雜亂的和隨機(jī)的，在許多次迭代中被細(xì)化，形成更加逼真的圖像，甚至無(wú)法與真實(shí)照片區(qū)別開(kāi)來(lái)。最近英偉達(dá)的GauGAN還能根據(jù)用戶草圖生成圖片。

通過(guò)預(yù)測(cè)創(chuàng)建內(nèi)容

無(wú)監(jiān)督學(xué)習(xí)中另一個(gè)值得注意的成員是自回歸模型，它把數(shù)據(jù)分成一系列小片段，每個(gè)片段依次被預(yù)測(cè)。這些模型可以通過(guò)連續(xù)猜測(cè)接下來(lái)會(huì)發(fā)生什么來(lái)作為輸入，并能夠再次生成猜測(cè)數(shù)據(jù)。

在語(yǔ)言模型中，每個(gè)單詞都是從它之前的單詞預(yù)測(cè)出來(lái)的。它能夠支持在電子郵件和消息應(yīng)用程序中彈出的文本預(yù)測(cè)內(nèi)容。

最近OpenAI公布的GPT-2模型還能能夠生成以假亂真的文字段落。

通過(guò)控制用于調(diào)節(jié)輸出預(yù)測(cè)的輸入序列，自回歸模型也能用于將一個(gè)序列轉(zhuǎn)換為另一個(gè)序列。例如將文本轉(zhuǎn)換為逼真的手寫體、自然的語(yǔ)音，還能將一種語(yǔ)言翻譯成另一種語(yǔ)言。

自回歸模型以預(yù)測(cè)特定順序數(shù)據(jù)的方式來(lái)理解數(shù)據(jù)。通過(guò)預(yù)測(cè)任何其他數(shù)據(jù)的任何部分，可以構(gòu)建更一般的無(wú)監(jiān)督學(xué)習(xí)算法。

例如從句子中刪除一個(gè)單詞，并試圖從剩余的內(nèi)容中預(yù)測(cè)它。通過(guò)學(xué)習(xí)進(jìn)行大量局部預(yù)測(cè)，系統(tǒng)被迫從整體上理解數(shù)據(jù)。

生成模型的出現(xiàn)讓人們產(chǎn)生了一種擔(dān)憂，就是它們可能被濫用。雖然通過(guò)照片、視頻和音頻編輯操縱證據(jù)歷史已久，但生成模型讓惡意編輯媒體內(nèi)容變得更加容易。一個(gè)知名的“deepfakes”范例是奧巴馬演講視頻片段。

令人鼓舞的是，人們已經(jīng)做出了面對(duì)這些挑戰(zhàn)的努力，包括利用統(tǒng)計(jì)技術(shù)幫助檢測(cè)偽造內(nèi)容和驗(yàn)證真實(shí)內(nèi)容、提高公眾意識(shí)、以及圍繞限制生成模型使用范圍展開(kāi)討論。

生成模型本身也能用在檢測(cè)偽造內(nèi)容和異常數(shù)據(jù)。例如，檢測(cè)虛假語(yǔ)音或識(shí)別支付異常，保護(hù)客戶免受欺詐。研究人員需要研究生成模型，以便更好地理解它們并降低風(fēng)險(xiǎn)。

實(shí)現(xiàn)通用智能

生成模型本身很吸引人，DeepMind的主要興趣是用它作為通用智能的踏腳石。賦予智能體生成數(shù)據(jù)的能力是一種賦予其想象力的方式，從而能夠規(guī)劃和推理未來(lái)。

DeepMind的研究表明，即使沒(méi)有明確的生成數(shù)據(jù)，學(xué)習(xí)預(yù)測(cè)環(huán)境的不同方面可以豐富智能體的世界模型，從而提高其解決問(wèn)題的能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像識(shí)別

圖像識(shí)別

+關(guān)注

關(guān)注
9

文章
527

瀏覽量
39128
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8505

瀏覽量
134677
DeepMind

DeepMind

+關(guān)注

關(guān)注
0

文章
131

瀏覽量
11597