99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)真正可以實(shí)現(xiàn)什么,與經(jīng)典計(jì)算機(jī)視覺(jué)的區(qū)別是什么?

DPVg_AI_era ? 來(lái)源:lp ? 2019-04-19 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)的成功和一系列令人驚訝的失敗模式教會(huì)了我們處理數(shù)據(jù)的寶貴教訓(xùn)。本文展示了深度學(xué)習(xí)真正可以實(shí)現(xiàn)什么,與經(jīng)典計(jì)算機(jī)視覺(jué)的區(qū)別是什么,以及進(jìn)行關(guān)鍵應(yīng)用的潛在危險(xiǎn)有哪些。

我們對(duì)深度網(wǎng)絡(luò)的黑盒效應(yīng)都很熟悉了。雖然沒(méi)有人知道黑盒子里到底經(jīng)歷了什么,然而深度學(xué)習(xí)的成功以及一系列驚人的失敗模式,提供了如何處理的數(shù)據(jù)的寶貴教訓(xùn)。

本文作者Piekniewski,將為我們展示深度學(xué)習(xí)的實(shí)際能力、與經(jīng)典計(jì)算機(jī)視覺(jué)的關(guān)系,在關(guān)鍵應(yīng)用上依賴深度學(xué)習(xí)的潛在危險(xiǎn),以及未來(lái)走向。

此人也對(duì)AI寒冬論持有堅(jiān)定的信念,參見文章《深度學(xué)習(xí)到頂,AI寒冬將至!》《歷史總是在重演,AI寒冬或再來(lái)》。

視覺(jué)問(wèn)題中沒(méi)有純粹的“簡(jiǎn)單”和“復(fù)雜”

首先需要就視覺(jué)/計(jì)算機(jī)視覺(jué)做一點(diǎn)說(shuō)明。原則上可以表述如下:給定一臺(tái)攝像機(jī)拍攝的圖像,計(jì)算機(jī)可以回答關(guān)于該圖像內(nèi)容的一些問(wèn)題。

簡(jiǎn)單的問(wèn)題比如“圖像中是否存在三角形”,“圖像中是否存在人臉”;復(fù)雜的問(wèn)題例如“是否有狗在圖像中追逐貓”。這些對(duì)人類來(lái)說(shuō)小兒科的問(wèn)題看似有很多相似的地方,然而事實(shí)卻證明這些問(wèn)題的背后的復(fù)雜性存在巨大差異。

同樣是讓計(jì)算機(jī)回答“圖中是否有XX”的問(wèn)題,“圖中是否有貓”顯然要比“圖中是否有紅色”更難。你看,試圖將視覺(jué)問(wèn)題劃分為“簡(jiǎn)單”或“復(fù)雜”將會(huì)陷入無(wú)止境的深淵。

這一點(diǎn)很重要。因?yàn)橄裎覀內(nèi)祟愡@種高度視覺(jué)化的動(dòng)物,以上問(wèn)題都不是問(wèn)題。但對(duì)計(jì)算機(jī)深度學(xué)習(xí)來(lái)說(shuō),確實(shí)非常復(fù)雜。

傳統(tǒng)計(jì)算機(jī)視覺(jué)存在的問(wèn)題

傳統(tǒng)的計(jì)算機(jī)視覺(jué)就是使用一套算法,從圖片里提取信息(通常表示為像素值數(shù)組)。比如去噪、增強(qiáng)和檢測(cè)的算法,一些方法旨在尋找簡(jiǎn)單的幾何圖元,例如邊緣檢測(cè)、形態(tài)分析、霍夫變換、斑點(diǎn)檢測(cè)、角點(diǎn)檢測(cè)、各種圖像閾值處理技術(shù)等。還有特征表示技術(shù)和變換,如定向梯度的直方圖、Haar級(jí)聯(lián)等可以用作機(jī)器學(xué)習(xí)分類器的前端以構(gòu)建更復(fù)雜的檢測(cè)器。

與流行的看法相反,上述工具結(jié)合在一起可以組成非常強(qiáng)大有效的特定物體探測(cè)器。人們可以構(gòu)建面部檢測(cè)器、汽車檢測(cè)器、路牌檢測(cè)器,并且它們很可能在精度和計(jì)算復(fù)雜性方面,優(yōu)于這些特定對(duì)象的深度學(xué)習(xí)解決方案。

但問(wèn)題是,每個(gè)探測(cè)器都需要由有能力的人員從頭開始構(gòu)建,低效又昂貴,且不可擴(kuò)展的。

因此,李上上那些很厲害的探測(cè)器只適用于必須高頻場(chǎng)景,還需要證明前期投資的合理性。許多探測(cè)器都是專有的,一般公眾無(wú)法使用。

優(yōu)秀的面部探測(cè)器、車牌閱讀器很多,但狗探測(cè)器卻很少。沒(méi)有一個(gè)心智正常的人會(huì)投入人力和物力去編寫狗探測(cè)器或分類器,從圖像中分類出一種狗,貴且不切實(shí)際。

這是傳統(tǒng)視覺(jué)的死穴,卻是深度學(xué)習(xí)的用武之地。

用一個(gè)聰明學(xué)生的故事來(lái)解釋深度學(xué)習(xí)的本質(zhì)

想象一下,你正在教授計(jì)算機(jī)視覺(jué)課程。在開始的幾個(gè)講座中,學(xué)生了解到豐富的技術(shù)(例如上面討論的技術(shù)),接下來(lái)就是給學(xué)生布置一些任務(wù)。

先從一些簡(jiǎn)單的任務(wù)開始,例如通過(guò)詢問(wèn)圖像中是否有圓形或正方形;接下來(lái)逐漸提高復(fù)雜度。學(xué)生每周都要編寫計(jì)算機(jī)程序來(lái)解決下一個(gè)任務(wù)。而你來(lái)查看代碼,并在某些示例上運(yùn)行代碼來(lái)檢驗(yàn)效果。

這個(gè)學(xué)期,來(lái)了一個(gè)新生,他不跟周圍人說(shuō)話,也從不問(wèn)問(wèn)題。但當(dāng)他提交第一個(gè)解決方案時(shí),你會(huì)發(fā)現(xiàn)這是一堆難以理解的代碼,跟你以前看到的代碼都不同。

看起來(lái)他正在用一些隨機(jī)看的過(guò)濾器對(duì)每個(gè)圖像進(jìn)行卷積,然后使用一些非常奇怪的邏輯,許多“ifthenelse”語(yǔ)句具有大量搞不懂的參數(shù)來(lái)獲得最終答案。你在樣本上運(yùn)行此代碼,它居然完全正常!你心想,這個(gè)方法是在不同尋常難以理解,但管他呢,確實(shí)有效??!

幾周過(guò)去了,任務(wù)復(fù)雜度在不斷提升,你越來(lái)越看不懂這個(gè)學(xué)生的代碼,但就算是最復(fù)雜的任務(wù),它的效果也令人驚訝。最后一個(gè)問(wèn)題是在一組真實(shí)的圖像中區(qū)分貓和狗。其他學(xué)生代碼的準(zhǔn)確率都沒(méi)有超過(guò)65%,但新學(xué)員的代碼能夠達(dá)到95%!太不可思議了。

你對(duì)代碼進(jìn)行了逆向工程,結(jié)果發(fā)現(xiàn)他那堆復(fù)雜的代碼,背后的邏輯其實(shí)非常簡(jiǎn)單:

檢測(cè)是否有狗牌:如果有返回“狗”;沒(méi)有返回“貓”

如果沒(méi)有狗牌,檢測(cè)圖像的左側(cè)部分是否比右側(cè)部分更黃:如果是返回“狗”;不是返回“貓”

你把這個(gè)學(xué)生叫到辦公室問(wèn)他是怎么想的,他表示其實(shí)自己也不知道,他根本不明白貓和狗是什么,只知道通過(guò)什么方法將二者區(qū)分出來(lái)。這算作弊嗎?從人類的角度來(lái)看,是的,他的出發(fā)點(diǎn)和你想的完全不同。

雖然其他學(xué)生使用原始數(shù)據(jù)集并沒(méi)有得到特別突出的結(jié)果,但也不會(huì)出什么奇怪的錯(cuò)誤。相比而言,新學(xué)生的方式雖然在使用當(dāng)前數(shù)據(jù)集的時(shí)候,效果卓著,然而一旦稍微對(duì)數(shù)據(jù)集做一點(diǎn)改動(dòng),例如將狗牌貼在貓身上,結(jié)果就是完全錯(cuò)誤的。

深度學(xué)習(xí)的天賜和詛咒

上面那個(gè)新學(xué)生的例子,其實(shí)很形象的表述了深度學(xué)習(xí)的特性。

深度學(xué)習(xí)是一種使用梯度反向傳播的、特定優(yōu)化技術(shù)來(lái)生成“程序”(也稱為“神經(jīng)網(wǎng)絡(luò)”)的技術(shù)。上面學(xué)生的程序只是構(gòu)建一組轉(zhuǎn)換和條件,將正確的標(biāo)簽分配給數(shù)據(jù)集中的正確圖像。而且總是在尋求解決問(wèn)題最省力的方法,比如給定數(shù)據(jù)集里,狗的圖片都在右上角有一道藍(lán)色的光暈,那么深度學(xué)習(xí)就會(huì)立刻使用這作為區(qū)分貓狗的標(biāo)準(zhǔn)。

為了消除這些虛假的偏差,我們通常會(huì)向訓(xùn)練集添加更多數(shù)據(jù)、反向傳播生成的“程序”可能非常大、非常復(fù)雜,具有數(shù)百萬(wàn)個(gè)參數(shù)和數(shù)千個(gè)條件檢查,可以鎖定到組合更精細(xì)偏見的組合。任何允許分配正確標(biāo)簽以統(tǒng)計(jì)優(yōu)化目標(biāo)函數(shù)的東西都會(huì)做,無(wú)論是否與任務(wù)的“語(yǔ)義精神”相關(guān)。

深度網(wǎng)絡(luò)能否最終鎖定到“語(yǔ)義正確”先驗(yàn)的東西上?當(dāng)然可以。但現(xiàn)在有大量證據(jù)表明,實(shí)際上并非五次。對(duì)抗性的例子表明,對(duì)圖像的微小修改都可以導(dǎo)致錯(cuò)誤的結(jié)果。對(duì)類似于先前訓(xùn)練的數(shù)據(jù)集的新樣本的研究表明,超出原始數(shù)據(jù)集的泛化遠(yuǎn)比數(shù)據(jù)集中的泛化弱得多。

自動(dòng)創(chuàng)建無(wú)人能想到的功能,是深度學(xué)習(xí)的最大優(yōu)勢(shì),同時(shí)也是它的最大弱點(diǎn)、因?yàn)榇蠖鄶?shù)時(shí)候,至少在語(yǔ)義上是存疑的。

深度學(xué)習(xí)在什么情況下好用,什么情況下不可用?

深度學(xué)習(xí)無(wú)疑是計(jì)算機(jī)視覺(jué)工具箱的一個(gè)有趣補(bǔ)充?,F(xiàn)在可以相對(duì)容易地“訓(xùn)練”探測(cè)器來(lái)探測(cè)物體,還可以在一定程度通過(guò)調(diào)整探測(cè)器來(lái)使用更多算力。但同時(shí)也需要為深度網(wǎng)絡(luò)的黑盒屬性付出高昂的代價(jià),我們無(wú)法確定他如何做出決定,而且跟我們認(rèn)可的“語(yǔ)義精神”毫無(wú)關(guān)系。因此,在輸入數(shù)據(jù)中出現(xiàn)的任何低級(jí)偏差都會(huì)導(dǎo)致檢測(cè)器意外地失敗,而且這些失效條件實(shí)際上無(wú)法表征。

因此在落地應(yīng)用時(shí),深度學(xué)習(xí)主要用于對(duì)錯(cuò)誤不敏感、且能夠保證輸入不會(huì)與訓(xùn)練數(shù)據(jù)集有很大差異場(chǎng)景,例如圖像搜索,可能是監(jiān)視,自動(dòng)零售以及幾乎所有的“非關(guān)鍵任務(wù)”,95%的準(zhǔn)確率非常夠用了。

具有諷刺意味的是,大多數(shù)人堅(jiān)信深度學(xué)習(xí)在無(wú)人駕駛汽車、自動(dòng)機(jī)器人場(chǎng)景下的應(yīng)用是一場(chǎng)革命,Piekniewski認(rèn)為,只能將這種信念描述為“不幸”的誤解。因?yàn)檫@些場(chǎng)景需要需要實(shí)時(shí)決策,容錯(cuò)率極低,經(jīng)常會(huì)導(dǎo)致致命的結(jié)果,最近的研究顯示基于深度神經(jīng)的自動(dòng)駕駛解決方案在現(xiàn)實(shí)生活中確實(shí)容易受到對(duì)抗性攻擊。

還有人對(duì)深度學(xué)習(xí)應(yīng)用在醫(yī)學(xué)和診斷中寄予厚望。然而,在這個(gè)領(lǐng)域,也有一些相關(guān)的發(fā)現(xiàn),例如,在一個(gè)機(jī)構(gòu)數(shù)據(jù)上訓(xùn)練的模型失敗了,換一個(gè)機(jī)構(gòu)數(shù)據(jù)卻成功了,說(shuō)明這些模型使用比許多研究人員所希望的更淺度的數(shù)據(jù)。

數(shù)據(jù)比我們想象的更淺。

深度學(xué)習(xí) vs 傳統(tǒng)計(jì)算機(jī)視覺(jué)

深度學(xué)習(xí)現(xiàn)在非常流行,但傳統(tǒng)的計(jì)算機(jī)視覺(jué)也并非就失去價(jià)值。

傳統(tǒng)計(jì)算機(jī)視覺(jué)仍然可以用來(lái)構(gòu)建強(qiáng)大的探測(cè)器。這些手工做成的探測(cè)器可能無(wú)法在某些特定數(shù)據(jù)集指標(biāo)上實(shí)現(xiàn)高性能,但可以保證依賴于輸入的“語(yǔ)義相關(guān)”特征集,它的故障模式可以更好地表征和預(yù)期。

深度學(xué)習(xí)提供統(tǒng)計(jì)上強(qiáng)大的探測(cè)器,而不需要昂貴的特征工程,盡管仍需要大量已標(biāo)記的數(shù)據(jù),外加大量GPU和現(xiàn)場(chǎng)的深度學(xué)習(xí)專家。而且,這些探測(cè)器會(huì)意外地失效,適用范圍也不容易被(完全)表征。

所以,在容錯(cuò)率高的場(chǎng)景中,可以選擇深度學(xué)習(xí);在容錯(cuò)率低且計(jì)算復(fù)雜性更重要的場(chǎng)景中,經(jīng)典機(jī)器視覺(jué)管道將在可預(yù)見的未來(lái)繼續(xù)占據(jù)重要位置。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:深度學(xué)習(xí)的天賜和詛咒:最大的優(yōu)勢(shì)也是最大的缺陷

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)要看什么書?

    計(jì)算機(jī)視覺(jué)深度學(xué)習(xí),看這本書就夠了
    發(fā)表于 05-21 12:43

    深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)領(lǐng)域圖像應(yīng)用總結(jié) 精選資料下載

    突破的領(lǐng)域,真正讓大家大吃一驚的顛覆傳統(tǒng)方法的應(yīng)用領(lǐng)域是語(yǔ)音識(shí)別,做出來(lái)的公司是微軟,而不是當(dāng)時(shí)如日中天的谷歌。計(jì)算機(jī)視覺(jué)應(yīng)用深度學(xué)習(xí)堪稱突
    發(fā)表于 07-28 08:22

    深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺(jué)簡(jiǎn)介

    文章目錄1 簡(jiǎn)介1.1 深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺(jué)1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計(jì)算機(jī)
    發(fā)表于 12-23 06:17

    深度學(xué)習(xí)是否會(huì)取代傳統(tǒng)的計(jì)算機(jī)視覺(jué)?

    理解傳統(tǒng)的計(jì)算機(jī)視覺(jué)實(shí)際上真的有助于你更好的使用深度學(xué)習(xí)。例如,計(jì)算機(jī)視覺(jué)中最常見的神經(jīng)網(wǎng)絡(luò)是卷
    的頭像 發(fā)表于 04-02 10:37 ?6443次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>是否會(huì)取代傳統(tǒng)的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>?

    深度學(xué)習(xí)不能取代計(jì)算機(jī)視覺(jué)技術(shù)背后的真正原因

    深度學(xué)習(xí)只是一種 計(jì)算機(jī)視覺(jué) 工具,而不是包治百病的良藥,不要因?yàn)榱餍芯鸵晃兜厥褂盟?。傳統(tǒng)的計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 04-05 11:37 ?5051次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>不能取代<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>技術(shù)背后的<b class='flag-5'>真正</b>原因

    計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)區(qū)別

     “計(jì)算機(jī)視覺(jué)”,是指用計(jì)算機(jī)實(shí)現(xiàn)人的視覺(jué)功能,對(duì)客觀世界的三維場(chǎng)景的感知、識(shí)別和理解。計(jì)算機(jī)
    的頭像 發(fā)表于 12-08 09:27 ?1.3w次閱讀

    深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)上的四大應(yīng)用

    計(jì)算機(jī)視覺(jué)中比較成功的深度學(xué)習(xí)的應(yīng)用,包括人臉識(shí)別,圖像問(wèn)答,物體檢測(cè),物體跟蹤。
    的頭像 發(fā)表于 08-24 16:16 ?5255次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>上的四大應(yīng)用

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)區(qū)別的講解

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)區(qū)別的講解。
    發(fā)表于 04-27 10:34 ?7次下載

    深度學(xué)習(xí)和傳統(tǒng)計(jì)算機(jī)視覺(jué)技術(shù)在新興領(lǐng)域的比較

    是不是深度學(xué)習(xí)可以解決所有問(wèn)題呢?是不是它就比傳統(tǒng)計(jì)算機(jī)視覺(jué)方法好呢?但是深度
    的頭像 發(fā)表于 11-28 11:01 ?2033次閱讀

    計(jì)算機(jī)視覺(jué)識(shí)別是如何工作的?

    計(jì)算機(jī)視覺(jué)識(shí)別是一種人工智能技術(shù),旨在使計(jì)算機(jī)系統(tǒng)從數(shù)字圖像、視頻等視覺(jué)信息中識(shí)別和提取有意義信息的能力。
    的頭像 發(fā)表于 02-09 13:41 ?5019次閱讀

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)區(qū)別

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)區(qū)別 機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)是兩
    的頭像 發(fā)表于 08-09 16:51 ?2492次閱讀

    計(jì)算機(jī)視覺(jué)中的九種深度學(xué)習(xí)技術(shù)

    計(jì)算機(jī)視覺(jué)中仍有許多具有挑戰(zhàn)性的問(wèn)題需要解決。然而,深度學(xué)習(xí)方法正在針對(duì)某些特定問(wèn)題取得最新成果。 在最基本的問(wèn)題上,最有趣的不僅僅是深度
    發(fā)表于 08-21 09:56 ?974次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>中的九種<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)

    用于計(jì)算機(jī)視覺(jué)經(jīng)典機(jī)器學(xué)習(xí)應(yīng)用分析

    深度學(xué)習(xí)是指在大部分未處理或“原始”數(shù)據(jù)上運(yùn)行的非常大的神經(jīng)網(wǎng)絡(luò)模型。深度學(xué)習(xí)通過(guò)將特征提取操作拉入模型本身,對(duì)計(jì)算機(jī)
    發(fā)表于 11-07 10:11 ?701次閱讀
    用于<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的<b class='flag-5'>經(jīng)典</b>機(jī)器<b class='flag-5'>學(xué)習(xí)</b>應(yīng)用分析

    深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了顯著的成果。計(jì)算機(jī)
    的頭像 發(fā)表于 07-01 11:38 ?1789次閱讀

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)區(qū)別在哪

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 07-09 09:22 ?877次閱讀