99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于GAN-inversion的圖像重構(gòu)過(guò)程

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:深度學(xué)習(xí)自然語(yǔ)言 ? 2022-07-13 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

筆者最近在集中時(shí)間學(xué)習(xí)對(duì)抗生成網(wǎng)絡(luò)(GAN),特別是深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理,需要對(duì)圖像修復(fù)與處理經(jīng)典論文進(jìn)行回顧和精讀。

將從圖像修復(fù)與處理的經(jīng)典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開(kāi)始,重啟精讀之路。

DGP提出了一種挖掘GAN中圖像先驗(yàn)的方式,在多個(gè)任務(wù)上揭示了GAN作為一種通用圖像先驗(yàn)的潛力。

論文提出了同時(shí)插值隱變量和生成器的漸變式圖像反演方法,可以應(yīng)用于復(fù)雜圖片的對(duì)抗防御,在實(shí)驗(yàn)中DGP所展現(xiàn)出的強(qiáng)大的像素間空間關(guān)系模擬能力也十分有趣。

Deep generative prior的圖像復(fù)原效果

01深度生成先驗(yàn)

深度圖像先驗(yàn)DIP僅依靠輸入圖像的統(tǒng)計(jì)信息,無(wú)法應(yīng)用于需要更一般的圖像統(tǒng)計(jì)信息的任務(wù),如圖像上色和圖像編輯。

我們更感興趣的是研究一種更通用的圖像先驗(yàn),即在大規(guī)模自然圖像上訓(xùn)練的GAN生成器用于圖像合成。具體來(lái)說(shuō),是一個(gè)基于GAN-inversion的圖像重構(gòu)過(guò)程。

在實(shí)踐中,僅僅通過(guò)優(yōu)化隱向量z難以準(zhǔn)確重建ImageNet這樣的復(fù)雜真實(shí)圖像。訓(xùn)練GAN的數(shù)據(jù)集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓(xùn)練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學(xué)習(xí)了豐富的圖片信息,為了利用這些信息并且實(shí)現(xiàn)精確重建,我們讓生成器online地適應(yīng)于每張目標(biāo)圖片,即聯(lián)合優(yōu)化隱向量z和生成器參數(shù)。

e8a3abdc-026d-11ed-ba43-dac502259ad0.png

我們將此新的目標(biāo)稱為深度生成先驗(yàn)(DGP),DGP顯著提高了圖像重構(gòu)的效果。設(shè)計(jì)合適的距離度量和優(yōu)化策略非常關(guān)鍵,在重建過(guò)程中,生成器原始的生成先驗(yàn)被修改了,輸出真實(shí)自然圖像的能力可能會(huì)下降。

02判別器指引的漸進(jìn)式重建

從 latent space Z 中隨機(jī)抽取幾百個(gè)候選的初始 latent code,并選擇在度量L下重構(gòu)效果最好的一個(gè)。

在GAN重建中,傳統(tǒng)的距離度量方法是 MSE 或 Perceptual loss。優(yōu)化生成器參數(shù)時(shí),將這些傳統(tǒng)距離度量用在圖像恢復(fù)如上色任務(wù)中,常常無(wú)法準(zhǔn)確恢復(fù)顏色,并且重建過(guò)程中圖像會(huì)變得模糊,需要設(shè)計(jì)更好的優(yōu)化方式來(lái)保留生成器的原有信息。

我們?cè)谠摴ぷ髦羞x擇使用與生成器對(duì)應(yīng)的判別器來(lái)作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個(gè)第三方的任務(wù)上訓(xùn)練,而是在預(yù)訓(xùn)練時(shí)就與生成器高度耦合,它天然地適用于調(diào)整生成器的輸出分布。

使用這種基于判別器的距離度量時(shí),重建的過(guò)程更加自然和真實(shí),最終顏色恢復(fù)的效果也更好。

e8da5646-026d-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時(shí)判別器第i個(gè)block輸出的特征

雖然改進(jìn)的距離度量帶來(lái)了更好的效果,但是圖像復(fù)原的結(jié)果仍存在非自然痕跡,因?yàn)樯善髟卺槍?duì)目標(biāo)圖片優(yōu)化時(shí),淺層參數(shù)匹配好圖片整體布局之前,深層參數(shù)就開(kāi)始匹配細(xì)節(jié)紋理了。

e8efceea-026d-11ed-ba43-dac502259ad0.png

上面的蘋(píng)果圖是幾種訓(xùn)練策略的對(duì)比,從三行效果可以看出,有的蘋(píng)果在訓(xùn)練初期沒(méi)被染上色后期還是沒(méi)被染上色,我們把這種現(xiàn)象稱作“信息滯留”。

對(duì)策就是:使用漸進(jìn)式重建的策略,即在微調(diào)生成器時(shí),先優(yōu)化淺層,再逐漸過(guò)渡到深層,讓重建過(guò)程“先整體后局部”。

與非漸進(jìn)策略相比,這種漸進(jìn)策略更好地保留了缺失語(yǔ)義和現(xiàn)有語(yǔ)義之間的一致性。

e91b971e-026d-11ed-ba43-dac502259ad0.png

03重建結(jié)果

使用BigGAN模型,基于ImageNet進(jìn)行訓(xùn)練,使用ImageNet驗(yàn)證集中的1000張圖像進(jìn)行實(shí)驗(yàn),取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺(jué)上的重建誤差幾乎難以察覺(jué)。

04實(shí)驗(yàn)

因?yàn)镚AN刻畫(huà)了自然圖像的先驗(yàn),因此可以完成很多的任務(wù):比如上色、補(bǔ)全、超分辨率等等,還能進(jìn)行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評(píng)估結(jié)果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

e9a097ca-026d-11ed-ba43-dac502259ad0.png

圖像補(bǔ)全

e9c15870-026d-11ed-ba43-dac502259ad0.png

超分辨率

e9e2b7a4-026d-11ed-ba43-dac502259ad0.png

靈活性

e9f9a248-026d-11ed-ba43-dac502259ad0.png

隨機(jī)擾動(dòng)

ea27bb4c-026d-11ed-ba43-dac502259ad0.png

總結(jié)

GAN作為圖像領(lǐng)域最強(qiáng)大的生成式模型之一,學(xué)習(xí)到了豐富的自然圖像流形,可以對(duì)自然圖像的恢復(fù)和編輯帶來(lái)巨大幫助。

利用好大規(guī)模預(yù)訓(xùn)練模型的能力是深度學(xué)習(xí)目前各個(gè)領(lǐng)域的流行前沿,可以減少對(duì)訓(xùn)練數(shù)據(jù)的需求,整合相近的研究領(lǐng)域。

未來(lái)更強(qiáng)大的生成式模型,將帶來(lái)更具實(shí)際應(yīng)用價(jià)值的圖像恢復(fù)和編輯應(yīng)用,有望在更廣泛的領(lǐng)域落地

ea5a7d48-026d-11ed-ba43-dac502259ad0.png

原文標(biāo)題:深度學(xué)習(xí)論文精讀[GAN]:利用深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2205

    瀏覽量

    76763
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    21887
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122782

原文標(biāo)題:深度學(xué)習(xí)論文精讀[GAN]:利用深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    增強(qiáng)AlN/GaN HEMT

    一種用于重?fù)诫sn型接觸的選擇性刻蝕工藝實(shí)現(xiàn)了AlN/GaN HEMT的縮小 上圖:原位SiN/AlN/GaN HEMT外延堆疊示意圖 俄亥俄州立大學(xué)的工程師們宣稱,他們已經(jīng)打開(kāi)了一扇大門(mén),有望制備出
    的頭像 發(fā)表于 06-12 15:44 ?202次閱讀
    增強(qiáng)AlN/<b class='flag-5'>GaN</b> HEMT

    GaN LLC電源EMC優(yōu)化技巧

    目錄 1,整機(jī)線路架構(gòu) 2,初次極安規(guī)Y電容接法 3,PFC校正電路參數(shù)選取及PCB布具注意事項(xiàng) 4,LLC環(huán)路設(shè)計(jì)注意事項(xiàng) 5,GaN驅(qū)動(dòng)電路設(shè)計(jì)走線參考 6,變壓器輸出整流注意事項(xiàng) 一,整體線路圖 獲取完整文檔資料可下載附件哦?。。?!如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持一下哦~
    發(fā)表于 05-28 16:15

    一種低翹曲扇出重構(gòu)方案

    翹曲(Warpage)是結(jié)構(gòu)固有的缺陷之一。晶圓級(jí)扇出封裝(FOWLP)工藝過(guò)程中,由于硅芯片需通過(guò)環(huán)氧樹(shù)脂(EMC)進(jìn)行模塑重構(gòu)成為新的晶圓,使其新的晶圓變成非均質(zhì)材料,不同材料間的熱膨脹和收縮程度不平衡則非常容易使重構(gòu)晶圓發(fā)
    的頭像 發(fā)表于 05-14 11:02 ?298次閱讀
    一種低翹曲扇出<b class='flag-5'>重構(gòu)</b>方案

    功率GaN的新趨勢(shì):GaN BDS

    電子發(fā)燒友綜合報(bào)道 最近多家GaN廠商推出雙向GaN功率開(kāi)關(guān),即GaN BDS(Bidirectional Switch,雙向開(kāi)關(guān))。這是一種較為新型的GaN功率器件產(chǎn)品,顧名思義,雙
    發(fā)表于 04-20 09:15 ?587次閱讀

    OptiSystem應(yīng)用:真實(shí)圖像在光纖中傳輸后的恢復(fù)

    經(jīng)過(guò)50km的光纖系統(tǒng)進(jìn)行傳輸,光電轉(zhuǎn)化并濾波之后,我們用數(shù)據(jù)恢復(fù)器件(Data Recovery)來(lái)恢復(fù)二進(jìn)制信號(hào),再用圖像重構(gòu)組件(Image Reconstructor)接收二進(jìn)制信號(hào)實(shí)現(xiàn)對(duì)傳
    發(fā)表于 03-03 09:26

    GAN039-650NBB氮化鎵(GaN)FET規(guī)格書(shū)

    電子發(fā)燒友網(wǎng)站提供《GAN039-650NBB氮化鎵(GaN)FET規(guī)格書(shū).pdf》資料免費(fèi)下載
    發(fā)表于 02-13 16:10 ?0次下載
    <b class='flag-5'>GAN</b>039-650NBB氮化鎵(<b class='flag-5'>GaN</b>)FET規(guī)格書(shū)

    GAN041-650WSB氮化鎵(GaN)FET規(guī)格書(shū)

    電子發(fā)燒友網(wǎng)站提供《GAN041-650WSB氮化鎵(GaN)FET規(guī)格書(shū).pdf》資料免費(fèi)下載
    發(fā)表于 02-13 14:24 ?0次下載
    <b class='flag-5'>GAN</b>041-650WSB氮化鎵(<b class='flag-5'>GaN</b>)FET規(guī)格書(shū)

    基于相變材料的可重構(gòu)超構(gòu)表面用于圖像處理

    光學(xué)超構(gòu)表面(metasurface)實(shí)現(xiàn)了在亞波長(zhǎng)尺度內(nèi)的模擬計(jì)算和圖像處理,并具備更低的功耗、更快的速度。雖然人們已經(jīng)展示了各種圖像處理超構(gòu)表面,但大多數(shù)考慮的器件都是靜態(tài)的,缺乏可重構(gòu)性。然而
    的頭像 發(fā)表于 11-13 10:24 ?1.1w次閱讀
    基于相變材料的可<b class='flag-5'>重構(gòu)</b>超構(gòu)表面用于<b class='flag-5'>圖像</b>處理

    GaN有體二極管嗎?了解GaN的第三象限運(yùn)行

    電子發(fā)燒友網(wǎng)站提供《GaN有體二極管嗎?了解GaN的第三象限運(yùn)行.pdf》資料免費(fèi)下載
    發(fā)表于 09-19 12:55 ?8次下載
    <b class='flag-5'>GaN</b>有體二極管嗎?了解<b class='flag-5'>GaN</b>的第三象限運(yùn)行

    GaN應(yīng)用介紹

    電子發(fā)燒友網(wǎng)站提供《GaN應(yīng)用介紹.pdf》資料免費(fèi)下載
    發(fā)表于 09-12 09:55 ?0次下載
    <b class='flag-5'>GaN</b>應(yīng)用介紹

    光學(xué)識(shí)別的過(guò)程包含哪些

    光學(xué)識(shí)別(Optical Character Recognition,OCR)是一種將圖像中的文字轉(zhuǎn)換為機(jī)器可讀文本的技術(shù)。這個(gè)過(guò)程涉及多個(gè)步驟,包括圖像預(yù)處理、文本檢測(cè)、字符分割、字符識(shí)別和后處理
    的頭像 發(fā)表于 09-10 15:36 ?815次閱讀

    GaN晶體管的應(yīng)用場(chǎng)景有哪些

    GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來(lái)在多個(gè)領(lǐng)域展現(xiàn)出廣泛的應(yīng)用場(chǎng)景。其出色的高頻性能、高功率密度、高溫穩(wěn)定性以及低導(dǎo)通電阻等特性,使得GaN晶體管成為電力電子和高頻通信等領(lǐng)域的優(yōu)選器件。以
    的頭像 發(fā)表于 08-15 11:27 ?1778次閱讀

    重構(gòu):改善既有代碼的設(shè)計(jì)」實(shí)戰(zhàn)篇

    背景 在軟件開(kāi)發(fā)的世界里,代碼重構(gòu)是提升項(xiàng)目質(zhì)量、適應(yīng)業(yè)務(wù)變化的關(guān)鍵步驟。最近,我重新翻閱了《重構(gòu):改善既有代碼的設(shè)計(jì) 第二版》,這本書(shū)不僅重新點(diǎn)燃了我對(duì)重構(gòu)的熱情,還深化了我的理解:重構(gòu)
    的頭像 發(fā)表于 08-14 10:42 ?602次閱讀
    「<b class='flag-5'>重構(gòu)</b>:改善既有代碼的設(shè)計(jì)」實(shí)戰(zhàn)篇

    圖像檢測(cè)和圖像識(shí)別的原理、方法及應(yīng)用場(chǎng)景

    的目標(biāo)物體的過(guò)程。它的目標(biāo)是確定圖像中是否存在特定的物體,并在圖像中找到這些物體的位置,通常以矩形框的形式表示。 1.2 圖像識(shí)別 圖像識(shí)別
    的頭像 發(fā)表于 07-16 11:19 ?6933次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    值化、濾波、邊緣檢測(cè)等操作。這些操作可以提高圖像的質(zhì)量,減少噪聲,突出圖像的特征,為后續(xù)的特征提取和分類器設(shè)計(jì)提供基礎(chǔ)。 1.1 去噪 去噪是去除圖像中的噪聲,提高圖像質(zhì)量的
    的頭像 發(fā)表于 07-16 10:46 ?2530次閱讀