99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

生成對抗網(wǎng)絡GAN論文TOP 10,幫助你理解最先進技術的基礎

電子工程師 ? 來源:lp ? 2019-03-20 15:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

生成對抗網(wǎng)絡 (GAN) 是深度學習中最有趣、最受歡迎的應用之一。本文列出了 10 篇關于 GAN 的論文,這些論文將為你提供一個很好的對 GAN 的介紹,幫助你理解最先進技術的基礎。

本文選擇的10篇GAN論文包括:

DCGANs

Improved Techniques for Training GANs

Conditional GANs

Progressively Growing GANs

BigGAN

StyleGAN

CycleGAN

Pix2Pix

StackGAN

Generative Adversarial Networks

DCGANs?—?Radford et al.(2015)

我建議你以DCGAN這篇論文來開啟你的GAN之旅。這篇論文展示了卷積層如何與GAN一起使用,并為此提供了一系列架構指南。這篇論文還討論了GAN特征的可視化、潛在空間插值、利用判別器特征來訓練分類器、評估結果等問題。所有這些問題都必然會出現(xiàn)在你的GAN研究中。

總之,DCGAN論文是一篇必讀的GAN論文,因為它以一種非常清晰的方式定義架構,因此很容易從一些代碼開始,并開始形成開發(fā)GAN的直覺。

DCGAN模型:具有上采樣卷積層的生成器架構

論文:

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

Alec Radford, Luke Metz, Soumith Chintala

https://arxiv.org/abs/1511.06434

改進GAN訓練的技術——?Salimans et al.(2016)

這篇論文(作者包括Ian Goodfellow)根據(jù)上述DCGAN論文中列出的架構指南,提供了一系列建議。這篇論文將幫助你了解GAN不穩(wěn)定性的最佳假設。此外,本文還提供了許多用于穩(wěn)定DCGAN訓練的其他機器,包括特征匹配、minibatch識別、歷史平均、單邊標簽平滑和虛擬批標準化。使用這些技巧來構建一個簡單的DCGAN實現(xiàn)是一個很好的練習,有助于更深入地了解GAN。

論文:

Improved Techniques for Training GANs

Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chen

https://arxiv.org/abs/1606.03498

Conditional GANs?—?Mirza and Osindero(2014)

這是一篇很好的論文,讀起來很順暢。條件GAN(Conditional GAN)是最先進的GAN之一。論文展示了如何整合數(shù)據(jù)的類標簽,從而使GAN訓練更加穩(wěn)定。利用先驗信息對GAN進行調(diào)節(jié)這樣的概念,在此后的GAN研究中是一個反復出現(xiàn)的主題,對于側(cè)重于image-to-image或text-to-image的論文尤其重要。

Conditional GAN架構:除了隨機噪聲向量z之外,類標簽y被連接在一起作為網(wǎng)絡的輸入

論文:

Conditional Generative Adversarial Nets

Mehdi Mirza, Simon Osindero

https://arxiv.org/abs/1411.1784

Progressively Growing GANs—?Karras et al.(2017)

Progressively Growing GAN (PG-GAN)有著驚人的結果,以及對GAN問題的創(chuàng)造性方法,因此也是一篇必讀論文。

這篇GAN論文來自NVIDIA Research,提出以一種漸進增大(progressive growing)的方式訓練GAN,通過使用逐漸增大的GAN網(wǎng)絡(稱為PG-GAN)和精心處理的CelebA-HQ數(shù)據(jù)集,實現(xiàn)了效果令人驚嘆的生成圖像。作者表示,這種方式不僅穩(wěn)定了訓練,GAN生成的圖像也是迄今為止質(zhì)量最好的。

它的關鍵想法是漸進地增大生成器和鑒別器:從低分辨率開始,隨著訓練的進展,添加新的層對越來越精細的細節(jié)進行建模。“Progressive Growing”指的是先訓練4x4的網(wǎng)絡,然后訓練8x8,不斷增大,最終達到1024x1024。這既加快了訓練速度,又大大穩(wěn)定了訓練速度,并且生成的圖像質(zhì)量非常高。

Progressively Growing GAN的多尺度架構,模型從4×4 逐步增大到1024×1024

論文:

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen

https://arxiv.org/abs/1710.10196

BigGAN?—?Brock et al.(2019)

BigGAN模型是基于ImageNet生成圖像質(zhì)量最高的模型之一。該模型很難在本地機器上實現(xiàn),而且BigGAN有許多組件,如Self-Attention、Spectral Normalization和帶有投影鑒別器的cGAN,這些組件在各自的論文中都有更好的解釋。不過,這篇論文對構成當前最先進技術水平的基礎論文的思想提供了很好的概述,因此非常值得閱讀。

BigGAN生成的圖像

論文:

Large Scale GAN Training for High Fidelity Natural Image Synthesis

Andrew Brock, Jeff Donahue, Karen Simonyan

https://arxiv.org/abs/1809.11096

StyleGAN?—?Karras et al.(2019)

StyleGAN模型可以說是最先進的,特別是利用了潛在空間控制。該模型借鑒了神經(jīng)風格遷移中一種稱為自適應實例標準化(AdaIN)的機制來控制潛在空間向量z。映射網(wǎng)絡和AdaIN條件在整個生成器模型中的分布的結合使得很難自己實現(xiàn)一個StyleGAN,但它仍是一篇很好的論文,包含了許多有趣的想法。

StyleGAN架構,允許潛在空間控制

論文:

A Style-Based Generator Architecture for Generative Adversarial Networks

Tero Karras, Samuli Laine, Timo Aila

https://arxiv.org/abs/1812.04948

CycleGAN?—?Zhu et al.(2017)

CycleGAN的論文不同于前面列舉的6篇論文,因為它討論的是image-to-image的轉(zhuǎn)換問題,而不是隨機向量的圖像合成問題。CycleGAN更具體地處理了沒有成對訓練樣本的image-to-image轉(zhuǎn)換的情況。然而,由于Cycle-Consistency loss公式的優(yōu)雅性,以及如何穩(wěn)定GAN訓練的啟發(fā)性,這是一篇很好的論文。CycleGAN有很多很酷的應用,比如超分辨率,風格轉(zhuǎn)換,例如將馬的圖像變成斑馬。

Cycle Consistency Loss背后的主要想法,一個句子從法語翻譯成英語,再翻譯回法語,應該跟原來的是同一個句子

論文:

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros

https://arxiv.org/abs/1703.10593

Pix2Pix?—?Isola et al.(2016)

Pix2Pix是另一種圖像到圖像轉(zhuǎn)換的GAN模型。該框架使用成對的訓練樣本,并在GAN模型中使用多種不同的配置。讀這篇論文時,我覺得最有趣部分是關于PatchGAN的討論。PatchGAN通過觀察圖像的70×70的區(qū)域來判斷它們是真的還是假的,而不是查看整個圖像。該模型還展示了一個有趣的U-Net風格的生成器架構,以及在生成器模型中使用ResNet風格的skip connections。Pix2Pix有很多很酷的應用,比如將草圖轉(zhuǎn)換成逼真的照片。

使用成對的訓練樣本進行Image-to-Image轉(zhuǎn)換

論文:

Image-to-Image Translation with Conditional Adversarial Networks

Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

https://arxiv.org/abs/1611.07004

StackGAN?—?Zhang et al.(2017)

StackGAN的論文與本列表中的前幾篇論文相比非常不同。它與Conditional GAN和Progressively Growing GANs最為相似。StackGAN模型的工作原理與Progressively Growing GANs相似,因為它可以在多個尺度上工作。StackGAN首先輸出分辨率為64×64的圖像,然后將其作為先驗信息生成一個256×256分辨率的圖像。

StackGAN是從自然語言文本生成圖像。這是通過改變文本嵌入來實現(xiàn)的,以便捕獲視覺特征。這是一篇非常有趣的文章,如果StyleGAN中顯示的潛在空間控制與StackGAN中定義的自然語言接口相結合,想必會非常令人驚訝。

基于文本嵌入的StackGAN多尺度架構背后的想法

論文:

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxas

https://arxiv.org/abs/1612.03242

Generative Adversarial Networks?—?Goodfellow et al.(2014)

Ian Goodfellow的原始GAN論文對任何研究GAN的人來說都是必讀的。這篇論文定義了GAN框架,并討論了“非飽和”損失函數(shù)。論文還給出了最優(yōu)判別器的推導,這是近年來GAN論文中經(jīng)常出現(xiàn)的一個證明。論文還在MNIST、TFD和CIFAR-10圖像數(shù)據(jù)集上對GAN的有效性進行了實驗驗證。

論文:

Generative Adversarial Networks

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

https://arxiv.org/abs/1406.2661

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2209

    瀏覽量

    76833
  • 生成器
    +關注

    關注

    7

    文章

    322

    瀏覽量

    21906
  • 數(shù)據(jù)集

    關注

    4

    文章

    1224

    瀏覽量

    25457

原文標題:必讀!生成對抗網(wǎng)絡GAN論文TOP 10

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FLIR先進技術如何助力安全生產(chǎn)

    夏日炎炎,安全更不能忘!在工業(yè)生產(chǎn)中每一個細節(jié)都關乎到人員的生命安全和設備的穩(wěn)定運行,今天就讓我們一起了解如何通過FLIR的先進技術為夏季生產(chǎn)保駕護航!
    的頭像 發(fā)表于 07-07 16:58 ?405次閱讀

    老板必修課:如何用NotebookLM 在上下班路上吃透一篇科技論文?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 作為私營企業(yè)主,每天的工作都非常繁忙,真正能學習的時間,可能就是在開車上下班或去拜訪客戶的路上。 作為科技企業(yè)的領航人,堅持學習并深入理解先進技術,是非
    的頭像 發(fā)表于 05-07 16:13 ?243次閱讀
    老板必修課:如何用NotebookLM 在上下班路上吃透一篇科技<b class='flag-5'>論文</b>?

    SGS亮相2025中國國際半導體先進技術與應用大會

    近日,2025中國國際半導體先進技術與應用大會在蘇州召開,作為國際公認的測試、檢驗和認證機構,SGS受邀出席并發(fā)表《車規(guī)器件的可靠性認證,助力芯片獲得車用“上路”資格》主題演講,分享SGS在半導體領域的深入見解和專業(yè)經(jīng)驗,為半導體行業(yè)從業(yè)者帶來了深度思考與啟發(fā)。
    的頭像 發(fā)表于 04-28 16:34 ?625次閱讀

    中海達亮相第二十屆水利先進技術推介會

    近日,由水利部國際合作與科技司指導,水利部科技推廣中心主辦的第二十屆水利先進技術(產(chǎn)品)推介會在蘇州隆重舉辦,來自全國水利行業(yè)的專家技術學者共同探討交流最新的技術發(fā)展和行業(yè)需求。中海達攜多款自主研發(fā)水文監(jiān)測設備應邀參展,集中展示
    的頭像 發(fā)表于 04-25 17:42 ?696次閱讀

    國民技術與中國科學院深圳先進技術研究院達成戰(zhàn)略合作

    近日,國民技術股份有限公司(簡稱“國民技術”)與中國科學院深圳先進技術研究院(簡稱“深圳先進院”)電驅(qū)系統(tǒng)專家團隊在深圳簽署合作意向協(xié)議,雙方將在國家重點研發(fā)項目支持下,就智能機器人及
    的頭像 發(fā)表于 04-25 15:45 ?594次閱讀

    敏捷合成器的技術原理和應用場景

    為實驗儀器使用,幫助學生和科研人員深入了解信號處理和頻率合成的原理和技術。 綜上所述,敏捷合成器憑借其先進技術原理和廣泛的應用場景,在電子測試和測量領域發(fā)揮著重要作用。隨著
    發(fā)表于 02-20 15:25

    RF3932D寬帶放大器現(xiàn)貨庫存RF-LAMBDA

    穩(wěn)定性。通過在封裝外部添加簡易、優(yōu)化的匹配網(wǎng)絡,在單一放大器中提供寬帶增益值和功率性能,實現(xiàn)集成的便捷性。特征峰值功率=60 W增益值=14dB最先進GaN HEMT技術48V操控5
    發(fā)表于 01-22 09:03

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術自動生成或輔助生成文本、圖像、音頻、視頻等內(nèi)容。 AIGC的核心技術
    發(fā)表于 01-13 10:46

    AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術自動生成或輔助生成文本、圖像、音頻、視頻等內(nèi)容。 AIGC的核心技術
    發(fā)表于 01-13 10:32

    Google兩款先進生成式AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進一步推動這一勢頭,客戶可以在Vertex AI平臺上使用這兩款
    的頭像 發(fā)表于 12-30 09:56 ?629次閱讀

    直流變頻焊接控制器:先進技術在焊接領域的革新應用探索

    在當今的工業(yè)生產(chǎn)領域中,新技術的發(fā)展與應用始終是推動產(chǎn)業(yè)升級、提升效率的關鍵驅(qū)動力。其中,直流變頻焊接控制器作為一種前沿技術,在焊接工藝中的革新性應用引起了廣泛關注。本文將深入探討這一先進技術
    的頭像 發(fā)表于 12-06 09:07 ?395次閱讀

    庫克稱iPhone16是最先進的iPhone

    最新款iPhone、Watch和AirPods,最大的亮點估計在人工智能。所以庫克稱iPhone16是最先進的iPhone。 庫克表示。iPhone 16 系列是我們打造的最先進的 iPhone。得益于
    的頭像 發(fā)表于 09-10 11:47 ?1193次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI 訓練的數(shù)據(jù)集。
    的頭像 發(fā)表于 09-06 14:59 ?738次閱讀
    NVIDIA Nemotron-4 340B模型<b class='flag-5'>幫助</b>開發(fā)者<b class='flag-5'>生成</b>合成訓練數(shù)據(jù)

    憶聯(lián)以完善的產(chǎn)品矩陣與先進技術為AI PC助力

    未來10年,AI產(chǎn)業(yè)將迎來快速發(fā)展期,尤其對于生成式AI(Generative AI)來說,其技術發(fā)展和應用將加速向端、邊、云、網(wǎng)、智(即終端、邊緣計算、云計算、網(wǎng)絡和智能應用)等各個
    的頭像 發(fā)表于 09-02 11:39 ?877次閱讀
    憶聯(lián)以完善的產(chǎn)品矩陣與<b class='flag-5'>先進技術</b>為AI PC助力

    首屆人工智能先進技術成果供需對接大會硬核又新潮!

    在各類人工智能技術及應用不斷融入人們?nèi)粘I畹漠斚?,大會聚?b class='flag-5'>先進技術、終端消費、行業(yè)應用以及綿陽本地創(chuàng)新產(chǎn)品,將一批“人工智能+”創(chuàng)新應用最新成果、應用場景搬到“會場”,讓你沉浸式體驗AI世界,感受未來已來。
    的頭像 發(fā)表于 07-25 17:04 ?658次閱讀
    首屆人工智能<b class='flag-5'>先進技術</b>成果供需對接大會硬核又新潮!