97MB。作者使用distillation,能夠用9.6MB的MobileNet-v2替換它,尺寸縮小了10倍。所以作者認為distillation這種技術(shù)被低估了,它可以為瀏覽器帶來一些很酷的ML功能,因為很多模型由于太大而無法在資源有限的環(huán)境中進行部署。" />

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進行風格化的demo

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-22 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一位日本小哥用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進行風格化的demo,只使用了一個單一的模型。demo效果相當不錯,并且也開源了代碼。

用一個模型就能實現(xiàn)所有類型的風格轉(zhuǎn)換!一個名為Arbitrary Image Stylization in the Browser的項目最近火起來。

作者是日本小哥Reiichiro Nakano,他用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進行風格化的demo。

不像以前的快速風格轉(zhuǎn)換算法那樣需要每種風格都有一個單獨的網(wǎng)絡(luò),在這個demo中,所有風格圖像只使用一個單一的模型。并且,你可以自由混合不同的風格。

使用也非常簡單,你只需要選擇一張內(nèi)容圖像(content image)和一張風格圖像(style image),然后點擊“Stylize”,靜候片刻,一張風格化的圖像就處理好了。

如圖所示,我們在“內(nèi)容圖像”選擇一張芝加哥城市風景圖,“風格圖像”選擇一張港口的版畫風格圖像,風格化后得到一張版畫風格的芝加哥風景圖。

其中,內(nèi)容圖像和風格圖像都可以自定義,也就是說,你可以上傳任意圖像。風格化的強度也可以調(diào)整。

作者還提供了混合兩種風格的效果。

總結(jié)而言,這個風格網(wǎng)絡(luò)被訓(xùn)練并用于為任意繪畫風格生成一個100-D的風格向量(style vector)。然后,將該向量與內(nèi)容圖像一起饋送到一個的轉(zhuǎn)換網(wǎng)絡(luò),進行實際的風格轉(zhuǎn)換。

這個100D的向量基本上是一個“style”的潛在空間。我們可以利用這個“潛在空間”做一些有趣的事情。

我們可以通過對風格圖像和內(nèi)容圖像的風格向量進行加權(quán)平均,來控制風格化的強度。作者發(fā)現(xiàn),這對于風格特別鮮明的內(nèi)容圖像很有用。

我們還可以通過在它們的風格向量之間插值,來組合不同的風格,并讓網(wǎng)絡(luò)猜測這兩幅圖像之間的風格是什么樣子的。

將模型移植到瀏覽器上的最大問題是模型大小。風格網(wǎng)絡(luò)基于Inception-v3,它的權(quán)重> 97MB。作者使用distillation,能夠用9.6MB的MobileNet-v2替換它,尺寸縮小了10倍。所以作者認為distillation這種技術(shù)被低估了,它可以為瀏覽器帶來一些很酷的ML功能,因為很多模型由于太大而無法在資源有限的環(huán)境中進行部署。

這個demo建立在谷歌大腦和蒙特利爾大學(xué)合作的論文Exploring the structure of a real-time, arbitrary neural artistic stylization network之上,這是圖像風格化的經(jīng)典論文之一。作者開源了代碼。

下面我們簡要介紹一下論文的主要思想。

模型和方法

這篇論文的核心是通過構(gòu)建一個風格學(xué)習(xí)網(wǎng)絡(luò)來實現(xiàn)快速的風格遷移。

論文提出了一種將藝術(shù)風格神經(jīng)算法的靈活性和快速風格遷移網(wǎng)絡(luò)的速度相結(jié)合的方法,允許使用任何內(nèi)容/風格圖像進行實時的風格化。

這個模型成功地用大約80000幅畫作的數(shù)據(jù)庫進行了訓(xùn)練,并能夠推廣到以前未見過的畫作。

論文的主要貢獻包括:

1、介紹了一種新的算法,用于快速、任意的藝術(shù)風格遷移;在80000幅畫作上訓(xùn)練,并能對未觀察過的畫作實時運行。

2、在緊湊的嵌入空間中呈現(xiàn)左右繪畫風格,捕捉繪畫的語義特征。

3、證明用大量畫作進行訓(xùn)練之后,模型能夠預(yù)測以前從未觀察過的風格。

4、嵌入空間允許對藝術(shù)家的藝術(shù)范圍進行新的探索。

圖1:網(wǎng)絡(luò)在大量的繪畫和紋理上訓(xùn)練生成的造型

圖2:模型架構(gòu)圖示

如圖2所示,整個網(wǎng)絡(luò)架構(gòu)由風格學(xué)習(xí)網(wǎng)絡(luò)P和風格轉(zhuǎn)換網(wǎng)絡(luò)T組成,學(xué)習(xí)的目的是style loss和content loss。風格學(xué)習(xí)網(wǎng)絡(luò)P預(yù)測來自輸入風格圖像的嵌入向量S,為風格轉(zhuǎn)換網(wǎng)絡(luò)提供一組歸一化常數(shù)。風格轉(zhuǎn)換網(wǎng)絡(luò)將照片轉(zhuǎn)換為風格化的表示。Content loss和style loss來源于VGG圖像分類網(wǎng)絡(luò)的表征空間距離。風格學(xué)習(xí)網(wǎng)絡(luò)主要遵循Inception-v3架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41301
  • 瀏覽器
    +關(guān)注

    關(guān)注

    1

    文章

    1040

    瀏覽量

    36327
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    330

    瀏覽量

    61189

原文標題:一個模型搞定所有風格轉(zhuǎn)換,直接在瀏覽器實現(xiàn)(demo+代碼)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    comicsviewer圖像瀏覽器軟件

    電子發(fā)燒友網(wǎng)站提供《comicsviewer圖像瀏覽器軟件.zip》資料免費下載
    發(fā)表于 06-19 17:00 ?0次下載

    TensorFlow發(fā)表推文正式發(fā)布TensorFlow v1.9

    是前所未有的。之前人工智能頭條也為大家介紹了瀏覽器通過TensorFlow.js
    的頭像 發(fā)表于 07-16 10:23 ?3389次閱讀

    利用TensorFlow.js,D3.js 和 Web 的力量使訓(xùn)練模型的過程可視

    TensorFlow.js 將機器學(xué)習(xí)引入 JavaScript 和 Web。 我們將利用這個很棒的框架來構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型。這個模型將能夠按大聯(lián)盟裁判的精準度來稱呼好球和壞球。
    的頭像 發(fā)表于 08-08 14:24 ?7333次閱讀

    如何使用TensorFlow.js構(gòu)建系統(tǒng)

    TensorFlow.js團隊一直在進行有趣的基于瀏覽器的實驗,以使人們熟悉機器學(xué)習(xí)的概念,并鼓勵他們將其用作您自己項目的構(gòu)建塊。對于那些不
    的頭像 發(fā)表于 08-19 08:55 ?3778次閱讀

    基于tensorflow.js設(shè)計、訓(xùn)練面向web的神經(jīng)網(wǎng)絡(luò)模型的經(jīng)驗

    NVIDIA顯卡。tensorflow.js底層使用了WebGL加速,所以瀏覽器訓(xùn)練模型的
    的頭像 發(fā)表于 10-18 09:43 ?4412次閱讀

    TensorFlow.js瀏覽器中部署可進行任意圖像風格遷移的模型

    Reiichiro Nakano提供的模型突破了以往模型的局限,它能將任何風格圖像分解為表示其風格的100維向量,然后把這些向量結(jié)合照片信息起饋送到另
    的頭像 發(fā)表于 11-22 09:01 ?6741次閱讀

    種開源的機器學(xué)習(xí)模型,可在瀏覽器中使用TensorFlow.js對人物及身體部位進行分割

    人物分割有何用途?這項技術(shù)可廣泛應(yīng)用于多個多領(lǐng)域,包括增強現(xiàn)實、攝影編輯以及圖像或視頻的藝術(shù)效果等。具體應(yīng)用由您決定!去年,當我們推出 PoseNet(首個能夠瀏覽器中使用簡易網(wǎng)絡(luò)攝像頭估測身體
    的頭像 發(fā)表于 02-26 16:33 ?6203次閱讀

    TensorFlow.js制作了僅用 200 余行代碼的項目

    我們先來看下運行的效果。下圖中,上半部分是原始視頻,下半部分是使用 TensorFlow.js 對人像進行消除后的視頻??梢钥吹?,除了偶爾會在邊緣處留有殘影之外,整體效果還是很不錯的。
    的頭像 發(fā)表于 05-11 18:08 ?5816次閱讀

    CNN是什么?美國有線電視新聞網(wǎng)嗎?

    它用TensorFlow.js加載了10層的預(yù)訓(xùn)練模型,相當于在你的瀏覽器上跑CNN模型
    的頭像 發(fā)表于 09-03 10:58 ?6466次閱讀
    CNN是什么?美國有線電視新聞網(wǎng)嗎?

    如何基于 ES6 的 JavaScript 進行 TensorFlow.js 的開發(fā)

    環(huán)境,如果有 CUDA 環(huán)境支持,或者瀏覽器環(huán)境,有 WebGL 環(huán)境支持,那么 TensorFlow.js 可以使用硬件
    的頭像 發(fā)表于 10-31 11:16 ?3490次閱讀

    關(guān)于瀏覽器緩存最詳細解析

    瀏覽器緩存即 http 緩存,將請求過的數(shù)據(jù)(html、css、js)存在瀏覽器(本地磁盤),當再次訪問這些資源時可以從本地直接加載,減少服務(wù)端請求。
    的頭像 發(fā)表于 04-16 16:01 ?3010次閱讀

    CNN到底是怎么回事?

    它用TensorFlow.js加載了10層的預(yù)訓(xùn)練模型,相當于在你的瀏覽器上跑CNN模型
    的頭像 發(fā)表于 06-28 14:47 ?4557次閱讀
    CNN到底是怎么回事?

    怎么js保存數(shù)據(jù)

    JS保存數(shù)據(jù)是Web開發(fā)中非常重要的功能,它能夠?qū)⒂脩舻妮斎牖蛘咂渌麛?shù)據(jù)存儲瀏覽器,隨后
    的頭像 發(fā)表于 11-27 16:10 ?1418次閱讀

    js文件可以直接瀏覽器運行嗎

    載和運行。 Web開發(fā),JS常被用于實現(xiàn)動態(tài)交互效果和頁面邏輯控制。通過將JS代碼嵌入到網(wǎng)頁的HTML文件,
    的頭像 發(fā)表于 11-27 16:45 ?4898次閱讀

    js腳本怎么瀏覽器運行

    瀏覽器運行JavaScript腳本是種常見的方式,因為JavaScript是Web
    的頭像 發(fā)表于 11-27 16:46 ?3410次閱讀