做計(jì)算機(jī)視覺,離不開CNN。
可是,卷積、池化、Softmax……究竟長(zhǎng)啥樣,是怎樣相互連接在一起的?
對(duì)著代碼憑空想象,多少讓人有點(diǎn)頭皮微涼。于是,有人干脆用Unity給它完整3D可視化了出來。
還不光是有個(gè)架子,訓(xùn)練過程也都呈現(xiàn)得明明白白。
比如隨著epoch(迭代次數(shù))的變化,訓(xùn)練過程中各層出現(xiàn)的實(shí)時(shí)變化。
為了能更清楚地展示網(wǎng)絡(luò)細(xì)節(jié),用戶還可以在其中自由地折疊、擴(kuò)展每個(gè)層。
比如將特征圖在線性布局和網(wǎng)格布局之間轉(zhuǎn)換。
折疊卷積層的特征圖輸出。
對(duì)全連接層進(jìn)行邊綁定(edge bunding)等等。
這樣的可視化圖像,可以通過加載TensorFlow的檢查點(diǎn)來構(gòu)建。
也可以在Unity編輯器中設(shè)計(jì)。
是不是有點(diǎn)鵝妹子嚶那感覺了?
最近,這個(gè)項(xiàng)目又在社交媒體上火了起來。
網(wǎng)友們紛紛表示:
“要是能在訓(xùn)練的時(shí)候看到這個(gè)過程,再長(zhǎng)時(shí)間我也能忍啊?!?/p>
“求開源?!?/p>
該項(xiàng)目的作者,是一位來自維也納的3D特效師。
據(jù)他介紹,之所以創(chuàng)建這樣一個(gè)CNN可視化工具,是因?yàn)樗约撼鯇W(xué)神經(jīng)網(wǎng)絡(luò)時(shí),經(jīng)常覺得很難理解卷積層之間是如何相互連接,又如何與不同類型的層連接的。
而該工具的主要功能包括,卷積、最大池化和完全連接層的可視化表示,以及各種能實(shí)現(xiàn)更清晰可視化的簡(jiǎn)化機(jī)制等等。
總而言之,就是想讓初學(xué)者通過最直觀的方式,來get到CNN的重點(diǎn)。
如何用Unity搞出一個(gè)3D網(wǎng)絡(luò)
在正式上手Unity前,作者先在Houdini軟件中,搭建了一個(gè)可視化的3D網(wǎng)絡(luò)原型。
也就是說,先給Unity版3D網(wǎng)絡(luò)提供一個(gè)搭建思路,提前準(zhǔn)備好實(shí)現(xiàn)展示卷積計(jì)算的方法、特征圖的形狀、邊綁定的效果等問題。
然后,就可以在Unity上搭建3D神經(jīng)網(wǎng)絡(luò)了。
首先,需要預(yù)設(shè)好神經(jīng)網(wǎng)絡(luò)的“形狀”。
由于之前并沒有用過Unity,作者先學(xué)習(xí)了著色器和過程式幾何相關(guān)的知識(shí)。
這里面,作者發(fā)現(xiàn)了一些局限性,他采用的是Unity為著色器開發(fā)的語言Shaderlab,這個(gè)語言無法使用著色變化,只有對(duì)語義進(jìn)行預(yù)定義的變量,才能讓它在頂點(diǎn)、幾何和像素著色器之間傳遞。
而且,它無法任意分配頂點(diǎn)屬性,只有位置、顏色、UV等預(yù)定義屬性。(可能這也是3D網(wǎng)絡(luò)無法實(shí)時(shí)改變顏色的原因之一)
在研究了一些實(shí)例化(instancing)相關(guān)的概念后,作者計(jì)劃采用幾何著色器的方法生成神經(jīng)網(wǎng)絡(luò)的連線。其中起點(diǎn)和終點(diǎn)被傳遞到頂點(diǎn)著色器,并直接轉(zhuǎn)發(fā)到幾何著色器。
這些線,最多可以由120個(gè)頂點(diǎn)組成,因?yàn)閁nity允許的幾何著色器能創(chuàng)建的變量的標(biāo)量浮點(diǎn)數(shù)為1024。
然后,就是從模型的TensorFlow代碼中,生成對(duì)應(yīng)的3D神經(jīng)網(wǎng)絡(luò)圖像。
其中,Tensorflow-native.ckpt格式的文件,需要存儲(chǔ)重構(gòu)模型圖所需的數(shù)據(jù)、二進(jìn)制的權(quán)重讀取和激活值,以及特定層的名字。
以Cifar10-greyscale數(shù)據(jù)集為例,需要編寫一個(gè)檢查點(diǎn)(checkpoint)文件,以及設(shè)置隨即初始化的權(quán)重。
在那之后,需要加載這些檢查點(diǎn)文件、啟動(dòng)TensorFlow會(huì)話,輸入訓(xùn)練示例,以便查詢每一層的激活函數(shù)。
然后編寫一個(gè)json文件,存儲(chǔ)每一層的形狀、名稱、權(quán)重和激活函數(shù),便于讀取。然后使用權(quán)重值,將顏色數(shù)據(jù)分配給各層的Unity Mesh。
最終搞出來的效果,還是不錯(cuò)的。
相關(guān)研究還不少
事實(shí)上,此前已經(jīng)有不少學(xué)者,進(jìn)行過神經(jīng)網(wǎng)絡(luò)可視化的研究。
例如,去年5月,一位中國(guó)博士就可視化了卷積神經(jīng)網(wǎng)絡(luò),將每一層的變化都展示得非常清楚,只需要點(diǎn)擊對(duì)應(yīng)的神經(jīng)元,就能看見它的“操作”。
這是用TensorFlow.js加載的一個(gè)10層預(yù)訓(xùn)練模型,相當(dāng)于在瀏覽器上就能跑CNN模型,也可以實(shí)時(shí)交互,顯示神經(jīng)元的變化。
不過,這還是個(gè)2D的項(xiàng)目。
目前,也已經(jīng)有人像上面那個(gè)神經(jīng)網(wǎng)絡(luò)模型一樣,做出了3D的可視化神經(jīng)網(wǎng)絡(luò):
這個(gè)項(xiàng)目,同樣用到了邊綁定、光線追蹤等技術(shù),與特征提取、微調(diào)和歸一化相結(jié)合,將神經(jīng)網(wǎng)絡(luò)可視化。
這項(xiàng)項(xiàng)目希望能借由這些技術(shù),來估計(jì)神經(jīng)網(wǎng)絡(luò)中不同部分的重要性。
為此,作者將神經(jīng)網(wǎng)絡(luò)的每一部分都用不同的顏色來表示,根據(jù)節(jié)點(diǎn)和節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性,來預(yù)測(cè)它們之間的關(guān)聯(lián)性。
大致的處理過程是這樣的:
如果對(duì)于這類3D神經(jīng)網(wǎng)絡(luò)可視化感興趣,可以在文末找到對(duì)應(yīng)的開源項(xiàng)目地址。
原文標(biāo)題:一位外國(guó)小哥把整個(gè) CNN 都給可視化了,卷積、池化清清楚楚!網(wǎng)友:美得不真實(shí)。
文章出處:【微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103695 -
機(jī)器視覺
+關(guān)注
關(guān)注
163文章
4597瀏覽量
122932
原文標(biāo)題:一位外國(guó)小哥把整個(gè) CNN 都給可視化了,卷積、池化清清楚楚!網(wǎng)友:美得不真實(shí)...
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于 HT 的 3D 可視化智慧礦山開發(fā)實(shí)現(xiàn)

VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化
HT 可視化監(jiān)控頁(yè)面的 2D 與 3D 連線效果

VirtualLab Fusion應(yīng)用:光學(xué)系統(tǒng)的3D可視化
基于 HT 2D&3D 渲染引擎的新能源充電樁可視化運(yùn)營(yíng)系統(tǒng)技術(shù)剖析

VirtualLab Fusion中的可視化設(shè)置
七款經(jīng)久不衰的數(shù)據(jù)可視化工具!
光學(xué)系統(tǒng)的3D可視化

智慧能源可視化監(jiān)管平臺(tái)——助力可視化能源數(shù)據(jù)管理


機(jī)房動(dòng)環(huán)監(jiān)測(cè):3D巡檢功能是什么


數(shù)字孿生3D大屏可視化技術(shù)應(yīng)用優(yōu)勢(shì)
開關(guān)柜可視化操作是什么?

評(píng)論