利用AI實(shí)現(xiàn)圖像的超級(jí)壓縮
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
神經(jīng)網(wǎng)絡(luò)這樣的數(shù)據(jù)驅(qū)動(dòng)算法,已經(jīng)狂風(fēng)暴雨般的席卷了世界,包括廉價(jià)且強(qiáng)大的硬件和大量的數(shù)據(jù)等方面的因素,導(dǎo)致AI技術(shù)的突飛猛進(jìn)。
神經(jīng)網(wǎng)絡(luò)是當(dāng)前“圖像識(shí)別”、“自然語言理解”等“認(rèn)知”領(lǐng)域的最新技術(shù),但其應(yīng)用并不限于這些。在這篇文章中,我們將討論一種使用神經(jīng)網(wǎng)絡(luò)壓縮圖像的方法,該方法能以更快的速度,達(dá)到圖像壓縮技術(shù)的最優(yōu)化。
該文基于論文:An End-to-End CompressionFramework Based on Convolutional Neural Networks(https://arxiv.org/pdf/1708.00838v1.pdf)
本文假設(shè),你對(duì)包括卷積和損失函數(shù)等神經(jīng)網(wǎng)絡(luò)有一定了解。
▍什么是圖像壓縮?
圖像壓縮是將圖像轉(zhuǎn)換為更小占用空間的過程。原始圖像存儲(chǔ)將占用大量空間,因此會(huì)使用編解碼器減小原始圖像的大小,例如JPEG和PNG。
圖像壓縮有兩種類型:無損和有損。
顧名思義,在無損壓縮中,可能獲取原始圖像的所有數(shù)據(jù),而在有損壓縮中,一些數(shù)據(jù)在轉(zhuǎn)換過程中丟失。
例如:JPG是一種有損算法,而PNG是一種無損算法。
圖1.0:無損和有損壓縮之間的比較
能看到右邊的圖像有許多塊狀的紋路,這就是信息的丟失。相似顏色的臨近像素被壓縮為一個(gè)區(qū)塊,這節(jié)省了空間,但也丟失了關(guān)于實(shí)際像素的信息。
圖示只是有損壓縮的直觀示例,真實(shí)的JPEG,PNG等編解碼器所使用的算法要復(fù)雜得多。無損壓縮當(dāng)然更好,但最終在磁盤上占用的空間太多。
當(dāng)然,有更好的方法壓縮圖像而不會(huì)丟失太多的信息,但是它們相當(dāng)慢,許多算法使用迭代的方式,這意味著它們不能在多個(gè)CPU內(nèi)核或GPU上并行運(yùn)行。這使得這些算法在日常使用中不實(shí)用。
▍卷積神經(jīng)網(wǎng)絡(luò)
如果任務(wù)需要計(jì)算,且可以近似計(jì)算,就可以考慮使用神經(jīng)網(wǎng)絡(luò)。論文作者使用了相當(dāng)標(biāo)準(zhǔn)的卷積神經(jīng)網(wǎng)絡(luò)來改善圖像壓縮。他們的方法不僅僅是“更好的方式”,還可以利用并行計(jì)算,實(shí)現(xiàn)高速壓縮。
其背后原理是卷積神經(jīng)網(wǎng)絡(luò)(CNN),能很好地從圖像中提取空間信息,然后以更緊湊的表征來表示(例如,僅存儲(chǔ)圖像的“重要”位點(diǎn))。論文作者利用CNN的這種能力來更好地壓縮、展示圖像。
▍架構(gòu)
論文提出了一個(gè)雙重網(wǎng)絡(luò)。第一層網(wǎng)絡(luò)(ComCNN)提取圖像信息并生成一個(gè)致密表征。然后,該網(wǎng)絡(luò)的輸出將由標(biāo)準(zhǔn)編解碼器(例如JPEG)來處理。
經(jīng)過編解碼器后,圖像將被傳遞到第二層網(wǎng)絡(luò),該層網(wǎng)絡(luò)將從編解碼器“修復(fù)”圖像,試圖恢復(fù)原始圖像。作者稱之為重建卷積神經(jīng)網(wǎng)絡(luò)(RecCNN)。這兩個(gè)網(wǎng)絡(luò)都經(jīng)迭代訓(xùn)練,類似生成對(duì)抗網(wǎng)絡(luò)(GAN)。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
利用AI實(shí)現(xiàn)圖像的超級(jí)壓縮下載
相關(guān)電子資料下載
- Arm物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬?。喝绾螏椭鶤IoT企業(yè)加速創(chuàng)新? 21
- Blackwell GB100能否在超級(jí)計(jì)算機(jī)和AI市場(chǎng)保持領(lǐng)先優(yōu)勢(shì)? 174
- 訊飛星火大模型V3.0正式發(fā)布,全面對(duì)標(biāo)ChatGPT 299
- 亞馬遜云科技生成式AI最新案例分析,助力企業(yè)業(yè)務(wù)創(chuàng)新迭代 57
- 新思科技攜手臺(tái)積公司加速N2工藝下的SoC創(chuàng)新 196
- 服務(wù)器硬盤通用基礎(chǔ)知識(shí) 19
- 常見的一級(jí)指針參數(shù)有什么作用 73
- NVIDIA AI 現(xiàn)已在 Oracle Cloud Marketplace 推出 33
- CNCC | 論壇:探索 AI 全棧解決方案和基于 LLM 的推理與部署實(shí)踐 36
- Prophesee的GenX320第五代DVS傳感器產(chǎn)品參數(shù)介紹 31