來自特拉維夫大學(xué)的一組研究人員開發(fā)了一種神經(jīng)網(wǎng)絡(luò),能夠讀取食譜并生成烹飪完成后的熟食產(chǎn)品的圖像。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現(xiàn)在我們無法確定我們在網(wǎng)上看到的美味食物都是否是真實(shí)的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團(tuán)隊(duì)使用名為StackGAN V2的生成對抗網(wǎng)絡(luò)(GAN)的修改版本和巨大的recipe1M數(shù)據(jù)集中的52K圖像/配方組合創(chuàng)建了他們的AI。
該團(tuán)隊(duì)開發(fā)了一種人工智能,只需要列出任何配方和說明清單,就可以運(yùn)算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統(tǒng)的番茄醬炸魚排配方時開始的。由于她年事已高,她不記得確切的食譜,所以吃貨科學(xué)家就建立了一個能夠給出食物圖像的系統(tǒng),方便輸出食譜。由于人們很難從飯菜中獲得具有實(shí)際數(shù)量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,面粉等。因此基于配方生成食物圖像就成了有用的做法,這項(xiàng)任務(wù)對于人類來說非常具有挑戰(zhàn)性,對于計(jì)算機(jī)更是如此。
由于目前大多數(shù)人工智能系統(tǒng)都試圖在人類易于完成的任務(wù)中取代人類專家,解決一項(xiàng)甚至超出人類能力的任務(wù)會很有趣。
值得一提的是,與CUB和Oxford102數(shù)據(jù)集中的圖像相比,recipe1M數(shù)據(jù)集中的圖像質(zhì)量較低。這反映在許多模糊的圖像上,光照條件差,“粥狀圖像”以及圖像不是方形(這使得訓(xùn)練模型變得困難)。這個事實(shí)可能會解釋這兩個模型成功生成“類似粥”的食物圖像(例如面食,米飯,湯,沙拉),但卻難以生成具有獨(dú)特形狀的食物圖像(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團(tuán)隊(duì)的人工智能現(xiàn)在可以將它變成一個看起來足夠好的圖像,根據(jù)研究論文顯示,在盲測中,人類有時更喜歡計(jì)算機(jī)生成的圖片而不是真實(shí)照片。
該團(tuán)隊(duì)打算繼續(xù)開發(fā)該系統(tǒng),希望擴(kuò)展到超越食物的領(lǐng)域。包括完善當(dāng)前的數(shù)據(jù)集質(zhì)量,還考慮構(gòu)建一個包含兒童書籍文本和相應(yīng)圖像的數(shù)據(jù)集,這樣就可以讓計(jì)算機(jī)看文章畫插畫了。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103640 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249575 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25449
原文標(biāo)題:研究人員開發(fā)神經(jīng)網(wǎng)絡(luò) 可讀取食譜并生成熟食產(chǎn)品的圖像
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
無刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究
神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究
BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較
BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)分析
BP神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

基于光學(xué)衍射神經(jīng)網(wǎng)絡(luò)的軌道角動量復(fù)用全息技術(shù)的設(shè)計(jì)與實(shí)驗(yàn)研究

評論