當(dāng)欣賞一幅畫(huà)作時(shí),每個(gè)人都會(huì)有若干推斷或結(jié)論。除了理解主題外,您可能還會(huì)按照時(shí)期、風(fēng)格和藝術(shù)家對(duì)其進(jìn)行分類(lèi)。那么,計(jì)算機(jī)算法能否像人類(lèi)一樣深入“理解”一幅畫(huà)并輕松地進(jìn)行分類(lèi)呢?
在羅格斯大學(xué)藝術(shù)與人工智能實(shí)驗(yàn)室,Ahmed Elgammal 教授和他的團(tuán)隊(duì)匯集了過(guò)去六個(gè)世紀(jì)幾千幅畫(huà)作的數(shù)據(jù)庫(kù),使用 MATLAB 和 Statistics and MachineLearning Toolbox對(duì)這個(gè)問(wèn)題進(jìn)行了深入研究,并解決了兩個(gè)關(guān)于 AI 算法的功能和局限的有趣問(wèn)題:
AI 能否發(fā)現(xiàn)哪些畫(huà)作對(duì)后世藝術(shù)家的影響最大
能否僅利用畫(huà)作的視覺(jué)特征衡量其創(chuàng)造性
通過(guò)提取視覺(jué)特征對(duì)作品進(jìn)行分類(lèi)
我們希望開(kāi)發(fā)出能夠按風(fēng)格(例如立體派、印象派、抽象表現(xiàn)派或巴洛克派)、題材(例如田園、肖像或靜物)和藝術(shù)家來(lái)對(duì)畫(huà)作進(jìn)行寬泛分類(lèi)的算法。完成這種分類(lèi)首先要求能夠識(shí)別顏色、構(gòu)圖、紋理、視角、主題和其它視覺(jué)特征。其次,還要選取最能夠展示不同畫(huà)作相似性的特征。
借助 MATLAB 和 Image Processing Toolbox,我們開(kāi)發(fā)出了能夠提取畫(huà)作視覺(jué)特征的算法。特征提取算法在計(jì)算機(jī)視覺(jué)中相當(dāng)常見(jiàn),且容易實(shí)現(xiàn)。比較困難的任務(wù)是找到最佳的機(jī)器學(xué)習(xí)技術(shù)。我們首先在 Statistics and Machine LearningToolbox 中使用支持向量機(jī) (SVM) 和其它分類(lèi)算法來(lái)識(shí)別可用于風(fēng)格分類(lèi)的視覺(jué)特征。在 MATLAB 中,我們隨后采用距離度量學(xué)習(xí)技術(shù)對(duì)特征進(jìn)行評(píng)估,進(jìn)而提高算法對(duì)畫(huà)作的分類(lèi)能力。
通過(guò)數(shù)據(jù)庫(kù)檢測(cè),我們開(kāi)發(fā)的按風(fēng)格分類(lèi)畫(huà)作的算法準(zhǔn)確率達(dá)到 60%,其中可能存在 2% 的隨機(jī)性。雖然藝術(shù)歷史學(xué)家的準(zhǔn)確率遠(yuǎn)遠(yuǎn)高于 60%,但算法的準(zhǔn)確率仍高于非專(zhuān)業(yè)人士。
使用機(jī)器學(xué)習(xí)發(fā)掘藝術(shù)的影響力
一旦我們有了可以準(zhǔn)確地對(duì)繪畫(huà)之間的相似之處進(jìn)行分類(lèi)的算法,我們便可以著手處理下一個(gè)挑戰(zhàn):利用機(jī)器學(xué)習(xí)揭示藝術(shù)的影響力。我們假設(shè),對(duì)于風(fēng)格分類(lèi)有用的視覺(jué)特征(一個(gè)監(jiān)督式學(xué)習(xí)問(wèn)題)同樣適用于確定影響力(一個(gè)無(wú)監(jiān)督問(wèn)題)。
藝術(shù)史學(xué)家的理論認(rèn)為藝術(shù)影響力是基于藝術(shù)家在同一時(shí)期如何工作、旅行或者交往決定的。我們基于 MATLAB 的機(jī)器學(xué)習(xí)算法僅使用視覺(jué)元素和創(chuàng)作日期進(jìn)行分析。我們認(rèn)為,一個(gè)將畫(huà)作中的主題和符號(hào)考慮在內(nèi)的算法會(huì)比僅僅依賴于顏色、紋理等低級(jí)別特征更有效。出于這種考慮,我們使用了通過(guò)谷歌圖片訓(xùn)練的分類(lèi)算法來(lái)識(shí)別特定對(duì)象。
我們對(duì) 66 名生活年代相差 550 多年的不同藝術(shù)家創(chuàng)作的 1700 多幅作品進(jìn)行了算法測(cè)試。該算法可以輕松識(shí)別出維拉斯奎茲的《教皇英諾森十世肖像》對(duì)弗朗西斯·培根的《教皇英諾森十世肖像的習(xí)作》的影響(下圖)。
左:維拉斯奎茲的《教皇英諾森十世肖像》。
右:弗朗西斯·培根的《教皇英諾森十世肖像的習(xí)作》。
即使外行也能輕松識(shí)別出這兩幅畫(huà)作在構(gòu)圖和主題上的相似性,但該算法也給出了令和我們一起工作的藝術(shù)史學(xué)家們十分驚訝的結(jié)果。例如,我們的算法識(shí)別出法國(guó)印象派畫(huà)家弗雷德里克·巴齊耶在 1870 年創(chuàng)作的《巴齊耶的畫(huà)室》很有可能影響了諾曼·洛克威爾在 80 年后創(chuàng)作的《沙弗萊頓的理發(fā)店》。
左:弗雷德里克·巴齊耶的《巴齊耶的畫(huà)室》。
右:諾曼·洛克威爾的《沙弗萊頓的理發(fā)店》。
黃色圓圈表示相似的物體,紅線表示類(lèi)似的構(gòu)圖,藍(lán)色方塊表示相似的結(jié)構(gòu)元素。
盡管這兩幅畫(huà)作乍看可能不太相似,但仔細(xì)觀察就會(huì)發(fā)現(xiàn)其在構(gòu)圖和主題上的共同點(diǎn),比如每幅畫(huà)中的火爐都在畫(huà)的右下方,三個(gè)人在畫(huà)面中間,還有左下角的椅子和三角形空間結(jié)構(gòu)。
在我們的數(shù)據(jù)集中,算法正確地識(shí)別出藝術(shù)史學(xué)家認(rèn)同的 55 個(gè)影響點(diǎn)中的 60%,這表明僅視覺(jué)相似性即可為算法(可能為人類(lèi))提供足夠的信息來(lái)確定這些影響。
通過(guò)解決網(wǎng)絡(luò)中心性問(wèn)題衡量創(chuàng)造性
我們的研究還集中在開(kāi)發(fā)衡量藝術(shù)創(chuàng)造力的算法上。我們的研究基于一個(gè)可識(shí)別主題創(chuàng)意是否新穎和有影響力的常用定義,也就是說(shuō),一幅有創(chuàng)造性的繪畫(huà)作品應(yīng)該不同于其先期的繪畫(huà)(新穎度),但與后世作品具有相似度(影響力)。
為解決這一問(wèn)題,我們?cè)俅慰吹綉?yīng)用 MATLAB 算法識(shí)別繪畫(huà)之間相似性的機(jī)會(huì)。在 MATLAB 中,我們創(chuàng)建了一個(gè)網(wǎng)絡(luò):頂點(diǎn)是繪畫(huà),每條邊表示頂點(diǎn)位置上兩幅畫(huà)之間的相似度。通過(guò)在這個(gè)網(wǎng)絡(luò)上的一系列轉(zhuǎn)換,我們發(fā)現(xiàn)根據(jù)這樣一個(gè)圖形進(jìn)行關(guān)于創(chuàng)造力的推斷是一個(gè)網(wǎng)絡(luò)中心性的問(wèn)題,而這個(gè)問(wèn)題可以通過(guò) MATLAB 有效解決。
我們使用兩個(gè)包含超過(guò) 62,000 幅畫(huà)作的數(shù)據(jù)集測(cè)試我們的創(chuàng)造性檢測(cè)算法。該算法給一些藝術(shù)史學(xué)家認(rèn)為新穎且具有影響力的作品打出了很高的分?jǐn)?shù),包括下圖所示的一些作品。排名高于同期畢加索的《阿維尼翁的少女》(1907) 的是馬列維奇(至上主義運(yùn)動(dòng) —— 最早的抽象藝術(shù)創(chuàng)始人之一)的幾幅繪畫(huà)作品。
從1400年到2000年(x軸)繪畫(huà)作品的創(chuàng)造力打分(y軸),表示各個(gè)時(shí)期的最高得分作品。
為了對(duì)算法進(jìn)行基本驗(yàn)證,我們改變了某些藝術(shù)作品的創(chuàng)作時(shí)間,有的時(shí)間提前,有的時(shí)間推后。在這些“時(shí)間機(jī)器”實(shí)驗(yàn)中,我們看到某些時(shí)間提前到十七世紀(jì)的印象派藝術(shù)的創(chuàng)造力分?jǐn)?shù)大幅增加,時(shí)間推后到20世紀(jì)的巴洛克畫(huà)作分?jǐn)?shù)大幅降低。算法正確地檢測(cè)出 300 年前創(chuàng)造的什物在今天并不具有創(chuàng)意,而如今一些有創(chuàng)意的作品放在過(guò)去創(chuàng)意度將大大提高。
人類(lèi)與生俱來(lái)就有對(duì)藝術(shù)進(jìn)行分類(lèi)的感知能力,并且擅長(zhǎng)識(shí)別不同畫(huà)作之間的共同點(diǎn),但缺乏時(shí)間和耐心應(yīng)用這些技能對(duì)數(shù)以千計(jì)甚至數(shù)以百萬(wàn)計(jì)的繪畫(huà)作品進(jìn)行分類(lèi)。處理這種規(guī)模龐大的任務(wù)是計(jì)算機(jī)所擅長(zhǎng)的。通過(guò)開(kāi)發(fā)與人類(lèi)感知能力相近的機(jī)器學(xué)習(xí)算法,我們的目標(biāo)是為藝術(shù)史學(xué)家提供分類(lèi)龐大圖像數(shù)據(jù)庫(kù)的工具。
使用 MATLAB 開(kāi)發(fā)的用來(lái)識(shí)別共性和衡量創(chuàng)造性的框架并不只局限于藝術(shù)方面。它可以應(yīng)用到文學(xué)、音樂(lè)或任何其它創(chuàng)造性領(lǐng)域,前提是這些單獨(dú)的作品可以被編碼并能被算法識(shí)別。
目前,Ahmed Elgammal 教授的關(guān)注點(diǎn)仍然在視覺(jué)藝術(shù)方面:不僅關(guān)心如何確保機(jī)器學(xué)習(xí)算法產(chǎn)生良好結(jié)果,也關(guān)心如何實(shí)現(xiàn)這些結(jié)果。在這個(gè)領(lǐng)域,MATLAB 也具有巨大優(yōu)勢(shì),因?yàn)樗峁┰S多可快速、輕松地使結(jié)果可視化的方法,幫助理解并利用它們?yōu)椴粩喟l(fā)展的人工智能研究提供信息。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249607 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134637
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA AI如何助力藝術(shù)創(chuàng)意落地
普源示波器如何連接MATLAB實(shí)現(xiàn)數(shù)據(jù)采集與分析
如何用FOC電機(jī)控制MATLAB仿真!
如何使用MATLAB實(shí)現(xiàn)一維時(shí)間卷積網(wǎng)絡(luò)

經(jīng)典分立buck完整原理圖及電路調(diào)試部分波形鑒賞 - 長(zhǎng)文【下篇】
分立buck完整原理圖及電路調(diào)試部分波形鑒賞 - 長(zhǎng)文【上篇】
松下投影機(jī)在墨爾本RISING藝術(shù)節(jié)引領(lǐng)沉浸之旅
制程能力和制造能力介紹

基于ESP開(kāi)發(fā)板的變色龍藝術(shù)相框

MathWorks積極推動(dòng)MATLAB與Simulink在教學(xué)項(xiàng)目中的應(yīng)用
Simulink與 MATLAB 的結(jié)合使用 Simulink中的信號(hào)處理方法
艾體寶干貨 OIDA之四:掌握數(shù)據(jù)包分析-分析的藝術(shù)

matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析
MATLAB中的矩陣索引

評(píng)論