OpenVX 1.3 是業(yè)界自動(dòng)化計(jì)算機(jī)視覺和感知任務(wù)所需的現(xiàn)代解決方案。但首先,什么是計(jì)算機(jī)視覺,為什么它很重要?
作為人類,我們僅僅通過讓光線進(jìn)入我們的眼睛就能很好地感知我們周圍的世界。隱蔽的光點(diǎn)照射到視網(wǎng)膜的不同區(qū)域,信號(hào)進(jìn)入我們的大腦,在那里信息被拼湊在一起。這就是場(chǎng)景開始形成的方式。在很長(zhǎng)一段時(shí)間內(nèi),在數(shù)字系統(tǒng)中模擬這一過程被認(rèn)為是棘手的。
一段時(shí)間以來,我們一直在使用數(shù)碼相機(jī)來捕捉光線信息。這些相機(jī)現(xiàn)在能夠?qū)崿F(xiàn)令人難以置信的高分辨率,但我們一直在努力解決人工視覺問題。原因當(dāng)然是相機(jī)和我們的眼睛一樣,只是視覺的一小部分。正是大腦中發(fā)生的位使不同的光點(diǎn)可以解釋。這是計(jì)算機(jī)科學(xué)家和不同分支的科學(xué)家一直在努力在人工系統(tǒng)中復(fù)制的過程。
在過去的十年中,計(jì)算機(jī)視覺領(lǐng)域從機(jī)器學(xué)習(xí)研究的爆炸式增長(zhǎng)中受益匪淺。卷積神經(jīng)網(wǎng)絡(luò)(CNN)等深度學(xué)習(xí)算法推動(dòng)了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,其功能僅在十年前還被認(rèn)為是機(jī)器無法實(shí)現(xiàn)的。
現(xiàn)在,視覺算法能夠識(shí)別照片中的物體。它們可以區(qū)分城市環(huán)境中的行人和汽車。他們還可以在病理圖像中識(shí)別令人不安的疾病跡象。這一成就非常成功,以至于推出了一個(gè)新的行業(yè):自主行業(yè)。
想象一下,未來交通由自動(dòng)駕駛汽車在城市地區(qū)巡回行駛,等待附近乘客的召喚??紤]走進(jìn)手術(shù)室,由經(jīng)過常規(guī)手術(shù)訓(xùn)練的機(jī)器進(jìn)行操作,或者登上一架無人駕駛飛機(jī)快速飛往歐洲。這些場(chǎng)景仍然在未來,但它們不再是科幻小說的內(nèi)容。在某些方面,所有這些例子都存在于我們今天的實(shí)驗(yàn)室中。而這一切只有在計(jì)算機(jī)視覺的進(jìn)步下才有可能。計(jì)算機(jī)視覺使系統(tǒng)能夠解釋環(huán)境的變化并做出反應(yīng)。
考慮到過去十年計(jì)算機(jī)視覺的突破,我們必須克服的下一個(gè)障礙是將我們的軟件解決方案與其執(zhí)行的硬件解耦。你看,當(dāng)前的機(jī)器學(xué)習(xí)革命,計(jì)算機(jī)視覺是其中的受益者,之所以成為可能,并不是由于晦澀理論的一些進(jìn)步。相反,飛躍來自于我們意識(shí)到可以使用圖形處理單元(GPU)作為加速器來加速運(yùn)行深度神經(jīng)網(wǎng)絡(luò)所涉及的計(jì)算。也就是說,解決方案來自編寫可以專門針對(duì)硬件加速器的軟件,以比任何人想象的更快地執(zhí)行計(jì)算。
自治時(shí)代的十年擺在我們面前,重要的是我們建立軟件的基礎(chǔ),使用與底層硬件分離的軟件為未來十年的自治系統(tǒng)提供支持,同時(shí)仍然能夠利用所需的加速資源。
這就是像Khronos? OpenVX? 1.3這樣的開放行業(yè)標(biāo)準(zhǔn)可以提供的好處。建立在開放標(biāo)準(zhǔn)之上的軟件堆棧可以自由地遷移到新的和不斷發(fā)展的硬件生態(tài)系統(tǒng)。
OpenVX 1.3 是基于計(jì)算機(jī)視覺功能集和神經(jīng)網(wǎng)絡(luò)推理功能集的模塊化 API。API 定義一個(gè)計(jì)算圖,其中圖中的每個(gè)節(jié)點(diǎn)構(gòu)成一個(gè)操作,該操作定義為其中一個(gè)功能集的一部分,或定義為用戶提供的內(nèi)核。計(jì)算圖作為執(zhí)行模式的優(yōu)勢(shì)在于,它為根據(jù)底層硬件平臺(tái)加速和優(yōu)化算法的實(shí)現(xiàn)提供了充足的機(jī)會(huì)。雖然呈現(xiàn)給應(yīng)用程序的 API 是所有實(shí)現(xiàn)者的標(biāo)準(zhǔn),但每個(gè)實(shí)現(xiàn)者都可以通過管理計(jì)算圖的方式以及根據(jù)底層平臺(tái)對(duì)其進(jìn)行優(yōu)化的程度來區(qū)分他們的解決方案。
功能集是什么樣的?
計(jì)算機(jī)視覺功能集提供了一組函數(shù),使應(yīng)用程序能夠執(zhí)行經(jīng)典的圖像處理任務(wù)。這些函數(shù)作為高級(jí) API 提供,應(yīng)用程序可以輕松調(diào)用這些 API,而無需擔(dān)心底層硬件。OpenVX 實(shí)現(xiàn)的工作是考慮給定硬件平臺(tái)下的加速。
盡管圖像處理和傳統(tǒng)的計(jì)算機(jī)視覺 API 仍然是強(qiáng)大的視覺管道的重要組成部分,但當(dāng)今最先進(jìn)的解決方案涉及深度學(xué)習(xí)算法。OpenVX 1.3 使應(yīng)用程序能夠通過兩種簡(jiǎn)單的方法推斷經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型:
應(yīng)用程序可以通過發(fā)出離散的函數(shù)調(diào)用(vxConvolutionLayer、vxActivationLayer、vxFullConnectedLayer、vxSoftmaxLayer等)并在運(yùn)行時(shí)構(gòu)建神經(jīng)網(wǎng)絡(luò),并向API提供相關(guān)的權(quán)重和偏差參數(shù)。
應(yīng)用程序可以將經(jīng)過訓(xùn)練的模型作為圖中的單個(gè)節(jié)點(diǎn)導(dǎo)入到 OpenVX 計(jì)算圖中。訓(xùn)練模型的導(dǎo)入是通過支持神經(jīng)網(wǎng)絡(luò)交換格式 (NNEF) 標(biāo)準(zhǔn)的導(dǎo)入/導(dǎo)出擴(kuò)展完成的。
對(duì)于那些希望構(gòu)建平臺(tái)來為自動(dòng)駕駛行業(yè)的決策和感知引擎提供動(dòng)力的人來說,他們需要解決兩個(gè)基本問題。首先是可擴(kuò)展性。他們構(gòu)建的平臺(tái)需要能夠適應(yīng)變化,并且必須適應(yīng)不斷發(fā)展的硬件加速器環(huán)境。這個(gè)問題的解決方案是使用行業(yè)標(biāo)準(zhǔn) API 如 OpenVX 1.3 將軟件與硬件解耦。
設(shè)計(jì)人員必須解決的第二個(gè)基本問題是安全性和可靠性。在這方面,OpenVX 1.3也提供了一個(gè)解決方案。OpenVX 1.3 規(guī)范提供了一個(gè)安全關(guān)鍵配置文件,該配置文件由旨在部署的功能子集組成。這些函數(shù)將在邊緣設(shè)備上運(yùn)行,因此保證由實(shí)現(xiàn)提供程序確定地執(zhí)行。
在單個(gè)API中,Khronos為計(jì)算機(jī)視覺和自治行業(yè)的未來提供了可擴(kuò)展性和可靠性的解決方案。該API是OpenVX 1.3。
審核編輯:郭婷
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103721 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7667瀏覽量
90863 -
API
+關(guān)注
關(guān)注
2文章
1624瀏覽量
64079
發(fā)布評(píng)論請(qǐng)先 登錄
RTOS的未來
LTE/LTE-A系統(tǒng)自組織網(wǎng)絡(luò)技術(shù)和標(biāo)準(zhǔn)化進(jìn)程分析
如何實(shí)現(xiàn)支持未來工業(yè)標(biāo)準(zhǔn)的方案?
一種開放性的SoC總線標(biāo)準(zhǔn)
構(gòu)建工業(yè)軟件開源工具鏈,2022 開放原子全球開源峰會(huì)開源工業(yè)軟件論壇即將開幕
?共建開源人才生態(tài),2022 開放原子全球開源峰會(huì)聚焦“產(chǎn)學(xué)研用”
2023開放原子全球開源峰會(huì)即將盛大舉行,開源賦能,普惠未來!
RISC-V:由全球社區(qū)支持的開放標(biāo)準(zhǔn),為所有人提供開放計(jì)算
LonMark標(biāo)準(zhǔn)在開放式系統(tǒng)中的應(yīng)用

自治系統(tǒng),自治系統(tǒng)是什么意思
PMBus--數(shù)字電源開放標(biāo)準(zhǔn)協(xié)議

基于區(qū)塊鏈智能合約技術(shù)的去中心化虛擬自治組織應(yīng)用聯(lián)盟鏈介紹
標(biāo)準(zhǔn)機(jī)構(gòu)需要關(guān)注未來

評(píng)論