前言背景
近期,經(jīng)過龍芯中科與NCNN社區(qū)的共同努力,在NCNN中使用龍架構(gòu)(LoongArch)向量優(yōu)化實現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實現(xiàn),優(yōu)化后NCNN在平臺上各項性能測試比通用實現(xiàn)普遍提升一倍以上。
基于龍架構(gòu)向量優(yōu)化開啟前后的NCNN各項性能對比
(豎軸為耗時高度,越高耗時越久,性能越低)
NCNN作為業(yè)界首個為移動端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計算框架,在2017年首次開源,是騰訊優(yōu)圖實驗室第一次對外公開深度學(xué)習(xí)的研究成果。目前多應(yīng)用在圖像方面,例如人像自動美顏,照片風(fēng)格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網(wǎng)絡(luò)的特點,是許多開發(fā)者在移動端、嵌入式設(shè)備上部署深度學(xué)習(xí)算法的首選框架。
龍架構(gòu)向量優(yōu)化加入NCNN生態(tài)社區(qū)
本次優(yōu)化共產(chǎn)出3萬多行代碼,成果將應(yīng)用于龍芯AI邊緣計算場景,完成基于龍架構(gòu)平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統(tǒng)、手勢識別、口罩檢測等等。依托于NCNN計算框架優(yōu)秀的低耦結(jié)構(gòu),開發(fā)者只需關(guān)注算子在龍架構(gòu)平臺上的高效實現(xiàn),無需考慮整個系統(tǒng)結(jié)構(gòu)問題,實現(xiàn)更高效的開發(fā)與部署工作。前期,NCNN與龍芯CPU進行了較為全面的適配和性能優(yōu)化,共同打通了AI應(yīng)用和國產(chǎn)CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計算場景
龍芯中科將與NCNN社區(qū)保持密切合作,繼續(xù)根據(jù)龍架構(gòu)平臺向量特點不斷優(yōu)化算子,推進龍架構(gòu)生態(tài)成果落地更多場景、服務(wù)更多領(lǐng)域、歡迎社區(qū)廣大開發(fā)者與龍芯中科一道共建自主開放的龍架構(gòu)生態(tài)體系。
審核編輯:湯梓紅
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103541 -
AI
+關(guān)注
關(guān)注
88文章
35065瀏覽量
279379 -
龍芯中科
+關(guān)注
關(guān)注
0文章
316瀏覽量
8049
原文標(biāo)題:龍架構(gòu)向量創(chuàng)新賦能AI圖像識別計算,促進NCNN神經(jīng)網(wǎng)絡(luò)前向計算框架性能翻倍
文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【嘉楠堪智K230開發(fā)板試用體驗】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測
BP神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

評論