Hot Chips——世界處理器行業(yè)的技術(shù)峰會,ARM、Intel、NVIDIA、微軟等巨頭的舞臺。今年,一家來自于中國的深度學習創(chuàng)業(yè)公司得到了全世界處理器行業(yè)專家的認可,登上了Hot Chips的演講臺,向全世界介紹兩項最新的針對于深度學習的DPU核心體系結(jié)構(gòu)設(shè)計——針對于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的Aristotle架構(gòu)和針對于稀疏深度神經(jīng)網(wǎng)絡(luò)(DNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的Descartes架構(gòu)。這所公司正是深鑒科技,而深鑒科技及CEO姚頌,也成為了Hot Chips歷史上最年輕的公司與最年輕的主講人。深鑒科技的報告榮獲本屆Hot Chips的Best Presentation殊榮。
歷史悠久的處理器行業(yè)技術(shù)峰會Hot Chips已經(jīng)走過了28年。芯片架構(gòu)設(shè)計領(lǐng)域每年都涌現(xiàn)大量新生代,但其中只有約20款最新的處理器架構(gòu)設(shè)計能夠在這個平臺進行展示,這使得該峰會成為世界芯片巨頭的必爭之地,每年的發(fā)表席位大多被ARM、高通、Intel、AMD等處理器巨頭占據(jù)。Hot Chips會議每年夏天在美國加州舉辦,今年會議地點則選在了位于Cupertino的Flint Center,而該中心之前也長期用于蘋果公司各項發(fā)布會。就在今年的峰會上,微軟首次公開了為Hololens設(shè)計的HPU處理器;NVIDIA則公開了下一代Tegra系列SoC。
得益于深鑒創(chuàng)始人團隊在深度學習硬件加速領(lǐng)域的深厚積累與公司卓越的技術(shù)實力,深鑒得到各大巨頭公司的一致認可。這家Hot Chips史上最年輕的公司,在會上展示了其核心技術(shù),身為深鑒CEO的姚頌也成為了Hot Chips史上最年輕的主講人。姚頌提到,深度學習專用處理平臺必須適應(yīng)最新的算法,如CNN中卷積核越來越小、LSTM中的矩陣尺寸越來越大。而深鑒之所以選擇FPGA作為其DPU的載體,正是因為其允許較短的TTM(Time To Market)與架構(gòu)的迭代,同時能夠提供合適的性能與功耗、較高的片上存儲帶寬。
姚頌在Hot Chips做主題演講
姚頌介紹了深鑒已經(jīng)實現(xiàn)的一鍵編譯技術(shù)。首先,對于神經(jīng)網(wǎng)絡(luò)層面進行深度壓縮,去除算法連接關(guān)系上的冗余;之后,再進行數(shù)據(jù)量化,去除單個數(shù)值在精度要求上的冗余;最后,根據(jù)深鑒設(shè)計的Aristotle與Descartes架構(gòu)指令集,當對神經(jīng)網(wǎng)絡(luò)模型進行編譯,而不進行重新訓練時,僅需要半分鐘即可完成從算法模型到可執(zhí)行指令的全套編譯流程。
在此次Hot Chips會議上,姚頌也首次公開了公司所設(shè)計的兩款深度學習專用處理架構(gòu):針對于CNN的Aristotle架構(gòu),以及針對于稀疏DNN/RNN-LSTM的Descartes架構(gòu)。
Aristotle架構(gòu)專為基于CNN的深度學習應(yīng)用設(shè)計,為小尺寸卷積核優(yōu)化,高效支持1x1,3x3等卷積操作;支持卷積、Pooling、ReLU、Concat、Batch Normalization等多種層,不限制網(wǎng)絡(luò)層數(shù)、規(guī)模;支持R-FCN等多種物體檢測框架;Aristotle搭載于Zynq 7020 FPGA上,可取得比NVIDIA Tegra K1 GPU好一個數(shù)量級的能效比;如果映射到相應(yīng)的芯片工藝上,毫無疑問可以取得進一步明顯的能效提升。Aristotle架構(gòu)可以廣泛應(yīng)用于無人機、安防監(jiān)控、機器人、自動駕駛等圖像相關(guān)的各大領(lǐng)域中。
姚頌介紹深鑒Aristotle架構(gòu)
Descartes架構(gòu)則專為稀疏DNN/RNN-LSTM設(shè)計,支持LSTM中多個矩陣操作的復雜調(diào)度,支持各種稀疏率、矩陣尺寸,以及多種非線性函數(shù),搭載與KU系列FPGA,可以實現(xiàn)比GPU超過一個數(shù)量級的能效提升,可以廣泛用于語音識別、翻譯、OCR等多種應(yīng)用領(lǐng)域。
姚頌介紹Descartes架構(gòu)
會場之外,深鑒科技創(chuàng)始人之一、首席科學家韓松也被邀請進行Poster展示,深鑒科技團隊也在Poster Session展示了Live Demo供參會專家體驗點評。深鑒團隊場內(nèi)的報告與場外展示的呼應(yīng),也成為了本屆Hot Chips的一大亮點。
值得一提的是,姚頌也在會上首次介紹了基于Aristotle架構(gòu)的深度學習處理平臺“雨燕”,該平臺將在10月實現(xiàn)批量供貨?!坝暄唷逼脚_基于Xilinx Zynq FPGA,支持各類神經(jīng)網(wǎng)絡(luò)、多種物體檢測框架,并且集成了HOG、KCF等物體追蹤常用模塊,能夠廣泛用于無人機、機器人、ADAS等領(lǐng)域。這也代表著深度學習專用處理平臺真正從學術(shù)走向了市場。世界,向深度學習無處不在的時代,又邁近了一步。
基于Aristotle架構(gòu)的“雨燕”深度學習處理平臺
-
循環(huán)神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
38瀏覽量
3113 -
深度神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
62瀏覽量
4702 -
深鑒科技
+關(guān)注
關(guān)注
0文章
36瀏覽量
5956
發(fā)布評論請先 登錄
瓴芯榮獲2024年度汽車電子科學技術(shù)獎兩項殊榮
長安汽車與深演智能榮獲2025愛分析DeepSeek最佳實踐案例
上能電氣無錫測試中心榮獲權(quán)威資質(zhì)
愛立信榮獲2025年iF設(shè)計獎
Best Sound用戶手冊
世強硬創(chuàng)榮獲利爾達“2024年度最佳成長合作伙伴”
Spire.Cloud.Presentation說明

光庭信息在科技創(chuàng)新領(lǐng)域榮獲兩項殊榮
英飛凌CoolSiC? MOSFET 2000V再獲殊榮,榮獲極光獎兩項大獎

摩爾斯微電子榮獲2024年WBA行業(yè)大獎最佳Wi-Fi創(chuàng)新獎等多項殊榮
Hot Swap外置軟啟電路設(shè)計

NVIDIA 在 Hot Chips 大會展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

小米集團榮獲《機構(gòu)投資者》“2024年亞洲最佳管理團隊”多項殊榮
華寶新能榮獲廣東省工業(yè)設(shè)計中心殊榮
深視智能榮獲機器人核心技術(shù)創(chuàng)新獎

評論