99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦 | 十年磨一劍!中國(guó)高通量計(jì)算機(jī)的自主研發(fā)之路

mK5P_AItists ? 來(lái)源:YXQ ? 2019-07-17 16:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,高性能計(jì)算的主要應(yīng)用從傳統(tǒng)的科學(xué)與工程計(jì)算為主逐步演變?yōu)橐詳?shù)據(jù)處理為核心,這給傳統(tǒng)高性能計(jì)算機(jī)體系結(jié)構(gòu)帶來(lái)巨大挑戰(zhàn)的同時(shí),也使高通量計(jì)算應(yīng)運(yùn)而生。文章從應(yīng)用特征出發(fā)闡述了高通量計(jì)算與傳統(tǒng)高性能計(jì)算的差別,并探討了高通量計(jì)算的基礎(chǔ)理論、關(guān)鍵技術(shù),以及中國(guó)科學(xué)院在高通量計(jì)算核心芯片及系統(tǒng)領(lǐng)域的研究成果;以期通過(guò)高通量計(jì)算機(jī)關(guān)鍵技術(shù)的研究與突破,為緩解我國(guó)核心芯片“卡脖子”的問(wèn)題,以及為構(gòu)建智能萬(wàn)物互聯(lián)時(shí)代的新型高性能計(jì)算平臺(tái)作出貢獻(xiàn)。

近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)每天產(chǎn)生的數(shù)據(jù)量呈爆炸式增長(zhǎng)。以幾個(gè)典型公司為例:淘寶網(wǎng)每天交易達(dá)數(shù)千萬(wàn)筆,其單日數(shù)據(jù)產(chǎn)生量超過(guò)?50?TB;百度每天大約要處理?200?億次搜索請(qǐng)求,處理數(shù)據(jù)量達(dá)數(shù)百?PB;騰訊網(wǎng)日覆蓋人數(shù)超過(guò)?1.5?億,騰訊視頻月總播放量達(dá)?800?億次;Facebook?注冊(cè)用戶(hù)超過(guò)?20?億,每月上傳的照片達(dá)數(shù)百億張。根據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),到?2025?年,全球需要管理的數(shù)據(jù)量將超過(guò)?160?ZB。如何有效對(duì)這些數(shù)據(jù)進(jìn)行加工將成為一大難題。

在這種背景下,高性能計(jì)算的主流應(yīng)用也從傳統(tǒng)的以科學(xué)與工程計(jì)算為主,逐步演變成以數(shù)據(jù)處理為核心。然而,由于網(wǎng)絡(luò)應(yīng)用及軟件技術(shù)的不同,需要處理的數(shù)據(jù)格式和產(chǎn)生速度也各不相同。更甚的是,諸如微博、團(tuán)購(gòu)、“秒殺”等網(wǎng)絡(luò)應(yīng)用的出現(xiàn),給大規(guī)模數(shù)據(jù)的實(shí)時(shí)處理及?QoS(服務(wù)質(zhì)量)提出了更高的要求。因此,互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用帶來(lái)的種種新特性給當(dāng)前的高性能處理器芯片和計(jì)算機(jī)系統(tǒng)帶來(lái)了巨大的挑戰(zhàn)。

我們都知道,芯片和系統(tǒng)是信息產(chǎn)業(yè)發(fā)展和安全的根基,盡管我國(guó)的信息服務(wù)行業(yè)發(fā)展繁榮,但支撐我國(guó)信息行業(yè)的核心設(shè)施卻嚴(yán)重受制于人,特別是關(guān)鍵芯片和核心系統(tǒng)等方面依然面臨“卡脖子”的相關(guān)問(wèn)題。當(dāng)前國(guó)內(nèi)數(shù)據(jù)中心的中央處理器(CPU)芯片市場(chǎng)幾乎被美國(guó)的?Intel?和?AMD?兩家公司全部瓜分,而加速器芯片則主要由美國(guó)的?NVIDIA?公司壟斷。核心技術(shù)的缺失,使得我國(guó)整個(gè)信息產(chǎn)業(yè)面臨著嚴(yán)重的產(chǎn)業(yè)安全問(wèn)題,尤其是當(dāng)前中美經(jīng)貿(mào)摩擦愈演愈烈,唯有科技自主方可不受制于人。

中國(guó)科學(xué)院計(jì)算技術(shù)研究所早在?10?年前就前瞻性地啟動(dòng)了高通量計(jì)算機(jī)的研究工作。經(jīng)過(guò)多年的科研積累,目前已經(jīng)在核心芯片、計(jì)算機(jī)系統(tǒng)等方面形成了諸多創(chuàng)新成果,并已開(kāi)始逐步投入產(chǎn)業(yè)應(yīng)用。

什么是高通量計(jì)算機(jī)

高性能計(jì)算在傳統(tǒng)的科學(xué)與工程計(jì)算類(lèi)應(yīng)用中的特點(diǎn)包括:任務(wù)單一,負(fù)載變化不頻繁,單個(gè)任務(wù)計(jì)算量大,以及計(jì)算局部性好。而高通量計(jì)算在數(shù)據(jù)中心的應(yīng)用則主要面向互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新興場(chǎng)景,其特點(diǎn)是:任務(wù)多樣,單個(gè)任務(wù)往往具有流式計(jì)算特征;計(jì)算量相對(duì)不大,但任務(wù)的并發(fā)數(shù)量及數(shù)據(jù)規(guī)模巨大;以及處理要求具有實(shí)時(shí)性。

傳統(tǒng)高性能計(jì)算機(jī)的研制目標(biāo)是提高速度,即縮短單個(gè)并行計(jì)算任務(wù)的運(yùn)行時(shí)間;而數(shù)據(jù)中心類(lèi)應(yīng)用系統(tǒng)的目標(biāo)是高通量,即提高單位時(shí)間內(nèi)任務(wù)或數(shù)據(jù)處理的吞吐量。這種以“算得多”為性能指標(biāo)的高性能計(jì)算機(jī)被稱(chēng)為高通量計(jì)算機(jī)。如果給高通量計(jì)算機(jī)一個(gè)定義,那么可以這么描述:高通量計(jì)算機(jī)是適用于互聯(lián)網(wǎng)大數(shù)據(jù)等新興應(yīng)用負(fù)載特征的、在強(qiáng)時(shí)間約束下能夠全局可控地處理高并發(fā)請(qǐng)求的新型高性能計(jì)算機(jī)。其核心特點(diǎn)是對(duì)并發(fā)性、實(shí)時(shí)性和確定性的保障。

高通量計(jì)算機(jī)和傳統(tǒng)的高性能計(jì)算機(jī)在目標(biāo)應(yīng)用、計(jì)算特征和設(shè)計(jì)目標(biāo)等方面都存在明確的區(qū)別(表?1)。然而,由于高性能計(jì)算由來(lái)已久,目前主流的通用計(jì)算機(jī)和高端計(jì)算系統(tǒng)的發(fā)展都深受其影響,這也使得當(dāng)前數(shù)據(jù)中心主流的計(jì)算系統(tǒng)在針對(duì)網(wǎng)絡(luò)服務(wù)這種高并發(fā)、強(qiáng)實(shí)時(shí)的高通量應(yīng)用時(shí)表現(xiàn)出諸多不足。為了進(jìn)一步理解高通量應(yīng)用對(duì)計(jì)算機(jī)體系結(jié)構(gòu)的需求,我們基于當(dāng)前主流的高性能服務(wù)器(采用Intel Xeon CPU)對(duì)典型高通量應(yīng)用進(jìn)行了測(cè)試,并且發(fā)現(xiàn)了以下一些問(wèn)題。

緩存資源浪費(fèi)。CPU上的共享緩存(cache)缺失率很高,這說(shuō)明高通量應(yīng)用與傳統(tǒng)高性能計(jì)算應(yīng)用的數(shù)據(jù)訪(fǎng)問(wèn)特征有明顯區(qū)別,傳統(tǒng)的多級(jí)緩存設(shè)計(jì)并不適合。從面積和功耗的角度來(lái)衡量的話(huà),共享緩存作用不大,但卻占用了大量的片上面積(在?Intel?的主流服務(wù)器芯片中,片上存儲(chǔ)所占面積通常高達(dá)?30%?以上),產(chǎn)生了大量的功耗。

內(nèi)存帶寬利用率低。CPU?在?70%?以上使用率時(shí)的壓力測(cè)試下,內(nèi)存帶寬的有效使用率通常也不到?10%。這說(shuō)明,在高通量應(yīng)用負(fù)載下,傳統(tǒng)計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì)下的內(nèi)存帶寬并沒(méi)有得到有效利用。

服務(wù)質(zhì)量難以保障。當(dāng)增加任務(wù)的并發(fā)負(fù)載,使得?CPU?利用率維持在較高水平時(shí),我們發(fā)現(xiàn)應(yīng)用的完成時(shí)間迅速拉長(zhǎng),也即系統(tǒng)的尾延遲明顯增大,從而導(dǎo)致延遲敏感應(yīng)用大量失效。因此,在傳統(tǒng)服務(wù)器系統(tǒng)上,要想獲得好的用戶(hù)體驗(yàn),必須把硬件利用率維持在較低水平。

通過(guò)上述實(shí)驗(yàn)結(jié)果我們可以看到,現(xiàn)有的高性能計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)并不能很好地滿(mǎn)足高通量應(yīng)用的新特性。因此,需要開(kāi)展新型的高通量計(jì)算體系結(jié)構(gòu)的研究。

高通量計(jì)算基礎(chǔ)理論

與傳統(tǒng)高性能計(jì)算以高速度為設(shè)計(jì)目標(biāo)相比,高通量計(jì)算的核心是追求高通量,即算得多。具體包括?3?個(gè)核心要素,即高吞吐、高利用率、低延遲。

高吞吐。是指單位時(shí)間完成的任務(wù)數(shù)或者響應(yīng)的請(qǐng)求數(shù)要多。對(duì)于互聯(lián)網(wǎng)應(yīng)用場(chǎng)景來(lái)說(shuō),數(shù)據(jù)中心的一個(gè)核心挑戰(zhàn)是要實(shí)時(shí)響應(yīng)海量的并發(fā)用戶(hù)請(qǐng)求。以?2018?年天貓“雙?11”全球狂歡節(jié)為例,其實(shí)時(shí)數(shù)據(jù)處理峰值超過(guò)?6?億條/秒,支付成功峰值超過(guò)?30?萬(wàn)筆/秒,數(shù)據(jù)中心必須充分挖掘各種并行性以應(yīng)對(duì)如此巨大的實(shí)時(shí)并發(fā)處理需求。

高利用率。是指計(jì)算機(jī)系統(tǒng)中的核心部件(如?CPU、存儲(chǔ)器、網(wǎng)絡(luò)等)的利用率要高。當(dāng)前大型數(shù)據(jù)中心通常包括數(shù)十萬(wàn)臺(tái)甚至百萬(wàn)臺(tái)服務(wù)器,建設(shè)資金則高達(dá)數(shù)十億甚至百億美元。然而,為了確保用戶(hù)的服務(wù)質(zhì)量,現(xiàn)有數(shù)據(jù)中心不得不將利用率控制在較低水平,因此整體利用率情況很不理想。公開(kāi)數(shù)據(jù)顯示,2013?年谷歌數(shù)據(jù)中心的平均?CPU?利用率只有30%,而其他互聯(lián)網(wǎng)公司運(yùn)營(yíng)的數(shù)據(jù)中心的利用率甚至比該值還要低??梢?jiàn)在現(xiàn)有的架構(gòu)下,要做到既能實(shí)時(shí)滿(mǎn)足用戶(hù)處理需求,同時(shí)又能達(dá)到高的利用率,是非常困難的。

低延遲。指用戶(hù)請(qǐng)求的響應(yīng)時(shí)間要短?;ヂ?lián)網(wǎng)上的大部分在線(xiàn)服務(wù)具有明顯的實(shí)時(shí)交互特征,數(shù)據(jù)中心必須確保在給定的實(shí)時(shí)性約束條件滿(mǎn)足的情況下返回結(jié)果,否則會(huì)導(dǎo)致服務(wù)的失效。比如一些圖像識(shí)別或者語(yǔ)音翻譯之類(lèi)的人工智能AI)應(yīng)用場(chǎng)景,通常要求響應(yīng)時(shí)間在毫秒級(jí)別,這對(duì)于當(dāng)前的計(jì)算機(jī)系統(tǒng)來(lái)講是一個(gè)巨大挑戰(zhàn)。

圖片源自xinhuanet.com

針對(duì)上述高吞吐、高利用率、低延遲的設(shè)計(jì)需求,我們提出一個(gè)基于“系統(tǒng)熵”的通量分析模型?。系統(tǒng)熵主要受延遲的不確定性(波動(dòng)情況)、資源利用率和吞吐量?3?個(gè)因素影響。簡(jiǎn)單來(lái)講,系統(tǒng)熵與延遲的波動(dòng)幅度成正比,與資源利用率以及系統(tǒng)吞吐量成反比。因此,延遲波動(dòng)越大,系統(tǒng)熵越大;資源利用率越高、吞吐量越大,則系統(tǒng)熵越小。類(lèi)似于“熱力學(xué)熵”的用法,我們通過(guò)“系統(tǒng)熵”可以反映計(jì)算機(jī)系統(tǒng)中的易擾動(dòng)程度或者不確定性。

“熵者,傷也?!备哽叵到y(tǒng)往往開(kāi)銷(xiāo)大、成本高。相比于高熵系統(tǒng),低熵系統(tǒng)具有更優(yōu)的可預(yù)測(cè)性,能達(dá)到更高的效率、更低的成本,也更受用戶(hù)青睞。曾有人問(wèn)美國(guó)能源部副部長(zhǎng)斯蒂文?·?庫(kù)寧(Steven Koonin),為什么電能如此受到人們的喜愛(ài)?他回答道,因?yàn)殡娏κ且环N低熵能源。前文提到,為了確保用戶(hù)服務(wù)質(zhì)量,現(xiàn)有的數(shù)據(jù)中心的?CPU?平均利用率很低,一旦利用率提高,其負(fù)載性能的波動(dòng)幅度將迅速增大。因此,當(dāng)前數(shù)據(jù)中心計(jì)算系統(tǒng)仍然是高熵系統(tǒng)。而高通量計(jì)算機(jī)的核心目標(biāo)就是要降低系統(tǒng)熵,也即降低系統(tǒng)的不確定性;以及通過(guò)高通量計(jì)算機(jī)實(shí)現(xiàn)提高系統(tǒng)利用率和任務(wù)吞吐量的同時(shí),避免應(yīng)用的性能波動(dòng)。

高通量計(jì)算關(guān)鍵技術(shù)

針對(duì)高通量計(jì)算高吞吐、高利用率、低延遲的需求,我們需要把當(dāng)前計(jì)算機(jī)體系結(jié)構(gòu)的設(shè)計(jì)從“速度導(dǎo)向”轉(zhuǎn)向“通量導(dǎo)向”,從而確保計(jì)算機(jī)系統(tǒng)在滿(mǎn)足高吞吐、低延遲的同時(shí)還能達(dá)到高利用率。針對(duì)上述目標(biāo),中國(guó)科學(xué)院計(jì)算技術(shù)研究所在高通量計(jì)算機(jī)研制過(guò)程中提出了一系列關(guān)鍵技術(shù),包括高通量眾核體系結(jié)構(gòu)、高通量片上數(shù)據(jù)通路、標(biāo)簽化體系結(jié)構(gòu)等。

高通量眾核體系結(jié)構(gòu)

針對(duì)高通量應(yīng)用中的海量并發(fā)處理需求,我們提出了?Godson-T?眾核處理器體系結(jié)構(gòu),以實(shí)現(xiàn)任務(wù)的高吞吐。相比于傳統(tǒng)多核處理器,Godson-T?采用眾核架構(gòu)提供豐富的并發(fā)處理能力,并在片上網(wǎng)絡(luò)、片上存儲(chǔ)、同步模型和通信機(jī)制等方面采用創(chuàng)新性的設(shè)計(jì)方法,以實(shí)現(xiàn)任務(wù)的高吞吐和低延遲。

易擴(kuò)展片上網(wǎng)絡(luò)。Godson-T?采用易擴(kuò)展的二維網(wǎng)格片上網(wǎng)絡(luò),同時(shí)支持擁塞感知和能耗感知的動(dòng)態(tài)路由算法以實(shí)現(xiàn)高并發(fā)場(chǎng)景下的片上網(wǎng)絡(luò)負(fù)載均衡,進(jìn)而確保網(wǎng)絡(luò)通信的低延遲。

細(xì)粒度可配置片上存儲(chǔ)。Godson-T?的片上存儲(chǔ)支持細(xì)粒度可配置,從而更好地適配高通量場(chǎng)景下復(fù)雜的數(shù)據(jù)訪(fǎng)問(wèn)模式,降低延遲。

快速同步機(jī)制。我們?cè)O(shè)計(jì)了片上同步管理結(jié)構(gòu),支持基于數(shù)據(jù)流的核間細(xì)粒度快速同步,相比傳統(tǒng)的基于內(nèi)存的同步機(jī)制,性能可獲得數(shù)量級(jí)的提升。

編程數(shù)據(jù)通信機(jī)制。Godson-T?提出了可編程數(shù)據(jù)傳輸引擎結(jié)構(gòu),可以快速實(shí)現(xiàn)數(shù)據(jù)的水平(片上處理器核之間)和垂直(從內(nèi)存到片上存儲(chǔ))搬運(yùn),實(shí)現(xiàn)了數(shù)據(jù)通信的低延遲。

Godson-T?眾核處理器結(jié)構(gòu)受到國(guó)際同行的廣泛關(guān)注,2011?年,處理器領(lǐng)域的知名期刊《微處理器報(bào)告》(Microprocessor Report)對(duì)?Godson-T?的研究成果進(jìn)行了專(zhuān)門(mén)文章報(bào)道,并將其選入?2011?年全球十大服務(wù)器處理器之一。

高通量片上數(shù)據(jù)通路

“通量導(dǎo)向”的處理器數(shù)據(jù)通路設(shè)計(jì)也是確?!案咄掏?、低延遲”的關(guān)鍵,我們借鑒城市交通管理的思路開(kāi)展設(shè)計(jì)。高通量計(jì)算在結(jié)構(gòu)特征、資源管理、調(diào)度策略等方面都非常類(lèi)似于城市交通管理,兩者的核心特征都是高通量,即在單位時(shí)間內(nèi)完成盡可能多的處理請(qǐng)求,并保證?QoS,表?2?給出了兩者的類(lèi)比情況。

針對(duì)應(yīng)用的新特點(diǎn),高通量數(shù)據(jù)通路重點(diǎn)在最基本的數(shù)據(jù)讀取、數(shù)據(jù)傳輸(訪(fǎng)存通路)和數(shù)據(jù)處理3個(gè)環(huán)節(jié)進(jìn)行了創(chuàng)新。

數(shù)據(jù)讀取環(huán)節(jié)。針對(duì)應(yīng)用中的大量細(xì)粒度訪(fǎng)存需求,設(shè)計(jì)了基于硬件的訪(fǎng)存請(qǐng)求收集表,通過(guò)對(duì)大量細(xì)粒度訪(fǎng)存的收集并批量處理,同時(shí)通過(guò)時(shí)間敏感的收集窗口控制機(jī)制,避免長(zhǎng)延遲導(dǎo)致的任務(wù)失效。

數(shù)據(jù)傳輸環(huán)節(jié)。針對(duì)大量細(xì)粒度訪(fǎng)存的需求,提出了高密度路網(wǎng)的設(shè)計(jì),從而提高片上網(wǎng)絡(luò)的利用率和吞吐量。支持動(dòng)態(tài)通路調(diào)整,能根據(jù)數(shù)據(jù)傳輸?shù)膲毫?,?dòng)態(tài)調(diào)整傳輸通路配置,提高通路利用率。此外,通過(guò)直連快速網(wǎng)絡(luò)保障關(guān)鍵數(shù)據(jù)通路的低延遲。

數(shù)據(jù)處理環(huán)節(jié)。提出了硬件支持的全局實(shí)時(shí)任務(wù)調(diào)度機(jī)制,將任務(wù)按照優(yōu)先級(jí)及剩余裕度時(shí)間進(jìn)行調(diào)度,有效保障任務(wù)的?QoS;同時(shí)避免對(duì)時(shí)間裕度不足的失效任務(wù)進(jìn)行調(diào)度,從而確保硬件資源的合理利用。

標(biāo)簽化體系結(jié)構(gòu)

為了在高吞吐、低延遲的同時(shí)還能實(shí)現(xiàn)高利用率,我們提出了標(biāo)簽化馮?·?諾依曼體系結(jié)構(gòu)(Labeled von Neumann Architecture,LvNA;圖?1)。LvNA?的主要思想,是在經(jīng)典馮?·?諾依曼體系結(jié)構(gòu)之上增加一套基于標(biāo)簽機(jī)制的可編程接口,使得總線(xiàn)與共享硬件部件支持“DIP”能力,即?D—區(qū)分(Distinguishing)、I—隔離(Isolation)、P—優(yōu)先化(Prioritizing),從而降低計(jì)算機(jī)系統(tǒng)內(nèi)部因資源競(jìng)爭(zhēng)造成的干擾。

D屬性標(biāo)簽機(jī)制。在?LvNA?中,標(biāo)簽將依附于所有的數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求中,用于標(biāo)識(shí)該請(qǐng)求來(lái)源于哪一個(gè)應(yīng)用(或應(yīng)用類(lèi)別),并隨著數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求一同在整個(gè)計(jì)算機(jī)系統(tǒng)中傳播。這樣,總線(xiàn)和共享硬件部件就可以通過(guò)檢查數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求的標(biāo)簽來(lái)對(duì)不同應(yīng)用(或應(yīng)用類(lèi)別)的請(qǐng)求進(jìn)行區(qū)分,從而支持區(qū)分屬性(D?屬性)。

I屬性標(biāo)簽機(jī)制。總線(xiàn)和共享硬件部件可以在對(duì)數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求進(jìn)行來(lái)源區(qū)分的基礎(chǔ)上,對(duì)請(qǐng)求所訪(fǎng)問(wèn)的空間資源(如緩存、內(nèi)存地址空間等)進(jìn)行隔離,減緩或消除因?yàn)榭臻g資源的共享沖突帶來(lái)的干擾,從而支持隔離屬性(I?屬性)。

P屬性標(biāo)簽機(jī)制。總線(xiàn)和共享硬件部件可以在對(duì)數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求進(jìn)行來(lái)源區(qū)分的基礎(chǔ)上,對(duì)請(qǐng)求所使用的性能資源(如隊(duì)列、帶寬等)進(jìn)行優(yōu)先化,減緩或消除因?yàn)樾阅苜Y源的共享沖突帶來(lái)的干擾,從而支持優(yōu)先化屬性(P?屬性)。

基于上述標(biāo)簽機(jī)制,控制邏輯按照預(yù)先設(shè)定的規(guī)則,以標(biāo)簽為依據(jù)對(duì)相應(yīng)的數(shù)據(jù)訪(fǎng)問(wèn)請(qǐng)求實(shí)施不同的性能調(diào)控策略。這些性能調(diào)控策略是軟件可編程的,并且可以做到比傳統(tǒng)操作系統(tǒng)的性能調(diào)控更為細(xì)粒度,從而對(duì)延遲敏感型應(yīng)用會(huì)有更優(yōu)的性能調(diào)控效果。

LvNA?對(duì)硬件的增強(qiáng)并不改動(dòng)現(xiàn)有指令的語(yǔ)義,因此對(duì)軟件系統(tǒng)沒(méi)有侵入性,可以做到無(wú)須修改操作系統(tǒng)和應(yīng)用程序。此外,LvNA?不依賴(lài)于處理器流水線(xiàn)結(jié)構(gòu)的改動(dòng),因而可以適用于任意處理器。

高通量計(jì)算核心芯片、系統(tǒng)及應(yīng)用

為了驗(yàn)證高通量計(jì)算機(jī)在核心芯片和系統(tǒng)等方面的核心技術(shù),中國(guó)科學(xué)院計(jì)算技術(shù)研究所先后研制了高通量眾核處理器——DPU-m、標(biāo)簽化體系結(jié)構(gòu)——“火苗”,以及高通量計(jì)算機(jī)系統(tǒng)——“金剛”等,并開(kāi)展實(shí)際應(yīng)用。

DPU-m高通量眾核處理器

我們完成了?DPU-m?高通量眾核處理器芯片(圖?2)的設(shè)計(jì)和流片,芯片基于?TSMC?40?nm?工藝,主要面向互聯(lián)網(wǎng)高通量視頻處理需求。與數(shù)據(jù)處理領(lǐng)域的主流芯片?Intel?的相同工藝芯片相比,能效提升達(dá)?20?余倍。

目前,基于自主技術(shù)構(gòu)建的高通量處理系統(tǒng)在國(guó)內(nèi)外均已開(kāi)展部署。在國(guó)內(nèi)已經(jīng)進(jìn)入國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心、中國(guó)移動(dòng)、中國(guó)聯(lián)通等重要高通量網(wǎng)絡(luò)數(shù)據(jù)監(jiān)管與分析領(lǐng)域,有效保障了國(guó)家信息安全。在國(guó)外也已經(jīng)累計(jì)部署數(shù)千節(jié)點(diǎn),服務(wù)于國(guó)家“一帶一路”倡議。

“火苗”標(biāo)簽化體系結(jié)構(gòu)原型系統(tǒng)

“火苗”原型系統(tǒng)(圖?3)是依據(jù)?LvNA?實(shí)現(xiàn)的?FPGA?原型系統(tǒng),包括?8?個(gè)節(jié)點(diǎn);基于?SiFive?公司?freechips?項(xiàng)目的開(kāi)源?SoC?實(shí)現(xiàn)?Rocketchip,并在其基礎(chǔ)上加入了標(biāo)簽化的基礎(chǔ)設(shè)施以及應(yīng)用標(biāo)簽的控制平面。該系統(tǒng)已整體達(dá)到國(guó)際先進(jìn)水平(美國(guó)加州大學(xué)伯克利分校于?2018?年?6?月發(fā)布同類(lèi)平臺(tái)),標(biāo)簽化功能處于國(guó)際領(lǐng)先水平。目前,“火苗”原型系統(tǒng)已對(duì)外開(kāi)放,被中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院、清華大學(xué)、北京大學(xué)、天津大學(xué)、大連理工大學(xué)、華為海思公司、美國(guó)?Clemson?大學(xué)等用于前沿研究與產(chǎn)品研發(fā)。

“金剛”高通量計(jì)算機(jī)

2018?年?10?月,中國(guó)科學(xué)院計(jì)算技術(shù)研究所聯(lián)合北京中科睿芯科技有限公司在中國(guó)計(jì)算機(jī)大會(huì)(CNCC)上發(fā)布了首臺(tái)高通量計(jì)算機(jī)系統(tǒng)——“金剛”(圖?4),該系統(tǒng)集成了該所相關(guān)團(tuán)隊(duì)在高通量處理器、高通量系統(tǒng)、高通量軟件及應(yīng)用等領(lǐng)域的一系列創(chuàng)新技術(shù),以高吞吐、高利用率、低延遲的特性滿(mǎn)足數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)的新需求,在高并發(fā)音視頻處理、深度學(xué)習(xí)等典型應(yīng)用場(chǎng)景相比傳統(tǒng)服務(wù)器獲得數(shù)量級(jí)的能效提升。目前,隨著高通量計(jì)算機(jī)系統(tǒng)的成功研制,高通量計(jì)算技術(shù)將逐步應(yīng)用到國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng),貢獻(xiàn)于國(guó)計(jì)民生。

高通量計(jì)算中心建設(shè)

當(dāng)前,城市公共計(jì)算基礎(chǔ)設(shè)施仍以超算中心和云計(jì)算中心為主。超算中心采用的是傳統(tǒng)高性能計(jì)算架構(gòu),其核心是“算得快”;以交通工具做類(lèi)比的話(huà),對(duì)應(yīng)的是飛機(jī),其特點(diǎn)就是速度快、完成時(shí)間短。而云計(jì)算中心的核心是面對(duì)多樣化的計(jì)算需求實(shí)現(xiàn)“算得省”,對(duì)應(yīng)交通工具中的汽車(chē),汽車(chē)可以在絕大部分出行場(chǎng)景中都達(dá)到成本低和利用率高的目的。然而,飛機(jī)和汽車(chē)都存在一個(gè)明顯的局限性:雖然,在流量較低的情況下,兩者都能確保較好的服務(wù)質(zhì)量;但是,一旦交通負(fù)載快速上升時(shí),就容易造成擁塞,導(dǎo)致完成時(shí)間急劇增長(zhǎng),難以保障服務(wù)質(zhì)量。而高通量計(jì)算的核心就是要突破上述局限性,在高負(fù)載的情況下實(shí)現(xiàn)“算得多”,類(lèi)似于高鐵。高鐵是目前交通工具中,在高負(fù)載、高利用率前提下依然能有效保障用戶(hù)服務(wù)質(zhì)量的最佳方案。

隨著用戶(hù)出行需求的多樣化,交通運(yùn)輸體系也在不斷發(fā)展完善。類(lèi)似地,隨著應(yīng)用需求的不斷變化,未來(lái)城市公共計(jì)算基礎(chǔ)設(shè)施也需要不斷發(fā)展和完善。面對(duì)未來(lái)千億級(jí)別端設(shè)備帶來(lái)的新需求,需要提供更高通量、更高智能、更高確定性、更低延遲和更低功耗的計(jì)算與傳輸能力,而高通量計(jì)算中心無(wú)疑將扮演著越來(lái)越重要的角色。

中國(guó)科學(xué)院計(jì)算技術(shù)研究所正在開(kāi)展高通量計(jì)算中心的建設(shè),按照規(guī)劃,第一步將先建設(shè)1—2個(gè)高通量計(jì)算的示范中心,然后在全國(guó)重點(diǎn)城市開(kāi)展高通量計(jì)算中心建設(shè),逐步實(shí)現(xiàn)高通量計(jì)算技術(shù)與新興產(chǎn)業(yè)的無(wú)縫融合。目前,第一個(gè)城市高通量計(jì)算中心已經(jīng)選址江蘇省鹽城市并已開(kāi)展建設(shè),由中國(guó)科學(xué)院計(jì)算技術(shù)研究所團(tuán)隊(duì)負(fù)責(zé)高通量計(jì)算中心的整體方案設(shè)計(jì)、核心設(shè)備研制和日常運(yùn)營(yíng)。鹽城高通量計(jì)算中心將重點(diǎn)支持高通量視頻處理和人工智能加速,作為服務(wù)鹽城智能產(chǎn)業(yè)升級(jí)的核心公共研發(fā)平臺(tái)。

總結(jié)及建議

經(jīng)過(guò)長(zhǎng)期的努力突破,我國(guó)在高性能計(jì)算機(jī)研制方面已經(jīng)取得一系列令人矚目的成果。然而我們也看到,不管是傳統(tǒng)超算中心,還是新興互聯(lián)網(wǎng)數(shù)據(jù)中心,核心芯片受制于人的現(xiàn)象仍然非常嚴(yán)重。

為了確保我國(guó)信息產(chǎn)業(yè)的安全可持續(xù)發(fā)展,有必要以高通量計(jì)算等新興應(yīng)用場(chǎng)景作為突破口,加強(qiáng)核心芯片和計(jì)算系統(tǒng)的自主研發(fā)和產(chǎn)業(yè)應(yīng)用,逐步打造自主可控的產(chǎn)業(yè)生態(tài)。為此,本文提出以下建議。

政策方面,政府明確以高通量計(jì)算等為代表的新興技術(shù)的戰(zhàn)略定位。一方面,加強(qiáng)以芯片和系統(tǒng)為代表的核心技術(shù)專(zhuān)項(xiàng)設(shè)置和科研投入;另一方面,加大國(guó)家相關(guān)部門(mén)在高通量計(jì)算相關(guān)信息基礎(chǔ)設(shè)施工程的布局和建設(shè),針對(duì)國(guó)產(chǎn)化自主核心技術(shù)在全國(guó)挑選重點(diǎn)城市開(kāi)展試點(diǎn)和驗(yàn)證。

產(chǎn)業(yè)方面,整合高通量計(jì)算相關(guān)優(yōu)勢(shì)科研單位、高校及企業(yè),推進(jìn)相關(guān)產(chǎn)業(yè)聯(lián)盟的構(gòu)建。推動(dòng)以高通量視頻處理、人工智能等為代表的行業(yè)應(yīng)用優(yōu)先導(dǎo)入產(chǎn)業(yè)生態(tài)。此外,針對(duì)國(guó)家“一帶一路”倡議,積極探索核心技術(shù)產(chǎn)品的出口應(yīng)用,擴(kuò)大國(guó)際影響力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11251

    瀏覽量

    106505
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7667

    瀏覽量

    90844

原文標(biāo)題:中國(guó)高通量計(jì)算機(jī)的自主研發(fā)之路

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    十年磨一劍,百頻通萬(wàn)物:國(guó)產(chǎn)無(wú)線(xiàn)通信突圍之路

    2025十年破壁,百頻織網(wǎng)BRIEFINTRODUCTION成都澤耀科技有限公司·導(dǎo)語(yǔ)·當(dāng)你家智能水表自動(dòng)抄讀、工廠(chǎng)設(shè)備跨越百米鋼墻傳輸數(shù)據(jù)、牧場(chǎng)牛羊位置實(shí)時(shí)回傳時(shí)——背后可能藏著枚硬幣大小的通信
    的頭像 發(fā)表于 06-09 15:21 ?490次閱讀
    <b class='flag-5'>十年磨一劍</b>,百頻通萬(wàn)物:國(guó)產(chǎn)無(wú)線(xiàn)通信突圍<b class='flag-5'>之路</b>

    十年磨一劍,我的新書(shū)上市了!

    大家好,我是皮哥Peter,十年磨一劍,我的新書(shū)《打通Linux操作系統(tǒng)和芯片開(kāi)發(fā)》上市了!今天,新書(shū)開(kāi)啟了5折優(yōu)惠,滿(mǎn)滿(mǎn)的干貨,高顏值,雙色印刷,手感厚實(shí),新書(shū)原價(jià)139元,限時(shí)半價(jià),只要69.5
    的頭像 發(fā)表于 04-01 07:33 ?373次閱讀
    <b class='flag-5'>十年磨一劍</b>,我的新書(shū)上市了!

    Raspberry Pi 是單板計(jì)算機(jī)之王?

    如果你需要臺(tái)小型且經(jīng)濟(jì)實(shí)惠的電腦來(lái)完成個(gè)人項(xiàng)目,那么現(xiàn)在正是最佳時(shí)機(jī)。單板計(jì)算機(jī)市場(chǎng)價(jià)值30億美元,預(yù)計(jì)未來(lái)十年將持續(xù)增長(zhǎng)。這意味著有很多選擇,但除非你有非常具體的需求,否則在考慮其他選項(xiàng)之前,有
    的頭像 發(fā)表于 03-25 09:27 ?314次閱讀
    Raspberry Pi 是單板<b class='flag-5'>計(jì)算機(jī)</b>之王?

    行業(yè)聚焦|深圳計(jì)算機(jī)協(xié)會(huì)走進(jìn)杰和,共探AI算力新邊界

    2025深圳市計(jì)算機(jī)行業(yè)的發(fā)展趨勢(shì)與戰(zhàn)略方向。作為東道主,杰和科技帶領(lǐng)與會(huì)嘉賓參觀數(shù)字化展廳,重點(diǎn)呈現(xiàn)企業(yè)歷程、AI算力產(chǎn)品以及系列自主研發(fā)
    的頭像 發(fā)表于 03-05 10:04 ?435次閱讀
    行業(yè)<b class='flag-5'>聚焦</b>|深圳<b class='flag-5'>計(jì)算機(jī)</b>協(xié)會(huì)走進(jìn)杰和,共探AI算力新邊界

    長(zhǎng)期主義創(chuàng)新破局,漢威科技柔性觸覺(jué)傳感器點(diǎn)燃人形機(jī)器人賽道

    。我國(guó)在CJ-1000A渦扇發(fā)動(dòng)機(jī)等領(lǐng)域的突破,都是“十年磨一劍”,實(shí)現(xiàn)從追趕到領(lǐng)跑的真實(shí)寫(xiě)照。創(chuàng)新研發(fā)與長(zhǎng)期主義的故事不止于此,在這兩大火的具身智能領(lǐng)域,柔性
    的頭像 發(fā)表于 02-28 09:42 ?550次閱讀
    長(zhǎng)期主義創(chuàng)新破局,漢威科技柔性觸覺(jué)傳感器點(diǎn)燃人形機(jī)器人賽道

    調(diào)理電路的噪聲余量計(jì)算如何計(jì)算

    調(diào)理電路的噪聲余量計(jì)算 請(qǐng)問(wèn)各位,在數(shù)據(jù)采集系統(tǒng)中,2Msps要達(dá)到12bit分辨率,選用14bit的ADC。前端調(diào)理電路的噪聲理論余量如何計(jì)算。根據(jù)什么條件確定前端調(diào)理放大器的噪聲指標(biāo)。。。比如調(diào)理電路的總噪聲不能夠超過(guò)多少?該如何
    發(fā)表于 01-21 07:55

    智芯公司2024度大事記回顧

    2024 ,智芯公司秉持 “十年磨一劍” 的精神,深耕科技創(chuàng)新體系的構(gòu)建與人才的悉心培育,著力打造原創(chuàng)技術(shù)的孵化搖籃,持續(xù)優(yōu)化科研管理模式,向高質(zhì)量全面發(fā)展之路邁進(jìn)。此刻,讓我們
    的頭像 發(fā)表于 01-09 10:53 ?1078次閱讀

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在起,通過(guò)網(wǎng)絡(luò)向
    的頭像 發(fā)表于 12-17 10:19 ?556次閱讀

    美國(guó)自動(dòng)駕駛:十年磨一劍,搶占智能未來(lái)先機(jī)

    在最近于加利福尼亞州舉行的特斯拉發(fā)布會(huì)上,馬斯克揭曉了項(xiàng)宏偉藍(lán)圖:預(yù)計(jì)在2025,美國(guó)兩個(gè)州將率先實(shí)現(xiàn)無(wú)人監(jiān)督的完全自動(dòng)駕駛,標(biāo)志著汽車(chē)行業(yè)智能化轉(zhuǎn)型的新里程碑。此次發(fā)布會(huì)亮點(diǎn)紛呈,特斯拉不僅
    的頭像 發(fā)表于 10-30 11:16 ?1206次閱讀

    本源產(chǎn)品集納之 :量子計(jì)算機(jī)整機(jī)系列

    本源量子研制的中國(guó)代、第二代、第三代自主超導(dǎo)量子計(jì)算機(jī)均已交付中國(guó)用戶(hù)使用,使中國(guó)成為世界上
    的頭像 發(fā)表于 10-25 16:08 ?1731次閱讀
    本源產(chǎn)品集納之<b class='flag-5'>一</b> :量子<b class='flag-5'>計(jì)算機(jī)</b>整機(jī)系列

    云端超級(jí)計(jì)算機(jī)怎么用

    云端超級(jí)計(jì)算機(jī)種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在起,通過(guò)網(wǎng)絡(luò)向
    的頭像 發(fā)表于 10-18 10:14 ?486次閱讀

    沒(méi)有退路就是勝利之路,Wi-Fi7 FEM最高報(bào)價(jià)0.2美金

    轉(zhuǎn)載自——鐘林談芯 沒(méi)有退路就是勝利之路,三伍微為Wi-Fi FEM而生,也為Wi-Fi FEM而戰(zhàn)。 從銳迪科(RDA)到三伍微,Wi-Fi FEM這條路,我們團(tuán)隊(duì)走過(guò)了第九個(gè)年頭,十年磨一劍
    的頭像 發(fā)表于 09-25 17:03 ?839次閱讀

    十年預(yù)言:Chiplet的使命

    未來(lái)十年內(nèi)芯片算力提升的核心動(dòng)力。 議題: 算力困局如何突圍? 韓銀和研究員: 現(xiàn)有的高性能計(jì)算架構(gòu)正遭遇算力瓶頸。目前全球頂級(jí)的高性能計(jì)算系統(tǒng),由美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室基于HPE C
    的頭像 發(fā)表于 08-27 11:09 ?815次閱讀
    <b class='flag-5'>十年</b>預(yù)言:Chiplet的使命

    《圖說(shuō)本源產(chǎn)品》系列之五:“本源悟空”量子計(jì)算機(jī)整機(jī)

    科技自立自強(qiáng)不能停留在論文中、匯報(bào)中和總結(jié)中,而是要一個(gè)一個(gè)產(chǎn)品制造出來(lái)。本源,擁有中國(guó)條超導(dǎo)量子計(jì)算機(jī)制造鏈?!秷D說(shuō)本源產(chǎn)品》以圖片形式,系列展示
    的頭像 發(fā)表于 08-13 08:22 ?1735次閱讀
    《圖說(shuō)本源產(chǎn)品》系列之五:“本源悟空”量子<b class='flag-5'>計(jì)算機(jī)</b>整機(jī)

    激勵(lì)科研人員使用中國(guó)自主量子計(jì)算機(jī)!“本源悟空”啟動(dòng)卓越論文獎(jiǎng)勵(lì)計(jì)劃

    中國(guó)第三代自主超導(dǎo)量子計(jì)算機(jī)“本源悟空”投入運(yùn)行以來(lái)已為超過(guò)125個(gè)國(guó)家的全球用戶(hù)完成了約25萬(wàn)次運(yùn)算任務(wù)全球訪(fǎng)問(wèn)次數(shù)已超過(guò)1200萬(wàn)次為感謝廣大用戶(hù)的信任與支持激勵(lì)更多的科研人員使用中國(guó)
    的頭像 發(fā)表于 08-09 08:22 ?803次閱讀
    激勵(lì)科研人員使用<b class='flag-5'>中國(guó)</b><b class='flag-5'>自主</b>量子<b class='flag-5'>計(jì)算機(jī)</b>!“本源悟空”啟動(dòng)卓越論文獎(jiǎng)勵(lì)計(jì)劃