半導(dǎo)體工藝技術(shù)創(chuàng)新長期以來的持續(xù)發(fā)展趨勢正在減緩。經(jīng)過幾十年對摩爾定律的顯著遵從性,即半導(dǎo)體晶圓上的晶體管密度大約每兩年翻一倍,但是在過去幾年中,晶體管的擴展速度明顯放緩,與摩爾定律預(yù)測相比慢了大約十倍。登納德縮放定律(Dennard Scaling)預(yù)測隨著晶體管密度的增加,每單位芯片面積的功耗保持不變,但實際上也失效了,導(dǎo)致大型數(shù)據(jù)中心和其它高性能計算環(huán)境需要更復(fù)雜的冷卻解決方案。
01.對半導(dǎo)體工藝創(chuàng)新放緩的架構(gòu)應(yīng)對
面對半導(dǎo)體工藝創(chuàng)新的減速,著名計算機架構(gòu)師John Hennessy和David Patterson在2018年的圖靈演講中提出,工藝技術(shù)創(chuàng)新的減緩將逐漸增加對架構(gòu)創(chuàng)新的動力——即設(shè)計集成電路以執(zhí)行計算任務(wù)的方式。他們認(rèn)為通用計算架構(gòu)(例如CPU)的固有低效性將開始向(或被)為特定計算任務(wù)優(yōu)化的架構(gòu)所取代或補充,這種架構(gòu)也被稱為專用域架構(gòu)(Domain-Specific Architectures,DSA)。
與此同時,隨著計算和數(shù)字化技術(shù)廣泛應(yīng)用于云計算(AI和高性能計算)、網(wǎng)絡(luò)、邊緣計算、物聯(lián)網(wǎng)和自動駕駛等各個應(yīng)用領(lǐng)域,高度專用域計算工作負(fù)載正在擴展,這為DSA提供了提供有意義的性能優(yōu)勢的機會。大型語言模型(Large Language Model,LLM)作為生成式AI的核心引擎,通過ChatGPT等應(yīng)用在AI工作負(fù)載中提供進一步的專業(yè)化,并可能導(dǎo)致進一步的硬件專業(yè)化。
針對專用域架構(gòu)(DSA),即為特定應(yīng)用領(lǐng)域開發(fā)的硬件和軟件,商業(yè)潛力是巨大的。例如,GPU和張量處理單元(Tensor Processing Units,TPU)已經(jīng)在數(shù)據(jù)中心獲得了顯著的市場份額,在AI工作負(fù)載(學(xué)習(xí)和推理)等受益于高并行度的工作負(fù)載中,他們的性能超過了CPU。性能提升可能非常顯著,工作負(fù)載特定的加速通常為15到50倍。在汽車領(lǐng)域,一些領(lǐng)先供應(yīng)商提供定制解決方案,提供所需的低延遲、高性能推理,以安全地支持日益增長的自動駕駛水平。
隨著DSA擴展到其它應(yīng)用領(lǐng)域,我們預(yù)計到2026年,DSA的收入將達到約900億美元(全球半導(dǎo)體市場的約10%到15%),而2022年的收入約為400億美元。因此,我們看到了對專用域設(shè)計初創(chuàng)公司的風(fēng)險投資流入顯著增加。在過去十年中,已累計有約150家初創(chuàng)企業(yè)獲得了180億美元的資金支持,而在之前的十年里,硬件投資被忽視,更多地偏向于軟件。
半導(dǎo)體產(chǎn)業(yè)鏈中的企業(yè)、計算系統(tǒng)制造商以及計算解決方案的最終用戶應(yīng)該做好準(zhǔn)備,充分利用這一趨勢,而不是措手不及。02.支持DSA商業(yè)可行性的關(guān)鍵因素正逐漸成熟以往,除了受益于摩爾定律的巨大助力外,CPU還受益于大規(guī)模經(jīng)濟效益,以抵消競爭專用域芯片(Domain-Specific Chip)的理論優(yōu)勢。專用域芯片由于其特異性而面臨較小的需求量,并可能需要專門的軟件才能高效部署。芯片越昂貴(由芯片尺寸、復(fù)雜性和工藝技術(shù)節(jié)點決定),應(yīng)用領(lǐng)域就需要更大規(guī)模的需求來證明采用專用域架構(gòu)的必要性。推動專用域架構(gòu)的顛覆潛力的是以下五個重要因素,他們正在共同努力縮小通用目的和專用域設(shè)計之間的經(jīng)濟差距:
1.通過晶圓代工廠獲得成熟和領(lǐng)先的半導(dǎo)體技術(shù)制造能力
晶圓代工廠——專注于半導(dǎo)體制造服務(wù)的公司——已經(jīng)在全球半導(dǎo)體制造中占據(jù)越來越大的份額,因為他們可以匯聚需求并實現(xiàn)規(guī)模效益,以抵消生產(chǎn)現(xiàn)代半導(dǎo)體的不斷上升的成本。(領(lǐng)先半導(dǎo)體制造廠或稱“晶圓廠”的成本超過100億美元。)晶圓代工廠不僅在不同技術(shù)節(jié)點上穩(wěn)步獲得制造市場份額,而且他們還提供了采用最先進技術(shù)節(jié)點的機會,這是過去一直由集成器件制造商掌握的優(yōu)勢。因此,任何一家擁有針對專用域設(shè)計的優(yōu)越想法的初創(chuàng)企業(yè)都可以迅速獲得最先進的制造能力,無需投資一分錢在制造能力上。
2.通過成熟的云平臺快速進入市場
專門針對企業(yè)、AI或HPC工作負(fù)載的卓越DSA供應(yīng)商不一定需要開發(fā)自己的進入市場的基礎(chǔ)設(shè)施。他們可以依賴成熟的云服務(wù)提供商(CSP)生態(tài)系統(tǒng),這些CSP提供計算作為一種服務(wù)。如果他們能向CSP和其客戶群體證明他們的DSA在特定工作負(fù)載下提供了卓越的計算性能(按照性價比和每瓦計算性能),那么他們的硬件解決方案可以被集成到CSP數(shù)據(jù)中心基礎(chǔ)設(shè)施中,并作為硬件服務(wù)提供給計算周期的最終用戶。
3.豐富的開源和許可知識產(chǎn)權(quán)(IP)庫用于加速DSA設(shè)計
盡管專用域架構(gòu)(DSA)按定義是為專用域工作負(fù)載而設(shè)計的,但這并不意味著DSA設(shè)計者在設(shè)計電路時必須從零開始??稍S可的指令集架構(gòu)(Instruction Set Architectures,ISA),如Arm和x86,以及開源ISA(例如RISC-V),使芯片設(shè)計變得民主化,并提供了豐富的構(gòu)建模塊和即用型設(shè)計組件。他們還允許訪問相應(yīng)的編譯器和應(yīng)用級軟件解決方案生態(tài)系統(tǒng)。選擇這些不同生態(tài)系統(tǒng)作為基礎(chǔ)將在軟件堆棧成熟度、成本和專用域硬件性能之間進行權(quán)衡。
4.支持DSA芯片片上異構(gòu)集成的2D和3D芯片封裝的進展
越來越多的領(lǐng)先計算設(shè)備不再由單一芯片組成。隨著高性能芯片變得越來越大,工藝技術(shù)變得更昂貴且更難以實現(xiàn)高工藝產(chǎn)量,領(lǐng)先廠商采取了一種分散策略,構(gòu)建芯片片而不是單個大型單片。這些芯片片可能在自己的工藝技術(shù)上進行優(yōu)化,并用于自己的功能,然后在先進的封裝中進行集成。過去芯片封裝只包含一個芯片,而先進封裝允許在單個封裝中以2D甚至3D的形式對數(shù)十個芯片進行異構(gòu)集成。這種技術(shù)趨勢對專注于DSA芯片片的企業(yè)非常有利,因為這些芯片片現(xiàn)在可以集成到先進封裝中,從而實現(xiàn)與其它計算、通信、存儲和模擬組件之間的高帶寬和低延遲連接。
5.物理層創(chuàng)新推動新型DSA的發(fā)展
對于物理計算層面而言,CMOS之外的選擇,例如光子學(xué)、神經(jīng)形態(tài)和量子架構(gòu),有望為專用域計算需求提供特定優(yōu)勢,如能源效率、可塑性、特定任務(wù)速度和特定NP難問題的線性縮放。隨著這些物理層解決方案的成熟,將會開辟新的DSA類別。
03.為了充分發(fā)揮DSA的價值
需要在技術(shù)堆棧的各個方面進行進一步的創(chuàng)新
從技術(shù)堆棧的各個層面,從物理層到應(yīng)用級工作負(fù)載管理,需要進一步的創(chuàng)新來推動DSA的可行性和商業(yè)成功。
在物理和電路層面,開源生態(tài)系統(tǒng)(例如Arm和RISC-V)需要進一步發(fā)展,以在這些構(gòu)建模塊上支持完整的DSA軟件堆棧。沒有高效的軟件堆棧,許多硬件級性能優(yōu)勢將無法轉(zhuǎn)化為實際的工作負(fù)載加速。
在系統(tǒng)級封裝(System-in-Package,SiP)層面,需要標(biāo)準(zhǔn)化芯片片間接口,以實現(xiàn)DSA的經(jīng)濟和普遍集成。行業(yè)聯(lián)盟(如Universal Chiplet Interconnect Express,UCIe)已經(jīng)開始形成,以定義這些標(biāo)準(zhǔn)。此外,在美國,CHIPS法案和DARPA(國防高級研究計劃局)認(rèn)識到實現(xiàn)先進封裝的協(xié)同開發(fā)平臺是一個重要的投資領(lǐng)域,并通過激勵措施來促進其發(fā)展。
在操作系統(tǒng)和編譯器層面,更高級的編譯器需要有效地考慮單個封裝中可能存在多個指令集架構(gòu)(ISA)的潛在共存。
在數(shù)據(jù)中心層面,需要先進的虛擬化程序和編排器來優(yōu)化地協(xié)調(diào)不同DSA計算實例中的工作負(fù)載容器,并在整個數(shù)據(jù)中心內(nèi)平衡利用率,以向最終客戶的應(yīng)用程序提供DSA級別的優(yōu)勢。此外,云服務(wù)提供商將開發(fā)工具來支持他們的最終客戶了解硬件實例的最佳配置,以滿足其特定的計算需求,避免計算資源的低效部署。
04.半導(dǎo)體價值鏈上的企業(yè)和最終用戶
應(yīng)該為DSA驅(qū)動的顛覆做好準(zhǔn)備
DSA可能會在整個半導(dǎo)體價值鏈上激活顛覆。以下是為其做好準(zhǔn)備的方法:
半導(dǎo)體企業(yè):為價值鏈顛覆做好準(zhǔn)備
材料供應(yīng)商應(yīng)該了解先進封裝技術(shù)的影響(例如,對2D和3D集成的基礎(chǔ)構(gòu)成形成的新型基板材料的需求,以及對當(dāng)前基板材料的熱機械穩(wěn)定性的需求),以及新的物理層范式對前端和后端材料流的影響。
前端工具制造商將希望參與支持DSA集成的先進封裝和異構(gòu)集成熱潮,這將需要與前端制造類似的精確定義和對齊。
晶圓代工廠將需要準(zhǔn)備迎接對較小批量和更多專用域芯片和Chiplet的需求,并找到有效和經(jīng)濟地支持較小玩家的方式。此外,對非先進封裝和新物理層解決方案(如光子學(xué))的支持將變得越來越重要,因為功能將被拆分為任務(wù)優(yōu)化的Chiplet。
芯片設(shè)計公司需要擁有能夠全面考慮專用域工作負(fù)載性能的人才,從門級布局和硬件架構(gòu)設(shè)計選擇到軟件堆棧和工作負(fù)載管理,以充分利用DSA的架構(gòu)優(yōu)化。
電子設(shè)計自動化(EDA)和硬件IP公司需要應(yīng)對兩個挑戰(zhàn)。首先是如何調(diào)整他們的商業(yè)模式,以支持可能沒有足夠財力購買昂貴前期許可證的較小DSA顛覆者。其次是如何將他們的IP、設(shè)計和仿真套件從芯片級擴展到SiP級,以支持在多個Chiplet和ISA之間進行系統(tǒng)級、多物理學(xué)(邏輯、電氣、熱學(xué)、光學(xué)和機械學(xué))EDA,同時實現(xiàn)以前僅在芯片級別見到的帶寬和延遲。
計算消費者:使用優(yōu)化的DSA,并投資于專業(yè)知識,充分發(fā)揮其優(yōu)勢
云服務(wù)提供商(CSP)已經(jīng)認(rèn)識到工作負(fù)載特定的芯片架構(gòu)的價值,這一點可以通過他們越來越多地采用GPU以及推出面向數(shù)據(jù)中心硬件實例的自主芯片設(shè)計得到證明。隨著設(shè)計初創(chuàng)企業(yè)繼續(xù)針對AI和高性能計算等應(yīng)用案例的工作負(fù)載特異性,CSP將希望密切關(guān)注新興的成功者,以便可能支持并推動他們擴展規(guī)模。
企業(yè)客戶需要了解DSA在其特定工作負(fù)載中的優(yōu)勢。將計算基礎(chǔ)設(shè)施移入公有云的好處將會不斷增加,因為CSP可以大規(guī)模提供DSA的訪問,通過聚合對專門硬件實例的需求并高效管理工作負(fù)載的部署。然而,企業(yè)應(yīng)該掌握或保留如何最好地利用這些硬件實例的專業(yè)知識,要深入了解如何優(yōu)化特定的工作負(fù)載和云硬件實例配置,以提供最大的總擁有成本優(yōu)勢。
專用域的原始設(shè)備制造商(如物聯(lián)網(wǎng)和邊緣設(shè)備制造商、網(wǎng)絡(luò)設(shè)備供應(yīng)商、汽車制造商和區(qū)塊鏈平臺)將希望深入了解其專用域的計算需求和工作負(fù)載的發(fā)展,而不是依賴于通用計算進展。他們還希望熟悉存在的架構(gòu)選項,以滿足芯片設(shè)計方面的能源、成本、占地面積和性能需求。這可能需要他們超越傳統(tǒng)的供應(yīng)鏈結(jié)構(gòu):例如,汽車原始設(shè)備制造商可能需要直接尋找和與DSA初創(chuàng)企業(yè)合作,而不是依賴于一、二級供應(yīng)商來獲取所有最新的洞察。
摩爾定律推動了計算行業(yè)的持久發(fā)展,在通用計算方面帶來了數(shù)十年的性能提升,大大減少了對工作負(fù)載特異性投資的需求。隨著晶體管密度增長放緩,DSA將越來越多地獲得專用域的性能優(yōu)勢,并對價值鏈參與者及其客戶帶來重大顛覆。
責(zé)任編輯:彭菁
-
芯片
+關(guān)注
關(guān)注
460文章
52529瀏覽量
441367 -
半導(dǎo)體
+關(guān)注
關(guān)注
335文章
28937瀏覽量
238460 -
晶圓
+關(guān)注
關(guān)注
53文章
5166瀏覽量
129851 -
DSA
+關(guān)注
關(guān)注
0文章
52瀏覽量
15558 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
855瀏覽量
39726
原文標(biāo)題:專用域架構(gòu)(DSA)與計算的未來
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
汽車架構(gòu)變化趨勢有哪些

ARM架構(gòu)的系統(tǒng)與X86架構(gòu)系統(tǒng)的特性有什么不同?
STM32的SPI特性及架構(gòu)資料分享
域內(nèi)路由協(xié)議,域內(nèi)路由協(xié)議的內(nèi)容有哪些?
域間路由協(xié)議,域間路由協(xié)議的內(nèi)容有哪些?
USB數(shù)據(jù)最小的單位域有哪些類型
主流車企電子電氣架構(gòu)進化對比分析
面向集中域控的汽車電子電氣架構(gòu)技術(shù)研究

域集中式架構(gòu)的優(yōu)勢有哪些
基于域或區(qū)域的ECU架構(gòu)過渡優(yōu)勢
域架構(gòu)下的功能安全思考

基于跨域計算新一代EE架構(gòu)的SDV車輛特性開發(fā)

評論