99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SLM:守護(hù)高性能計(jì)算與數(shù)據(jù)中心SoC的每一步

新思科技 ? 來源:未知 ? 2023-08-10 17:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能計(jì)算(HPC)和超大規(guī)模存儲不僅讓我們得以在超級互聯(lián)和人工智能的幫助下,動動手指就能輕松獲取各種信息;更是我們?nèi)缃駭?shù)字生活中不可或缺的一部分。從數(shù)學(xué)模型到氣象預(yù)測,超級計(jì)算機(jī)正在協(xié)助我們改善各個(gè)領(lǐng)域的計(jì)算結(jié)果,而云數(shù)據(jù)中心則是確保數(shù)字生活正常運(yùn)行的基礎(chǔ)支柱。在當(dāng)今時(shí)代,數(shù)據(jù)不僅在數(shù)量上遠(yuǎn)超以往,還面臨著需要進(jìn)行遠(yuǎn)距離高速傳輸?shù)奶魬?zhàn)。隨著芯片制程節(jié)點(diǎn)不斷微縮,逐漸逼近制造領(lǐng)域的極限,Multi-Die系統(tǒng)應(yīng)運(yùn)而生,為性能提升開辟了新的可能性。


隨著電子系統(tǒng)變得愈加復(fù)雜,靜默數(shù)據(jù)損壞(SDC)等錯(cuò)誤時(shí)有發(fā)生,芯片老化、熱挑戰(zhàn)和功耗挑戰(zhàn)等問題也同樣存在。這些問題非常棘手,如果處理不當(dāng),就會導(dǎo)致災(zāi)難性后果,尤其是在大規(guī)模處理此類問題的情況下。


除此之外,對于SoC開發(fā)者來說,由于復(fù)雜性的提高,他們迫切需要采用芯片生命周期管理(SLM)策略,以確保芯片的可靠性、可用性和可服務(wù)性(RAS)。了解最終產(chǎn)品的內(nèi)部情況并認(rèn)識長期的RAS影響,對于設(shè)計(jì)的成功至關(guān)重要。


芯片生命周期管理策略是什么?


如今,我們不僅需要在生產(chǎn)和發(fā)貨時(shí)確保芯片能夠正常運(yùn)行,還需要在整個(gè)生命周期內(nèi)對芯片工作狀態(tài)進(jìn)行監(jiān)控和測試,盡可能在問題甚至故障出現(xiàn)之前提前進(jìn)行預(yù)警甚至修復(fù)。對于SoC 和 Multi-Die產(chǎn)品,這一點(diǎn)攸關(guān)重要。為了做到這一點(diǎn),開發(fā)者需要掌控和訪問芯片內(nèi)部元件,以調(diào)試和讀取數(shù)據(jù),并進(jìn)行適當(dāng)?shù)姆治鰜泶_定是否存在問題。借助這些信息,開發(fā)者能夠及時(shí)維護(hù)系統(tǒng),避免問題變得無法挽回。


SLM平臺所提供的解決方案及策略可以幫助開發(fā)者采取針對性措施,在芯片的整個(gè)生命周期內(nèi)確保RAS:


  1. 設(shè)計(jì)階段/ In-Design識別芯片中適合用于監(jiān)控的設(shè)計(jì)組件。將監(jiān)控IP直接嵌入設(shè)計(jì)的基礎(chǔ)架構(gòu)中。

  2. 產(chǎn)品試產(chǎn)及良率優(yōu)化階段/ In-Ramp:優(yōu)先處理影響良率的主要限制因素,進(jìn)行準(zhǔn)確的故障分析,并調(diào)整設(shè)計(jì)和/或晶圓工藝,從而滿足高良率要求。

  3. 量產(chǎn)階段/ In-Production:通過自動化洞察功能識別良率和質(zhì)量異常,在大批量生產(chǎn)的各個(gè)階段進(jìn)行根本原因分析,并在必要時(shí)對半導(dǎo)體供應(yīng)鏈進(jìn)行調(diào)整。

  4. 產(chǎn)品實(shí)際應(yīng)用現(xiàn)場/ In-Field:通過預(yù)測性維護(hù)評估芯片運(yùn)行狀況,并優(yōu)化各項(xiàng)性能指標(biāo),比如功耗和吞吐量(如果可能),特別是在芯片不斷老化的情況下。


示例:對策略建模,從而改善熱和電源管理


在SoC系統(tǒng)中,管理熱復(fù)雜性和優(yōu)化功耗是重中之重。而且,當(dāng)一個(gè)系統(tǒng)中包含多個(gè)晶片時(shí),管理難度會呈指數(shù)級增長,特別是在系統(tǒng)不斷老化的情況下。要想緩解熱問題和電壓問題并在HPC和數(shù)據(jù)中心中保障芯片長期可靠運(yùn)行,在設(shè)計(jì)中整合適當(dāng)?shù)谋O(jiān)控功能是必不可少的。


多年來,在芯片內(nèi)部的片上電壓和電源管理一直使用工藝、電壓和溫度(PVT)監(jiān)測器,也稱為動態(tài)電壓頻率調(diào)整(DVFS)技術(shù)。有些場景下,這些監(jiān)視器用于監(jiān)測溫度,當(dāng)溫度可能造成災(zāi)難性結(jié)果時(shí),就會關(guān)閉系統(tǒng)。事實(shí)上,幾乎所有16納米及以下制程的芯片設(shè)計(jì)和所有的數(shù)據(jù)中心芯片,都使用PVT監(jiān)測器。


在晶圓分選測試期間,開發(fā)者將從這些監(jiān)測器獲得測試數(shù)據(jù)結(jié)果,并立即將這些數(shù)據(jù)投入使用。在這個(gè)時(shí)候,開發(fā)者將了解晶片的熱特性,并可以應(yīng)用更多測試序列來監(jiān)測晶片各處的電壓值。此外,開發(fā)者可以根據(jù)測試、PVT和PMMIP數(shù)據(jù)來執(zhí)行分析,然后返回設(shè)計(jì)環(huán)境,了解測試中得出的芯片實(shí)際裕量,并將其與模型相關(guān)聯(lián)。隨著模型的改進(jìn),開發(fā)者可以降低裕量,以提高性能或降低功耗,而又不會犧牲RAS。


為了更好地預(yù)測故障的出現(xiàn),開發(fā)者可以設(shè)置閾值。對于溫度監(jiān)測器,閾值代表開發(fā)者將在什么情況下開始介入來降低溫度。究其緣由,大部分熱響應(yīng)的速度都相對緩慢。設(shè)定的閾值越嚴(yán)格,就可以越早地采取措施。類似地,也可以使用電壓監(jiān)測器,只是監(jiān)測對象有所不同。


早期研發(fā)階段,通常只會生產(chǎn)很少量的芯片,只有確保芯片能夠正常運(yùn)行并確認(rèn)可以達(dá)到目標(biāo)良率后,才會進(jìn)行大規(guī)模生產(chǎn)。開發(fā)者會從晶圓廠的早期測試和診斷結(jié)果中收集數(shù)據(jù),另外還會在整個(gè)產(chǎn)品制造過程中收集數(shù)據(jù)。在這個(gè)期間,開發(fā)者可能會發(fā)現(xiàn)系統(tǒng)性問題并予以解決。當(dāng)芯片在現(xiàn)場部署之后,則需要使用最新的策略,了解芯片在使用過程中的運(yùn)行情況以及隨著芯片老化會發(fā)生哪些變化。為此,一些新功能應(yīng)運(yùn)而生,包括使用英特爾Sapphire Rapids進(jìn)行現(xiàn)場掃描。開發(fā)者還可以將SLM軟件代理嵌入到芯片系統(tǒng)本地,從而持續(xù)地進(jìn)行邊緣分析并緩解問題。在現(xiàn)場芯片管理領(lǐng)域中,各類創(chuàng)新層出不窮,各種新的功能也會在近期內(nèi)不斷推出。


如何綜合考慮各種數(shù)據(jù) — 全面的SLM策略


HPC和數(shù)據(jù)中心工作負(fù)載要求在整個(gè)芯片生命周期內(nèi)對芯片進(jìn)行測試、監(jiān)測和維修。因此,我們需要了解芯片內(nèi)部發(fā)生的情況。與此同時(shí),由于需要處理大量數(shù)據(jù),例如設(shè)計(jì)數(shù)據(jù)、晶圓廠數(shù)據(jù)、診斷數(shù)據(jù)、產(chǎn)品制造測試數(shù)據(jù)(包括重要的監(jiān)測數(shù)據(jù))等等,開發(fā)者迫切需要全面系統(tǒng)的方法來分析數(shù)據(jù)并生成可行見解,同時(shí)確保提升工作效率。


新思科技提供全面完整的SLM解決方案,這是一個(gè)包含多種工具的集成平臺,能夠?yàn)閺脑O(shè)計(jì)到生產(chǎn)的整個(gè)SoC生命周期提供支持。另外,還有功能強(qiáng)大的現(xiàn)場解決方案即將推出!我們可以幫助開發(fā)者做好各項(xiàng)準(zhǔn)備,確保產(chǎn)品在當(dāng)前及整個(gè)生命周期內(nèi)都能正常運(yùn)行。新思科技的SLM產(chǎn)品系列包括PVT監(jiān)測器、路徑裕度監(jiān)測器(PMM)和實(shí)時(shí)高速訪問和測試(HSAT)IP。它們?yōu)殚_發(fā)者提供了所需的片上傳感器,讓開發(fā)者能夠監(jiān)測數(shù)據(jù)、運(yùn)行制造和進(jìn)行現(xiàn)場測試。借助新思科技的HSAT IP,芯片可以使用USB和PCI Express(PCIe)接口等功能I/O,因此開發(fā)者無需使用大量的測試和接口引腳,就可以在芯片部署使用時(shí)繼續(xù)執(zhí)行掃描和診斷。


除了IP監(jiān)測器,新思科技SLM還將關(guān)于各類芯片健康數(shù)據(jù)的分析和預(yù)警集中在同一位置。這一完整解決方案能夠在設(shè)計(jì)階段為開發(fā)者提供支持,幫助開發(fā)者識別需要監(jiān)測的候選路徑。在實(shí)施監(jiān)控IP之后,開發(fā)者可以使用新思科技的TestMax產(chǎn)品系列等測試基礎(chǔ)設(shè)施產(chǎn)品來將芯片連接到測試基礎(chǔ)設(shè)施,生成監(jiān)測器掃描序列,然后輸入和輸出數(shù)據(jù),以便進(jìn)一步診斷潛在的問題。借助新思科技SLM,開發(fā)者可以深入了解自己的SoC,即使在大規(guī)模生產(chǎn)中,也可以保持芯片的RAS。



我們將在9月14日召開的線上研討會中揭示如何在IC設(shè)計(jì)中嵌入分布式PVT IP,通過實(shí)時(shí)收集參數(shù)和PVT controller分析,優(yōu)化性能,提高可靠性。了解更多關(guān)于SLM PVT IP信息,請掃碼報(bào)名線上研討會:
















原文標(biāo)題:SLM:守護(hù)高性能計(jì)算與數(shù)據(jù)中心SoC的每一步

文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    870

    瀏覽量

    51561

原文標(biāo)題:SLM:守護(hù)高性能計(jì)算與數(shù)據(jù)中心SoC的每一步

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    核心網(wǎng)絡(luò)、存儲、通信與計(jì)算節(jié)點(diǎn)。 通過精準(zhǔn)選型與合理布線,這些高性能差分晶體振蕩器可有效提升數(shù)據(jù)中心設(shè)備間的時(shí)鐘致性與傳輸效率,是構(gòu)建穩(wěn)定、可靠、高吞吐量
    發(fā)表于 07-01 16:33

    小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解

    相位抖動等技術(shù)指標(biāo),還需要根據(jù)實(shí)際應(yīng)用的功耗、溫度穩(wěn)定性和其他環(huán)境因素來做出最合適的選擇。 通過合理布置PCB線路和優(yōu)化時(shí)鐘信號的傳輸路徑,可以進(jìn)一步提升時(shí)鐘同步的精度和可靠性,確保數(shù)據(jù)中心的高效穩(wěn)定
    發(fā)表于 06-11 13:37

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    數(shù)據(jù)中心依賴數(shù)千甚至上萬個(gè)GPU集群進(jìn)行高性能計(jì)算,對帶寬、延遲和數(shù)據(jù)交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環(huán)境提供推理服務(wù)。這類
    發(fā)表于 03-25 17:35

    優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案

    的三大主流布線解決方案——高速線纜(DAC)、有源光纜(AOC)和光纖跳線,并分析它們?nèi)绾翁?b class='flag-5'>高性能并支持現(xiàn)代數(shù)據(jù)中心不斷增長的需求。 800G數(shù)據(jù)中心高速線纜和有源光纜解決方案 高速線纜(DAC
    發(fā)表于 03-24 14:20

    國產(chǎn)高性能物理層以太網(wǎng)PHY收發(fā)器適用于數(shù)據(jù)中心、智能計(jì)算等應(yīng)用市場

    國產(chǎn)高性能物理層以太網(wǎng)PHY收發(fā)器適用于數(shù)據(jù)中心、智能計(jì)算等應(yīng)用市場
    的頭像 發(fā)表于 12-26 09:58 ?816次閱讀
    國產(chǎn)<b class='flag-5'>高性能</b>物理層以太網(wǎng)PHY收發(fā)器適用于<b class='flag-5'>數(shù)據(jù)中心</b>、智能<b class='flag-5'>計(jì)算</b>等應(yīng)用市場

    谷歌在芬蘭購地?cái)U(kuò)建云計(jì)算數(shù)據(jù)中心

    谷歌公司近日發(fā)布聲明,宣布在芬蘭卡亞尼和穆霍斯兩地購買土地,作為其擴(kuò)建云計(jì)算數(shù)據(jù)中心基礎(chǔ)設(shè)施計(jì)劃的重要一步。此次購地行動標(biāo)志著谷歌在芬蘭的投資進(jìn)一步加深。 據(jù)芬蘭農(nóng)業(yè)和林業(yè)部透露,谷
    的頭像 發(fā)表于 12-04 11:38 ?596次閱讀

    諾基亞擴(kuò)展與微軟Azure的數(shù)據(jù)中心網(wǎng)絡(luò)供應(yīng)協(xié)議

    的進(jìn)一步鞏固。 作為協(xié)議擴(kuò)展的重要組成部分,諾基亞將向微軟Azure提供其最新的7250 IXR-10e平臺。該平臺以其卓越的性能、靈活性和可擴(kuò)展性,在數(shù)據(jù)中心網(wǎng)絡(luò)中發(fā)揮著關(guān)鍵作用。通過提供這
    的頭像 發(fā)表于 11-22 13:53 ?562次閱讀

    計(jì)算數(shù)據(jù)中心的關(guān)系

    計(jì)算數(shù)據(jù)中心之間存在著密切且復(fù)雜的關(guān)系,它們相互依存、互相促進(jìn)。 、數(shù)據(jù)中心是云計(jì)算的基礎(chǔ)設(shè)施 數(shù)
    的頭像 發(fā)表于 10-24 16:15 ?1515次閱讀

    當(dāng)今數(shù)據(jù)中心新技術(shù)趨勢

    當(dāng)今數(shù)據(jù)中心的新技術(shù)趨勢正以前所未有的速度推動著行業(yè)的變革與創(chuàng)新。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,數(shù)據(jù)中心作為信息技術(shù)的核心基礎(chǔ)設(shè)施,正面臨著前所未有的機(jī)遇與挑戰(zhàn)。
    的頭像 發(fā)表于 10-24 15:15 ?1002次閱讀

    數(shù)據(jù)中心對MOS管性能的要求

    數(shù)據(jù)中心作為現(xiàn)代信息技術(shù)的核心基礎(chǔ)設(shè)施,承載著數(shù)據(jù)存儲、處理和傳輸?shù)闹匾蝿?wù)。在這些任務(wù)中,MOS管(金屬氧化物半導(dǎo)體場效應(yīng)晶體管)作為關(guān)鍵的電子元件,其性能對數(shù)據(jù)中心的整體效率和穩(wěn)定性起著至關(guān)重要的作用。本文將詳細(xì)探討
    的頭像 發(fā)表于 10-11 11:22 ?717次閱讀

    數(shù)據(jù)中心產(chǎn)品通常包括哪些

    應(yīng)用在數(shù)據(jù)中心的分立器件產(chǎn)品而言,這是巨大的市場機(jī)遇。在信息時(shí)代下,數(shù)據(jù)中心價(jià)值會越來越高,可靠性能也需要進(jìn)一步加強(qiáng)。好的分立器件才能更好支持數(shù)據(jù)中
    的頭像 發(fā)表于 10-11 11:12 ?1536次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>產(chǎn)品通常包括哪些

    SK海力士推出高性能數(shù)據(jù)中心SSD PEB110

    SK海力士近日宣布成功開發(fā)出專為數(shù)據(jù)中心設(shè)計(jì)的高性能固態(tài)硬盤(SSD)新品——PEB110 E1.S(簡稱PEB110),標(biāo)志著公司在數(shù)據(jù)存儲解決方案領(lǐng)域邁出了重要一步。這款SSD旨在
    的頭像 發(fā)表于 09-12 17:01 ?920次閱讀

    淺析如何降低數(shù)據(jù)中心電力能耗

    ,如何減少數(shù)據(jù)中心的電力消耗成為了焦點(diǎn)問題。 ? 1 IT設(shè)備能耗的降低 數(shù)據(jù)中心的能耗主要源自IT設(shè)備。這些設(shè)備的直接能耗不僅增加了電費(fèi)成本,而且還需要配備相應(yīng)的電源和冷卻系統(tǒng),這些系統(tǒng)同樣消耗大量電力,從而進(jìn)一步增加
    的頭像 發(fā)表于 09-02 12:31 ?615次閱讀
    淺析如何降低<b class='flag-5'>數(shù)據(jù)中心</b>電力能耗

    數(shù)據(jù)中心提高存儲性能的方法是什么?

    這些技術(shù)是走向云計(jì)算的重要的第一步。 重復(fù)數(shù)據(jù)刪除 在任何數(shù)據(jù)存儲系統(tǒng)最大的阻礙是相關(guān)的冗余數(shù)據(jù)。采用智能壓縮技術(shù),可以刪除重復(fù)
    的頭像 發(fā)表于 08-05 11:40 ?655次閱讀

    IaaS+on+DPU(IoD)+下高性能算力底座技術(shù)白皮書

    數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲、安全等處理性能,助力服務(wù)器運(yùn)行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時(shí),圍繞 DPU 構(gòu)建
    發(fā)表于 07-24 15:32