99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)預(yù)測計算機(jī)芯片執(zhí)行來自各種應(yīng)用程序的代碼的運(yùn)行速度

倩倩 ? 來源:量子認(rèn)知 ? 2020-01-16 08:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,麻省理工學(xué)院的研究人員發(fā)明了一種機(jī)器學(xué)習(xí)工具,該工具可以預(yù)測計算機(jī)芯片執(zhí)行來自各種應(yīng)用程序的代碼的運(yùn)行速度。

為了使代碼盡可能快地運(yùn)行,開發(fā)人員和編譯器將編程語言轉(zhuǎn)換為機(jī)器可讀代碼的程序,通常使用通過模擬給定芯片體系結(jié)構(gòu)運(yùn)行代碼的性能模型。

編譯器使用該信息來自動優(yōu)化代碼,而開發(fā)人員使用該信息來解決將運(yùn)行該代碼的微處理器的性能瓶頸。但是,機(jī)器代碼的性能模型是由相對較少的專家小組手寫的,并且未經(jīng)適當(dāng)驗證。結(jié)果,模擬的性能測量通常會偏離實際結(jié)果。

研究人員開發(fā)了一種新穎的機(jī)器學(xué)習(xí)管道,該管道可自動執(zhí)行此過程,從而使其變得更輕松、更快、更準(zhǔn)確。這項研究成果在國際機(jī)器學(xué)習(xí)大會上發(fā)表。

研究人員通過一種特殊的神經(jīng)網(wǎng)絡(luò)模型,它以“基本塊”(計算指令的基本摘要)形式訓(xùn)練標(biāo)記的數(shù)據(jù),以自動預(yù)測其持續(xù)時間使用給定的芯片執(zhí)行以前看不見的基本塊。結(jié)果表明,這種神經(jīng)網(wǎng)絡(luò)模型的性能要比傳統(tǒng)的手動調(diào)整模型精確得多。

這個基準(zhǔn)測試套件涉及多個領(lǐng)域,包括機(jī)器學(xué)習(xí)、編譯器、密碼學(xué)和可用于驗證性能模型的圖形。研究人員將超過30萬已分析的塊合并到一個開源數(shù)據(jù)集中。在評估過程中,這種神經(jīng)網(wǎng)絡(luò)模型預(yù)測了英特爾芯片運(yùn)行代碼的速度要比英特爾自身構(gòu)建的性能模型還要好。

最終,開發(fā)人員和編譯器可以使用該工具來生成代碼,這些代碼可以在越來越多的多樣化“黑匣子”芯片設(shè)計上更快、更高效地運(yùn)行?,F(xiàn)代計算機(jī)處理器不透明,極其復(fù)雜且難以理解。編寫對這些處理器執(zhí)行得盡可能快的計算機(jī)代碼也極具挑戰(zhàn)性,該工具是朝著對這些芯片的性能進(jìn)行完全建模以提高效率的重要一步。

最近,該團(tuán)隊又提出了一種自動生成編譯器優(yōu)化的新技術(shù)。具體來說,它們會自動生成一種算法,該算法將某些代碼轉(zhuǎn)換為向量,可用于并行計算。 這種算法優(yōu)于LLVM編譯器中使用的手工矢量化算法。

LLVM是業(yè)界常用的編譯器,一個自由軟件項目,它是一種編譯器基礎(chǔ)設(shè)施,以C++寫成,包含一系列模塊化的編譯器組件和工具鏈,用來開發(fā)編譯器前端和后端。它是為了任意一種編程語言而寫成的程序,利用虛擬技術(shù)創(chuàng)造出編譯時期、鏈接時期、運(yùn)行時期以及“閑置時期”的最優(yōu)化。它最早以C/C++為實現(xiàn)對象,而當(dāng)前它已支持許多種程序語言。

研究人員說,手工設(shè)計性能模型可能是“一門妖術(shù)”。英特爾提供了超過3000頁的詳盡文檔,描述了其芯片的體系結(jié)構(gòu)。但是目前只有一小部分專家將構(gòu)建性能模型,以模擬這些架構(gòu)上代碼的執(zhí)行。

研究人員指出:“英特爾的文檔既沒有錯誤,也沒有完整,并且英特爾會省略某些事情,因為它是專有的?!?“但是,當(dāng)使用數(shù)據(jù)時,不需要了解文檔。如果有隱藏的內(nèi)容,可以直接從數(shù)據(jù)中學(xué)習(xí)。”

為此,研究人員記錄了給定微處理器用于計算基本塊指令的平均周期數(shù),基本上是啟動,執(zhí)行和關(guān)閉的順序,而無需人工干預(yù)。使過程自動化可以快速分析成千上萬個塊。

在培訓(xùn)學(xué)習(xí)中,這種神經(jīng)網(wǎng)絡(luò)模型分析了數(shù)百萬個自動剖析的基本塊,以準(zhǔn)確了解不同的芯片體系結(jié)構(gòu)將如何執(zhí)行計算。重要的是,該模型將原始文本作為輸入,不需要手動向輸入數(shù)據(jù)添加功能。在測試中,可以將以前看不見的基本塊和給定的芯片提供給模型,模型將生成一個數(shù)字,指示芯片將以多快的速度執(zhí)行該代碼。

研究人員發(fā)現(xiàn),該模型的準(zhǔn)確性降低了錯誤率,這意味著預(yù)測速度與實際速度之間的差異比傳統(tǒng)的手工模型降低了50%。此外,他們表明該模型的錯誤率為10%,而Intel性能預(yù)測模型在多個不同領(lǐng)域的各種基本塊上的錯誤率為20%。

該工具現(xiàn)在使人們可以更輕松地快速了解任何新芯片架構(gòu)的性能速度。例如,特定領(lǐng)域的體系結(jié)構(gòu),例如Google專門用于神經(jīng)網(wǎng)絡(luò)的新型Tensor處理單元,目前正在構(gòu)建中,但并未得到廣泛理解。 如果要在某種新架構(gòu)上訓(xùn)練模型,只需從該架構(gòu)收集更多數(shù)據(jù),通過探查器運(yùn)行它,使用該信息來訓(xùn)練模型,從而就有了一個預(yù)測性能的模型。

接下來,研究人員將通過這樣的神經(jīng)網(wǎng)絡(luò)模型研究使人工智能模型可解釋的方法。人工智能機(jī)器學(xué)習(xí)在很大程度上是一個黑匣子,因此尚不清楚為什么特定的模型會做出某種預(yù)測。這樣的模型指示一個處理器要執(zhí)行一個基本塊需要10個周期,從而有可能設(shè)法找出其原因。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工業(yè)計算機(jī)與商用計算機(jī)的區(qū)別有哪些

    工業(yè)計算機(jī)是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機(jī)器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?171次閱讀
    工業(yè)<b class='flag-5'>計算機(jī)</b>與商用<b class='flag-5'>計算機(jī)</b>的區(qū)別有哪些

    Blue Lion超級計算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機(jī) Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機(jī)提升了約 30 倍。這臺新的超級計算機(jī)將在 NVIDIA Vera Rubin 架構(gòu)上
    的頭像 發(fā)表于 06-12 15:39 ?409次閱讀

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    ,是rvct3.1還是rvct4.0?如何把rvct編譯器集成到ide中? 2、RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?
    發(fā)表于 05-08 07:49

    CPU的各種指令和執(zhí)行流程

    在集成電路設(shè)計中,CPU的指令是指計算機(jī)中央處理單元(CPU)用來執(zhí)行計算任務(wù)的基本操作指令集。這些指令是CPU能夠理解并執(zhí)行的二進(jìn)制代碼,
    的頭像 發(fā)表于 04-18 11:24 ?833次閱讀

    部署計算機(jī)運(yùn)行 LabVIEW 應(yīng)用程序時出現(xiàn)以下錯誤: “缺少外部函數(shù) dll...”解決辦法

    如果你既有 DLL 文件,也有頭 (.h) 文件,那么可以使用共享庫批量生成VI,不用再一個一個使用“調(diào)用庫函數(shù)節(jié)點”來調(diào)用DLL,源代碼運(yùn)行是沒有問題,一旦生成應(yīng)用程序報錯缺失外部函數(shù)或者外部函數(shù)
    發(fā)表于 04-01 19:10

    Quantinuum“Reimei”量子計算機(jī)在RIKEN正式運(yùn)行

    )成功安裝并全面投入運(yùn)行。 此次合作中,RIKEN為“Reimei”量子計算機(jī)提供了世界級的基礎(chǔ)設(shè)施,包括為其量身定制的設(shè)計、準(zhǔn)備及交付工作。這一里程碑式的成就不僅標(biāo)志著Quantinuum在量子計算領(lǐng)域的持續(xù)突破,也預(yù)示著未來
    的頭像 發(fā)表于 02-17 10:21 ?464次閱讀

    BU-67121W實驗室航空電子接口計算機(jī)North Hills

    可以在BU-67121W上輕松創(chuàng)建嵌入式軟件,實現(xiàn)MIL-STD-1553、ARINC 429和以太網(wǎng)接口之間的數(shù)據(jù)自動轉(zhuǎn)發(fā)。獨立模式:允許BU-67121W作為用戶可編程的計算機(jī)系統(tǒng)獨立運(yùn)行。
    發(fā)表于 02-11 09:26

    飛利浦出售計算機(jī)芯片子公司Xiver

    近日,據(jù)Xiver公司首席執(zhí)行官透露,醫(yī)療技術(shù)領(lǐng)域的知名企業(yè)飛利浦已正式將其計算機(jī)芯片子公司Xiver出售。這一消息引起了業(yè)界的廣泛關(guān)注。 據(jù)了解,此次收購由荷蘭商人Cees Meeuwis領(lǐng)導(dǎo)
    的頭像 發(fā)表于 01-09 15:55 ?617次閱讀

    工業(yè)中使用哪種計算機(jī)?

    使其成為工廠、倉庫和其他要求苛刻的工業(yè)環(huán)境的理想選擇。通過提供高性能和可靠性,工業(yè)計算機(jī)可確保高效、連續(xù)的運(yùn)行。工業(yè)計算機(jī)的類型在工業(yè)環(huán)境中,人們使用各種專用
    的頭像 發(fā)表于 11-29 14:07 ?708次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機(jī)</b>?

    計算機(jī)接口位于什么之間

    計算機(jī)接口是計算機(jī)硬件和軟件之間、計算機(jī)與外部設(shè)備之間以及計算機(jī)各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在
    的頭像 發(fā)表于 10-14 14:02 ?1308次閱讀

    計算機(jī)系統(tǒng)的硬件組成和主要部件

    計算機(jī)系統(tǒng)的硬件組成是計算機(jī)運(yùn)行的基礎(chǔ),它包含了多個關(guān)鍵部件,這些部件相互協(xié)作,共同實現(xiàn)計算機(jī)各種功能。
    的頭像 發(fā)表于 09-10 11:41 ?6868次閱讀

    計算機(jī)程序的三種基本控制結(jié)構(gòu)是什么

    計算機(jī)程序的三種基本控制結(jié)構(gòu)是: 順序結(jié)構(gòu)(Sequence Structure) :順序結(jié)構(gòu)是最基本的控制結(jié)構(gòu),也是最簡單的結(jié)構(gòu)。它按照程序中語句的書寫順序,自上而下地依次執(zhí)行,即每
    的頭像 發(fā)表于 09-04 17:00 ?3157次閱讀

    計算機(jī)進(jìn)行程序控制工作的基本原理是怎樣的

    計算機(jī)程序控制是計算機(jī)科學(xué)中的一個核心概念,它涉及到計算機(jī)如何根據(jù)預(yù)設(shè)的指令序列執(zhí)行任務(wù)。 1. 計算機(jī)
    的頭像 發(fā)表于 09-04 16:57 ?1536次閱讀

    微處理器如何控制計算機(jī)系統(tǒng)

    微處理器,作為計算機(jī)系統(tǒng)的核心部件,承擔(dān)著控制整個計算機(jī)系統(tǒng)運(yùn)行的重要任務(wù)。它不僅是計算機(jī)的運(yùn)算中心,還是控制中心,負(fù)責(zé)執(zhí)行程序指令、處理數(shù)
    的頭像 發(fā)表于 08-22 14:21 ?980次閱讀

    ARMxy ARM嵌入式計算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計算機(jī)BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達(dá)一萬億次的浮點運(yùn)算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計算資源。在產(chǎn)品缺陷檢測領(lǐng)域
    的頭像 發(fā)表于 08-20 11:53 ?844次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機(jī)</b>搭載 1 TOPS NPU支持深度<b class='flag-5'>學(xué)習(xí)</b>