99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf:邊緣AI推理的新行業(yè)基準

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:嵌入式計算設計 ? 2022-10-14 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這些數字重要嗎?它們中的大多數都是在實驗室類型的環(huán)境中生產的,其中理想的條件和工作負載允許被測設備(SUT)產生用于營銷目的的最高分數。另一方面,大多數工程師可能不太關心這些理論可能性。他們更關心的是技術如何影響其推理設備的準確性、吞吐量和/或延遲。

將計算元素與特定工作負載進行比較的行業(yè)標準基準測試更有用。例如,圖像分類工程師可以確定滿足其性能要求的多個選項,然后根據功耗、成本等對其進行縮減。語音識別設計人員可以使用基準測試結果來分析各種處理器和內存組合,然后決定是在本地還是在云中合成語音。

但是,AI和ML模型,開發(fā)框架和工具的快速引入使這種比較復雜化。如圖 1 所示,AI 技術堆棧中越來越多的選項也意味著可用于判斷推理性能的排列呈指數級增長。這是在考慮模型和算法可以針對給定系統(tǒng)架構進行優(yōu)化的所有方法之前。

pYYBAGNIvmeAfv_HAAHbWQS6EGk129.png

圖 1.AI開發(fā)堆棧中越來越多的選項使行業(yè)標準基準測試變得復雜。

毋庸置疑,制定這樣一個全面的基準超出了大多數公司的能力或愿望。即使有人能夠完成這一壯舉,工程界真的會接受它作為“標準基準”嗎?

機器學習成果:人工智能推理的更好基準

更廣泛地說,在過去幾年中,工業(yè)界和學術界已經開發(fā)了幾個推理基準,但他們傾向于關注新興人工智能市場的更多利基領域。一些例子包括EEMBC用于嵌入式圖像分類和對象檢測的MLMark,蘇黎世聯邦理工學院的AI基準測試,針對Android智能手機上的計算機視覺,以及哈佛的Fathom基準測試,強調各種神經網絡的吞吐量,但不是準確性。

對 AI 推理格局的更完整評估可以在 MLPerf 最近發(fā)布的推理 v0.5 基準測試中找到。MLPerf 推理是社區(qū)開發(fā)的測試套件,可用于測量 AI 硬件、軟件、系統(tǒng)和服務的推理性能。這是來自30多家公司的200多名工程師合作的結果。

正如您對任何基準測試所期望的那樣,MLPerf 推理定義了一套標準化工作負載,這些工作負載被組織成圖像分類、對象檢測和機器翻譯用例的“任務”。每個任務都由與正在執(zhí)行的功能相關的 AI 模型和數據集組成,其中圖像分類任務支持 ResNet-50 和 MobileNet-v1 模型,對象檢測任務利用具有 ResNet34 或 MobileNet-v1 主干的 SSD 模型,以及使用 GNMT 模型的機器轉換任務。

除了這些任務之外,MLPerf 推理開始偏離傳統(tǒng)基準測試的規(guī)范。由于準確性、延遲、吞吐量和成本的重要性在不同用例中具有不同的權重,因此 MLPerf 推理通過在移動設備、自動駕駛汽車、機器人和云這四個關鍵應用領域中根據質量目標對推理性能進行分級來權衡。

為了在盡可能接近在這些應用領域中運行的真實系統(tǒng)的上下文中有效地對任務進行分級,MLPerf 推理引入了一個負載生成器工具,該工具根據四種不同的方案生成查詢流量:

樣本大小為 1 的連續(xù)單流查詢,在移動設備中很常見

連續(xù)的多流查詢,每個流有多個樣本,就像在延遲至關重要的自動駕駛汽車中發(fā)現的那樣

請求隨機到達的服務器查詢,例如在延遲也很重要的 Web 服務中

執(zhí)行批處理且吞吐量是一個突出考慮因素的脫機查詢

負載生成器在測試準確性和吞吐量(性能)的模式下提供這些方案。圖 2 描述了 SUT 如何從負載生成器接收請求,相應地將數據集中的樣本加載到內存中,運行基準測試并將結果返回到負載生成器。然后,準確性腳本將驗證結果。

pYYBAGNIvnCAEAcaAAENd-3ADao787.png

圖 2. MLPerf 推理基準測試依賴于負載生成器,該負載生成器根據許多實際方案查詢被測系統(tǒng) (SUT)。

作為基準測試的一部分,每個 SUT 必須執(zhí)行最少數量的查詢,以確保統(tǒng)計置信度。

提高靈活性

如前所述,人工智能技術市場中使用的各種框架和工具是任何推理基準測試的關鍵挑戰(zhàn)。前面提到的另一個考慮因素是調整模型和算法,以從AI推理系統(tǒng)中擠出最高的準確性,吞吐量或最低延遲。就后者而言,量化和圖像重塑等技術現在是常見的做法。

MLPerf 推理是一種語義級基準測試,這意味著,雖然基準測試提供了特定的工作負載(或一組工作負載)以及執(zhí)行它的一般規(guī)則,但實際實現取決于執(zhí)行基準測試的公司。公司可以優(yōu)化提供的參考模型,使用他們想要的工具鏈,并在他們選擇的硬件目標上運行基準測試,只要它們保持在特定的指導方針之內。

但是,重要的是要注意,這并不意味著提交公司可以對MLPerf模型或數據集采取任何和所有自由,并且仍然有資格獲得主要基準。MLPerf 推理基準分為兩個部分 - 封閉式和開放式 - 封閉式部門對可以使用哪些類型的優(yōu)化技術以及其他禁止的優(yōu)化技術有更嚴格的要求。

要獲得封閉分區(qū)的資格,提交者必須使用提供的模型和數據集,但允許量化。為了確保兼容性,封閉部門的參賽者不能使用重新訓練或修剪的模型,也不能使用緩存或已調整為基準或數據集感知的網絡。

另一方面,開放式劃分旨在促進AI模型和算法的創(chuàng)新。仍需要向開放分區(qū)提交以執(zhí)行相同的任務,但可以更改模型類型、重新訓練和修剪其模型、使用緩存等。

盡管封閉式劃分可能聽起來很嚴格,但超過 150 個條目成功獲得了 MLPerf 推理 v0.5 發(fā)布資格。圖3和圖4展示了參賽者使用的AI技術堆棧的多樣性,這些堆棧幾乎涵蓋了從ONNX和PyTorch到TensorFlow,OpenVINO和Arm NN的各種處理器架構和軟件框架。

poYBAGNIvneATVpSAAD0vbiiLaI086.png

圖 3.數字信號處理器、FPGA、CPUASICGPU 都成功完成了 MLPerf 推理封閉式除法要求。

pYYBAGNIvn-ALKBBAAFGgFHFxJs564.png

圖 4. 人工智能軟件開發(fā)框架,如 ONNX、畢拓、張量流、OpenVINO、Arm NN 等,被用于開發(fā)符合封閉分區(qū)基準測試的 MLPerf 推理系統(tǒng)。

消除評估中的猜測

雖然 MLPerf 推理的初始版本包含一組有限的模型和用例,但基準測試套件是以模塊化、可擴展的方式構建的。這將使MLPerf能夠隨著技術和行業(yè)的發(fā)展而擴展任務,模型和應用領域,并且組織已經計劃這樣做。

最新的AI推理基準顯然是目前可用的最接近真實世界AI推理性能的衡量標準。但隨著它的成熟并吸引更多的提交,它也將成為成功部署的技術堆棧的晴雨表,以及新實施的試驗場。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19890

    瀏覽量

    235102
  • AI
    AI
    +關注

    關注

    88

    文章

    35106

    瀏覽量

    279563
  • 人工智能
    +關注

    關注

    1806

    文章

    49011

    瀏覽量

    249334
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI推理的存儲,看好SRAM?

    電子發(fā)燒友網報道(文/黃晶晶)近幾年,生成式AI引領行業(yè)變革,AI訓練率先崛起,帶動高帶寬內存HBM一飛沖天。但我們知道AI推理的廣泛應用才
    的頭像 發(fā)表于 03-03 08:51 ?1676次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲,看好SRAM?

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    邊緣AI盒子技術解析:ASIC/FPGA/GPU芯片及邊緣-云端協同與自適應推理

    數據上傳到云端,為眾多行業(yè)提供高效、智能的解決方案。它是邊緣AI需要用到的關鍵邊緣設備。 邊緣AI
    的頭像 發(fā)表于 07-13 08:25 ?2048次閱讀

    Nordic收購 Neuton.AI 關于產品技術的分析

    與 Nordic 的 nRF54 系列超低功耗無線 SoC 結合,使得即使是資源極為有限的設備也能高效運行邊緣 AI。Nordic 目前正在將 Neuton 深度集成到自身開發(fā)生態(tài)中,未來會提供更多工具、固件
    發(fā)表于 06-28 14:18

    STM32F769是否可以部署邊緣AI

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    Deepseek海思SD3403邊緣計算AI產品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應用場景,自己采集樣本數據,進
    發(fā)表于 04-28 11:05

    華為AI WAN在智算邊緣推理網絡中的關鍵優(yōu)勢

    WAN:智算邊緣推理網絡架構、實踐及產業(yè)進展”的演講,詳細闡述了AI WAN在智算邊緣推理網絡中的關鍵優(yōu)勢及其對產業(yè)發(fā)展的深遠意義。
    的頭像 發(fā)表于 04-09 09:53 ?462次閱讀

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在本次測試的六個
    的頭像 發(fā)表于 04-07 10:58 ?278次閱讀

    2025邊緣AI預測:昇騰310B邊緣將占工業(yè)推理市場35%的三大動因

    據工信部《2025 智能算力發(fā)展白皮書》預測,到 2025 年我國邊緣 AI 推理芯片市場規(guī)模將突破 580 億元,其中工業(yè)場景占比達 42%。在這場變革中,昇騰 310B 邊緣
    的頭像 發(fā)表于 03-24 14:09 ?918次閱讀
    2025<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>預測:昇騰310B<b class='flag-5'>邊緣</b>將占工業(yè)<b class='flag-5'>推理</b>市場35%的三大動因

    使用修改后的基準C++工具推斷灰度圖像時的推理速度慢怎么解決?

    修改了 基準測試 C++ 工具 ,以加載灰度圖像。 獲得的推理速度非常低。
    發(fā)表于 03-06 07:11

    AI賦能邊緣網關:開啟智能時代的新藍海

    在數字化轉型的浪潮中,AI邊緣計算的結合正掀起一場深刻的產業(yè)變革。邊緣網關作為連接物理世界與數字世界的橋梁,在AI技術的加持下,正從簡單的數據采集傳輸節(jié)點,進化為具備智能決策能力的
    發(fā)表于 02-15 11:41

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?710次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    新品| LLM630 Compute Kit,AI 大語言模型推理開發(fā)平臺

    LLM630LLM推理,視覺識別,可開發(fā),靈活擴展···LLM630ComputeKit是一款AI大語言模型推理開發(fā)平臺,專為邊緣計算和智能交互應用而設計。該套件的主板搭載愛芯AX63
    的頭像 發(fā)表于 01-17 18:48 ?689次閱讀
    新品| LLM630 Compute Kit,<b class='flag-5'>AI</b> 大語言模型<b class='flag-5'>推理</b>開發(fā)平臺

    MLCommons推出AI基準測試0.5版

    開放式機器學習工程聯盟 MLCommons 在美國加州當地時間公布推出適用于消費類 PC 的 AI 性能的 MLPerf Client 基準測試的 0.5 版,這是該測試的第一個公開版本
    的頭像 發(fā)表于 12-12 16:47 ?826次閱讀

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現出
    的頭像 發(fā)表于 09-28 16:46 ?408次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? <b class='flag-5'>AI</b>存儲<b class='flag-5'>基準</b>測試五項性能全球第一