99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工業(yè)物聯(lián)網(wǎng)架構師花了數(shù)年時間才得出結論,邊緣需要數(shù)據(jù)中心級的性能,以實現(xiàn)高效分析、提高安全性和降低網(wǎng)絡成本。在人工智能機器學習領域,傳感器設備內部或附近對高端處理能力的需求從一開始就很明顯。

考慮到即使是簡單的自主機器(我知道這是矛盾的說法)也需要大量的計算能力來運行神經(jīng)網(wǎng)絡來執(zhí)行障礙物檢測、識別和避免等功能。例如,京東和菜鳥等公司生產的自動送貨車需要大約每秒 30 兆次運算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動駕駛檢查無人機需要大約 20 兆次運算 (TOPS) 的處理性能。

當然,這對嵌入式和工業(yè)工程師提出了一個經(jīng)典的設計挑戰(zhàn):平衡每瓦性能。性能太低,應用程序失敗。功耗太大,自主機器必須連接到持續(xù)的電源

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務器級性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構處理性能,適用于人工智能驅動的機器人應用程序,包括:

512 核 Volta GPU,帶有 64 個 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學習加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負載相關的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務器級性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺式風扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報告稱每瓦性能 (PPW) 的最佳點在 15W 左右。即使在那個水平(大約相當于藍光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項功能可實現(xiàn)這種類型的每瓦性能,從基礎芯片架構開始。雖然 SoC 上的每個內核都有自己的內存,但內存是離散 SoC 模塊之間的零內存復制。雖然 AGX Xavier 模塊確實通過外部 16 GB LPDDR4X DRAM 提供共享內存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構的異構性也提高了效率,因為工作負載可以在最適合任務的架構上執(zhí)行。這方面的一個例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復雜或用戶定義的任務。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡 (CNN) 時,NVDLA 引擎可提供高達 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時,功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時,Carmel CPU 內核可以保留用于通用計算任務。

JetPack 簡化了深度學習編程的復雜性

Jetson AGX 系列運行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對 GPU 和/或深度學習加速器進行編程。幸運的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對 GPU 進行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機 API

TensorRT 5.0 包中提供的 API 也簡化了對 DLA 進行編程以執(zhí)行神經(jīng)網(wǎng)絡工作負載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡層或層,而像 _allowGPUFallback() 這樣的命令可讓工作負載在 DLA 不支持的情況下恢復到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應用程序的開發(fā)。

當然,低級 CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4814

    瀏覽量

    103697
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106457
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4949

    瀏覽量

    131287
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從25G PHY到AI平臺:差分晶振FCO-PG系列關鍵應用全解讀

    :200~800 MHz,適配 Xilinx Kintex UltraScale+ · AI邊緣計算模塊:156.25 MHz,搭配 NVIDIA Jetson AGX Orin ·
    發(fā)表于 05-16 14:46

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    Jetson Nano、Jetson TX2 NX、Jetson Xavier NX 系統(tǒng)模塊Je
    發(fā)表于 05-12 18:13

    邊緣AI MPU深度盤點:品牌、型號與技術特性全解析

    三個維度,結合典型應用場景,對主流邊緣AI MPU進行全面盤點。 一、國際品牌:技術領先,場景覆蓋全面 NVIDIA(英偉達) 代表型號 :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?2277次閱讀

    市場上主流的端側AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Ampere架構,4-64 TOPS算力)
    的頭像 發(fā)表于 04-02 17:44 ?1968次閱讀

    用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡

    ,成為新一代AI數(shù)據(jù)中心的核心驅動力。 AI時代的兩大數(shù)據(jù)中心:AI工廠與AIAI時代催生了兩類數(shù)據(jù)中心架構:
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    聯(lián)網(wǎng)提供無縫連接能力。 堅固耐用,適應工業(yè)環(huán)境 BPI-AI2N采用 SO-DIMM 260PIN 設計,尺寸僅 45x69.5mm,支持定制載板,適用于空間受限的嵌入式應用。支持 -40℃ 至 85
    發(fā)表于 03-19 17:54

    研華NVIDIA Jetson Orin Nano系統(tǒng)支持Super Mode

    提升生成式AI性能1.7倍 2025年春季— 研華科技,作為全球工業(yè)嵌入式 AI 解決方案供應商,宣布推出搭載NVIDIA Jetson Orin Nano 8GB系統(tǒng)
    發(fā)表于 03-10 14:07 ?390次閱讀
    研華NVIDIA <b class='flag-5'>Jetson</b> Orin Nano系統(tǒng)支持Super Mode

    研華發(fā)布全系列車載AI控制器,引領智能軌道交通新時代

    。 ITA-560AGX Orin基于NVIDIA Jetson AGX Orin芯片打造,憑借其卓越的算力性能和豐富的I/O接口,為軌道列車車載應用提供了專業(yè)、可靠的解決方案。該控制器不僅能夠高效處理復雜的
    的頭像 發(fā)表于 01-23 14:21 ?509次閱讀

    NVIDIA發(fā)布小巧高性價比的Jetson Orin Nano Super開發(fā)者套件

    NVIDIA近期推出了一款全新的生成式AI超級計算機——Jetson Orin Nano Super開發(fā)者套件。這款開發(fā)者套件以其小巧的尺寸和高性價比吸引了廣泛關注。 Jetson Orin
    的頭像 發(fā)表于 12-19 11:28 ?1093次閱讀

    初創(chuàng)公司借助NVIDIA Metropolis和Jetson提高生產線效率

    初創(chuàng)公司使用 NVIDIA Metropolis 視覺 AIJetson 邊緣 AI 平臺提高生產線效率。
    的頭像 發(fā)表于 11-19 14:39 ?710次閱讀

    使用NVIDIA Jetson打造機器人導盲犬

    Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學習和 NVIDIA Jetson邊緣 AI 和機器人平臺,為視障人士打造了機器人導盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?769次閱讀

    用于工業(yè)以太網(wǎng)PHY的AM2x評估模塊附加板用戶指南

    電子發(fā)燒友網(wǎng)站提供《用于工業(yè)以太網(wǎng)PHY的AM2x評估模塊附加板用戶指南.pdf》資料免費下載
    發(fā)表于 11-05 09:20 ?0次下載
    <b class='flag-5'>用于</b><b class='flag-5'>工業(yè)</b>以太網(wǎng)PHY的AM2x評估<b class='flag-5'>模塊</b>附加板用戶指南

    GPU計算主板學習資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號

    GPU計算主板學習資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號
    的頭像 發(fā)表于 10-23 10:09 ?663次閱讀
    GPU計算主板學習資料第735篇:基于3U VPX的<b class='flag-5'>AGX</b> <b class='flag-5'>Xavier</b> GPU計算主板 信號計算主板 視頻處理 相機信號

    fx3系列的硬件主要由什么組成

    FX3系列是索尼(Sony)推出的一款高性能計算平臺,它基于NVIDIA的Jetson AGX Xavier模塊,專為需要高性能計算、機器學習、計算機視覺和實時數(shù)據(jù)處理的嵌入式系統(tǒng)設計
    的頭像 發(fā)表于 09-18 11:14 ?1349次閱讀

    新品發(fā)布 | 合眾恒躍發(fā)布多款無人機智能飛控產品搭載英偉達Jetson模塊,賦能低空經(jīng)濟新質生產力

    控產品搭載英偉達Jetson模塊系列產品,為低空經(jīng)濟注入新的活力。01HZHY-AI529Compact采用NVIDIA高性能AI處理器,是自主機器和其他嵌入式應用的
    的頭像 發(fā)表于 07-27 08:46 ?1105次閱讀
    新品發(fā)布 | 合眾恒躍發(fā)布多款無人機智能飛控產品搭載英偉達<b class='flag-5'>Jetson</b><b class='flag-5'>模塊</b>,賦能低空經(jīng)濟新質生產力