NVIDIA TensorRT的數(shù)據(jù)格式定義

TensorRT 支持不同的數(shù)據(jù)格式。有兩個方面需要考慮：數(shù)據(jù)類型和布局。

數(shù)據(jù)類型格式

數(shù)據(jù)類型是每個單獨值的表示。它的大小決定了取值范圍和表示的精度，分別是FP32（32位浮點，或單精度），F(xiàn)P16（16位浮點或半精度），INT32（32位整數(shù)表示），和 INT8（8 位表示）。

布局格式

布局格式確定存儲值的順序。通常，batch 維度是最左邊的維度，其他維度指的是每個數(shù)據(jù)項的方面，例如圖像中的C是通道， H是高度， W是寬度。忽略總是在這些之前的批量大小， C 、 H和W通常被排序為CHW （參見圖 1 ）或HWC （參見圖 2 ）。

圖1. CHW的布局格式：圖像分為HxW矩陣，每個通道一個，矩陣按順序存儲；通道的所有值都是連續(xù)存儲的。

圖2. HWC的布局格式：圖像存儲為單個HxW矩陣，其值實際上是 C 元組，每個通道都有一個值；一個點（像素）的所有值都是連續(xù)存儲的。

為了實現(xiàn)更快的計算，定義了更多格式以將通道值打包在一起并使用降低的精度。因此，TensorRT 還支持NC / 2HW2和NHWC8等格式。

在NC / 2HW2 （ TensorFormat：：kCHW2 ）中，通道值對在每個HxW矩陣中打包在一起（在奇數(shù)通道的情況下為空值）。結(jié)果是一種格式，其中? C/2 ? HxW矩陣的值是兩個連續(xù)通道的值對（參見圖 3 ）；請注意，如果它們在同一對中，則此排序?qū)⒕S度交錯為具有步長1的通道的值，否則將步長為 2xHxW 。

圖 3. 一對通道值在每個HxW矩陣中打包在一起。結(jié)果是一種格式，其中［C/2］ HxW矩陣的值是兩個連續(xù)通道的值對

在NHWC8 （ TensorFormat：：kHWC8 ）中， HxW矩陣的條目包括所有通道的值。此外，這些值被打包在? C/8 ? 8 元組中，并且C向上舍入到最接近的 8 倍數(shù)。

在這種NHWC8格式中， HxW矩陣的條目包括所有通道的值。

其他TensorFormat遵循與前面提到的TensorFormat：：kCHW2和TensorFormat：：kHWC8類似的規(guī)則。

關(guān)于作者

Ken He 是 NVIDIA 企業(yè)級開發(fā)者社區(qū)經(jīng)理 & 高級講師，擁有多年的 GPU 和人工智能開發(fā)經(jīng)驗。自 2017 年加入 NVIDIA 開發(fā)者社區(qū)以來，完成過上百場培訓(xùn)，幫助上萬個開發(fā)者了解人工智能和 GPU 編程開發(fā)。在計算機視覺，高性能計算領(lǐng)域完成過多個獨立項目。并且，在機器人和無人機領(lǐng)域，有過豐富的研發(fā)經(jīng)驗。對于圖像識別，目標(biāo)的檢測與跟蹤完成過多種解決方案。曾經(jīng)參與 GPU 版氣象模式GRAPES，是其主要研發(fā)者。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器人

機器人

+關(guān)注

關(guān)注
213

文章
29748

瀏覽量
212887
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106412
人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
49028

瀏覽量
249514

星星科技指導(dǎo)員
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 使用microchip參考設(shè)計開發(fā)您的下一個基于USB-C PD的充電器
Hot 所有IC中半導(dǎo)體噪聲的特性如何估算基準(zhǔn)電壓源的噪聲

New 微電網(wǎng)系統(tǒng)控制方法和原理
New 飛輪儲能系統(tǒng)的核心及優(yōu)勢分析

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現(xiàn)實

腦極體
4小時前

168 閱讀

RKDC2025 | 視美泰亮相瑞芯微2025開發(fā)者大會，共探AIoT新藍海

視美泰
9小時前

276 閱讀

老化測試效率提升，高壓干簧繼電器究竟做對了什么？

Standexe_2021
10小時前

292 閱讀

光儲邊緣智能的核心演進方向:MCU + AFE + 通信 + AI 一體化設(shè)計

eeDesigner
12小時前

421 閱讀

線性穩(wěn)壓器和開關(guān)穩(wěn)壓器、串聯(lián)穩(wěn)壓器的區(qū)別

東芝半導(dǎo)體
12小時前

380 閱讀

WinCC數(shù)據(jù)報表實現(xiàn)方法介紹

張燕
3244

10積分

192下載

基于EKF的異步電機直接轉(zhuǎn)矩控制系統(tǒng)

石玉蘭
793

5積分

31下載

計算機網(wǎng)絡(luò)信息安全技術(shù)研究

吳藩
384

10積分

71下載

筆記本電腦無線電源的制作

LL-LING寧
649 KB

10積分

198下載

漫畫電子電路（日）——激發(fā)學(xué)習(xí)興趣

陶瓷肥貓
38.8 MB

免費

0下載

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

156 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

366 閱讀

【RA-Eco-RA6M4開發(fā)板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

340 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復(fù)古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

353 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+兩種開發(fā)板間的比較

jinglixixi
2天前

314 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

NVIDIA TensorRT的數(shù)據(jù)格式定義

評論