99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SOK將HugeCTR中的高級特性進行包裝使用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. Introduction

HugeCTR 能夠高效地利用 GPU 來進行推薦系統(tǒng)的訓(xùn)練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開發(fā)了 SparseOperationKit (SOK),來將 HugeCTR 中的高級特性封裝為 TensorFlow 可直接調(diào)用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級特性來加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內(nèi)部做黑盒式地模型轉(zhuǎn)換,最后將計算結(jié)果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個 GPU 上進行擴展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實際需求提供了對應(yīng)的新解決方案,比如說 GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標(biāo)準(zhǔn)模型 DLRM 來對 SOK 的性能進行測試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓(xùn)練速度以及更高的吞吐量。

3. API

SOK 提供了簡潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡單、直接;讓用戶通過修改幾行代碼就可以使用 SOK。

定義模型結(jié)構(gòu)

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側(cè)是使用 TensorFlow 的 API 來搭建模型,右側(cè)是使用 SOK 的 API 來搭建相同的模型。使用 SOK 來搭建模型的時候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對應(yīng)的 API 即可。

使用 Horovod 來定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側(cè)是使用 TensorFlow 來定義 training loop,右側(cè)是使用 SOK 時,training loop 的定義方式??梢钥吹?,使用 SOK 時,只需要對 Embedding Variables 和 Dense Variables 進行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來定義 training loop。

開始訓(xùn)練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開始訓(xùn)練過程時,使用 SOK 與使用 TensorFlow 時所用代碼完全一致。

4. 結(jié)語

SOK 將 HugeCTR 中的高級特性包裝為 TensorFlow 可以直接使用的模塊,通過修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進設(shè)計。

關(guān)于作者

NVIDIA GPU 計算專家研發(fā)團隊成立于2020年7月,主要面向全球用戶開發(fā)基于英偉達通用計算產(chǎn)品的軟件解決方案。 目前團隊致力于推薦系統(tǒng)訓(xùn)練框架 Merlin HugeCTR的開發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對于推薦系統(tǒng)設(shè)計的模型訓(xùn)練框架。項目啟動于2018年,目前產(chǎn)品應(yīng)用于多家國際互聯(lián)網(wǎng)公司,自2020年以來,HugeCTR持續(xù)參與并推動國際性競賽MLPerf DLRM訓(xùn)練項目,從而實現(xiàn)了業(yè)界領(lǐng)先的優(yōu)化性能。 NVIDIA GPU 計算專家研發(fā)團隊是一個小型國際化工程團隊,核心成員來自于多個國家(中國,韓國,荷蘭,德國),客戶分布于世界各地。日常工作使用英語溝通。 團隊主要工作圍繞軟件產(chǎn)品開發(fā)展開,涉及產(chǎn)品維護、文檔、測試、發(fā)布、部署,日常工作中與各國硬件、產(chǎn)品、工程、客戶支持團隊有著緊密的合作。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106356
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4944

    瀏覽量

    131218
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    西門子S200伺服在裹包機的應(yīng)用

    參考。 包裹機的重要作用 裹包機作為包裝生產(chǎn)線的重要設(shè)備,主要負責(zé)產(chǎn)品進行包裝,提高產(chǎn)品美觀度、保護產(chǎn)品在運輸過程的安全。隨著市場競爭
    的頭像 發(fā)表于 02-10 16:05 ?456次閱讀
    西門子S200伺服在裹包機<b class='flag-5'>中</b>的應(yīng)用

    磁珠和電感在電路的阻抗特性如何呢?

    磁珠和電感在電路的阻抗特性各有其獨特之處,下面分別進行詳細闡述。 磁珠的阻抗特性 磁珠在電路
    的頭像 發(fā)表于 01-15 15:40 ?721次閱讀
    磁珠和電感在電路<b class='flag-5'>中</b>的阻抗<b class='flag-5'>特性</b>如何呢?

    解密巧克力包裝背后的智能科技

    對于巧克力這種快消品而言,得體有效的包裝,是產(chǎn)品與品牌進行差異化表達的主要途徑,承擔(dān)著與消費者進行互動的重要功能。面對消費者逐漸多樣化的需求,企業(yè)亟需通過創(chuàng)新設(shè)計,數(shù)字化、柔性化和精
    的頭像 發(fā)表于 12-29 15:03 ?639次閱讀

    接地電阻柜采用免熏蒸包裝的優(yōu)勢

    在接地電阻柜的包裝領(lǐng)域,免熏蒸包裝正逐漸成為主流選擇,具有諸多顯著優(yōu)勢。 免熏蒸包裝材料通常由環(huán)保型復(fù)合材料制成,無需進行熏蒸處理,減少了化學(xué)藥劑的使用,更加環(huán)保安全,符合現(xiàn)代綠色發(fā)展
    的頭像 發(fā)表于 12-11 16:09 ?369次閱讀

    包裝行業(yè)設(shè)備如何通過Profinet轉(zhuǎn)EthernetIP網(wǎng)關(guān)進行交流?

    在我們的日常生活,無論是食品、醫(yī)藥,還是化妝品行業(yè),包裝都是一個重要的環(huán)節(jié)。包裝不僅需要美觀大方,更需要快速高效。然而,許多包裝機械設(shè)備在生產(chǎn)過程
    的頭像 發(fā)表于 12-04 09:19 ?442次閱讀
    <b class='flag-5'>包裝</b>行業(yè)<b class='flag-5'>中</b>設(shè)備如何通過Profinet轉(zhuǎn)EthernetIP網(wǎng)關(guān)<b class='flag-5'>進行</b>交流?

    Wilink8高級特性

    電子發(fā)燒友網(wǎng)站提供《Wilink8高級特性.pdf》資料免費下載
    發(fā)表于 11-08 15:58 ?0次下載
    Wilink8<b class='flag-5'>高級</b><b class='flag-5'>特性</b>

    淺析RFID技術(shù)在循環(huán)包裝管理的應(yīng)用

    隨著物流行業(yè)的快速發(fā)展和環(huán)保意識的增強,循環(huán)包裝逐漸成為企業(yè)減少成本、提升效率和踐行綠色發(fā)展的重要手段。循環(huán)包裝是指可多次重復(fù)使用的包裝容器,如鐵質(zhì)包裝箱、塑料托盤等。相較于一次性
    的頭像 發(fā)表于 10-31 14:26 ?568次閱讀
    淺析RFID技術(shù)在循環(huán)<b class='flag-5'>包裝</b>管理<b class='flag-5'>中</b>的應(yīng)用

    明達IO——搭建包裝產(chǎn)線新方案

    包裝行業(yè)在商品銷售扮演著至關(guān)重要的角色,其可以按照多種方式進行分類,如按包裝容器、包裝材料、包裝
    的頭像 發(fā)表于 10-15 11:04 ?530次閱讀
    明達IO——搭建<b class='flag-5'>包裝</b>產(chǎn)線新方案

    利用新型ePWM特性進行多相控制

    電子發(fā)燒友網(wǎng)站提供《利用新型ePWM特性進行多相控制.pdf》資料免費下載
    發(fā)表于 09-24 11:25 ?0次下載
    利用新型ePWM<b class='flag-5'>特性</b><b class='flag-5'>進行</b>多相控制

    MT6835 磁編碼 IC 技術(shù)在全自動紙包裝的應(yīng)用

    一、引言 在現(xiàn)代包裝行業(yè),效率和精度是衡量生產(chǎn)設(shè)備性能的關(guān)鍵指標(biāo)。全自動紙包裝機作為包裝生產(chǎn)線的重要設(shè)備,其性能的優(yōu)劣直接影響到產(chǎn)品的
    的頭像 發(fā)表于 08-15 16:34 ?701次閱讀
    MT6835 磁編碼 IC 技術(shù)在全自動紙<b class='flag-5'>包裝</b>機<b class='flag-5'>中</b>的應(yīng)用

    宏工科技發(fā)力包裝領(lǐng)域,解決超細粉料包裝難點

    宏工科技不斷在物料處理鏈條上加大研發(fā)力度,攻克了一系列“卡脖子”技術(shù)難題,以技術(shù)創(chuàng)新鑄就宏工的“品牌力”。以包裝領(lǐng)域為例,針對不同的包裝需求,宏工科技目前在工業(yè)包裝領(lǐng)域已推出了噸袋包裝
    的頭像 發(fā)表于 08-15 14:54 ?645次閱讀
    宏工科技發(fā)力<b class='flag-5'>包裝</b>領(lǐng)域,解決超細粉料<b class='flag-5'>包裝</b>難點

    熱收縮膜包裝機的主要作用

    熱收縮膜包裝機又稱熱收縮包裝機(也稱為收縮包裝機、熱收縮機、收縮機、膜包機等),主要作用是產(chǎn)品用熱收縮薄膜裹包后再進行加熱,使薄膜收縮后
    的頭像 發(fā)表于 08-15 11:43 ?927次閱讀

    SOK在手機行業(yè)的應(yīng)用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性
    的頭像 發(fā)表于 07-25 10:01 ?887次閱讀
    <b class='flag-5'>SOK</b>在手機行業(yè)的應(yīng)用案例

    MT6816IC在農(nóng)業(yè)包裝生產(chǎn)線的應(yīng)用

    。MT6816IC作為一款高性能的集成電路,其獨特的性能和廣泛的應(yīng)用場景,使得在農(nóng)業(yè)包裝生產(chǎn)線的應(yīng)用顯得尤為突出。本文將從 MT6816IC 的性能特點、農(nóng)業(yè)包裝生產(chǎn)線的需求以及MT6816IC在農(nóng)業(yè)
    的頭像 發(fā)表于 07-22 17:57 ?685次閱讀
    MT6816IC在農(nóng)業(yè)<b class='flag-5'>包裝</b>生產(chǎn)線<b class='flag-5'>中</b>的應(yīng)用

    物聯(lián)網(wǎng)高級智能網(wǎng)關(guān)是什么

    的主要功能包括: 1.協(xié)議轉(zhuǎn)換:不同的物聯(lián)網(wǎng)設(shè)備可能使用不同的通信協(xié)議(如MQTT,HTTP,Modbus等),網(wǎng)關(guān)能夠這些協(xié)議轉(zhuǎn)換為統(tǒng)一的格式,以便于數(shù)據(jù)的集中管理和分析。 2.數(shù)據(jù)收集與預(yù)處理:網(wǎng)關(guān)從各種傳感器和設(shè)備收集數(shù)據(jù),并
    的頭像 發(fā)表于 07-22 15:46 ?1450次閱讀
    物聯(lián)網(wǎng)<b class='flag-5'>高級</b>智能網(wǎng)關(guān)是什么