国产天天怕怕夜夜怕怕,人妻久久精品视频,一道本久在线中文字幕

無(wú)量推薦系統(tǒng)承載著騰訊PCG（平臺(tái)與內(nèi)容事業(yè)群）的推薦場(chǎng)景，包括：騰訊看點(diǎn)（瀏覽器、QQ看點(diǎn)、商業(yè)化）、騰訊新聞、騰訊視頻、騰訊音樂(lè)、閱文、應(yīng)用寶、小鵝拼拼等。無(wú)量推薦系統(tǒng)支持日活躍用戶達(dá)數(shù)億級(jí)別，其中的模型數(shù)量達(dá)數(shù)千個(gè)，日均調(diào)用服務(wù)達(dá)到千億級(jí)別。無(wú)量推薦系統(tǒng)，在模型訓(xùn)練和推理都能夠進(jìn)行海量Embedding和DNN模型的GPU計(jì)算，是目前業(yè)界領(lǐng)先的體系結(jié)構(gòu)設(shè)計(jì)。

傳統(tǒng)推薦系統(tǒng)面臨挑戰(zhàn)

傳統(tǒng)推薦系統(tǒng)具有以下特點(diǎn)：訓(xùn)練是基于參數(shù)服務(wù)器的框架，解決海量數(shù)據(jù)和稀疏特征的分布式訓(xùn)練問(wèn)題。推理通常分離大規(guī)模Embedding和DNN，只能進(jìn)行DNN的GPU加速。所以，傳統(tǒng)的推薦系統(tǒng)架構(gòu)具有一些局限性：1. 大規(guī)模分布式架構(gòu)有大量的額外開(kāi)銷(xiāo)，比如參數(shù)和梯度的網(wǎng)絡(luò)收發(fā)。2. 隨著DNN模型復(fù)雜性的的進(jìn)一步提升，CPU的計(jì)算速度開(kāi)始捉襟見(jiàn)肘。隨著業(yè)務(wù)的快速增長(zhǎng)，日活用戶增多，對(duì)其調(diào)用數(shù)量快速增加，給推薦系統(tǒng)后臺(tái)帶來(lái)了新的挑戰(zhàn)：1. 模型更加復(fù)雜，計(jì)算量更大，但是參數(shù)服務(wù)器的分布式架構(gòu)有效計(jì)算比很低。2. 海量Embedding因?yàn)橐?guī)模龐大，查詢和聚合計(jì)算難以有效利用GPU高性能顯存和算力的優(yōu)勢(shì)。

GPU助力提升模型訓(xùn)練和推理性價(jià)比

基于以上的挑戰(zhàn)，騰訊PCG（平臺(tái)與內(nèi)容事業(yè)群）選擇使用基于NVIDIA A100 GPU的分布式系統(tǒng)架構(gòu)來(lái)創(chuàng)建無(wú)量推薦系統(tǒng)。

1. 通過(guò)多級(jí)存儲(chǔ)和Pipeline優(yōu)化，在HPC上完成大規(guī)模推薦模型的GPU的高性能訓(xùn)練。2. 基于特征訪問(wèn)Power-law分布的特性，GPU緩存高頻特征參數(shù)，同時(shí)從CPU中動(dòng)態(tài)獲取低頻特征參數(shù)，實(shí)現(xiàn)了大規(guī)模推薦模型完整的GPU端到端模型推理。

騰訊PCG有多種類(lèi)型的推薦業(yè)務(wù)場(chǎng)景。比如信息流推薦的QQ瀏覽器、QQ看點(diǎn)、新聞推薦的騰訊新聞、視頻推薦的騰訊視頻、微視、App推薦的應(yīng)用寶、以及騰訊音樂(lè)的音樂(lè)推薦和閱文集團(tuán)的文學(xué)推薦。

無(wú)量推薦系統(tǒng)承載了這些推薦業(yè)務(wù)場(chǎng)景的模型訓(xùn)練和推理服務(wù)。基于傳統(tǒng)的推薦系統(tǒng)架構(gòu)，無(wú)量推薦系統(tǒng)使用大量CPU資源，通過(guò)分布式架構(gòu)可以擴(kuò)展到TB級(jí)模型的訓(xùn)練和部署，取得了巨大的成功。隨著業(yè)務(wù)的快速增長(zhǎng)，日活用戶增多，對(duì)其調(diào)用數(shù)量快速增加，傳統(tǒng)架構(gòu)局限性限制了推薦系統(tǒng)的架構(gòu)擴(kuò)展和性能提升。

通過(guò)使用GPU訓(xùn)練和推理，單機(jī)多卡的GPU算力可以達(dá)到數(shù)十臺(tái)CPU機(jī)器的算力，節(jié)省了大量的額外分布式開(kāi)銷(xiāo)。通過(guò)充分利用A100 GPU高性能顯存快速訪問(wèn)Embedding，以及并行算力處理DNN推理，單張A100 GPU可以在相同的延遲下推理10倍于CPU的打分樣本。目前基于GPU的推薦架構(gòu)可以提升模型訓(xùn)練和推理性價(jià)比1~3倍。

未來(lái)，無(wú)量推薦系統(tǒng)將不斷優(yōu)化推薦模型在GPU上的應(yīng)用，利用HPC多機(jī)多卡，混合精度等能力，進(jìn)一步提高推薦場(chǎng)景使用GPU的性價(jià)比。

重磅！NVIDIA行業(yè)微站一睹為快！內(nèi)容涵蓋NVIDIA主要的12大行業(yè)方案，以及NVIDIA當(dāng)期重點(diǎn)產(chǎn)品資料。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106448

原文標(biāo)題：NVIDIA A100 GPU助力騰訊PCG加速無(wú)量推薦系統(tǒng)

文章出處：【微信號(hào)：murata-eetrend，微信公眾號(hào)：murata-eetrend】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

NVIDIA GPU助力提升模型訓(xùn)練和推理性價(jià)比

評(píng)論