99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-09-09 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DolphinDB 是一家高性能數(shù)據(jù)庫(kù)研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫(kù),是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。

DolphinDB 公司推出的 CPU-GPU 異構(gòu)計(jì)算平臺(tái) Shark,將 DolphinDB 上的復(fù)雜指標(biāo)計(jì)算能力無縫切換到 GPU 算力平臺(tái),從而大幅提升了計(jì)算性能。

DolphinDB 開發(fā)團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作,通過利用NVIDIA RAPIDS加速 Shark 異構(gòu)計(jì)算平臺(tái)的因子挖掘算法運(yùn)行效率,幫助 Shark 將因子挖掘的效率提升 2 - 10 倍,并基于NVIDIA cuDF實(shí)現(xiàn) Shark 因子高效計(jì)算,大幅減少開發(fā)成本,縮短開發(fā)周期。

RAPIDS 的 RMM 是一套開源的內(nèi)存/顯存管理庫(kù),提供 C++Python 接口,相比 cuMalloc、cuFree 等操作來講,具有更好的性能和靈活性;RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 庫(kù),提供了基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),并且內(nèi)置了基礎(chǔ)的函數(shù)算子。

Shark 的因子挖掘功能,能通過利用遺傳算法從數(shù)據(jù)中挖掘出有效的因子。在這一場(chǎng)景中,遺傳算法會(huì)隨機(jī)生成大量因子并進(jìn)行計(jì)算。這一過程會(huì)頻繁地創(chuàng)建和釋放臨時(shí)空間來存儲(chǔ)中間結(jié)果,直接使用原生的 CUDA C 顯存分配和釋放接口,會(huì)嚴(yán)重降低執(zhí)行效率。

Shark 的因子計(jì)算功能,針對(duì)金融領(lǐng)域的數(shù)據(jù)分析與處理,提供了豐富的函數(shù)庫(kù)。如果從零開始將 CPU 的函數(shù)遷移至 GPU,需要為 GPU 重新實(shí)現(xiàn)一套底層數(shù)據(jù)結(jié)構(gòu)以及基礎(chǔ)計(jì)算函數(shù),會(huì)導(dǎo)致開發(fā)周期的延長(zhǎng)以及開發(fā)成本的增加。

基于以上挑戰(zhàn),DolphinDB 開發(fā)團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)及 RAPIDS 開發(fā)團(tuán)隊(duì)合作,通過利用 RAPIDS RMM,解決因子挖掘過程中頻繁申請(qǐng)和釋放顯存導(dǎo)致的性能問題;通過基于 RAPIDS libcudf 進(jìn)行二次開發(fā),實(shí)現(xiàn)因子計(jì)算,從而縮短開發(fā)周期,降低開發(fā)成本。

Shark 進(jìn)行因子挖掘時(shí),會(huì)通過遺傳算法隨機(jī)生成海量的因子計(jì)算公式。這些公式長(zhǎng)度不等,接受的參數(shù)數(shù)量也不盡相同。因此在計(jì)算時(shí),需要頻繁地申請(qǐng)和釋放臨時(shí)空間用于存儲(chǔ)中間結(jié)果。DolphinDB 開發(fā)團(tuán)隊(duì)通過使用 RMM 對(duì)顯存進(jìn)行池化,從而對(duì)中間結(jié)果所使用的顯存進(jìn)行高效地分配、釋放和重用。

Shark 支持用戶輸入自定義的公式,自動(dòng)將自定義公式轉(zhuǎn)換為計(jì)算圖,并在 GPU 完成計(jì)算,從而加快數(shù)據(jù)分析和處理的效率。如果從零開始將 DolphinDB 的計(jì)算函數(shù)遷移至 Shark,則需要在 GPU 構(gòu)建 array、table 等底層數(shù)據(jù)結(jié)構(gòu),并實(shí)現(xiàn)大量基礎(chǔ)計(jì)算函數(shù)。經(jīng)過調(diào)研后,DolphinDB 開發(fā)團(tuán)隊(duì)決定基于 RAPIDS libcudf 進(jìn)行二次開發(fā),復(fù)用 cuDF 的 column、table 等底層數(shù)據(jù)結(jié)構(gòu),并借助 cuDF 的 groupby 和 rolling 框架,只需要完成算子的核心計(jì)算邏輯,即可完成 DolphinDB 時(shí)序算子和橫截面算子的遷移,這樣不僅極大提升了開發(fā)效率,還降低了開發(fā)成本。

下圖展示了在不同規(guī)模數(shù)據(jù)下,使用 RAPIDS 的 RMM 顯存管理庫(kù)相對(duì)于原生的 CUDA 顯存分配 API,Shark 因子挖掘效率的對(duì)比??梢郧宄乜吹?,使用 RMM 可以顯著提升 Shark 因子挖掘效率,最高可達(dá)到 10 倍的加速比。

50de12f3c871da8be6a7494a93111a82.png

除此之外,Shark 通過使用 RAPIDS libcudf,大大提升了因子的計(jì)算效率。下圖中對(duì)比了 1000 個(gè) group,每個(gè) group 有 10 萬(wàn)行的數(shù)據(jù),采用分組方式計(jì)算下面的算子。可以看到與 CPU 相比,利用 GPU 總體耗時(shí)(包含拷貝時(shí)間),基本達(dá)到了一個(gè)數(shù)量級(jí)的加速比。

75c03a398e3c2fe4ee975f744d834f86.png

借助 RAPIDS ,Shark 的因子挖掘效率提升了 10 倍。除此之外,基于 cuDF 進(jìn)行二次開發(fā),只需要實(shí)現(xiàn)算子的核心邏輯,就可以達(dá)到一個(gè)數(shù)量級(jí)的加速,并極大降低了算子遷移成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106452
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131283
  • 數(shù)據(jù)庫(kù)
    +關(guān)注

    關(guān)注

    7

    文章

    3927

    瀏覽量

    66273

原文標(biāo)題:NVIDIA RAPIDS 助力 Shark 平臺(tái)實(shí)現(xiàn)高效數(shù)據(jù)挖掘和計(jì)算

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷及物流等方面的運(yùn)營(yíng)效率。
    的頭像 發(fā)表于 06-19 14:36 ?490次閱讀

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA Blackwell加速計(jì)算機(jī)輔助工程軟件,實(shí)現(xiàn)實(shí)時(shí)數(shù)字孿生性能數(shù)量級(jí)提升

    、Altair、Cadence、Siemens 和 Synopsys 等在內(nèi)的領(lǐng)先計(jì)算機(jī)輔助工程(CAE)軟件供應(yīng)商正在使用 NVIDIA Blackwell 平臺(tái)加速其仿真工具,速度
    的頭像 發(fā)表于 03-21 15:12 ?682次閱讀

    GPU加速計(jì)算平臺(tái)的優(yōu)勢(shì)

    傳統(tǒng)的CPU雖然在日常計(jì)算任務(wù)中表現(xiàn)出色,但在面對(duì)大規(guī)模并行計(jì)算需求時(shí),其性能往往捉襟見肘。而GPU加速計(jì)算
    的頭像 發(fā)表于 02-23 16:16 ?434次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速計(jì)算的未來

    越來越多的企業(yè)開始采用加速計(jì)算,從而滿足生成式 AI、5G 電信和主權(quán)云的需求。NVIDIA 推出了 DOCA 平臺(tái)框架(DPF),該框架提供了基礎(chǔ)構(gòu)建模塊來釋放
    的頭像 發(fā)表于 01-24 09:29 ?723次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> DPF引領(lǐng)DPU<b class='flag-5'>加速</b>云<b class='flag-5'>計(jì)算</b>的未來

    NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺(tái),F(xiàn)inCatch 實(shí)現(xiàn)了投資研究流程的全面智能化,提升數(shù)據(jù)分析速度和準(zhǔn)確性,
    的頭像 發(fā)表于 01-07 09:23 ?511次閱讀

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,
    的頭像 發(fā)表于 12-27 16:24 ?683次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問題,但會(huì)降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計(jì)算需要啟用,可通過命令行
    發(fā)表于 12-16 14:25

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴(kuò)展了 Meta Llama 開源模型集的模型陣容,包含視覺語(yǔ)言模型(VLM)、小語(yǔ)言模型(SLM)和支持視覺的更新版 Llama Guard 模型。與 NVIDIA 加速
    的頭像 發(fā)表于 11-20 09:59 ?806次閱讀

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?664次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    NVIDIA加速計(jì)算如何推動(dòng)醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺(tái)副總裁 Bob Pette 在 AI Summit 一場(chǎng)演講中重點(diǎn)談?wù)摿?NVIDIA 加速計(jì)算如何推動(dòng)醫(yī)療健康
    的頭像 發(fā)表于 11-20 09:10 ?682次閱讀

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)
    的頭像 發(fā)表于 11-19 15:30 ?666次閱讀

    AI高性能計(jì)算平臺(tái)是什么

    AI高性能計(jì)算平臺(tái)不僅是AI技術(shù)發(fā)展的基石,更是推動(dòng)AI應(yīng)用落地、加速產(chǎn)業(yè)升級(jí)的重要工具。以下,是對(duì)AI高性能
    的頭像 發(fā)表于 11-11 09:56 ?709次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)
    的頭像 發(fā)表于 10-25 09:23 ?602次閱讀

    “跨越數(shù)據(jù)邊界:企業(yè)級(jí)實(shí)時(shí)計(jì)算平臺(tái)構(gòu)想——2024 DolphinDB 年度峰會(huì)

    DolphinDB 目前只具備單一集群的運(yùn)維能力,而事實(shí)上,已經(jīng)有數(shù)十家金融客戶在運(yùn)行著 2 個(gè)以上的 DolphinDB 集群。我們會(huì)通過幾個(gè)版本的迭代,提供多集群的運(yùn)維能力。DolphinDB
    的頭像 發(fā)表于 09-11 10:01 ?632次閱讀
    “跨越數(shù)據(jù)邊界:企業(yè)級(jí)實(shí)時(shí)<b class='flag-5'>計(jì)算</b><b class='flag-5'>平臺(tái)</b>構(gòu)想——2024 <b class='flag-5'>DolphinDB</b> 年度峰會(huì)

    以實(shí)時(shí),見未來——DolphinDB 2024 年度峰會(huì)圓滿舉辦

    DolphinDB 還圍繞投研、交易、FICC、數(shù)據(jù)分析、計(jì)算平臺(tái)、AI 前沿等熱門場(chǎng)景,精心設(shè)置了六大路演展臺(tái)。DolphinDB 技術(shù)工程師現(xiàn)場(chǎng)演示了諸多新功能的應(yīng)用 Demo,與
    的頭像 發(fā)表于 09-10 14:14 ?533次閱讀
    以實(shí)時(shí),見未來——<b class='flag-5'>DolphinDB</b> 2024 年度峰會(huì)圓滿舉辦