HPE、IBM、Oracle、開源社區(qū)、創(chuàng)業(yè)公司采用RAPIDS,顯著提升端到端預測數(shù)據(jù)分析能力。
NVIDIA今日發(fā)布了一款針對數(shù)據(jù)科學和機器學習的GPU加速平臺,該平臺已為多個行業(yè)領先者所采用,并能幫助超大規(guī)模公司以前所未有的速度分析海量數(shù)據(jù)并進行精準的業(yè)務預測。
RAPIDS? 開源軟件幫助數(shù)據(jù)科學家顯著地提高了工作績效,對于這些數(shù)據(jù)科學家來說,種種業(yè)務挑戰(zhàn)應接不暇,其中包括預估信用卡詐騙、預測零售存貨及理解顧客購買行為等等。眾多公司——無論是Databricks和Anaconda等開源社區(qū)先驅還是Hewlett Packard Enterprise、IBM和Oracle等技術領袖——在GPU對數(shù)據(jù)分析的重要性方面日益達成共識,并對RAPIDS表現(xiàn)出越來越多的支持。
據(jù)分析師估計,面向數(shù)據(jù)科學和機器學習的服務器市場每年價值約為200億美元,加上科學分析和深度學習市場,高性能計算市場總價值大約為360億美元。
“數(shù)據(jù)分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現(xiàn)加速,”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在GPU技術大會主旨演講中發(fā)布RAPIDS時表示,“全球最大的行業(yè)均在海量服務器上運行機器學習算法,目的在于了解所在市場和環(huán)境中的復雜模式,同時迅速、精準地做出將直接影響其基礎的預測 ?!?/p>
黃仁勛表示,“得益于CUDA及其全球生態(tài)系統(tǒng)以及與開源社區(qū)緊密合作,我們已創(chuàng)建了RAPIDS GPU加速平臺。該平臺已與全球最流行的數(shù)據(jù)科學庫及工作流無縫整合,可加速機器學習。如同深度學習一樣,我們正在不斷地為機器學習提速?!?/p>
RAPIDS已為GPU加速分析和機器學習提供了一整套開源庫,數(shù)據(jù)可視化即將是下一個目標。RAPIDS由NVIDIA工程師與主要的開源貢獻者在過去兩年的合作成果。
RAPIDS第一次為數(shù)據(jù)科學家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學習算法在NVIDIA DGX-2? 系統(tǒng)上進行訓練,結果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍。這可幫助數(shù)據(jù)科學家將典型訓練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘,具體取決于其數(shù)據(jù)集的規(guī)模。
與開源社區(qū)開展緊密合作
RAPIDS構建于Apache Arrow、pandas和scikit-learn等流行的開源項目之上,為最流行的Python數(shù)據(jù)科學工具鏈帶來了GPU提速。為了將更多的機器學習庫和功能引入RAPIDS,NVIDIA廣泛地與開源生態(tài)系統(tǒng)貢獻者展開合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼Apache Arrow締造者Wes McKinney以及迅速增長的Python數(shù)據(jù)科學庫pandas等等。
McKinney表示,“作為GPU加速的數(shù)據(jù)科學平臺,RAPIDS是由Apache Arrow驅動的新一代的計算生態(tài)系統(tǒng)。NVIDIA與Ursa Labs的合作將加速Arrow核心數(shù)據(jù)庫的創(chuàng)新步伐,并有助于大幅提升分析及特征工程的績效。”
為了推動RAPIDS的廣泛應用,NVIDIA正努力將RAPIDS與Apache Spark進行整合,后者是分析及數(shù)據(jù)科學方面領先的開源框架。
Databricks聯(lián)合創(chuàng)始人、首席技術官兼Apache Spark 創(chuàng)始人Matei Zaharia表示,“在Databricks公司中,我們對RAPIDS在加速Apache Spark工作量方面的潛力感到非常興奮。我們目前開展的多個項目都意在將Spark更好地與本地加速器進行整合,其中包括借助Project Hydrogen實現(xiàn)的Apache Arrow的支持以及GPU調度。我們相信,就擴大我們客戶數(shù)據(jù)科學及AI工作量來說,RAPIDS將是全新的、振奮人心的機會?!?/p>
廣泛的生態(tài)系統(tǒng)支持及應用
各個行業(yè)技術領先的企業(yè)均是NVIDIA GPU加速平臺及RAPIDS的率先應用者。
沃爾瑪執(zhí)行副總裁兼首席技術官Jeremy King表示,“NVIDIA的GPU加速平臺及RAPIDS軟件極大改進了我們使用數(shù)據(jù)的方式,幫助我們實現(xiàn)了復雜模式大規(guī)模地運行,同時進行更加精準的預測。RAPIDS的應用得益于NVIDIA和沃爾瑪工程師之間的深度合作,我們準備繼續(xù)推進這種合作關系?!?/p>
此外,一些全球領先的技術公司也力圖通過全新的系統(tǒng)、數(shù)據(jù)科學平臺和軟件解決方案支持RAPIDS:
“HPE致力于改進客戶生活和工作的方式。人工智能、分析和機器學習技術能在揭示洞察方面扮演關鍵的角色,這有助于幫助客戶實現(xiàn)突破性的成果,同時改善我們所生存的世界。HPE提供全面的人工智能和數(shù)據(jù)分析解決方案并在市場中保持獨一無二的優(yōu)勢,其中既包括戰(zhàn)略咨詢,也包括專為特定需求開發(fā)的GPU加速器技術、運行支持以及強大的伙伴生態(tài)系統(tǒng);我們旨在為每位客戶定制合適的解決方案。我們對與NVIDIA在RAPIDS方面的合作感到非常興奮,此舉能加快數(shù)據(jù)科學和機器學習的應用,推動我們的客戶更快地實現(xiàn)更具洞察力的成果?!薄萜掌髽I(yè)首席執(zhí)行官Antonio Neri
“IBM已為企業(yè)人工智能構建了全球領先的、在任何部署模式上均能運行的平臺。我們期望能拓展與NVIDIA已有的成功合作,利用RAPIDS來為客戶提供全新的機器學習工具。”——Hybrid Cloud高級副總裁兼IBM Research董事 Arvind Krishna
“當今的計算領域要要強大的處理能力,以便應對數(shù)據(jù)科學和分析智能等紛繁復雜的工作,而這正是NVIDIA GPU的優(yōu)勢。RAPIDS正在不斷加速處理和機器學習培訓的速度。能在Oracle Cloud Infrastructure上支持這套全新的開源軟件讓我們感到非常興奮,我們也希望能與NVIDIA繼續(xù)合作,以在我們的Oracle Data Science Cloud等各種平臺上支持RAPIDS,并進一步加速客戶端到端數(shù)據(jù)科學工作流。RAPIDS軟件在Oracle Cloud上無縫運行,這使客戶得以支持各種高性能計算、人工智能和數(shù)據(jù)科學需求,同時利用Oracle Cloud Infrastructure 上可獲得的GPU實例組合?!薄狾racle Cloud Infrastructure軟件開發(fā)部門高級副總裁Clay Magouyrk
本新聞稿得到包括Cisco、DELL EMC、聯(lián)想、NERSC, NetApp, Pure Storage, SAP和SAS等其它領先創(chuàng)新者以及諸多數(shù)據(jù)科學先驅的支持。
供貨
全套RAPIDS開源庫現(xiàn)在即可在http://www.rapids.ai上獲得,代碼經(jīng)Apache許可公布。容器化RAPIDS版本本周內可在NVIDIA GPU Cloud container registry (https://www.nvidia.com/en-us/gpu-cloud/)上獲得。
-
NVIDIA
+關注
關注
14文章
5309瀏覽量
106467 -
機器學習
+關注
關注
66文章
8505瀏覽量
134669
原文標題:GTC Europe | NVIDIA針對大規(guī)模數(shù)據(jù)分析和機器學習推出RAPIDS開源GPU加速平臺
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
NVIDIA技術助力歐洲廠商推出機器人系統(tǒng)與平臺
NVIDIA Isaac 是英偉達推出的綜合性機器人開發(fā)平臺
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
GPU加速計算平臺的優(yōu)勢
利用NVIDIA DPF引領DPU加速云計算的未來

NVIDIA發(fā)布Cosmos平臺,加速物理AI開發(fā)
NVIDIA Cosmos世界基礎模型平臺發(fā)布
NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)
《CST Studio Suite 2024 GPU加速計算指南》
將NVIDIA加速計算引入Polars

AMD與NVIDIA GPU優(yōu)缺點
GPU加速計算平臺是什么
利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

NVIDIA全面轉向開源GPU內核模塊

評論