99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用Apache Spark和RAPIDS Apache加速Spark實(shí)踐

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:William Benton ? 2022-04-26 17:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是描述預(yù)測(cè)客戶流失的端到端藍(lán)圖的系列文章的第三部分。在前幾期文章中,我們已經(jīng)討論了機(jī)器學(xué)習(xí)系統(tǒng)的一些挑戰(zhàn),這些挑戰(zhàn)直到您投入生產(chǎn)時(shí)才會(huì)出現(xiàn):在 第一期付款 中,我們介紹了我們的用例,并描述了一個(gè)加速的數(shù)據(jù)聯(lián)合管道;在 第二期 中,我們展示了高級(jí)分析如何適應(yīng)機(jī)器學(xué)習(xí)生命周期的其余部分。

在第三期文章中,我們將介紹應(yīng)用程序的分析和聯(lián)合組件,并解釋如何充分利用 Apache Spark 和 RAPIDS Apache 加速器 Spark 的一些最佳實(shí)踐。

架構(gòu)( Architecture )評(píng)審

An architecture diagram showing a federation and analytics application that takes five database tables and produces one table and a set of reports, a model training application that takes the federated table and the reports and produces a model, and a production inference application that serves the model.

圖 1 :我們的藍(lán)圖架構(gòu)的高級(jí)概述。

回想一下,我們的 blueprint 應(yīng)用程序(圖 1 )包括一個(gè)聯(lián)邦工作負(fù)載和一對(duì)分析工作負(fù)載。

聯(lián)合工作負(fù)載 生成了一個(gè)關(guān)于每個(gè)客戶的非規(guī)范化寬數(shù)據(jù)表,這些數(shù)據(jù)來(lái)自于五個(gè)與客戶賬戶不同方面相關(guān)的規(guī)范化觀察表的數(shù)據(jù)匯總。

第一次分析工作量 為每個(gè)特性生成一個(gè)機(jī)器可讀的值分布和域的摘要報(bào)告。

第二次分析工作量 生成一系列關(guān)于客戶結(jié)果的說(shuō)明性業(yè)務(wù)報(bào)告 我們的第一期 包含有關(guān)聯(lián)合工作負(fù)載的其他詳細(xì)信息, 我們的第二期 包含有關(guān)分析工作負(fù)載的其他詳細(xì)信息。

我們將這三個(gè)工作負(fù)載作為一個(gè)具有多個(gè)階段的 Spark 應(yīng)用程序來(lái)實(shí)現(xiàn):

應(yīng)用程序?qū)?HDFS 中多個(gè)表(存儲(chǔ)為拼花文件)的原始數(shù)據(jù)聯(lián)合到一個(gè)寬表中。

因?yàn)閷挶肀仍紨?shù)據(jù)小得多,所以應(yīng)用程序然后通過(guò)合并到較少的分區(qū)并將數(shù)值轉(zhuǎn)換為適合 ML 模型訓(xùn)練的類型來(lái)重新格式化寬輸出。此階段的輸出是 ML 模型訓(xùn)練的源數(shù)據(jù)。

然后,應(yīng)用程序針對(duì)合并和轉(zhuǎn)換的寬表運(yùn)行分析工作負(fù)載,首先生成機(jī)器可讀的摘要報(bào)告,然后生成匯總和數(shù)據(jù)立方體報(bào)告的集合。

性能注意事項(xiàng)

并行執(zhí)行

50 多年來(lái),提高并行執(zhí)行的適用性一直是計(jì)算機(jī)系統(tǒng)高性能最重要的考慮因素之一 ( 我們有點(diǎn)武斷地選擇在 1967 年確定 托馬蘇洛算法 的開(kāi)發(fā),它為無(wú)處不在的超標(biāo)量處理奠定了基礎(chǔ),因?yàn)樵谶@一點(diǎn)上,對(duì)并行性的關(guān)注變得實(shí)用而不僅僅是理論上的。)在分析員、數(shù)據(jù)科學(xué)家、數(shù)據(jù)和 ML 工程師以及應(yīng)用程序開(kāi)發(fā)人員的日常工作中,對(duì)并行性的關(guān)注通常表現(xiàn)為以下幾種方式之一;我們現(xiàn)在來(lái)看看。

向外擴(kuò)展時(shí),在集群上執(zhí)行工作

如果您使用的是橫向擴(kuò)展框架,請(qǐng)盡可能在集群上而不是在單個(gè)節(jié)點(diǎn)上執(zhí)行工作。在 Spark 的情況下,這意味著在執(zhí)行器上執(zhí)行 Spark 作業(yè)中的代碼,而不是在驅(qū)動(dòng)程序上執(zhí)行串行代碼。 一般來(lái)說(shuō),在驅(qū)動(dòng)程序中使用 Spark 的 API 而不是宿主語(yǔ)言代碼將使您獲得大部分的成功,但是您需要確保所使用的 Spark API 實(shí)際上是在執(zhí)行器上并行執(zhí)行的。

操作集合,而不是元素;在列上,而不是行上

開(kāi)發(fā)并行性和提高性能的一般最佳實(shí)踐是使用一次對(duì)集合執(zhí)行操作的專用庫(kù),而不是一次對(duì)元素執(zhí)行操作。在 Spark 的情況下,這意味著使用數(shù)據(jù)幀和列操作,而不是迭代 rdd 分區(qū)中的記錄;在 Python 數(shù)據(jù)生態(tài)系統(tǒng)和 RAPIDS 。 ai 中,這意味著使用在單個(gè)庫(kù)調(diào)用中對(duì)整個(gè)數(shù)組和矩陣進(jìn)行操作的 矢量化操作 ,而不是在 Python 中使用顯式循環(huán)。最關(guān)鍵的是,這兩種方法也適用于 GPU 加速。

分?jǐn)?I / O 和數(shù)據(jù)加載的成本

I / O 和數(shù)據(jù)加載成本很高,因此在盡可能多的并行操作中分?jǐn)偹鼈兊某杀臼怯幸饬x的。 我們可以通過(guò)直接降低數(shù)據(jù)傳輸成本和在數(shù)據(jù)加載后盡可能多地處理數(shù)據(jù)來(lái)提高性能。在 Spark 中,這意味著使用列格式,在從穩(wěn)定存儲(chǔ)導(dǎo)入時(shí)只過(guò)濾一次關(guān)系,并在 I / O 或無(wú)序操作之間執(zhí)行盡可能多的工作。

通過(guò)抽象提高性能

一般來(lái)說(shuō),提高分析師和開(kāi)發(fā)人員在應(yīng)用程序、查詢和報(bào)表中使用的抽象級(jí)別,可以讓運(yùn)行時(shí)和框架找到開(kāi)發(fā)人員沒(méi)有(或無(wú)法)預(yù)料到的并行執(zhí)行機(jī)會(huì)。

使用 Spark 的數(shù)據(jù)幀

例如,在 Spark 中使用數(shù)據(jù)幀并主要針對(duì)高級(jí)數(shù)據(jù)幀 API 進(jìn)行開(kāi)發(fā)有許多好處,包括執(zhí)行速度更快、查詢的語(yǔ)義保持優(yōu)化、對(duì)存儲(chǔ)和 I / O 的需求減少,以及相對(duì)于使用基于 RDD 的代碼顯著改善了內(nèi)存占用。但除了這些好處之外,還有一個(gè)更深層次的優(yōu)勢(shì):因?yàn)閿?shù)據(jù)幀接口是高級(jí)的,而且 Spark 允許插件改變查詢優(yōu)化器的行為,所以 RAPIDS Apache 加速器 Spark 有可能用在 GPU 上運(yùn)行的等效但實(shí)際上更快的操作替換某些數(shù)據(jù)幀操作。

透明加速 Spark 查詢

用插件替換 Spark 的查詢規(guī)劃器的一些功能是抽象能力的一個(gè)特別引人注目的例子:在能夠在 GPU 上運(yùn)行 Spark 查詢之前幾年編寫(xiě)的應(yīng)用程序仍然可以通過(guò)使用 Spark 3 。 1 和 RAPIDS 加速器來(lái)利用 GPU 加速。

保持清晰的抽象

盡管使用新的運(yùn)行時(shí)加速未修改的應(yīng)用程序的潛力是針對(duì)高級(jí)抽象進(jìn)行開(kāi)發(fā)的一個(gè)主要優(yōu)勢(shì),但實(shí)際上,對(duì)于開(kāi)發(fā)團(tuán)隊(duì)來(lái)說(shuō),維護(hù)清晰的抽象很少比按時(shí)交付工作項(xiàng)目更重要。由于多種原因,抽象背后的細(xì)節(jié)常常會(huì)泄漏到產(chǎn)品代碼中;雖然這可能會(huì)引入技術(shù)債務(wù)并產(chǎn)生無(wú)數(shù)工程后果,但它也會(huì)限制高級(jí)運(yùn)行時(shí)的適用性,以優(yōu)化干凈地使用抽象的程序。

考慮適合 GPU 加速的操作

為了從 Spark 中獲得最大的收益,在圍繞 Spark 的數(shù)據(jù)幀抽象的應(yīng)用程序中償還技術(shù)債務(wù)(例如,通過(guò)將部分查詢實(shí)現(xiàn)為 RDD 操作)是有意義的。 不過(guò),為了充分利用先進(jìn)的基礎(chǔ)設(shè)施,在不破壞抽象的情況下考慮執(zhí)行環(huán)境的細(xì)節(jié)通常是有意義的。 為了從 NVIDIA GPU 和 RAPIDS Apache 加速器 Spark 獲得盡可能好的性能,首先要確保您的代碼不會(huì)圍繞抽象工作,然后考慮或多或少適合 GPU 執(zhí)行的類型和操作,這樣您就可以確保盡可能多的應(yīng)用程序在 GPU 上運(yùn)行。下面我們將看到一些這樣的例子。

類型和操作

并不是每一個(gè)操作都能被 GPU 加速。當(dāng)有疑問(wèn)時(shí),運(yùn)行作業(yè)時(shí)將 spark.rapids.sql.explain 設(shè)置為 NOT_ON_GPU 并檢查記錄到標(biāo)準(zhǔn)輸出的解釋總是有意義的。在本節(jié)中,我們將指出一些常見(jiàn)的陷阱,包括需要配置支持的十進(jìn)制算法和操作。

小心十進(jìn)制算術(shù)

十進(jìn)制計(jì)算機(jī)算法支持高達(dá)給定精度限制的精確運(yùn)算,可以避免和檢測(cè)溢出,并像人類在執(zhí)行鉛筆和紙張計(jì)算時(shí)那樣舍入數(shù)字。盡管十進(jìn)制算法是許多數(shù)據(jù)處理系統(tǒng)(尤其是金融數(shù)據(jù))的重要組成部分,但它對(duì)分析系統(tǒng)提出了特殊的挑戰(zhàn)。為了避免溢出,十進(jìn)制運(yùn)算的結(jié)果必須擴(kuò)大到包括所有可能的結(jié)果;在結(jié)果比系統(tǒng)特定限制更寬的情況下,系統(tǒng)必須檢測(cè)溢出。在 cpu 上使用 Spark 的情況下,這涉及將操作委托給 Java 標(biāo)準(zhǔn)庫(kù)中的 BigDecimal 類 ,并且精度限制為 38 位十進(jìn)制數(shù)字或 128 位。 Apache 的 RAPIDS 加速器 Spark 目前可以加速計(jì)算多達(dá) 18 位或 64 位的十進(jìn)制值。

我們已經(jīng)評(píng)估了客戶流失藍(lán)圖的兩種配置:一種使用浮點(diǎn)值表示貨幣金額(如我們?cè)?第一期 中所描述的那樣),另一種使用十進(jìn)制值表示貨幣金額(這是我們當(dāng)前報(bào)告的性能數(shù)字所針對(duì)的配置)。由于其語(yǔ)義和健壯性,十進(jìn)制算法比浮點(diǎn)算法成本更高,但只要所涉及的所有十進(jìn)制類型都在 64 位以內(nèi),就可以通過(guò) RAPIDS 加速器插件來(lái)加速。

配置 RAPIDS 加速器以啟用更多操作

RAPIDS 加速器對(duì)于在 GPU 上執(zhí)行 MIG ht 表現(xiàn)出較差性能或返回與基于 CPU 的加速器略有不同的結(jié)果的操作持保守態(tài)度。因此,一些可以加速的操作在默認(rèn)情況下可能不會(huì)加速,許多實(shí)際應(yīng)用程序需要使這些操作能夠看到最佳性能。我們?cè)?我們的第一期 中看到了這種現(xiàn)象的一個(gè)例子,其中我們必須通過(guò)將 true 設(shè)置為 true ,在 Spark 配置中顯式啟用浮點(diǎn)聚合操作。類似地,當(dāng)我們將工作負(fù)載配置為使用十進(jìn)制算法時(shí),我們需要通過(guò)將 spark.rapids.sql.decimalType.enabled 設(shè)置為 true 來(lái)啟用十進(jìn)制加速。

插件文檔 列出了配置支持或不支持的操作,以及在默認(rèn)情況下啟用或禁用某些操作的原因。除了浮點(diǎn)聚合和十進(jìn)制支持之外,生產(chǎn) Spark 工作負(fù)載極有可能受益于以下幾類操作:

鑄造作業(yè) ,特別是從字符串到日期或數(shù)字類型,或從浮點(diǎn)類型到十進(jìn)制類型。

某些 Unicode 字符不支持字符串大小寫(xiě)(例如“ SELECT UPPER(name) FROM EMPLOYEES ”),更改大小寫(xiě)也會(huì)更改字符寬度(以字節(jié)為單位),但許多應(yīng)用程序不使用此類字符[或者通過(guò)將 Spark 。 RAPIDS 。 sql 。 compatibleops 。 enabled 設(shè)置為 true 來(lái)啟用它們和其他幾個(gè)。

從 CSV 文件中讀取特定類型;雖然插件( Spark 。 RAPIDS 。 sql 。 format 。 CSV 。 enabled )中當(dāng)前默認(rèn)啟用了讀取 CSV 文件,但讀取某些類型的無(wú)效值(尤其是數(shù)字類型、日期和小數(shù))在 GPU 和 CPU 上會(huì)有不同的行為,因此需要單獨(dú)啟用每個(gè)類型的讀取。

加快從 CSV 文件接收數(shù)據(jù)

CSV 閱讀需要額外的注意:它是昂貴的,加速它可以提高許多工作的性能。然而,由于在 RAPIDS 加速器下讀取 CSV 的行為可能與在 cpu 上執(zhí)行時(shí)的 Spark 行為不同,并且由于實(shí)際 CSV 文件質(zhì)量的巨大動(dòng)態(tài)范圍,因此驗(yàn)證在 GPU 上讀取 CSV 文件的結(jié)果尤為重要。一個(gè)快速但有價(jià)值的健全性檢查是確保在 GPU 上讀取 CSV 文件返回的空值數(shù)與在 CPU 上讀取相同的文件返回的空值數(shù)相同。當(dāng)然,如果可能的話,使用像 Parquet 或 ORC 這樣的自文檔結(jié)構(gòu)化輸入格式而不是 CSV 有很多好處。

避免查詢優(yōu)化的意外后果

RAPIDS 加速器將 物理查詢計(jì)劃 轉(zhuǎn)換為將某些操作符委派給 GPU 。 但是,在 Spark 生成物理計(jì)劃時(shí),它已經(jīng)對(duì)邏輯計(jì)劃執(zhí)行了幾個(gè)轉(zhuǎn)換,這可能涉及重新排序操作。 因此,開(kāi)發(fā)人員或分析人員聲明的接近查詢或數(shù)據(jù)幀操作末尾的操作可能會(huì)從查詢計(jì)劃的葉移向根。

A diagram of a database query execution. The first step shows joining two input relations; the second step shows the output of joining these two relations; the third shows the result of filtering the join output, producing in relatively few records.

圖 2 : 一種執(zhí)行數(shù)據(jù)幀查詢的描述,該查詢連接兩個(gè)數(shù)據(jù)幀,然后過(guò)濾結(jié)果。 如果謂詞具有足夠的選擇性,則大多數(shù)輸出元組將被丟棄。

A diagram of a database query execution. The first step shows filtering the first input relation; the second step shows filtering the second input relation; and the third shows joining the results of filtering the two input relations, resulting in relatively few records.

圖 3 : 執(zhí)行數(shù)據(jù)幀查詢的描述,在連接結(jié)果之前過(guò)濾兩個(gè)輸入關(guān)系。 如果可以對(duì)每個(gè)輸入關(guān)系獨(dú)立地計(jì)算謂詞,那么此查詢執(zhí)行將產(chǎn)生與圖 2 中的查詢執(zhí)行相同的結(jié)果,效率將大大提高。

一般來(lái)說(shuō),這種轉(zhuǎn)換可以提高性能。 例如,考慮一個(gè)查詢,該查詢連接兩個(gè)數(shù)據(jù)幀,然后過(guò)濾結(jié)果: 如果可能的話,在執(zhí)行連接之前執(zhí)行過(guò)濾器通常會(huì)更有效。 這樣做將減少連接的基數(shù),消除最終不必要的比較,減少內(nèi)存壓力,甚至可能減少連接中需要考慮的數(shù)據(jù)幀分區(qū)的數(shù)量。 然而,這種優(yōu)化可能會(huì)產(chǎn)生違反直覺(jué)的后果: 如果向查詢計(jì)劃的根移動(dòng)的操作僅在 CPU 上受支持,或者如果它生成的值的類型在 GPU 上不受支持,則主動(dòng)查詢重新排序可能會(huì)對(duì) GPU 的性能產(chǎn)生負(fù)面影響。 當(dāng)這種情況發(fā)生時(shí),在 CPU 上執(zhí)行的查詢計(jì)劃的百分比可能比嚴(yán)格需要的要大。 您通??梢越鉀Q這個(gè)問(wèn)題,并通過(guò)將查詢劃分為兩個(gè)分別執(zhí)行的部分來(lái)提高性能,從而強(qiáng)制在查詢計(jì)劃的葉子附近僅 CPU 的操作僅在原始查詢的可加速部分在 GPU 上運(yùn)行之后執(zhí)行。

結(jié)論

在第三期文章中,我們?cè)敿?xì)介紹了如何充分利用 Apache Spark 和 Apache RAPIDS 加速器 Spark 。 大多數(shù)團(tuán)隊(duì)都會(huì)通過(guò)干凈地使用 Spark 的數(shù)據(jù)幀抽象來(lái)實(shí)現(xiàn)最大的好處。 但是,一些應(yīng)用程序可能會(huì)受益于細(xì)微的調(diào)整,特別是考慮 RAPIDS 加速器的執(zhí)行模型并避免不受支持的操作的保留語(yǔ)義的代碼更改。 未來(lái)幾期文章將討論數(shù)據(jù)科學(xué)發(fā)現(xiàn)工作流和機(jī)器學(xué)習(xí)生命周期的其余部分。

關(guān)于作者

William Benton在NVIDIA數(shù)據(jù)科學(xué)產(chǎn)品小組工作,他熱衷于使機(jī)器學(xué)習(xí)從業(yè)人員可以輕松地從先進(jìn)的基礎(chǔ)架構(gòu)中受益,并使組織可以管理機(jī)器學(xué)習(xí)系統(tǒng)。 在擔(dān)任過(guò)以前的職務(wù)時(shí),他定義了與數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)有關(guān)的產(chǎn)品戰(zhàn)略和專業(yè)服務(wù)產(chǎn)品,領(lǐng)導(dǎo)了數(shù)據(jù)科學(xué)家和工程師團(tuán)隊(duì),并為與數(shù)據(jù),機(jī)器學(xué)習(xí)和分布式系統(tǒng)有關(guān)的開(kāi)源社區(qū)做出了貢獻(xiàn)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    826

    瀏覽量

    39038
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5284

    瀏覽量

    106125
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134394
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    GPU 上,F(xiàn)5-TTS 模型每秒可生成長(zhǎng)達(dá) 25 秒的音頻;Spark-TTS 在流式合成場(chǎng)景下,首包延遲可低至 200 余毫秒。
    的頭像 發(fā)表于 06-12 15:37 ?484次閱讀
    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳<b class='flag-5'>實(shí)踐</b>

    Tomcat服務(wù)器使用指南

    Tomcat是由Java編寫(xiě)的一個(gè)開(kāi)源的、輕量級(jí)的應(yīng)用服務(wù)器,是Apache軟件基金會(huì)的一個(gè)項(xiàng)目。它實(shí)現(xiàn)了Java Servlet、JavaServer Pages(JSP)和Java
    的頭像 發(fā)表于 06-09 16:26 ?356次閱讀

    NVIDIA發(fā)布AI優(yōu)先DGX個(gè)人計(jì)算系統(tǒng)

    NVIDIA 宣布,多家行業(yè)領(lǐng)先系統(tǒng)制造商將打造 NVIDIA DGX Spark。
    的頭像 發(fā)表于 05-22 09:39 ?259次閱讀

    NVIDIA加速Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項(xiàng)目,通過(guò)采用 NVIDIA 加速Apache Spark 企業(yè)得以自動(dòng)加速其數(shù)據(jù)中心規(guī)模的分析工作負(fù)載,從而節(jié)省數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 03-25 15:09 ?509次閱讀
    NVIDIA<b class='flag-5'>加速</b>的<b class='flag-5'>Apache</b> <b class='flag-5'>Spark</b>助力企業(yè)節(jié)省大量成本

    NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個(gè)人AI計(jì)算機(jī)

    臺(tái)式超級(jí)計(jì)算機(jī)由 NVIDIA Grace Blackwell 驅(qū)動(dòng),為開(kāi)發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計(jì)算機(jī)制造商(包括華碩、Dell Technologies、HP
    的頭像 發(fā)表于 03-20 18:59 ?858次閱讀
    NVIDIA GTC2025 亮點(diǎn)  NVIDIA推出 DGX <b class='flag-5'>Spark</b>個(gè)人AI計(jì)算機(jī)

    NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

    臺(tái)式超級(jí)計(jì)算機(jī)由 NVIDIA Grace Blackwell 驅(qū)動(dòng),為開(kāi)發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計(jì)算機(jī)制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?314次閱讀
       NVIDIA 宣布推出 DGX <b class='flag-5'>Spark</b> 個(gè)人 AI 計(jì)算機(jī)

    元戎啟行最新戰(zhàn)略RoadAGI:所有移動(dòng)智能體都將被AI驅(qū)動(dòng)

    人工智能平臺(tái)——AI Spark(以下簡(jiǎn)稱"Spark平臺(tái)")。 ? *元戎啟行的RoadAGI戰(zhàn)略 ? RoadAGI是元戎啟行實(shí)現(xiàn)物理世界通用人工智能的關(guān)鍵一步,旨在讓包括智能駕駛汽車(chē)在內(nèi)的移動(dòng)智能體,都具有在道路上自主行駛、與物理世界深度交互的能力。其中,
    發(fā)表于 03-18 15:14 ?257次閱讀
    元戎啟行最新戰(zhàn)略RoadAGI:所有移動(dòng)智能體都將被AI驅(qū)動(dòng)

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無(wú)法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    華為云 Flexus X 加速 Redis 案例實(shí)踐與詳解

    的 Redis 加速鏡像,更是為開(kāi)發(fā)者提供了極大的便利。本文將詳細(xì)介紹如何利用華為云 Flexus X 實(shí)例自帶的 Redis 鏡像,快速部署并配置 Redis,以及通過(guò)實(shí)際案例展示其便捷性和高效性。 一、華為云 Flexus X 加速
    的頭像 發(fā)表于 01-23 17:52 ?311次閱讀
    華為云 Flexus X <b class='flag-5'>加速</b> Redis 案例<b class='flag-5'>實(shí)踐</b>與詳解

    華為云 FlexusX 實(shí)例下的 Kafka 集群部署實(shí)踐與性能優(yōu)化

    前言 華為云 FlexusX 實(shí)例,以創(chuàng)新的柔性算力技術(shù),為 Kafka 集群部署帶來(lái)前所未有的性能飛躍。其靈活的 CPU 與內(nèi)存配比,結(jié)合智能調(diào)度與加速技術(shù),讓 Kafka 在高并發(fā)場(chǎng)景下依然
    的頭像 發(fā)表于 01-07 17:23 ?412次閱讀
    華為云 FlexusX 實(shí)例下的 Kafka 集群部署<b class='flag-5'>實(shí)踐</b>與性能優(yōu)化

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?624次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫(kù)研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開(kāi)發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫(kù),是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?828次閱讀
    <b class='flag-5'>利用</b>NVIDIA <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺(tái)提升計(jì)算性能

    spark為什么比mapreduce快?

    spark為什么比mapreduce快? 首先澄清幾個(gè)誤區(qū): 1:兩者都是基于內(nèi)存計(jì)算的,任何計(jì)算框架都肯定是基于內(nèi)存的,所以網(wǎng)上說(shuō)的spark是基于內(nèi)存計(jì)算所以快,顯然是錯(cuò)誤的 2;DAG計(jì)算模型
    的頭像 發(fā)表于 09-06 09:45 ?496次閱讀

    上線 Airflow 官方!DolphinDB 帶來(lái)數(shù)據(jù)管理新體驗(yàn)

    DolphinDB 正式登陸 Apache Airflow 官方,成為 Airflow 官方認(rèn)可的第三方插件及工具供應(yīng)商。Apache Airflow 是一個(gè)可編程、調(diào)度和監(jiān)控的工作流管理平臺(tái),以其模塊化的架構(gòu)和動(dòng)態(tài)定義數(shù)據(jù)管道的能力著稱,能夠靈活調(diào)度和管理各種工作流任務(wù)
    的頭像 發(fā)表于 08-23 17:00 ?538次閱讀
    上線 Airflow 官方!DolphinDB 帶來(lái)數(shù)據(jù)管理新體驗(yàn)

    廣汽能源與泰國(guó)Spark EV簽訂合作框架協(xié)議

    近日,廣汽能源科技(泰國(guó))有限公司與Spark EV Co.Ltd.宣布達(dá)成重要合作,雙方共同簽署了一項(xiàng)合作框架協(xié)議,旨在泰國(guó)境內(nèi)全面布局并運(yùn)營(yíng)超級(jí)充電場(chǎng)站,為新能源汽車(chē)的普及與發(fā)展注入強(qiáng)勁動(dòng)力。
    的頭像 發(fā)表于 07-19 17:08 ?1115次閱讀