99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenDILab幕后的「孤勇者」:AI研究員、電競冠軍和他們的開源夢

邢強 ? 來源:科技前沿資訊 ? 作者:科技前沿資訊 ? 2022-09-27 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

生物智能的產(chǎn)生,一直以來被定義為「奇跡」和「謎團」。

從宇宙的一片塵埃開始,人類的演化花費了數(shù)十億年的時間。很難想象,你我均起源于出現(xiàn)在地球上的單細胞生物。

時至今日,人類憑借自身的智慧,創(chuàng)造了地球上最繁榮的文明。同時,這一演化仍在繼續(xù),遠沒有走到盡頭。

但演化的方向已經(jīng)悄然改變:下一代文明的方向,將由人類親手創(chuàng)造的「智能體」來探索。

由此引出一個問題:人類智能與人工智能,誰的上限將會更高?

過去數(shù)十年,研究者夙興夜寐,將無數(shù)人類智慧灌注其中,不斷將「人工智能」的能力上限抬高。一個剛剛誕生的智能體,就像一個初來世間的嬰孩,即使懵懂,卻蘊藏著無限潛力。在永不停歇的演變之后,人們普遍認為,智能體終將超越人類。

這種演化規(guī)律,在 OpenDILab平臺的開源歷程中體現(xiàn)得淋漓盡致。它的源起,是幾位算法研究員的一次跨界設(shè)想,是面向最復(fù)雜的競技游戲的一場挑戰(zhàn)。僅僅過了兩年多時間,今天的 OpenDILab已演化為覆蓋最全學(xué)術(shù)界算法和工業(yè)級規(guī)模的國產(chǎn)決策智能開源平臺。它為整個決策智能領(lǐng)域開辟了一個全新的開源社區(qū),這個社區(qū)正在以驚人的速度生長。

2022年 6月 12日,《星際爭霸 II》前中國冠軍——IG戰(zhàn)隊的 iA ,又一次登陸了斗魚直播間。這么久不見,人們發(fā)現(xiàn),iA竟然開始講 PPT了。

兩年之前,iA低調(diào)退役。兩年之后,電競少年歸來,已是 AI研究員,還帶來了目前已開源項目中實力最強的《星際爭霸 II》 AI——DI-star。

一個多小時的直播里,iA 演示了多場對局。在所有演示中,DI-star均表現(xiàn)出人類最高段位——Grandmaster分段的競技水平。

驚喜的是,DI-star 的決策能力相當靈活,屢次在復(fù)雜對局中快速找到最優(yōu)策略。比如與前世界冠軍 Scarlett對戰(zhàn)時,DI-star使用了 「女王前壓」 這種不常見于人類的戰(zhàn)術(shù),出奇制勝:

此時,距離 DI-star及其背后的決策智能平臺 OpenDILab開源已經(jīng)有一年了。

2022年 9月,OpenDILab 正式升級為 1.0版本,幕后團隊兩年多來的心血,全部凝聚于此。

白手起家

所有的故事都從 2020 年的第一個月開始。一群來自中國的算法研究員和工程師,在人臉識別的數(shù)據(jù)海中摸爬滾打多年之后,決定跳出舒適區(qū),做一點探索未來的事。

比如,從零開始打造一個星際爭霸 AI。

在當時的 AI學(xué)界眼中,決策 AI是不同于計算機視覺等感知型 AI的另一道難關(guān),而《星際爭霸 II》一直被看作檢驗 AI決策能力的絕佳舞臺,也是 AI爭相挑戰(zhàn)的「珠峰」。

星際爭霸系列游戲能保持 20多年長盛不衰,一部分原因就在于其豐富的多層次游戲機制?!缎请H爭霸 II》的空間復(fù)雜度高達 10的 1685次方,遠超圍棋 10的 170次方復(fù)雜度。對于 AI來說,這是一個非常接近現(xiàn)實世界的虛擬環(huán)境。

開源社區(qū)是助力 AI發(fā)展的重要因素之一,而在項目的開始階段,DI-star的開發(fā)者們準備好了充足的算力和資源,卻發(fā)現(xiàn)星際爭霸 AI的開源生態(tài)基本是一片空白,只能找到 DeepMind公開的原版論文,非常多的技術(shù)細節(jié)都有待考證。就好比老師教了你九九乘法表,卻突然讓你做一道微積分的作業(yè)題。

DI-star的開發(fā)者們首先調(diào)研了各種已有的強化學(xué)習(xí)開源平臺,但發(fā)現(xiàn)開源的算法、工具等基本都是圍繞「小而精」的學(xué)術(shù)研究,壓根沒有星際爭霸這種大規(guī)模環(huán)境的開源項目。

「沒有輪子,就立馬動手造一個,這才是極客精神!」

于是乎,DI-star的開發(fā)者們拿著之前自己在計算機視覺任務(wù)上積累的經(jīng)驗,想要一定程度的知識復(fù)用。但很快他們就發(fā)現(xiàn),這不只是個脫離舒適區(qū)的問題,這簡直是一腳踏入深水區(qū),每天都會誕生新的靈魂拷問:

原本規(guī)規(guī)整整的張量圖片,卻變成了高度結(jié)構(gòu)化且動態(tài)變化的游戲信息;

原本直筒式簡簡單單搭積木的神經(jīng)網(wǎng)絡(luò)設(shè)計,卻變成了復(fù)雜多樣的「毛線團網(wǎng)絡(luò)」設(shè)計比賽;

原本輕易擴展的分布式訓(xùn)練架構(gòu),卻變成了多種硬件和計算模式混合的大雜燴系統(tǒng)……

在不斷以「一日速成法」了解各類游戲 AI設(shè)計和分布式系統(tǒng)設(shè)計知識后,團隊總算是搭出了第一版能正常運行的分布式訓(xùn)練系統(tǒng),這也是之后 OpenDILab的最初原型。

只不過還有一件事讓人犯愁:到底怎么讓 AI學(xué)習(xí)打星際的技巧呢?這需要集深度學(xué)習(xí)、強化學(xué)習(xí)、游戲 AI三方面的技術(shù)和力量。

技術(shù)可以后天努力學(xué)習(xí),游戲天賦可真是命中注定,于是,他們找到了中國星際的傳奇人物:iA周航。于是,幾個基本對決策 AI零基礎(chǔ)的人,構(gòu)成了 DI-star項目的最初班底。

「最初幾乎訓(xùn)練不出來任何哪怕有正常操作的 AI」。DI-star團隊一度很頭疼。沒辦法,前半年只能一點一點解 bug,慢慢地教。發(fā)現(xiàn)一個不合理的 AI行為,就從游戲錄像中開始分析,對應(yīng)到具體的游戲操作,解析游戲引擎內(nèi)存中的數(shù)據(jù)片段,再一步步追根溯源,最終分析到神經(jīng)網(wǎng)絡(luò)里具體某個神經(jīng)元的激活輸出,從而定位到代碼實現(xiàn)和算法設(shè)計的相關(guān)問題。

「程序是不會騙你的,只要你用心去凝視它?!瓜裆厦孢@樣一環(huán)扣一環(huán),非常需要高度集中心力的細節(jié)分析,在 DI-star的前期階段,幾乎是天天都有。

終于,經(jīng)歷了半年的艱苦奮斗, 2020年 6月,DI-star已經(jīng)能夠擊敗簡單的電腦。2020年 7月,團隊進行了 DI-star第一次人機內(nèi)測,AI戰(zhàn)勝了一位剛剛?cè)腴T《星際爭霸 II》的研究員。

步入正軌之后,就要去探索 AI的上限究竟在哪里。DI-star團隊希望在整個系統(tǒng)的各個環(huán)節(jié)中都做到極致:不僅僅是復(fù)現(xiàn)最強的決策 AI問題,而是盡其所能去嘗試每種可能性。有人從神經(jīng)網(wǎng)絡(luò)角度,設(shè)計更穩(wěn)定的大批量樣本優(yōu)化技術(shù)和高效處理動態(tài)決策空間的網(wǎng)絡(luò)層,有人從強化學(xué)習(xí)優(yōu)化方向,精心調(diào)控探索和利用的多方面平衡,有人從游戲 AI領(lǐng)域,融合即時戰(zhàn)略類游戲的百家之長,將 AI的微操優(yōu)勢培養(yǎng)到新的境界,有人從系統(tǒng)效率出發(fā),做各種資源的權(quán)衡,存儲 /網(wǎng)絡(luò) /計算,一切能想到的辦法都用來優(yōu)化訓(xùn)練效率。

在集合整個團隊的技術(shù)積累之后,歷經(jīng)人類錄像模仿學(xué)習(xí)和自我博弈強化學(xué)習(xí)兩個階段,總計一億局星際對局,五周的最終訓(xùn)練時間,2021年 6月,DI-star終于戰(zhàn)勝了 DI-star的創(chuàng)造者之一——周航本人。之后,周航又拉來一些職業(yè)電競時期的老朋友跟 DI-star打,包括 MMR6000分的中國最強蟲族選手 Rex。

好消息是,DI-star 都贏了,沒辜負一年多來的苦練。

從星際 AI到開源平臺

路行至此,接下來又該怎么走?

極客探索歸探索,但想把技術(shù)做長久做出影響力,復(fù)盤是必不可少的。而在當時的馬拉松復(fù)盤會中,研發(fā)團隊一致的觀點是:必須積累足夠扎實的技術(shù)工具鏈。DI-star中的小農(nóng)式精耕細作太難復(fù)制也太難推廣了,需要能有讓決策AI技術(shù)真正大放光彩的基建工作。那么自然的,做一個決策智能開源平臺和生態(tài),就成了大家新的目標。

更具體一點,在算法方面,哪些技術(shù)適合在前期探索智能體策略的多樣性和潛力,哪些方法適合作為最終超大規(guī)模強化學(xué)習(xí)訓(xùn)練的核心模塊;在系統(tǒng)方面,哪些系統(tǒng)設(shè)計既能提高采樣效率又能對大規(guī)模強化學(xué)習(xí)的優(yōu)化效率帶來幫助,什么樣的設(shè)計可以易用快速的算法迭代和想法驗證。所有上述這些積累的經(jīng)驗和知識,都是有價值被沉淀下來的東西。

光是教會AI玩《星際爭霸 II》并不是最終目標,探索決策AI的能力邊界,學(xué)會面對更加復(fù)雜的真實世界,才是在青春年月值得去拼搏的事?;谶@樣的初心,后續(xù)成立的 OpenDILab團隊以 DI-star為起點,開始進一步探索如何做開源。

當時決策智能領(lǐng)域的開源生態(tài),比起 CV、NLP這些成熟的研究領(lǐng)域,的確差了不是一點半點。

不過對于整個決策智能領(lǐng)域來說,開發(fā)者最需要的不只是某一套代碼,也不僅是某一個工具包。這個領(lǐng)域,正需要一個功能全面、便捷易用的開源平臺。

但如何設(shè)計一個能滿足廣大研究者需求的平臺,是需要認真考慮的問題。

這時,更多學(xué)術(shù)界、產(chǎn)業(yè)界的決策智能研究痛點進入了團隊成員們的視野:

與感知智能不同,決策類問題通常涉及處理諸如圖像、語音、結(jié)構(gòu)化數(shù)據(jù)等多種復(fù)雜模態(tài)的數(shù)據(jù)類型。此外,單機單卡與多機多卡甚至跨集群計算的決策 AI計算邏輯也完全不同。不同任務(wù)間的最優(yōu)算法配置也差別較大。對于決策智能,這些問題很難標準化。

還有一個客觀現(xiàn)象:關(guān)于決策智能的問題定義和研究視角,學(xué)術(shù)界和工業(yè)界之間的差距是很大的。很多前沿的理論算法缺少環(huán)境和計算 pipeline上的通用性,只能局限于 toy model級別的實驗環(huán)境,無法遷移到真正的工業(yè)場景中。

因此,團隊最終對開源平臺的期望是:既要在學(xué)術(shù)算法層面做到最全最廣的覆蓋和統(tǒng)一,又要將這些算法真正發(fā)揮到相應(yīng)的實際場景中去,解決各個其他領(lǐng)域的工業(yè)級應(yīng)用問題。當然,想要兼顧兩者是一件極為困難的事,系統(tǒng)和平臺設(shè)計本身就是在做各種各樣的權(quán)衡,而開源社區(qū)正是幫助平臺成長和不斷進化的重要力量。

這將是一項產(chǎn)生長期價值的工程,力求將技術(shù)的廣度和深度都推到極致,將成千上萬開發(fā)者的智慧與努力集合起來,在各行各業(yè)中演化出無限可能。

人人可用的開源決策智能平臺

2021年 7月,DI-star 及其衍生出的決策智能平臺 OpenDILab在 GitHub 正式開源了。

在最初發(fā)布的 OpenDILab beta版本中,自上而下覆蓋了應(yīng)用生態(tài)層、算法抽象層、分布式管理層和分布式執(zhí)行層,還支持從單機到上萬級別 CPU/GPU聯(lián)合訓(xùn)練的全尺度調(diào)度系統(tǒng)優(yōu)化,將 OpenDILab團隊自 DI-star項目以來積累的各方面技術(shù)和知識完全開源開放出來。然而開源社區(qū)的構(gòu)建是需要不斷打磨的,beta版本在各種各樣的權(quán)衡中遺留了一些上手難度問題,而在這一年多開發(fā)者與開源社區(qū)的共同努力下,OpenDILab 1.0版本在易用性、效率、多元化等方面都展現(xiàn)出了新的思考和理解。

poYBAGMyYiOABmMGAAM4-y3CJ5c469.png

其中,OpenDILab 推出了一系列面向不同目標的開源庫:

最底層的 DI-engine及相關(guān)系統(tǒng)支持庫致力于解決決策AI在環(huán)境,算法,計算尺度三個方面的標準化問題,它首先提供了在 40+不同類型決策環(huán)境上的最佳實踐,可作為不同領(lǐng)域研究者應(yīng)用強化學(xué)習(xí)技術(shù)的最佳模板,還匯聚了 8大研究子方向的 60+決策智能算法,將深度強化學(xué)習(xí),多智能體博弈,離線強化學(xué)習(xí)和模仿學(xué)習(xí)等領(lǐng)域一網(wǎng)打盡,而上述這些環(huán)境和算法,都可以在統(tǒng)一的系統(tǒng)執(zhí)行設(shè)計下高效實現(xiàn),并根據(jù)任務(wù)特性自適應(yīng)地調(diào)整資源利用的最佳方案。

中層的算法與模型抽象層 DI-zoo整合了 OpenDILab在各個領(lǐng)域應(yīng)用決策AI算法的相關(guān)經(jīng)驗,將算法理論,代碼實現(xiàn),應(yīng)用領(lǐng)域知識一一對應(yīng)在一起,并在AutoML工具的支持下,幫助開發(fā)者構(gòu)建統(tǒng)一且標準的基準方案,也很大程度上降低了初學(xué)者的入門門檻。

在應(yīng)用生態(tài)層,既有 DI-star這樣面向于虛擬世界即時戰(zhàn)略類游戲的大規(guī)模強化學(xué)習(xí)訓(xùn)練方案,包含完整的訓(xùn)練、測試和應(yīng)用原型代碼細節(jié),還開源了包含感知決策全流程的自動駕駛平臺 DI-drive,朝著決策 AI落地應(yīng)用的方向前進。

自開源以來,OpenDILab 已經(jīng)收獲了4500多個 GitHub star。DI-star也被列入 Github Trending Python語言優(yōu)質(zhì)開源項目。

多智能體決策智能領(lǐng)域的「ImageNet」

決策智能的落地通常會受到訓(xùn)練平臺、仿真環(huán)境兩方面的挑戰(zhàn)。OpenDILab是好用的,但它暫時只解決了訓(xùn)練平臺層面的一部分問題。

那么,仿真環(huán)境的問題怎么解決呢?

為了讓更多人參與到?jīng)Q策智能的探索中來,OpenDILab搞了一場 Go-Bigger挑戰(zhàn)賽。通俗地講,這其實是一場決策 AI版的「大球吃小球」挑戰(zhàn)賽。

在 Go-Bigger挑戰(zhàn)賽里,每局時長十分鐘,大球吃掉小球會獲得更大重量和體積,但同時需要避免被更大的球吃掉。球的類型包括分身球、孢子球、食物球、荊棘球,這四種球的決策路徑是不同的。

poYBAGMyYi2AL6ZBAAj7lr2qKiw530.png

每個隊伍都需和其他隊伍對抗,總重量更大的團隊獲勝。

這個游戲環(huán)境看起來簡單,但其實非??简灦嘀悄荏w之間的配合和對抗,包括權(quán)衡同一團隊中的個體行動與合作行動、不同團隊間的合作與競爭、表征和交換與其它智能體的環(huán)境信息等,體現(xiàn)了很高的決策復(fù)雜度。

有意思的是,Go-Bigger游戲設(shè)計了球球?qū)箷r間、成長加速度、分裂、消失、衰亡等約束條件,這種情況其實廣泛存在于現(xiàn)實世界,比如在人的生命周期中,我們都需要在不同的人生階段,在各種約束條件下進行協(xié)作、對抗,做出最利于自身的決策。球球和人類之間,由此產(chǎn)生了一種微妙的關(guān)聯(lián)。

在 AI領(lǐng)域,很多研究問題的真正被定義和解決,都經(jīng)歷了從「球球」到「真實世界」的模擬過程。

比如計算機視覺領(lǐng)域的經(jīng)典之作 ImageNet。上海人工智能實驗室青年科學(xué)家、商湯科技高級研究總監(jiān)、OpenDILab項目發(fā)起人劉宇表示,在 ImageNet比賽之前,數(shù)據(jù)集都非常小,學(xué)術(shù)界很難定義產(chǎn)業(yè)界真正需要的算法問題。但 ImageNet提出了全新的挑戰(zhàn),在海量數(shù)據(jù)上定義的研究問題與真實世界中真正應(yīng)該被解決的問題更加貼近了,加上算力條件的提升,成就了后來計算機視覺的蓬勃發(fā)展。

對于今天的多智能體決策智能領(lǐng)域來說,學(xué)術(shù)界和產(chǎn)業(yè)界都在等待著像「ImageNet」這樣具備「公認的問題定義能力」的項目出現(xiàn),而 OpenDILab希望 Go-Bigger能擔起這一重擔。

有人可能會問,既然開源了 DI-star,為什么不直接辦一場星際爭霸 AI挑戰(zhàn)賽?

這也是從現(xiàn)實因素出發(fā)來考慮的,畢竟訓(xùn)練一個星際爭霸 AI需要太多的算力消耗,對于一般參賽者來說實在不友好。

Go-Bigger的定位是人人可以參加的中型游戲 AI競技環(huán)境。相比學(xué)術(shù)界常用的 Atari、MuJoCo、SMAC,Go-Bigger 的環(huán)境規(guī)模更大,但又可以在小型的實驗室中完成,用一臺機器、一塊 GPU就能訓(xùn)練起來。這樣一來,參賽者就能把更多精力聚焦到探索多智能體協(xié)作能力的算法上。

即使如此,從零開始實現(xiàn)比賽要用的算法和訓(xùn)練流程還是很復(fù)雜的,而 OpenDILab平臺提供的決策 AI框架 DI-engine正好幫助開發(fā)者簡化了這一過程。

開發(fā)者們基于DI-engine為Go-Bigger設(shè)計實現(xiàn)了多種類型的基準算法,包含多智能體協(xié)作,稀疏獎勵引導(dǎo),記憶化探索和計算效率提升等多個方面。

走進現(xiàn)實世界

在工業(yè)應(yīng)用這塊,OpenDILab也沒松懈,推出了自動駕駛領(lǐng)域內(nèi)第一個支持多種仿真器和多種決策智能算法的開源研究平臺——DI-drive。

之所以選擇自動駕駛領(lǐng)域做開源,OpenDILab有自己的思考:

第三次發(fā)展浪潮之后,AI技術(shù)已經(jīng)進入從感知智能到?jīng)Q策智能演變的關(guān)鍵節(jié)點,決策 AI技術(shù)的突破也到了在實際場景部署和應(yīng)用的階段。任何前沿的學(xué)術(shù)理論,都要走到現(xiàn)實世界當中去,才能產(chǎn)生更多的價值。

可以說,決策 AI技術(shù)應(yīng)用的成功與否,直接決定了這一技術(shù)在產(chǎn)業(yè)界的認可程度,反過來,應(yīng)用領(lǐng)域的難題也可以指導(dǎo)決策 AI理論的演進。

另一方面,生態(tài)構(gòu)建的成功與否體現(xiàn)了決策 AI技術(shù)的應(yīng)用門檻、其通用能力和泛化能力以及對不同任務(wù)的適應(yīng)能力。應(yīng)用生態(tài)也可以更加廣泛地拓展決策 AI的應(yīng)用領(lǐng)域,打通不同應(yīng)用領(lǐng)域所面臨的問題和挑戰(zhàn)。

自動駕駛是當前人工智能的熱門研究方向。決策、規(guī)劃與控制是自動駕駛?cè)蝿?wù)的大腦,一向被各大公司視作高度保密技術(shù)。如果是一位普通開發(fā)者,就算想深入了解也難。

所以,OpenDILab綜合了大量自動駕駛決策 AI的方法,抽象出基本涵蓋現(xiàn)有自動駕駛方法的一套流程,做出了自動駕駛領(lǐng)域第一個開源的、人人可以參與的研究平臺 DI-drive。

目前,DI-drive已在自動駕駛端到端仿真任務(wù)上取得若干算法突破。對于一系列核心技術(shù)突破,OpenDILab不作保留,全部開源。

比如自動駕駛策略 InterFuser,該策略基于 Transformer進行多傳感器融合,并使用了可解釋性特征來增加自動駕駛的安全性。

我們都知道,在高交通密度的場景中,會有大量的障礙物和動態(tài)物體參與決策。在這些情況下,一些部署的自動駕駛系統(tǒng)可能表現(xiàn)出不正確或意外的行為,導(dǎo)致災(zāi)難性的事故。

比如行人突然從路邊出現(xiàn)、通過路口時遭遇意外車流(闖紅燈等),這需要更好地理解多模態(tài)多視角傳感器輸入下的場景。另外,如何驗證決策過程也是個問題,換句話說,識別系統(tǒng)的功能 /故障情況以及故障原因,這需要決策系統(tǒng)的可解釋性。

OpenDILab模擬了大部分情況,基于自動駕駛研究的開源模擬器 CARLA進行了測評,InterFuser顯示出良好的問題處理能力:

poYBAGMyYj6AWLd2AEjMd0-0JRw800.png

等紅燈

poYBAGMyYkSActUoAIC-zq22V-M964.png

轉(zhuǎn)彎

在最新的 CARLA Leaderboard排行榜中,OpenDILab提出的自動駕駛策略 InterFuser取得了 Top 1的成績。

poYBAGMyYkeADKSTAAGFGqmgdjY232.png

InterFuser在 CARLA Leaderboard上的排名

InterFuser arXiv論文地址: https://arxiv.org/abs/2207.14024

InterFuser Github項目地址: https://github.com/opendilab/InterFuser

此外,OpenDILab還針對自動駕駛開發(fā)了一套貼近真實的駕駛場景 Casezoo,所涉及的駕駛場景均由實車數(shù)據(jù)和路測案例轉(zhuǎn)化而來。他們在多種貼近真實的駕駛環(huán)境中訓(xùn)練和測試了決策模型,有效促進自動駕駛領(lǐng)域仿真研究在實車環(huán)境中的推廣和應(yīng)用。

與此同時,OpenDILab也在探索新的決策智能應(yīng)用領(lǐng)域和方法,如金融領(lǐng)域的反欺詐和交易,電網(wǎng)、港口等場景的資源調(diào)度和優(yōu)化,生物領(lǐng)域的合成搜索和預(yù)測等。一系列重磅成果,均在醞釀之中。

不斷進化的 OpenDILab

一年時間過得很快。Beta版本開源之后,OpenDILab團隊一直在根據(jù)開發(fā)者社區(qū)的反饋改進。

經(jīng)過多次完善后,近日的 WAIC 2022大會上,OpenDILab 1.0版本正式問世。

pYYBAGMyYleAKfFzAASIh0UWidI212.png

OpenDILab框架圖

整體來看,OpenDILab 1.0有三大升級特點:

1.易用高效的大規(guī)模決策智能訓(xùn)練系統(tǒng):具備插件化的擴展能力和友好的分布式能力

2.當前世界上最全面的標準化決策 AI平臺:一個平臺整合所有 RL研究領(lǐng)域,一套框架服務(wù)多種決策 AI問題,最全最強算法集(1個架構(gòu),8大研究方向,40 +環(huán)境,60 +算法,70 +專利)

3.到手即用的工業(yè)應(yīng)用生態(tài):決策 AI+X的最佳實踐,助力各行各業(yè)實現(xiàn)關(guān)鍵的技術(shù)和應(yīng)用突破。

「在計算機視覺領(lǐng)域,標準化做得很好,比如所有數(shù)據(jù)模態(tài)都可以用非常規(guī)整的 Tensor來表示,所有任務(wù)都可以在 batch維度同步 forward和 bp(Back Propagation)的神經(jīng)網(wǎng)絡(luò)來處理,比如 PyTorch和 TensorFlow。而在數(shù)據(jù)模態(tài)高度結(jié)構(gòu)化,訓(xùn)練過程高度異步化的決策智能領(lǐng)域,我們希望做的也是這樣一件事。」劉宇表示。

硬核升級之外,OpenDILab也更加注重易用性和便捷性,為社區(qū)內(nèi)的開發(fā)者提供了更加詳盡的上手教程。值得一提的是,OpenDILab將于今年 10月推出從應(yīng)用場景出發(fā)的 「PPO x Famliy入門公開課」,課程內(nèi)容主要從一個 PPO解決絕大多數(shù)的常規(guī)決策問題,根據(jù)算法原理,代碼實現(xiàn),實際應(yīng)用三者的一一對應(yīng)來設(shè)計,即使你只是一枚想入門決策 AI的萌新,或者只是一位想用決策 AI技術(shù)解決某個實際問題的非內(nèi)行工程師,都可以通過該課程和 OpenDILab平臺獲得在算法、系統(tǒng)、工程等經(jīng)驗和工具支持。

poYBAGMyYl6AMo_nAAHz7j56DQg883.png

我們也了解到,同在 WAIC2022發(fā)布的 SenseMAP商湯多智能體平臺,在搭建過程中也用到了 OpenDILab開源的多項前沿技術(shù)。

在 WAIC 2022的企業(yè)論壇中,劉宇介紹:「我們利用 OpenDILab作為基建之一構(gòu)建了商湯多智能體游戲 AI平臺 SenseMAP,同時 OpenDILab也支持了我們在游戲、電力調(diào)度、自動駕駛和貨運調(diào)度等領(lǐng)域的業(yè)務(wù)應(yīng)用。」

劉宇認為,只有一項技術(shù)的門檻明顯降低,更多人才有機會入局。

縱觀人類技術(shù)發(fā)展歷史,真正帶動整個社會往前走的機會,未必出現(xiàn)在某種技術(shù)誕生的那一刻,更多是這項技術(shù)能夠得到普及之后。這正是 OpenDILab的開源初衷。

來源:轉(zhuǎn)載機器之心

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源軟件
    +關(guān)注

    關(guān)注

    0

    文章

    212

    瀏覽量

    16275
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279971
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    開源鴻蒙開發(fā)者大會2025·AI分論壇圓滿閉幕,探索開源鴻蒙AI無限可能

    多個方面,分享交流了端側(cè)AI相關(guān)的理論研究和實踐經(jīng)驗,探討了“開源鴻蒙+AI”面臨的機會與挑戰(zhàn),思考規(guī)劃開源鴻蒙操作系統(tǒng)
    的頭像 發(fā)表于 05-26 18:06 ?666次閱讀
    <b class='flag-5'>開源</b>鴻蒙開發(fā)者大會2025·<b class='flag-5'>AI</b>分論壇圓滿閉幕,探索<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>AI</b>無限可能

    開源AI MPU

    1. 基于RISC-V的開源AI MPU/加速器 ? ?**(1) SiFive Intelligence系列**? ? 特點 ?:SiFive提供開源的RISC-V IP核,支持AI
    的頭像 發(fā)表于 04-02 17:44 ?1644次閱讀

    LG UltraGear系列職業(yè)顯示器新品發(fā)布

    2025年初,LG電子隆重推出兩款UltraGear系列顯示器新品——GX7炫系列27GX790A和G8極系列27G850A,再次刷新顯示器性能標準,重新定義高端
    的頭像 發(fā)表于 02-25 10:28 ?751次閱讀

    TrendForce預(yù)估2025年LCD顯示器面板出貨增長放緩

    近日,根據(jù)知名市場研究機構(gòu)TrendForce最新公布的研究數(shù)據(jù)顯示,2024年全球LCD顯示器面板出貨量呈現(xiàn)出一定的增長態(tài)勢,全年出貨量達到了3242萬片,與去年同期相比增長了1
    的頭像 發(fā)表于 02-20 10:42 ?616次閱讀

    NVIDIA推出個人AI超級計算機Project DIGITS

    NVIDIA 推出個人 AI 超級計算機 NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據(jù)科學(xué)家和學(xué)生都可獲取 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 01-08 11:03 ?826次閱讀

    天璣 9400拿下AI性能榜冠軍,最強NPU引領(lǐng)手機AI應(yīng)用變革

    蘇黎世AI Benchmark榜單冠軍,以稱霸行業(yè)的AI性能,加速智能手機的智能體化進程。 在蘇黎世 ETHZ AI Benchmark榜單中,天璣 9400的
    的頭像 發(fā)表于 12-30 20:09 ?717次閱讀
    天璣 9400拿下<b class='flag-5'>AI</b>性能榜<b class='flag-5'>冠軍</b>,最強NPU引領(lǐng)手機<b class='flag-5'>AI</b>應(yīng)用變革

    達爾優(yōu)A75HE磁軸鍵盤震撼發(fā)布:引領(lǐng)新潮流

    近日,達爾優(yōu)與歐希德強強聯(lián)手,推出了其最新的磁軸鍵盤——A75HE。這款鍵盤憑借其卓越的性能和獨特的設(shè)計,迅速在愛好者中引起了廣泛關(guān)注。
    的頭像 發(fā)表于 12-17 17:36 ?638次閱讀

    讓奧運冠軍都贊不絕口的海信激光電視 憑借的到底是什么?

    奧運冠軍在賽場之外是什么樣?通常會引起不少網(wǎng)友的好奇心,像今年在巴黎奧運會上奪得女乒單打金牌的陳,賽場之外豐富多彩的活動吸引了許多網(wǎng)友的關(guān)注,通過這些活動,大家認識到了更為立體生動的奧運冠軍另一面
    的頭像 發(fā)表于 11-13 13:49 ?579次閱讀
    讓奧運<b class='flag-5'>冠軍</b>陳<b class='flag-5'>夢</b>都贊不絕口的海信激光電視 憑借的到底是什么?

    AI編程工具會不會搶程序飯碗

    AI編程工具可輔助編程,減少手動編碼,提升效率,對程序有積極影響也有挑戰(zhàn)。程序需深化技能、拓寬知識應(yīng)對。長遠看,AI與人類程序將共生共
    的頭像 發(fā)表于 11-08 10:17 ?533次閱讀

    冠軍說|第二屆OpenHarmony競賽訓(xùn)練營冠軍團隊專訪

    實現(xiàn)技術(shù)創(chuàng)新,解決現(xiàn)實問題的呢? 高校創(chuàng)新技術(shù)人才又將如何助力OpenHarmony技術(shù)生態(tài)的繁榮與活力? 點擊下方視頻一起聽冠軍說 探秘冠軍團隊與老師的獨家幕后分享 OpenHarmony 競賽
    發(fā)表于 10-28 17:11

    Llama 3 與開源AI模型的關(guān)系

    體現(xiàn)在多個層面。 1. 開源精神的體現(xiàn) Llama 3項目可能是一個開源項目,這意味著它的源代碼、算法和數(shù)據(jù)集對公眾開放。這種開放性是開源AI模型的核心特征,它鼓勵了全球范圍內(nèi)的開發(fā)者
    的頭像 發(fā)表于 10-27 14:42 ?779次閱讀

    開啟全新AI時代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    計算機學(xué)院牛建偉教授主持。 中科院軟件所副所長、總工程師,武延軍研究員做了“AI大模型時代下的操作系統(tǒng)發(fā)展思考”主題演講。 武延軍介紹了操作系統(tǒng)的發(fā)展歷程,指出應(yīng)用的高速發(fā)展給操作系統(tǒng)帶來的算力和數(shù)
    發(fā)表于 08-30 17:24

    RUCKUS助您實現(xiàn)卓越體驗

    在充滿活力、快節(jié)奏的世界中,強大、可靠且高性能網(wǎng)絡(luò)是至關(guān)重要的。隨著行業(yè)以前所未有的速度持續(xù)發(fā)展,對能夠滿足日益增長的帶寬和低延遲連接的先進網(wǎng)絡(luò)解決方案的需求也在水漲船高。而這
    的頭像 發(fā)表于 08-16 15:59 ?882次閱讀

    技嘉科技最新OLED顯示器榮獲紅點設(shè)計大獎

    技嘉科技近日傳來喜訊,其最新推出的兩款OLED顯示器——AORUS FO32U2P與GIGABYTE MO34WQC2,在設(shè)計領(lǐng)域大放異彩,雙雙榮獲享有盛譽的紅點設(shè)計大獎,彰顯了技嘉在
    的頭像 發(fā)表于 08-14 14:48 ?846次閱讀

    AI上線,字節(jié)跳動挑戰(zhàn)Sora等AI創(chuàng)作平臺

    字節(jié)跳動近期動作頻頻,其剪映團隊精心研發(fā)的“即AI”移動版已正式登陸蘋果App Store,標志著字節(jié)在AI創(chuàng)作領(lǐng)域的又一重要布局。即AI
    的頭像 發(fā)表于 08-07 16:47 ?981次閱讀