99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI“里程碑”的含金量到底高不高?

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周,OpenAI Five擊敗DOTA2業(yè)余人類玩家,轟動游戲圈和AI圈,連比爾·蓋茨都忍不住發(fā)推特點贊,稱之為“里程碑事件”。這個事件對業(yè)界帶來的影響有多大?技術(shù)含量有多高?新智元采訪了數(shù)位國內(nèi)外專家,他們并不全都贊同“里程碑”的觀點。

上周,OpenAI自學(xué)習(xí)多智能體5v5團隊?wèi)?zhàn)擊敗DOTA2業(yè)余人類玩家,成為轟動人工智能圈的一件大事。

這個事件的意義,不僅僅局限于AI“攻克”星際爭霸或者Dota這樣的復(fù)雜電子競技游戲,而是代表著AI在決策智能上的能力大幅向前推進。

對于這件事,比爾·蓋茨也發(fā)推文稱贊:這是一件大事,因為它們的勝利需要團隊合作和協(xié)作——這是推進人工智能的一個巨大里程碑。

不過,也有觀點認(rèn)為OpenAI這個“里程碑”只是在算力上的巨大勝利,并沒有在算法上創(chuàng)新,他們只是擴展了已有的方法。

OpenAI“里程碑”的含金量到底高不高?

先來看技術(shù):強化學(xué)習(xí)能夠進行大但是可實現(xiàn)規(guī)模的長期規(guī)劃

OpenAI Five之所以戰(zhàn)勝DOTA2的業(yè)余選手,成為比爾·蓋茨眼里的里程碑事件,主要原因在于它使用“近端策略優(yōu)化”(PPO)的擴展版算法,在256個GPU和128000個CPU內(nèi)核上進行訓(xùn)練。每個英雄都使用單獨的LSTM,不使用人類數(shù)據(jù),最終AI能夠?qū)W會識別策略。

這種做法表明,強化學(xué)習(xí)能夠進行大但卻可實現(xiàn)規(guī)模(large but achievable scale)的長期規(guī)劃,而不發(fā)生根本性的進展。

國內(nèi)首家決策智能公司啟元世界研究科學(xué)家、香港科技大學(xué)彭鵬博士認(rèn)為,從Dota2中展現(xiàn)出來的群體智能來看,OpenAI Five無論從對整體局勢的判斷還是對局部戰(zhàn)場的應(yīng)對,都展現(xiàn)了很高的智能決策能力。

整體戰(zhàn)略上,通過前期給輔助英雄一定的資源,讓輔助英雄可以通過gank和push幫助隊伍快速進入中期階段,加快并試圖掌握游戲節(jié)奏;能夠快速集結(jié)起部分隊員進行連續(xù)有效的gank;集中push敵方優(yōu)勢路和中路,逼迫對方在較難防守的位置交戰(zhàn)。在團戰(zhàn)中,對切入時機、距離控制、英雄的職責(zé)分配、集火目標(biāo)選擇和多種裝備的靈活運用做的非常到位。

最令人驚訝的是,OpenAI Five直接在微操級別的動作空間中進行探索和學(xué)習(xí),僅僅通過幾天的訓(xùn)練就達到了上述的效果。雖然有12800 CPU cores和256 P100 GPU的加持,這一結(jié)果足以使大家對深度強化學(xué)習(xí)有更強的信心。

此外,盡管當(dāng)前版本的OpenAI Five的補兵能力表現(xiàn)不佳,但它在選擇優(yōu)先攻擊目標(biāo)上已經(jīng)達到專業(yè)水平。獲得長期回報往往需要犧牲短期回報,例如發(fā)育后的金錢,因為團推時也需要耗費時間。這表明系統(tǒng)真正在進行長期的優(yōu)化。

(關(guān)于更具體的實現(xiàn)過程,新智元此前有詳細報道,讀者可移步新智元知乎專欄閱讀:

https://zhuanlan.zhihu.com/p/38499219)

OpenAI自有過人之處,Smerity高度評價

彭鵬博士認(rèn)為,從技術(shù)角度來講,OpenAI Five延續(xù)了OpenAI在1v1中所采用的建模方式,相比Deepmind主打的端到端學(xué)習(xí)(end-to-end learning),OpenAI Five直接使用語義信息作為模型的輸入,極大地降低模型訓(xùn)練所需的計算力,這算是一個新進展。

另外,OpenAI Five也在reward function的構(gòu)造也很有特色,在個人reward和團隊reward之間做了很好的平衡;模型會在訓(xùn)練前期重視優(yōu)化個人reward,而在訓(xùn)練后期開始注重團隊reward。最后,OpenAI大規(guī)模高性能的Rapid系統(tǒng)設(shè)計也體現(xiàn)了他們的功力,同時調(diào)度上萬的CPU和GPU資源,在自我對弈的過程中不斷變強。

如果僅僅是通過算力提升來訓(xùn)練模型,恐怕不能稱之為“里程碑”。

Metamind高級研究科學(xué)家Stephen Merity(即Smerity)在OpenAI Five的研究發(fā)布當(dāng)天,連發(fā)數(shù)條推特,高度評價了這項成果。

Smerity本身是一名DOTA的深度玩家,他從WC3時代開始并且已經(jīng)打了830小時的DOTA2,他認(rèn)為這一影響遠遠超出了DOTA本身。

這些機器人從來沒有見過傳統(tǒng)的人類策略,它們只是按照規(guī)則和目標(biāo)來玩游戲。如果有一種正和(positive sum)的方式來玩“人”的零和游戲,它一定會找到的。

我們可以預(yù)見未來社會中很多錯綜復(fù)雜的東西都沒有了,為什么呢?因為這些自主系統(tǒng)將讓我們意識到,現(xiàn)在我們的一些優(yōu)化措施實際上是不成熟的,反而讓問題變得復(fù)雜;這些系統(tǒng)還能讓我們少走很多彎路,現(xiàn)在我們都是走了彎路以后才意識到自己繞了道。

作為人類,我們還不夠聰明,無法看穿復(fù)雜和復(fù)雜交互的迷霧,但我們編寫的系統(tǒng)或許可以。它們可能幫助我們實現(xiàn)幾百年來我們一直不情愿地、迷茫地走向的目標(biāo)——協(xié)作。

OpenAI并沒有在算法上創(chuàng)新,談不上“里程碑式的成就”

倫敦大學(xué)學(xué)院(UCL)的計算機教授汪軍告訴新智元,AlphaGo之后,AI領(lǐng)域的下一大挑戰(zhàn)就是多智能體強化學(xué)習(xí)(Multi-Agent reinforcement learning,MARL),也即讓多個智能體學(xué)會合作與競爭。

DOTA、星際爭霸,還有更多人熟悉的王者榮耀,都屬于多智能體強化學(xué)習(xí)(MARL),但DOTA 5v5的設(shè)置相對更加簡單。從去年開始,汪軍在UCL的團隊與上海的一家游戲公司合作,研究如何讓AI玩王者榮耀。目前,包括DeepMind、Facebook、阿里、騰訊在內(nèi)的很多機構(gòu),都在這些游戲上從事MARL研究,但尚未有團隊公開實質(zhì)性的突破。

OpenAI的工作讓更多學(xué)者和公眾關(guān)注MARL,這是一件好事,但如果說這是一項“里程碑式的成就”,則遠遠談不上。

汪軍說,OpenAI僅發(fā)布了blog,沒有發(fā)布學(xué)術(shù)論文,目前對其科學(xué)性還比較難以評估。但從發(fā)布的blog上看不到算法的創(chuàng)新。他們只是擴展了已有的方法,然后上了大量的計算力——整整128000 CPU和 256 GPU,這樣的硬件基礎(chǔ)設(shè)施是一般的高校所不具備的?!?/p>

“OpenAI證明了使用現(xiàn)有的算法和trick,加上強大的計算力、工程力量和足夠的耐心,是可以把這件事情做出來的。”

很可惜的是,OpenAI并沒有針對游戲中AI如何合作去明晰建模,沒有嘗試去理解AI彼此合作的機制,模型還是單獨的強化學(xué)習(xí),把其他的英雄當(dāng)成環(huán)境的一部分,并使用普通的團隊和個體結(jié)合的獎勵機制,通過大量試錯取得了最后的結(jié)果?!爸灰凶銐蚨嗟臅r間(也就是足夠多的計算資源),你總能試出一些結(jié)果?!蓖糗娬f,因此它不太具有創(chuàng)新性。

汪軍呼吁大家重視并扶持基礎(chǔ)性的長期研究,將眼光放長遠,“多多資助我們這些搞基礎(chǔ)研究的一些GPU”,對領(lǐng)域長期健康發(fā)展做出積極貢獻。

不過,汪軍也非??隙ˋlphaGo、OpenAI等機構(gòu)的研究對產(chǎn)業(yè)帶來的潛移默化的影響?!澳壳?,阿里巴巴、百度、滴滴、京東、華為這些公司都在嘗試把強化學(xué)習(xí)用在不同的場景,比如直接用在互聯(lián)網(wǎng)廣告、倉儲物流、自動駕駛等場景上面,這就是AlphaGo帶來的影響,大家都對強化學(xué)習(xí)非常關(guān)注?!?/p>

“據(jù)我所知,DeepMind已經(jīng)把研究的一些能量輸入到谷歌內(nèi)部中,好像我們看到DeepMind還沒有實現(xiàn)經(jīng)濟價值,其實已經(jīng)讓谷歌內(nèi)部產(chǎn)生了效率?!蓖糗娬f。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249585
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    11080
  • 強化學(xué)習(xí)
    +關(guān)注

    關(guān)注

    4

    文章

    269

    瀏覽量

    11604

原文標(biāo)題:OpenAI戰(zhàn)勝DOTA2人類玩家是“里程碑式成就”?有專家評含金量不高

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    里程碑!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    年中之際,屹立芯創(chuàng)迎來里程碑時刻 —— 公司自主研發(fā)生產(chǎn)的真空壓力除泡系統(tǒng),已正式交付頭部通信模組企業(yè),馬來西亞檳城研發(fā)中心。這一成果不僅是對其在先進制造領(lǐng)域技術(shù)實力的硬核驗證,更標(biāo)志著企業(yè)在 IoT 領(lǐng)域?qū)崿F(xiàn)了更深層次的突破,為其海外市場拓展與先進封裝領(lǐng)域的深耕筑牢了根基。
    的頭像 發(fā)表于 07-15 10:07 ?165次閱讀
    <b class='flag-5'>里程碑</b>!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    四創(chuàng)電子水利監(jiān)測設(shè)備取得里程碑式進展

    近日,四創(chuàng)電子自主研發(fā)的相控陣型水利測雨雷達,完成全部技術(shù)驗證并工程化落地。該型雷達不僅攻克了相控陣體制下水利測雨全要素技術(shù)指標(biāo)的工程實現(xiàn)難題,更在核心算法、軟計架構(gòu)等關(guān)鍵技術(shù)實現(xiàn)完全自主可控,標(biāo)志著公司水利監(jiān)測設(shè)備取得里程碑式進展。
    的頭像 發(fā)表于 05-06 16:06 ?445次閱讀

    無線路燈控制器:路燈控制器走向智能化的里程碑

    無線路燈控制器:路燈控制器走向智能化的里程碑
    的頭像 發(fā)表于 03-17 09:19 ?356次閱讀
    無線路燈控制器:路燈控制器走向智能化的<b class='flag-5'>里程碑</b>

    三星電子1c nm內(nèi)存開發(fā)良率里程碑推遲

    據(jù)韓媒報道,三星電子已將其1c nm DRAM內(nèi)存開發(fā)的良率里程碑時間推遲了半年。原本,三星計劃在2024年底將1c nm制程DRAM的良率提升至70%,以達到結(jié)束開發(fā)工作、順利進入量產(chǎn)階段的要求。然而,實際情況并未如愿。
    的頭像 發(fā)表于 01-22 15:54 ?592次閱讀

    三星1c nm DRAM開發(fā)良率里程碑延期

    據(jù)韓媒MoneyToday報道,三星電子已將其1c nm(1-cyano nanometer)DRAM內(nèi)存開發(fā)的良率里程碑時間從原定的2024年底推遲至2025年6月。這一變動可能對三星在HBM4
    的頭像 發(fā)表于 01-22 14:27 ?635次閱讀

    e絡(luò)盟達成micro:bit分銷里程碑

    近日,全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟,與合作伙伴Micro:bit教育基金會共同宣布了一項重要里程碑:e絡(luò)盟成功制造并分銷了超過1000萬臺BBC micro:bit計算機。這一
    的頭像 發(fā)表于 12-23 16:26 ?668次閱讀

    破萬億!中國芯片出口迎來里程碑

    在全球科技競爭日益激烈的今天,中國芯片產(chǎn)業(yè)的發(fā)展備受矚目。根據(jù)海關(guān)總署最新公布的數(shù)據(jù),2023年前11個月,中國集成電路出口額首次突破1萬億元人民幣,同比增長20.3%,這一里程碑式的成就標(biāo)志著中國
    的頭像 發(fā)表于 12-17 16:43 ?1151次閱讀
    破萬億!中國芯片出口迎來<b class='flag-5'>里程碑</b>

    e絡(luò)盟實現(xiàn)重要里程碑:成功分銷 1000 萬套 micro:bit 設(shè)備

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟與合作伙伴 Micro:bit 教育基金會日前攜手宣布,e絡(luò)盟成功達成了制造并分銷超過 1000 萬臺 BBC micro:bit 計算機的重大里程碑,以幫助全球青少年通過物理計算發(fā)現(xiàn)編程的樂趣。
    的頭像 發(fā)表于 12-12 10:34 ?672次閱讀
    e絡(luò)盟實現(xiàn)重要<b class='flag-5'>里程碑</b>:成功分銷 1000 萬套 micro:bit 設(shè)備

    Coherent 意已實現(xiàn)出貨150,000個OPSL的里程碑

    150,000 個 OPSL 且仍在增加Coherent 意的里程碑成就展現(xiàn)了光泵半導(dǎo)體激光器 (OPSL) 的持久優(yōu)勢。我們于 2002 年將第一款 OPSL(488 nm 藍色
    的頭像 發(fā)表于 11-22 06:31 ?428次閱讀
    Coherent <b class='flag-5'>高</b>意已實現(xiàn)出貨150,000個OPSL的<b class='flag-5'>里程碑</b>

    比亞迪達成新能源汽車下線千萬輛里程碑

    近日,比亞迪迎來了其發(fā)展歷程中的一個重要里程碑——第1000萬輛新能源汽車正式下線。這一歷史性的時刻標(biāo)志著比亞迪在新能源汽車領(lǐng)域的卓越成就和持續(xù)創(chuàng)新。 此次下線的車型為騰勢Z9,一款定位于D級市場
    的頭像 發(fā)表于 11-19 14:16 ?886次閱讀

    黑芝麻智能與Nullmax達成重要合作里程碑

    近日,自動駕駛技術(shù)領(lǐng)域的兩大領(lǐng)先企業(yè)——黑芝麻智能與Nullmax宣布達成了一項重要的合作里程碑。雙方基于黑芝麻智能的武當(dāng)C1200家族芯片,共同推出了BEV無圖方案,并成功實現(xiàn)了NOA領(lǐng)航輔助、記憶行車及記憶泊車等高階智能駕駛功能。
    的頭像 發(fā)表于 10-10 18:15 ?1104次閱讀

    OpenAI預(yù)計2029年實現(xiàn)盈利

    據(jù)最新報道,OpenAI預(yù)測其將在2029年實現(xiàn)盈利,屆時年收入有望達到1000億美元。然而,在達到這一里程碑之前,該公司將面臨長期的財務(wù)挑戰(zhàn)。
    的頭像 發(fā)表于 10-10 16:39 ?597次閱讀

    愛瑪機電突破千萬臺電機產(chǎn)量里程碑

     在電動車行業(yè)迎來新里程碑的9月25日,愛瑪科技集團股份有限公司(以下簡稱“愛瑪科技”)宣布其機電事業(yè)部成功實現(xiàn)累計產(chǎn)量從300萬臺到1000萬臺的飛躍。這一成就不僅標(biāo)志著愛瑪機電在電動車動力領(lǐng)域的行業(yè)地位進一步鞏固,也充分展示了中國在兩輪電動車制造領(lǐng)域的強大創(chuàng)新能力和市場影響力。
    的頭像 發(fā)表于 09-26 17:07 ?1050次閱讀

    特斯拉里程碑達成:第1億顆4680電池震撼問世

    特斯拉的4680電池技術(shù)再次跨越重要里程碑,公司于9月15日欣然宣布,其第1億顆創(chuàng)新性的4680電池已成功下線,這一成就標(biāo)志著特斯拉在電池制造領(lǐng)域的飛速進展。特斯拉首席執(zhí)行官埃隆·馬斯克通過社交媒體向辛勤工作的電池團隊致以熱烈祝賀,彰顯了公司對這一里程碑事件的自豪與重視。
    的頭像 發(fā)表于 09-18 15:30 ?1848次閱讀

    特斯拉迎來里程碑:全球第1000萬個電驅(qū)系統(tǒng)下線

    在科技日新月異的今天,電動汽車行業(yè)的領(lǐng)軍企業(yè)特斯拉再次以非凡的成就震撼全球。8月1日,特斯拉官方宣布了一個具有歷史意義的消息——全球第1000萬個電驅(qū)系統(tǒng)正式下線,標(biāo)志著特斯拉在電動汽車核心技術(shù)的自主研發(fā)與規(guī)?;a(chǎn)上邁出了堅實的一步,迎來了其發(fā)展歷程中的首個“一千萬”里程碑。
    的頭像 發(fā)表于 08-01 16:40 ?1455次閱讀