99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI棋牌應(yīng)用的現(xiàn)實(shí)意義

bzSh_drc_iite ? 來(lái)源:YXQ ? 2019-07-29 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI在棋牌類游戲的應(yīng)用,將促進(jìn)博弈決策的研究,以棋牌類AI應(yīng)用為基礎(chǔ)的相關(guān)AI博弈工具,在經(jīng)濟(jì)金融領(lǐng)域的風(fēng)險(xiǎn)預(yù)測(cè)、軍事領(lǐng)域的戰(zhàn)局預(yù)測(cè)等方向有著廣泛的應(yīng)用前景。

半個(gè)多世紀(jì)以來(lái),棋牌類游戲一直是人工智能(AI)發(fā)展創(chuàng)新的舞臺(tái)。利用AI在被視作智力游戲的棋牌中打敗人類,也一直是AI研究所追求的目標(biāo)。從1997年IBM的超級(jí)電腦“深藍(lán)”擊敗國(guó)際象棋世界冠軍卡斯帕羅夫,到2016年谷歌開發(fā)的AI機(jī)器人AlphaGo戰(zhàn)勝圍棋世界冠軍李世石,AI在棋牌類比賽中屢獲突破。2019年7月,卡耐基梅隆大學(xué)與Facebook公司共同開發(fā)的AI機(jī)器人“Pluribus”,在無(wú)限制德州撲克6人對(duì)決比賽中戰(zhàn)勝5名專家級(jí)人類玩家,AI在德州撲克戰(zhàn)場(chǎng)再下一城。

Pluribus概況

Pluribus與人類的比賽分為兩種模式:1個(gè)AI與5個(gè)人類玩家和5個(gè)AI與1個(gè)人類玩家,Pluribus在這兩種模式中都取得了勝利。而為了戰(zhàn)勝人類,Pluribus在策略、算法和能耗上進(jìn)行了多次優(yōu)化。

Pluribus研發(fā)的核心策略是運(yùn)用改進(jìn)版本的蒙特卡洛遺憾最小化算法(Monte Carlo Counter factual Regret Minimization,MCCFR),通過自我博弈的方式學(xué)習(xí)。Pluribus首先隨機(jī)地選擇玩法,通過蠻力計(jì)算得到收斂的結(jié)果,并對(duì)這些行動(dòng)擬合概率分布,使得其實(shí)力在不斷自我博弈中逐步變強(qiáng)。在整個(gè)學(xué)習(xí)過程中,AI機(jī)器人和自己進(jìn)行對(duì)戰(zhàn),不使用任何人類游戲數(shù)據(jù)作為輸入。

算法上,為了解決6名玩家的額外復(fù)雜性,Pluribus整合了新的在線搜索算法,使AI能夠在游戲中向前預(yù)測(cè)并決定下一步該做什么,這種機(jī)制被稱為搜索功能。以往的棋牌類算法的每一步?jīng)Q策都需要計(jì)算到游戲結(jié)束,而在線搜索算法只需搜索前面的幾步即可。此外,Pluribus還利用了速度更快的新型self-play非完美信息游戲算法?;谏鲜鰞煞N算法,使得憑借極少的處理能力和內(nèi)存來(lái)訓(xùn)練Pluribus成為可能。

能耗上,研究人員使用一個(gè)64核的服務(wù)器,利用不大于512GB的內(nèi)存,在8天時(shí)間里完成了Pluribus的自我博弈訓(xùn)練,其成本大約為150美元,同其他自我對(duì)弈的AI研究相比,成本極低。而且算法上的進(jìn)步,讓研究人員可憑借較少的資源消耗實(shí)現(xiàn)極大的性能提升。

撲克AI和其他棋牌類AI的對(duì)比

撲克AI與棋類AI的基本原理相同,都采用蒙特卡洛搜索樹算法作為基本算法,不依賴人類所提供的策略,在不斷迭代的過程中實(shí)現(xiàn)自我學(xué)習(xí)。不同的是,棋類游戲中的棋子都展現(xiàn)在棋盤上,結(jié)果種類有限,所有的結(jié)果都是可推算的,這種情況被稱為“完美信息博弈”;牌類游戲中無(wú)法知道對(duì)手的底牌,含有隱藏信息,結(jié)果可能是多樣的,導(dǎo)致其計(jì)算難度和計(jì)算量大大增加,被稱為“不完美信息博弈”。

棋類AI

棋類游戲包括西洋雙陸棋、國(guó)際象棋、圍棋等,比賽中所有的信息和決策公開,并且游戲?qū)τ谕婕襾?lái)說只有贏或輸兩種可能的結(jié)果,從某種意義上說,這使得訓(xùn)練AI變得更容易。棋類在理論上可通過計(jì)算機(jī)模擬出每一種可能的情況,從而進(jìn)行完美信息動(dòng)態(tài)博弈。這類完美信息博弈中AI機(jī)器人往往使用實(shí)時(shí)搜索。例如,當(dāng)模型在決定下一步該如何走時(shí),國(guó)際象棋AI通常會(huì)考慮以后的一些移動(dòng)步驟,直到算法的前瞻到達(dá)深度上限。而圍棋的棋盤變化可能性比可觀測(cè)宇宙范圍的原子總數(shù)還多,因此圍棋AI主要通過深度學(xué)習(xí)技術(shù)訓(xùn)練用于判斷結(jié)果輸贏概率的價(jià)值網(wǎng)絡(luò),來(lái)增強(qiáng)AI對(duì)弈能力。

麻將AI

麻將AI的策略需要更多地增加得點(diǎn)的期望值,盡量增大和大牌的可能性,同時(shí)盡量避免對(duì)手的大牌點(diǎn)炮,這一打牌策略顯然是有最優(yōu)解的。為了有更大的可能性和大牌,AI需要通過手牌和棄牌池里的牌,計(jì)算進(jìn)張(摸到有效牌)和鳴牌(吃、碰、杠)使手牌有進(jìn)展的概率,進(jìn)而計(jì)算和牌得分的期望值。目前最強(qiáng)的麻將AI機(jī)器人是日本東京大學(xué)開發(fā)的“暴打”。

撲克AI

以德州撲克為例,由于在游戲中,玩家無(wú)法獲取已發(fā)生事件的全部信息(如對(duì)手的底牌等),因此這個(gè)游戲?qū)儆凇安煌昝佬畔ⅰ保↖mperfect Information)類游戲。德州撲克一直是人工智能領(lǐng)域最難以攻克的重大問題之一,因?yàn)楹推孱愑螒虿煌瑩淇薃I必須推理隱藏的信息,并慎重平衡自己策略。同時(shí),相比棋類比賽,在撲克游戲中需要使用Bluff(嚇唬)等更多游戲策略。

在Pluribus之前,AI機(jī)器人曾在兩個(gè)參與者的完美信息零和博弈中取得了多次引人注目的成功,但大多數(shù)真實(shí)世界中的策略交互都涉及隱藏信息,且并非兩個(gè)參與者的零和博弈。Pluribus的成功表明,在復(fù)雜的多參與者場(chǎng)景中,基于自我博弈和搜索算法的AI能夠獲得很好的效果。

AI棋牌應(yīng)用的現(xiàn)實(shí)意義

Pluribus提出了在大型狀態(tài)空間、隱藏信息中有效地解決博弈論推理挑戰(zhàn)的方法,所開發(fā)出的技術(shù)很大程度上獨(dú)立于撲克領(lǐng)域,可用于大量不完美信息博弈。Pluribus處理的諸多問題,與真實(shí)世界中的通用問題相對(duì)應(yīng),“不知道對(duì)手的牌”對(duì)應(yīng)現(xiàn)實(shí)中的“不完整信息”,“下注策略和由此帶來(lái)的結(jié)果”對(duì)應(yīng)現(xiàn)實(shí)中的“風(fēng)險(xiǎn)管理”,“確認(rèn)對(duì)手的模式,并進(jìn)行利用”對(duì)應(yīng)現(xiàn)實(shí)中的“智能體建?!保癇luffing(撲克中的恐嚇技巧)”對(duì)應(yīng)現(xiàn)實(shí)中的“欺騙”,“處理對(duì)手欺騙的牌”對(duì)應(yīng)現(xiàn)實(shí)中的“不可靠信息”。

事實(shí)上,棋牌類游戲的本質(zhì)是競(jìng)爭(zhēng)和對(duì)抗,由游戲規(guī)則定義其目標(biāo)(評(píng)價(jià)標(biāo)準(zhǔn)),玩家使用各種策略達(dá)成目標(biāo),其中涉及數(shù)量可觀的博弈過程。AI在棋牌類游戲的應(yīng)用,將促進(jìn)博弈決策的研究。以棋牌類AI應(yīng)用為基礎(chǔ)的相關(guān)AI博弈工具,在經(jīng)濟(jì)金融領(lǐng)域的風(fēng)險(xiǎn)預(yù)測(cè)、軍事領(lǐng)域的戰(zhàn)局預(yù)測(cè)等方向有著廣泛的應(yīng)用前景。

在經(jīng)濟(jì)金融領(lǐng)域,不論對(duì)經(jīng)濟(jì)發(fā)展的總體趨勢(shì)預(yù)測(cè),還是銀行、保險(xiǎn)、股市等細(xì)分行業(yè)的風(fēng)險(xiǎn)模型建立,都需要依靠大量“不完美信息”來(lái)決策。AI博弈工具可通過處理不完美信息來(lái)獲得最佳決策。政府可利用AI博弈工具對(duì)社會(huì)行業(yè)的未來(lái)趨勢(shì)進(jìn)行預(yù)測(cè),判斷供需關(guān)系,合理有序引導(dǎo)行業(yè)健康發(fā)展。銀行、保險(xiǎn)公司可利用AI工具判斷短期行業(yè)走勢(shì),高效評(píng)估企業(yè)風(fēng)險(xiǎn),以決定是否達(dá)成交易。

在軍事領(lǐng)域,具有自主學(xué)習(xí)功能的AI博弈工具與兵棋推演相結(jié)合,將爆發(fā)出極強(qiáng)的戰(zhàn)斗力,幫助軍隊(duì)獲取制勝先機(jī)。從上個(gè)世紀(jì)70年代初開始,美國(guó)陸軍就按照“全自動(dòng)兵棋”概念建立起“地面作戰(zhàn)模擬系統(tǒng)”。20世紀(jì)90年代初,美軍在海灣戰(zhàn)爭(zhēng)爆發(fā)前就使用兵棋游戲?qū)φ麄€(gè)戰(zhàn)爭(zhēng)進(jìn)行了推演,而戰(zhàn)爭(zhēng)的過程幾乎和美軍事前的推演如出一轍。隨著技術(shù)的進(jìn)步,算法不斷成熟使得算力需求進(jìn)一步降低,同時(shí)計(jì)算技術(shù)朝著系統(tǒng)微型化和處理高速化方向發(fā)展,具備超強(qiáng)自主學(xué)習(xí)和計(jì)算能力的AI系統(tǒng)與作戰(zhàn)模擬系統(tǒng)相結(jié)合,將提升對(duì)戰(zhàn)局的預(yù)測(cè)和把控。未來(lái),AI系統(tǒng)將有希望直接與戰(zhàn)場(chǎng)指揮系統(tǒng)對(duì)接,其快速戰(zhàn)局推演能力、高效制定作戰(zhàn)方案的能力,將主導(dǎo)戰(zhàn)爭(zhēng)的勝負(fù)走向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212998
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35168

    瀏覽量

    280179

原文標(biāo)題:人工智能技術(shù)在棋牌中的應(yīng)用“Pluribus”及其現(xiàn)實(shí)意義

文章出處:【微信號(hào):drc_iite,微信公眾號(hào):全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ChatGPT 智能體發(fā)布的觀點(diǎn)解析及對(duì)科義相關(guān)系統(tǒng)的現(xiàn)實(shí)意義

    7月18日凌晨,OpenAI 發(fā)布通用人工智能代理 ChatGPT 智能體。這一事件蘊(yùn)含著多層面的深刻意義,同時(shí)也為科義巡檢機(jī)器人和科義視頻行為分析系統(tǒng)帶來(lái)了諸多現(xiàn)實(shí)影響。 從技術(shù)層面來(lái)看,這標(biāo)志著
    的頭像 發(fā)表于 07-18 16:31 ?245次閱讀

    基于FPGA YOLO算法的掃描式SMT焊點(diǎn)缺陷檢測(cè)系統(tǒng)設(shè)計(jì)

    作為電子產(chǎn)品最重要的組成部分,印刷電路板(PCB)的設(shè)計(jì)日趨復(fù)雜和器件尺寸的縮小,促使對(duì) SMT 可靠性提出了更高的要求。因此對(duì)于 SMT 電路板的檢測(cè)研究具有深刻的現(xiàn)實(shí)意義和經(jīng)濟(jì)價(jià)值。
    的頭像 發(fā)表于 07-16 11:16 ?773次閱讀
    基于FPGA YOLO算法的掃描式SMT焊點(diǎn)缺陷檢測(cè)系統(tǒng)設(shè)計(jì)

    森瑟傳感器在風(fēng)電葉片監(jiān)測(cè)行業(yè)的應(yīng)用

    通過風(fēng)機(jī)葉片在線監(jiān)測(cè)系統(tǒng)及早發(fā)現(xiàn)葉片振動(dòng)超限、載荷過大等問題,通過實(shí)時(shí)監(jiān)測(cè) 和超限報(bào)警及時(shí)調(diào)整風(fēng)機(jī)運(yùn)行狀態(tài),防止出現(xiàn)葉片發(fā)生事故,這對(duì)風(fēng)機(jī)安全有非常重要的現(xiàn)實(shí)意義。
    的頭像 發(fā)表于 07-15 10:02 ?114次閱讀
    森瑟傳感器在風(fēng)電葉片監(jiān)測(cè)行業(yè)的應(yīng)用

    巨頭押寶AI眼鏡,DPVR AI Glasses將成“現(xiàn)實(shí)助手”?

    VR同期曝光的戰(zhàn)略級(jí)產(chǎn)品DPVR AI Glasses,其技術(shù)架構(gòu)與功能設(shè)計(jì)理念同樣指向更廣闊的現(xiàn)實(shí)應(yīng)用場(chǎng)景,展現(xiàn)出國(guó)產(chǎn)科技企業(yè)在智能穿戴領(lǐng)域的前瞻性戰(zhàn)略布局。 影像技術(shù)預(yù)研突破,定義沉浸式記錄新標(biāo)準(zhǔn) DPVR AI Glass
    的頭像 發(fā)表于 05-30 10:49 ?270次閱讀

    開關(guān)柜防誤可視化順控操作為什么有必要做?

    蜀瑞創(chuàng)新科普:開關(guān)柜防誤可視化順控操作(通常指基于可視化技術(shù)的順序控制防誤操作)即使在已有傳統(tǒng)五防系統(tǒng)的基礎(chǔ)上,仍然具有重要的現(xiàn)實(shí)意義和必要性,主要原因如下:
    的頭像 發(fā)表于 05-29 09:22 ?105次閱讀
    開關(guān)柜防誤可視化順控操作為什么有必要做?

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺(tái)開發(fā)智能體方法

    Agent的開發(fā)基本過程和應(yīng)該具備的知識(shí)有了一個(gè)認(rèn)識(shí),具有相當(dāng)?shù)?b class='flag-5'>現(xiàn)實(shí)實(shí)在意義,希望您也能讀一讀它,也希望的的分享對(duì)您有意義。 感謝電子發(fā)燒友!??!
    發(fā)表于 05-14 19:51

    安防智能制造有了新的指引

    安防行業(yè)正向智能化、數(shù)字化方向發(fā)展,而2025年以DeepSeek為代表的大模型技術(shù)讓安防+AI2.0更具現(xiàn)實(shí)意義
    的頭像 發(fā)表于 05-09 09:21 ?188次閱讀
    安防智能制造有了新的指引

    隧道調(diào)頻廣播覆蓋的實(shí)現(xiàn)路徑:隧道無(wú)線廣播技術(shù)賦能行車安全升級(jí)

    實(shí)施,該系統(tǒng)不僅能夠解決隧道內(nèi)的廣播盲區(qū)問題,還能在安全應(yīng)急、交通管理等方面發(fā)揮重要作用。因此,實(shí)現(xiàn)隧道調(diào)頻廣播全覆蓋具有重要的現(xiàn)實(shí)意義和安全價(jià)值。
    的頭像 發(fā)表于 04-23 18:24 ?144次閱讀
    隧道調(diào)頻廣播覆蓋的實(shí)現(xiàn)路徑:隧道無(wú)線廣播技術(shù)賦能行車安全升級(jí)

    基于RV1126開發(fā)板的人臉姿態(tài)估計(jì)算法開發(fā)

    )、左右旋轉(zhuǎn)(yaw)以及平面內(nèi)角度旋轉(zhuǎn)(roll)。因此,姿態(tài)估計(jì)在多姿態(tài)人臉的識(shí)別和司機(jī)行為檢測(cè)等應(yīng)用場(chǎng)景,具有巨大的現(xiàn)實(shí)意義和實(shí)用價(jià)值。
    的頭像 發(fā)表于 04-14 17:21 ?1666次閱讀
    基于RV1126開發(fā)板的人臉姿態(tài)估計(jì)算法開發(fā)

    固定式雷達(dá)波在線測(cè)流系統(tǒng):保障河流防汛安全的 “流量衛(wèi)士”

    固定式雷達(dá)波在線測(cè)流系統(tǒng)作為保障河流防汛安全的 “流量衛(wèi)士”,具有重要的現(xiàn)實(shí)意義和廣泛的應(yīng)用前景。它以其高精度、實(shí)時(shí)在線、非接觸式測(cè)量等特點(diǎn),為河流防汛、水資源管理、水利工程管理和生態(tài)環(huán)境保護(hù)等方面提供了有力的技術(shù)支持。
    的頭像 發(fā)表于 12-04 17:45 ?764次閱讀
    固定式雷達(dá)波在線測(cè)流系統(tǒng):保障河流防汛安全的 “流量衛(wèi)士”

    人工智能與計(jì)算產(chǎn)業(yè)生態(tài)峰會(huì)暨哈爾濱新質(zhì)生產(chǎn)力峰會(huì)圓滿落幕

    以“數(shù)智龍江·向新而行”為主題的人工智能與計(jì)算產(chǎn)業(yè)生態(tài)峰會(huì)暨哈爾濱新質(zhì)生產(chǎn)力峰會(huì)成功舉辦。新質(zhì)生產(chǎn)力是以科技創(chuàng)新為主導(dǎo)的生產(chǎn)力,對(duì)新時(shí)代新征程推動(dòng)高質(zhì)量發(fā)展、推進(jìn)現(xiàn)代化進(jìn)程具有重大現(xiàn)實(shí)意義和深遠(yuǎn)
    的頭像 發(fā)表于 12-04 11:18 ?594次閱讀

    揭秘那些賺錢的無(wú)人自助場(chǎng)景!涂鴉IoT Core賦能無(wú)人棋牌房案例應(yīng)用

    隨著棋牌與臺(tái)球領(lǐng)域的深度探索與持續(xù)創(chuàng)新,科學(xué)技術(shù)的不斷突破與創(chuàng)新,雀江湖無(wú)人自助棋牌室解決方案將前沿的智能技術(shù)、人工智能算法與云計(jì)算能力深度融合,為行業(yè)樹立了新的技術(shù)標(biāo)桿。涂鴉智能的云開發(fā)者平臺(tái)為
    的頭像 發(fā)表于 11-16 01:04 ?962次閱讀
    揭秘那些賺錢的無(wú)人自助場(chǎng)景!涂鴉IoT Core賦能無(wú)人<b class='flag-5'>棋牌</b>房案例應(yīng)用

    淺談光伏-直流智能充電樁有序充電策略與應(yīng)用效果

    光伏-直流智能充電樁的有序充電策略具有重要的現(xiàn)實(shí)意義和應(yīng)用價(jià)值。通過合理的規(guī)劃和管理,可以充分發(fā)揮其優(yōu)勢(shì),為電動(dòng)汽車用戶提供有效、便捷、環(huán)保的充電服務(wù),同時(shí)也為能源轉(zhuǎn)型和可持續(xù)發(fā)展做出貢獻(xiàn)。
    的頭像 發(fā)表于 11-11 13:48 ?685次閱讀
    淺談光伏-直流智能充電樁有序充電策略與應(yīng)用效果

    AI云平臺(tái)建設(shè)意義

    AI云平臺(tái),作為AI技術(shù)與云計(jì)算深度融合的產(chǎn)物,其建設(shè)不僅標(biāo)志著技術(shù)創(chuàng)新的又一高峰,更蘊(yùn)含著對(duì)社會(huì)經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)升級(jí)、創(chuàng)新生態(tài)構(gòu)建等多方面的深遠(yuǎn)意義。
    的頭像 發(fā)表于 10-12 09:52 ?511次閱讀