完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:225個(gè) 瀏覽:11597次 帖子:1個(gè)
盤(pán)點(diǎn)人工智能行業(yè)的25大趨勢(shì)
知名創(chuàng)投研究機(jī)構(gòu)CB Insights調(diào)研了25種最大的AI趨勢(shì),以確定2019年該技術(shù)的下一步趨勢(shì),他們根據(jù)行業(yè)采用率和市場(chǎng)優(yōu)勢(shì)評(píng)估了每種趨勢(shì),并將其...
2019-02-25 標(biāo)簽:人工智能開(kāi)源強(qiáng)化學(xué)習(xí) 4718 0
簡(jiǎn)單隨機(jī)搜索:無(wú)模型強(qiáng)化學(xué)習(xí)的高效途徑
讓我們?cè)趶?qiáng)化學(xué)習(xí)社區(qū)感興趣的問(wèn)題上應(yīng)用隨機(jī)搜索。深度強(qiáng)化學(xué)習(xí)領(lǐng)域一直把大量時(shí)間和精力用于由OpenAI維護(hù)的、基于MuJoCo模擬器的一套基準(zhǔn)測(cè)試中。這...
2018-04-01 標(biāo)簽:強(qiáng)化學(xué)習(xí) 4672 0
OpenAI宣布他們的AI僅通過(guò)一次人類(lèi)演示,蒙特祖瑪?shù)膹?fù)仇游戲中玩出歷史最高分
這次,OpenAI的研究團(tuán)隊(duì)訓(xùn)練了一個(gè)智能體,僅通過(guò)一次人類(lèi)demo,就在蒙特祖瑪?shù)膹?fù)仇游戲中獲得了74500分的成績(jī),比以往公布的任何結(jié)果都要好。
2018-07-09 標(biāo)簽:算法智能體強(qiáng)化學(xué)習(xí) 4579 0
上海的谷歌開(kāi)發(fā)者大會(huì)還沒(méi)結(jié)束,14日,在北京,谷歌也舉行了一個(gè)小范圍的面向?qū)W生的宣講,李飛飛教授出席。昨天在上海,主旨演講后,李飛飛和李佳等谷歌的AI研...
2017-12-28 標(biāo)簽:AI深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 4468 0
谷歌AI發(fā)布足球游戲強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境“足球引擎”
該強(qiáng)化學(xué)習(xí)環(huán)境的核心是一種先進(jìn)的足球游戲模擬,稱(chēng)為“足球引擎”,它基于一個(gè)足球游戲版本經(jīng)大量修改而成。根據(jù)兩支對(duì)方球隊(duì)的輸入動(dòng)作,模擬了足球比賽中的常見(jiàn)...
2019-06-15 標(biāo)簽:谷歌AI強(qiáng)化學(xué)習(xí) 4460 0
圖解大模型RLHF系列之:人人都能看懂的PPO原理與源碼解讀
回想一下我們對(duì)NLP任務(wù)做強(qiáng)化學(xué)習(xí)(RLHF)的目的:我們希望給模型一個(gè)prompt,讓模型能生成符合人類(lèi)喜好的response。再回想一下gpt模型做...
2024-01-14 標(biāo)簽:源碼強(qiáng)化學(xué)習(xí)大模型 4213 0
只有提高算力才能發(fā)展AI? 強(qiáng)化學(xué)習(xí)之父薩頓與牛津教授掀起隔空論戰(zhàn)
關(guān)系到AI的方向問(wèn)題!
2019-03-25 標(biāo)簽:AI強(qiáng)化學(xué)習(xí) 4189 0
簡(jiǎn)單來(lái)說(shuō)就是,不管你是亞馬遜云、微軟云、谷歌云、阿里云還是 IBM 云,公有云、私有云還是混合云,Watson 微服務(wù)都能跑。這就使得那些使用 Wats...
2019-02-18 標(biāo)簽:IBMAI強(qiáng)化學(xué)習(xí) 4155 0
微軟亞洲研究院開(kāi)發(fā)的麻將AI系統(tǒng)Suphx成為首個(gè)在國(guó)際知名專(zhuān)業(yè)麻將平臺(tái)“天鳳”
2019-09-13 標(biāo)簽:微軟AI強(qiáng)化學(xué)習(xí) 3983 0
除此之外,這場(chǎng)比賽與正常的Dota 2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地...
2019-04-19 標(biāo)簽:機(jī)器人AI強(qiáng)化學(xué)習(xí) 3961 0
2018-2019年十項(xiàng)最具特色的成長(zhǎng)性技術(shù)的AI技術(shù)
膠囊網(wǎng)絡(luò)。是指在深度神經(jīng)網(wǎng)絡(luò)中構(gòu)建多層神經(jīng)元模塊,用以發(fā)現(xiàn)并存儲(chǔ)物體詳細(xì)空間位置和姿態(tài)等信息的技術(shù)。該技術(shù)能使機(jī)器在樣本數(shù)據(jù)較少情形下,快速識(shí)別不同情境...
2018-08-19 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強(qiáng)化學(xué)習(xí) 3926 0
不像現(xiàn)在的許多四足機(jī)器人,ANYmal有防水能力,是專(zhuān)門(mén)為穿越不太理想的環(huán)境而設(shè)計(jì)的,比如森林、工業(yè)場(chǎng)所和雪地。根據(jù)ANYbotics的說(shuō)法,這款機(jī)器人...
2019-01-21 標(biāo)簽:強(qiáng)化學(xué)習(xí)波士頓動(dòng)力機(jī)器狗 3921 0
谷歌推出新的基于Tensorflow的強(qiáng)化學(xué)習(xí)框架,稱(chēng)為Dopamine
強(qiáng)化學(xué)習(xí)(RL)研究在過(guò)去幾年取得了許多重大進(jìn)展。強(qiáng)化學(xué)習(xí)的進(jìn)步使得 AI 智能體能夠在一些游戲上超過(guò)人類(lèi),值得關(guān)注的例子包括 DeepMind 攻破 ...
2018-08-31 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí) 3913 0
人工智能的強(qiáng)化學(xué)習(xí)要點(diǎn)
強(qiáng)化學(xué)習(xí)(RL)是現(xiàn)代人工智能領(lǐng)域中最熱門(mén)的研究主題之一,其普及度還在不斷增長(zhǎng)。 讓我們看一下開(kāi)始學(xué)習(xí)RL需要了解的5件事。
2020-05-04 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 3837 0
讓我們一起來(lái)感受夏威夷撲面而來(lái)的AI暖風(fēng)吧
AAAI19的教程在27號(hào)和28號(hào)舉行,基本上包括了人工智能基礎(chǔ)研究領(lǐng)域近年來(lái)的最新進(jìn)展。在教程中可以學(xué)習(xí)到對(duì)于某個(gè)細(xì)分領(lǐng)域問(wèn)題的理論框架和模型工具。無(wú)...
2019-01-29 標(biāo)簽:人工智能智慧城市強(qiáng)化學(xué)習(xí) 3733 0
ICLR 2019共接收1591篇投稿,創(chuàng)下歷年新高
我建議你們將會(huì)議視為一種“必須申請(qǐng)的免費(fèi)推廣機(jī)會(huì)”,它會(huì)對(duì)已經(jīng)很好的論文有幫助,但評(píng)分多少并沒(méi)有論文的實(shí)際影響那么重要。如果以后每個(gè)人都開(kāi)始使用你的re...
2018-11-08 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)GAN強(qiáng)化學(xué)習(xí) 3709 0
一個(gè)基于TF2.0的強(qiáng)化學(xué)習(xí)訓(xùn)練工具
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(...
2019-02-25 標(biāo)簽:強(qiáng)化學(xué)習(xí)tensorflow開(kāi)源工具 3674 0
韓國(guó)科學(xué)技術(shù)院(KAIST)上周在大田市舉辦了“人工智能世界杯”,證明人工智能已經(jīng)準(zhǔn)備好進(jìn)入足球世界。
2018-08-28 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 3615 0
谷歌、DeepMind重磅推出PlaNet 強(qiáng)化學(xué)習(xí)新突破
Google AI 與 DeepMind 合作推出深度規(guī)劃網(wǎng)絡(luò) (PlaNet),這是一個(gè)純粹基于模型的智能體,能從圖像輸入中學(xué)習(xí)世界模型,完成多項(xiàng)規(guī)劃...
2019-02-17 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí)DeepMind 3615 0
基于部分可觀察馬爾可夫決策過(guò)程思考自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí)問(wèn)題的一些想法
但是端到端世界的態(tài)度看起來(lái)是,既然我們不再進(jìn)行邏輯推理,那么我們完全沒(méi)有必要考慮含義。突然之間,所有人都喜歡稱(chēng)引維特根斯坦,主張我們應(yīng)該以下游任務(wù)的成功...
2018-11-30 標(biāo)簽:強(qiáng)化學(xué)習(xí)自然語(yǔ)言處理 3582 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |