完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:225個(gè) 瀏覽:11597次 帖子:1個(gè)
深度強(qiáng)化學(xué)習(xí)已經(jīng)達(dá)到了盡頭?
不可否認(rèn),深度學(xué)習(xí)的熱度已經(jīng)大大下降,贊美深度學(xué)習(xí)作為AI終極算法的推文少得多了,而且論文正在變得不那么“革命”,現(xiàn)在大家換了個(gè)詞,叫:進(jìn)化。
2019-04-29 標(biāo)簽:人工智能自動(dòng)駕駛強(qiáng)化學(xué)習(xí) 3562 0
深度強(qiáng)化學(xué)習(xí)能讓機(jī)器人擁有人一樣的意識(shí)
機(jī)器人擁有人一樣的意識(shí),一直是我們目前難以攻克的難題。在近日,加州大學(xué)伯克利分校的科學(xué)家和谷歌人工智能(AI)研究部門(mén)之一的Google Brain在A...
2019-01-03 標(biāo)簽:機(jī)器人強(qiáng)化學(xué)習(xí) 3547 0
如果不避讓就會(huì)撞上一群人,避讓就會(huì)撞上另一個(gè)人,它應(yīng)該避開(kāi)人群?jiǎn)??它?yīng)該保護(hù)乘客,還是保護(hù)行人?它應(yīng)該保護(hù)年輕人還是老年人?盡管這些情況極為罕見(jiàn),但很顯...
2018-11-12 標(biāo)簽:谷歌AI強(qiáng)化學(xué)習(xí) 3534 0
教會(huì)機(jī)器人如何和人類(lèi)一樣靈活地操縱物體
在幫助計(jì)算機(jī)視覺(jué)模型識(shí)別被操縱物體的樣子之后,研究人員轉(zhuǎn)而進(jìn)行了艱苦的工作,即使用384臺(tái)機(jī)器來(lái)訓(xùn)練模型,以使用模擬的攝像機(jī)圖像來(lái)預(yù)測(cè)物體的方向。為了加...
2018-08-01 標(biāo)簽:機(jī)器人計(jì)算機(jī)視覺(jué)強(qiáng)化學(xué)習(xí) 3522 0
AlphaGo首席研究員談強(qiáng)化學(xué)習(xí)十大黃金法則!
Silver的演講中提出的強(qiáng)化學(xué)習(xí)10大要點(diǎn)涵蓋涉及算法評(píng)估、狀態(tài)控制、建模函數(shù)等方面的心得和建議,非常值得開(kāi)發(fā)者和機(jī)器學(xué)習(xí)愛(ài)好者參考學(xué)習(xí)。一起看看他是...
2018-09-17 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí)DeepMind 3501 0
深度強(qiáng)化學(xué)習(xí)打造的ANYmal登上Science子刊,真的超越了波士頓動(dòng)力!
習(xí)得運(yùn)動(dòng)控制器的量化評(píng)估結(jié)果。A. 發(fā)現(xiàn)的步態(tài)模式按速度指令以 1.0 m/s 的速度運(yùn)行。LF 表示左前腿,RF 表示右前腿,LH 表示左后腿,RH ...
2019-01-28 標(biāo)簽:強(qiáng)化學(xué)習(xí)ai技術(shù)波士頓動(dòng)力 3411 0
博士生David Abel詳細(xì)整理了一份87頁(yè)的ICML大會(huì)筆記
很多博士生可能覺(jué)得論文眼花繚亂看都不看不過(guò)來(lái),更不要說(shuō)整理出一份詳細(xì)的筆記。而對(duì)很多還沒(méi)有機(jī)會(huì)參加 ICML 這樣頂級(jí)大會(huì)的人來(lái)說(shuō),顯然,David A...
2019-07-18 標(biāo)簽:計(jì)算機(jī)科學(xué)機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 3376 0
中國(guó)電子學(xué)會(huì)發(fā)布十項(xiàng)最具成長(zhǎng)性的AI技術(shù)
為加強(qiáng)對(duì)新一代人工智能技術(shù)的前瞻預(yù)判,把握全球技術(shù)創(chuàng)新動(dòng)態(tài)及發(fā)展趨勢(shì),中國(guó)電子學(xué)會(huì)近期走訪人工智能相關(guān)企業(yè)及高校院所專(zhuān)家,遴選發(fā)布了十項(xiàng)最具特色的成長(zhǎng)性技術(shù)。
2018-09-01 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強(qiáng)化學(xué)習(xí) 3314 0
70年來(lái)AI研究方面的苦澀教訓(xùn):我們過(guò)于依靠人類(lèi)知識(shí)了
Sutton認(rèn)為,過(guò)去70年來(lái),AI研究走過(guò)的最大彎路,就是過(guò)于重視人類(lèi)既有經(jīng)驗(yàn)和知識(shí),研究人員在訓(xùn)練AI模型時(shí),往往想將人類(lèi)知識(shí)灌輸給智能體,而不是讓...
2019-03-18 標(biāo)簽:AI智能體強(qiáng)化學(xué)習(xí) 3278 0
谷歌提出元獎(jiǎng)勵(lì)學(xué)習(xí),兩大基準(zhǔn)測(cè)試刷新最優(yōu)結(jié)果
重要的是,由于獎(jiǎng)勵(lì)不明確,智能體可能會(huì)收到“利用環(huán)境中的虛假模式”的正反饋,這就有可能導(dǎo)致獎(jiǎng)勵(lì)黑客攻擊,在實(shí)際系統(tǒng)中部署時(shí)會(huì)導(dǎo)致意外和有害的行為。
2019-02-24 標(biāo)簽:谷歌智能體強(qiáng)化學(xué)習(xí) 3180 0
基于PPO強(qiáng)化學(xué)習(xí)算法的AI應(yīng)用案例
Viet Nguyen就是其中一個(gè)。這位來(lái)自德國(guó)的程序員表示自己只玩到了第9個(gè)關(guān)卡。因此,他決定利用強(qiáng)化學(xué)習(xí)AI算法來(lái)幫他完成未通關(guān)的遺憾。
2020-07-29 標(biāo)簽:算法AI強(qiáng)化學(xué)習(xí) 3177 0
用AI打星際有多“硬核”?難點(diǎn)和挑戰(zhàn)在哪?
包括DeepMind在內(nèi)的世界頂尖AI團(tuán)隊(duì)也在攻堅(jiān)《星際爭(zhēng)霸II》。其背后擁有一個(gè)共同的終極目標(biāo)——進(jìn)一步拓展AI邊界,并為最終達(dá)到通用人工智能(AGI...
2019-09-13 標(biāo)簽:AI強(qiáng)化學(xué)習(xí)DeepMind 3163 0
谷歌最近提出一種新的強(qiáng)化學(xué)習(xí)算法:模擬策略學(xué)習(xí) (SimPLe)
為了訓(xùn)練一個(gè)玩 Atari 游戲的模型,我們首先需要在像素空間中生成合理的未來(lái)版本。換句話說(shuō),我們通過(guò)將一系列已經(jīng)觀察到的幀和給到游戲的命令 (如 “左...
2019-03-29 標(biāo)簽:谷歌算法強(qiáng)化學(xué)習(xí) 3144 0
基于帶約束強(qiáng)化學(xué)習(xí)的 BPP-1 求解
事實(shí)上,人可以根據(jù)即將到來(lái)的幾個(gè)箱子的形狀尺寸,很快地做出決策,并不需要、也無(wú)法做到對(duì)整個(gè)箱子序列的全局規(guī)劃。這種僅僅看到部分箱子序列的裝箱問(wèn)題,稱(chēng)為在...
2021-01-27 標(biāo)簽:機(jī)器人算法強(qiáng)化學(xué)習(xí) 3115 0
你們不是嫌棄世界冠軍OG團(tuán)隊(duì)實(shí)力太水嗎?“你行你上”的機(jī)會(huì)來(lái)了
對(duì)于 OpenAI Five 競(jìng)技場(chǎng)模式,有很多人報(bào)以期待,reddit 上有網(wǎng)友評(píng)論稱(chēng),“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經(jīng)...
2019-04-22 標(biāo)簽:機(jī)器人智能體強(qiáng)化學(xué)習(xí) 3101 0
70年來(lái),人們?cè)贏I領(lǐng)域“一直連續(xù)犯著同樣的錯(cuò)誤”
就像在棋類(lèi)游戲中一樣,研究人員總是試圖讓系統(tǒng)按照他們心目中的人類(lèi)的思維方式工作,試圖把這些知識(shí)放進(jìn)計(jì)算機(jī)的系統(tǒng)里。但最終,當(dāng)摩爾定律帶來(lái)大規(guī)模算力,其他...
2019-03-26 標(biāo)簽:摩爾定律深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2961 0
Reaver在《星際爭(zhēng)霸 II》各種小型游戲上與其他AI的性能對(duì)比
“對(duì)于業(yè)余愛(ài)好者而言,只要對(duì) Reaver 稍作修改(例如超參數(shù)),就能得到訓(xùn)練深度強(qiáng)化學(xué)習(xí)智能體的所有必須工具。對(duì)于經(jīng)驗(yàn)豐富的研究人員,Reaver ...
2018-11-29 標(biāo)簽:強(qiáng)化學(xué)習(xí)GithubAI算法 2893 0
樹(shù)枝也能制造機(jī)器人?日本創(chuàng)新機(jī)器人自主學(xué)會(huì)走路
近日,日本研究人員公開(kāi)了一種使用樹(shù)枝制造而成的機(jī)器人,可以通過(guò)強(qiáng)化學(xué)習(xí),學(xué)會(huì)自主移動(dòng)。
2019-07-09 標(biāo)簽:機(jī)器人強(qiáng)化學(xué)習(xí) 2893 0
如何將強(qiáng)化學(xué)習(xí)用于火箭發(fā)動(dòng)機(jī)引擎研發(fā)的創(chuàng)新解決方案中
機(jī)器學(xué)習(xí)(ML)在各個(gè)行業(yè)以及眾多的應(yīng)用軟件中產(chǎn)生了令人難以置信的影響,其中包括個(gè)性化電視推薦和順風(fēng)車(chē)應(yīng)用中的動(dòng)態(tài)價(jià)格模型等。
2019-04-29 標(biāo)簽:火箭發(fā)動(dòng)機(jī)強(qiáng)化學(xué)習(xí) 2751 0
當(dāng)機(jī)器人遇見(jiàn)強(qiáng)化學(xué)習(xí),會(huì)碰出怎樣的火花?
當(dāng)機(jī)器人遇見(jiàn)強(qiáng)化學(xué)習(xí),會(huì)碰出怎樣的火花? 一名叫 Cassie 的機(jī)器人,給出了生動(dòng)演繹。 最近,24 歲的中國(guó)南昌小伙李鐘毓和其所在團(tuán)隊(duì),用強(qiáng)化學(xué)習(xí)教...
2021-04-13 標(biāo)簽:機(jī)器人強(qiáng)化學(xué)習(xí) 2730 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |