完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:225個(gè) 瀏覽:11597次 帖子:1個(gè)
Facebook開源Horizon主要是為了推進(jìn)AI強(qiáng)化學(xué)習(xí)的發(fā)展
11月1日,F(xiàn)acebook開源了Horizon,一個(gè)由Facebook的AI研究人員、推薦系統(tǒng)專家和工程師共同搭建的強(qiáng)化學(xué)習(xí)平臺(tái),其框架的構(gòu)建工作開始...
2018-11-05 標(biāo)簽:AIFacebook強(qiáng)化學(xué)習(xí) 981 0
DeepMind發(fā)布強(qiáng)化學(xué)習(xí)庫(kù)RLax
RLax(發(fā)音為“ relax”)是建立在JAX之上的庫(kù),它公開了用于實(shí)施強(qiáng)化學(xué)習(xí)智能體的有用構(gòu)建塊。。報(bào)道:深度強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室作者:DeepRL ...
2020-12-10 標(biāo)簽:強(qiáng)化學(xué)習(xí)DeepMind 981 0
碾壓GPT-4!谷歌DeepMind CEO自曝:下一代大模型將與AlphaGo合體
一個(gè)是用強(qiáng)化學(xué)習(xí)擊敗人類圍棋冠軍、創(chuàng)造歷史的AI系統(tǒng),一個(gè)是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強(qiáng)多模態(tài)大模型,兩個(gè)AI一合體,簡(jiǎn)直要無(wú)敵了!
2023-07-04 標(biāo)簽:語(yǔ)言模型強(qiáng)化學(xué)習(xí)DeepMind 920 0
靠強(qiáng)化學(xué)習(xí)來調(diào)整機(jī)器人假肢的系統(tǒng) 讓假肢更加靈活
來自北卡羅來納州立大和亞利桑那州立大學(xué)的研究人員開發(fā)了一種智能系統(tǒng),可以“調(diào)節(jié)”動(dòng)力假肢膝蓋,讓患者在幾分鐘內(nèi)就能自如地使用假肢行走,而不是由訓(xùn)練有素的...
2019-04-05 標(biāo)簽:機(jī)器人智能機(jī)器人強(qiáng)化學(xué)習(xí) 868 0
83篇文獻(xiàn)、萬(wàn)字總結(jié)強(qiáng)化學(xué)習(xí)之路
深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合的產(chǎn)物,它集成了深度學(xué)習(xí)在視覺等感知問題上強(qiáng)大的理解能力,以及強(qiáng)化學(xué)習(xí)的決策能力,實(shí)現(xiàn)了...
2020-12-10 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 861 0
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬(wàn)億token的強(qiáng)化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型...
2024-04-23 標(biāo)簽:微軟移動(dòng)設(shè)備強(qiáng)化學(xué)習(xí) 836 0
MoDem解決了視覺強(qiáng)化學(xué)習(xí)領(lǐng)域的三個(gè)挑戰(zhàn)
他表示,僅給出5個(gè)演示,MoDem就能在100K交互步驟中解決具有稀疏獎(jiǎng)勵(lì)和高維動(dòng)作空間的具有挑戰(zhàn)性的視覺運(yùn)動(dòng)控制任務(wù),大大優(yōu)于現(xiàn)有的最先進(jìn)方法。
2023-01-05 標(biāo)簽:解碼器Meta強(qiáng)化學(xué)習(xí) 820 0
特斯拉自動(dòng)駕駛團(tuán)隊(duì)再受重挫,頂尖工程師Paril Jain離任,高層人事變動(dòng)
數(shù)周內(nèi),特斯拉已在各部門實(shí)施多輪裁員。此外,還有報(bào)道顯示部分員工因士氣低落而選擇離司。種種跡象表明,特斯拉正面臨嚴(yán)重的人才流失問題。
2024-05-15 標(biāo)簽:特斯拉自動(dòng)駕駛強(qiáng)化學(xué)習(xí) 769 0
谷歌AlphaChip強(qiáng)化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用
近日,谷歌在芯片設(shè)計(jì)領(lǐng)域取得了重要突破,詳細(xì)介紹了其用于芯片設(shè)計(jì)布局的強(qiáng)化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望...
2024-09-30 標(biāo)簽:谷歌芯片設(shè)計(jì)強(qiáng)化學(xué)習(xí) 693 0
強(qiáng)化學(xué)習(xí)正在推進(jìn)AI應(yīng)用
就在幾年前,能夠感知周圍環(huán)境、識(shí)別重要細(xì)節(jié)——并忽略其余部分——然后利用這些細(xì)節(jié)來完成任務(wù)的技術(shù)應(yīng)用似乎還只是科幻小說中的內(nèi)容。
2022-12-30 標(biāo)簽:AI機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 611 0
近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面...
2025-01-03 標(biāo)簽:模型強(qiáng)化學(xué)習(xí)智譜 493 0
適合初學(xué)者的神經(jīng)網(wǎng)絡(luò)理論到實(shí)踐(3):打破概念束縛:什么是強(qiáng)化學(xué)習(xí)?
專欄中《零神經(jīng)網(wǎng)絡(luò)實(shí)戰(zhàn)》系列持續(xù)更新介紹神經(jīng)元怎么工作,最后使用python從0到1不調(diào)用任何依賴神經(jīng)網(wǎng)絡(luò)框架(不使用tensorflow等框架)...
2020-12-10 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 454 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |