99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布了基礎(chǔ)世界模型:Genie(精靈)

vliwulianw ? 來源:軟件質(zhì)量報道 ? 2024-02-28 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家都喜歡玩游戲吧?因為游戲最大的吸引力是讓我們逃避現(xiàn)實、幻想一個遠離我們眼前現(xiàn)實的世界,掌控這個虛擬的現(xiàn)實世界。現(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。 讓我們激動的這一天來了! 北美時間26號下午,GoogleGenie團隊的負責人Tim Rockt?schel非常興奮地宣布:Google DeepMindOpen Endedness團隊開發(fā)的基于互聯(lián)網(wǎng)視頻訓練的基礎(chǔ)世界模型(foundation world model)——Genie

(幽靈)發(fā)布了,它可以根據(jù)圖像提示生成無窮無盡的可控動作2D世界的各種變化。這個110億參數(shù)大模型Genie,能從一張圖片就能創(chuàng)造出可玩的虛擬世界,動作可控,這也預(yù)示著,AI已經(jīng)真正殺到視頻游戲領(lǐng)域了。

084845f0-d5db-11ee-a297-92fbcf53809c.png

0853455e-d5db-11ee-a297-92fbcf53809c.png

什么是Genie(精靈)?

根據(jù) Google DeepMind 的官方博客文章,Genie 是一個基礎(chǔ)世界模型,它是根據(jù)來自互聯(lián)網(wǎng)的視頻進行訓練的。該模型可以“從合成圖像、照片甚至草圖中生成無窮無盡的可玩(動作可控)世界”。 研究論文 “Genie:Generative Interactive Environments” 指出,Genie是第一個從未標記的互聯(lián)網(wǎng)視頻中以無監(jiān)督方式訓練的生成式交互式環(huán)境。在大小方面,Genie 的參數(shù)為 11B,由時空視頻標記器(spatiotemporal videotokenizer)、自回歸動力學模型(autoregressive dynamics model)和簡單且可擴展的潛在動作模型(simple and scalable latent action model)組成。

這些技術(shù)規(guī)范允許 Genie 在生成的環(huán)境中逐幀運行,即使在沒有訓練、標注或任何其他特定領(lǐng)域要求的情況下也是如此。

Genie 能做什么的?

根據(jù)這篇研究論文,Genie是一種新型的生成式人工智能,它使任何人(甚至是兒童)都能夢想并進入類似于人類設(shè)計的模擬環(huán)境的生成世界??梢蕴崾?Genie 生成一組不同的交互式和可控環(huán)境,盡管它是在純視頻數(shù)據(jù)上訓練的。

簡而言之,我們已經(jīng)看到了許多生成式 AI 模型,它們使用語言、圖像甚至視頻生成創(chuàng)意內(nèi)容。Genie 是一個突破,因為它可以從單個圖像提示中創(chuàng)建可玩的環(huán)境。

試著記住《哈利·波特與魔法石》中哈利和他的朋友們在前往格蘭芬多公共休息室的路上進入霍格沃茨城堡的場景。年輕的學生們看到一面墻上掛滿了畫作,每個角色都在他們的畫面中慢慢地移動,這些畫作栩栩如生。Genie能使靜止圖像栩栩如生,賦予我們一個自己的世界。

根據(jù) Google DeepMind 的說法,Genie 可以收到它從未見過的圖像提示,這包括現(xiàn)實世界的照片、草圖,允許人們與他們想象的虛擬世界互動,這就是稱之為“基礎(chǔ)世界模型”。在培訓方面,研究論文強調(diào),他們更關(guān)注2D平臺游戲和機器人技術(shù)的視頻。Genie 使用通用方法進行訓練,使其能夠在任何類型的域上運行,并且可以擴展到更大的 Internet 數(shù)據(jù)集。

為什么Genie很重要?

Genie 的突出之處在于它能夠從互聯(lián)網(wǎng)視頻中學習和重現(xiàn)游戲中角色的控制。這是值得注意的,因為互聯(lián)網(wǎng)視頻沒有關(guān)于視頻中執(zhí)行的動作的標簽,甚至沒有關(guān)于應(yīng)該控制圖像的哪一部分的標簽。

Google 博客文章寫道:“Genie不僅可以學習觀察的哪些部分通常是可控的,還可以推斷出在生成的環(huán)境中一致的各種潛在行為。請注意,相同的潛在動作如何在不同的提示圖像中產(chǎn)生相似的行為,“ 根據(jù) Google DeepMind 的說法,該模型最獨特的方面是:它允許您從單個圖像創(chuàng)建一個全新的交互式環(huán)境。這開辟了許多可能性,尤其是創(chuàng)建和進入虛擬世界的新方法。為了證明這一點,研究人員使用文本到圖像模型Imagen 2創(chuàng)建了一個圖像,然后將其用作創(chuàng)建虛擬世界的提示。草圖也可以做同樣的事情。

有了 Genie,任何人都可以創(chuàng)建自己完全想象的虛擬世界。此外,該模型學習和開發(fā)新世界模型的能力標志著向通用人工智能代理(一個獨立的程序或?qū)嶓w,通過傳感器感知其周圍環(huán)境來與環(huán)境交互)的重大飛躍。 開啟另一個旅程:




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108170
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249638
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4078

原文標題:基礎(chǔ)世界模型Google Genie誕生了:根據(jù)提示生成無窮無盡的、可交互的2D世界

文章出處:【微信號:軟件質(zhì)量報道,微信公眾號:軟件質(zhì)量報道】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    genie nano c2020無法顯示畫面

    一開始顯示“the packet size may be too large for the network setup”后面減小了數(shù)據(jù)包大小,沒有報錯,但是點擊grab之后沒有畫面 NI MAX和labview都試過了,換另外一個鏡頭就有畫面,genie nano c2020應(yīng)該沒有壞,請問是為什么呢
    發(fā)表于 04-16 14:19

    軟通計算機重磅發(fā)布DeepSeek大模型一體機產(chǎn)品

    3月20日,華為中國合作伙伴大會2025在深圳盛大啟幕。大會上,軟通計算機重磅發(fā)布“DeepSeek大模型一體機產(chǎn)品”,為用戶提供一站式的AI應(yīng)用算力平臺,讓大
    的頭像 發(fā)表于 03-22 10:40 ?971次閱讀
    軟通計算機<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>DeepSeek大<b class='flag-5'>模型</b>一體機產(chǎn)品

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌已將AI Studio團隊整體轉(zhuǎn)移至DeepMi
    的頭像 發(fā)表于 01-13 14:40 ?716次閱讀

    英偉達發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開帷幕的國際消費類電子產(chǎn)品展覽會(CES)上,英偉達宣布一項重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺。該平臺集成了先進的生成世界基礎(chǔ)
    的頭像 發(fā)表于 01-09 10:23 ?715次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成式世界基礎(chǔ)模型、高級 tokenizer、護欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?570次閱讀

    Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑

    ?在人工智能領(lǐng)域,Meta的最新動作再次引起了全球的關(guān)注。今天,我們見證Meta發(fā)布的 Llama 3.3 70B 模型,這是一個開源的人工智能模型,它不僅令人印象深刻,而且在性能上
    的頭像 發(fā)表于 12-18 16:46 ?586次閱讀
    Meta<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>Llama 3.3 70B:開源AI<b class='flag-5'>模型</b>的新里程碑

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布一款名為“深度研究”的先進AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實現(xiàn)對網(wǎng)絡(luò)信息的高效檢索與
    的頭像 發(fā)表于 12-16 09:35 ?727次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布其最新力作——Gemini 2.0。這款A(yù)I模型不僅在性能上實現(xiàn)顯著提升,更是在多模態(tài)表現(xiàn)和
    的頭像 發(fā)表于 12-12 14:22 ?826次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?649次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界

    在OpenAI宣布即將發(fā)布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——
    的頭像 發(fā)表于 12-05 14:16 ?1040次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

    10月31日訊,自動駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊視為其在自動駕駛競賽中脫穎而出的關(guān)鍵。如今,Waymo再
    的頭像 發(fā)表于 10-31 16:55 ?1731次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1144次閱讀

    AI實火!諾貝爾又把化學獎頒給AI大模型

    的蛋白質(zhì)結(jié)構(gòu)預(yù)測大模型——AlphaFold系列。 今年5月9日,谷歌DeepMind重磅發(fā)布
    的頭像 發(fā)表于 10-10 10:38 ?420次閱讀

    Meta發(fā)布全新開源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標志著Meta在AI領(lǐng)域的又一重大突破。Meta創(chuàng)始人馬克·扎克伯格親自站臺,盛贊Llama 3.1為“業(yè)內(nèi)頂尖水準”的AI
    的頭像 發(fā)表于 07-24 18:25 ?1792次閱讀

    谷歌發(fā)布革命性AI天氣預(yù)測模型NeuralGCM

    在科技與自然科學的交匯點上,谷歌公司于7月23日宣布一項重大突破——全新的人工智能天氣預(yù)測模型NeuralGCM。這一創(chuàng)新成果不僅融合機器學習的前沿技術(shù),還巧妙結(jié)合
    的頭像 發(fā)表于 07-23 14:24 ?819次閱讀