99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

驚!大腦視覺信號(hào)被Stable Diffusion復(fù)現(xiàn)成視頻!

CVer ? 來(lái)源:量子位 ? 2023-06-02 16:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)在,AI可以把人類腦中的信息,用高清視頻展示出來(lái)了!

例如你坐在副駕所欣賞到的沿途美景信息,AI分分鐘給重建了出來(lái):

e8e12ad0-fae1-11ed-90ce-dac502259ad0.gif

看到過(guò)的水中的魚兒、草原上的馬兒,也不在話下:

e8f91f00-fae1-11ed-90ce-dac502259ad0.gif

e90528ea-fae1-11ed-90ce-dac502259ad0.gif

這就是由新加坡國(guó)立大學(xué)和香港中文大學(xué)共同完成的最新研究,團(tuán)隊(duì)將項(xiàng)目取名為MinD-Video。

e914e28a-fae1-11ed-90ce-dac502259ad0.png

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 主頁(yè):https://mind-video.com/ 論文:https://arxiv.org/abs/2305.11675 代碼:https://github.com/jqin4749/MindVideo

這波操作,宛如科幻電影《超體》中Lucy讀取反派大佬記憶一般:

e91f001c-fae1-11ed-90ce-dac502259ad0.gif

引得網(wǎng)友直呼:

推動(dòng)人工智能和神經(jīng)科學(xué)的前沿。

e94a5302-fae1-11ed-90ce-dac502259ad0.png

值得一提的是,大火的Stable Diffusion也在這次研究中立了不小的功勞。

e9588300-fae1-11ed-90ce-dac502259ad0.png

怎么做到的?

從大腦活動(dòng)中重建人類視覺任務(wù),尤其是功能磁共振成像技術(shù)(fMRI)這種非侵入式方法,一直是受到學(xué)界較多的關(guān)注。

因?yàn)轭愃七@樣的研究,有利于理解我們的認(rèn)知過(guò)程。

但以往的研究都主要聚焦在重建靜態(tài)圖像,而以高清視頻形式來(lái)展現(xiàn)的工作還是較為有限。

之所以會(huì)如此,是因?yàn)榕c重建一張靜態(tài)圖片不同,我們視覺所看到的場(chǎng)景、動(dòng)作和物體的變化是連續(xù)、多樣化的。

而fMRI這項(xiàng)技術(shù)的本質(zhì)是測(cè)量血氧水平依賴(BOLD)信號(hào),并且在每隔幾秒鐘的時(shí)間里捕捉大腦活動(dòng)的快照。

相比之下,一個(gè)典型的視頻每秒大約包含30幀畫面,如果要用fMRI去重建一個(gè)2秒的視頻,就需要呈現(xiàn)起碼60幀。

因此,這項(xiàng)任務(wù)的難點(diǎn)就在于解碼fMRI并以遠(yuǎn)高于fMRI時(shí)間分辨率的FPS恢復(fù)視頻。

為了彌合圖像和視頻大腦解碼之間差距,研究團(tuán)隊(duì)便提出了MinD-Video的方法。

整體來(lái)看,這個(gè)方法主要包含兩大模塊,它們分別做訓(xùn)練,然后再在一起做微調(diào)。

e96f0e18-fae1-11ed-90ce-dac502259ad0.png

這個(gè)模型從大腦信號(hào)中逐步學(xué)習(xí),在第一個(gè)模塊多個(gè)階段的過(guò)程,可以獲得對(duì)語(yǔ)義空間的更深入理解。

具體而言,便是先利用大規(guī)模無(wú)監(jiān)督學(xué)習(xí)與mask brain modeling(MBM)來(lái)學(xué)習(xí)一般的視覺fMRI特征。

然后,團(tuán)隊(duì)使用標(biāo)注數(shù)據(jù)集的多模態(tài)提取語(yǔ)義相關(guān)特征,在對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練(CLIP)空間中使用對(duì)比學(xué)習(xí)訓(xùn)練fMRI編碼器

在第二個(gè)模塊中,團(tuán)隊(duì)通過(guò)與增強(qiáng)版Stable Diffusion模型的共同訓(xùn)練來(lái)微調(diào)學(xué)習(xí)到的特征,這個(gè)模型是專門為fMRI技術(shù)下的視頻生成量身定制的。

如此方法之下,團(tuán)隊(duì)也與此前的諸多研究做了對(duì)比,可以明顯地看到MinD-Video方法所生成的圖片、視頻質(zhì)量要遠(yuǎn)優(yōu)于其它方法。

e97b83f0-fae1-11ed-90ce-dac502259ad0.png

而且在場(chǎng)景連續(xù)變化的過(guò)程中,也能夠呈現(xiàn)高清、有意義的連續(xù)幀。

e98d88ac-fae1-11ed-90ce-dac502259ad0.png

研究團(tuán)隊(duì)

這項(xiàng)研究的共同一作,其中一位是來(lái)自新加坡國(guó)立大學(xué)的博士生Zijiao Chen,目前在該校的神經(jīng)精神疾病多模式神經(jīng)成像實(shí)驗(yàn)室(MNNDL_Lab)。

另一位一作則是來(lái)自香港中文大學(xué)的Jiaxin Qing,就讀專業(yè)是信息工程系。

除此之外,通訊作者是新加坡國(guó)立大學(xué)副教授Juan Helen ZHOU。

據(jù)了解,這次的新研究是他們團(tuán)隊(duì)在此前一項(xiàng)名為MinD-Vis的功能磁共振成像圖像重建工作的延伸。

MinD-Vis已經(jīng)被CVPR 2023所接收。

e99ee28c-fae1-11ed-90ce-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35123

    瀏覽量

    279676
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49012

    瀏覽量

    249393
  • 視覺
    +關(guān)注

    關(guān)注

    1

    文章

    163

    瀏覽量

    24367

原文標(biāo)題:驚!大腦視覺信號(hào)被Stable Diffusion復(fù)現(xiàn)成視頻!"AI讀腦術(shù)"又來(lái)了!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    是德N5173B信號(hào)發(fā)生器在EMC測(cè)試中的干擾信號(hào)精準(zhǔn)復(fù)現(xiàn)技巧

    具備寬頻段覆蓋、高精度調(diào)制和靈活的信號(hào)生成能力,成為EMC實(shí)驗(yàn)室中復(fù)現(xiàn)干擾信號(hào)的重要工具。掌握其使用技巧,可有效提升測(cè)試的精準(zhǔn)性和效率。 ? 二、干擾信號(hào)精準(zhǔn)
    的頭像 發(fā)表于 06-03 16:09 ?170次閱讀
    是德N5173B<b class='flag-5'>信號(hào)</b>發(fā)生器在EMC測(cè)試中的干擾<b class='flag-5'>信號(hào)</b>精準(zhǔn)<b class='flag-5'>復(fù)現(xiàn)</b>技巧

    ?Diffusion生成式動(dòng)作引擎技術(shù)解析

    Diffusion生成式動(dòng)作引擎 Diffusion生成式動(dòng)作引擎是一種基于擴(kuò)散模型(Diffusion Models)的生成式人工智能技術(shù),專注于生成連續(xù)、逼真的人類動(dòng)作或動(dòng)畫序列。這類引擎在游戲
    的頭像 發(fā)表于 03-17 15:14 ?1816次閱讀

    IGBT模塊的反向恢復(fù)現(xiàn)

    IGBT模塊的反向恢復(fù)現(xiàn)象是指在IGBT關(guān)斷時(shí),其內(nèi)部集成的續(xù)流二極管(FWD)從正向?qū)顟B(tài)轉(zhuǎn)變?yōu)榉聪蚪刂範(fàn)顟B(tài)過(guò)程中出現(xiàn)的一些特定物理現(xiàn)象和電氣特性變化。
    的頭像 發(fā)表于 03-13 14:39 ?1666次閱讀
    IGBT模塊的反向恢<b class='flag-5'>復(fù)現(xiàn)</b>象

    使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無(wú)奇的文本提示詞轉(zhuǎn)換為令人驚艷的視覺效果。
    的頭像 發(fā)表于 03-12 13:49 ?845次閱讀
    使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

    安裝OpenVINO?工具包穩(wěn)定擴(kuò)散后報(bào)錯(cuò),怎么解決?

    :\\stable-openvino2\\stable-diffusion-webui-master\\venv\\lib\\site-packages\\diffusers\\models
    發(fā)表于 03-05 06:56

    Meta非入侵式腦機(jī)技術(shù):AI讀取大腦信號(hào)打字準(zhǔn)確率80%

    腦機(jī)技術(shù)主要通過(guò)AI模型與特定硬件的結(jié)合,將用戶的大腦信號(hào)映射成具體的鍵盤字符。該技術(shù)的準(zhǔn)確率高達(dá)約80%,能夠準(zhǔn)確判斷用戶在“敲擊”的按鍵,從而實(shí)現(xiàn)文字輸入。 值得注意的是,這項(xiàng)設(shè)備完全依靠外部腦機(jī)讀取用戶的大腦
    的頭像 發(fā)表于 02-11 15:45 ?659次閱讀

    Meta AI推出Brain2Qwerty:非侵入性大腦信號(hào)轉(zhuǎn)文本系統(tǒng)

    。 Brain2Qwerty系統(tǒng)主要依賴于非侵入性的技術(shù)手段來(lái)捕捉和解析大腦活動(dòng)。具體而言,它結(jié)合了腦電圖(EEG)和腦磁圖(MEG)這兩種先進(jìn)的神經(jīng)科學(xué)工具,以精確記錄志愿者在思考過(guò)程中的大腦信號(hào)。 在研究過(guò)程中,Meta A
    的頭像 發(fā)表于 02-11 13:37 ?587次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發(fā)表于 12-11 20:13 ?558次閱讀
    如何開啟<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> WebUI模型推理部署

    HDMI光端機(jī):打造高清視頻信號(hào)傳輸?shù)臉蛄?/a>

    在當(dāng)今這個(gè)追求高清畫質(zhì)與極致視覺體驗(yàn)的時(shí)代,HDMI信號(hào)傳輸?shù)馁|(zhì)量與穩(wěn)定性成為了眾多行業(yè)關(guān)注的焦點(diǎn)。無(wú)論是網(wǎng)絡(luò)平板顯示、大屏幕幕墻顯示廣告工程,還是工業(yè)自動(dòng)化控制、醫(yī)療設(shè)備、安防監(jiān)控以及多媒體教學(xué)等
    的頭像 發(fā)表于 11-28 09:17 ?851次閱讀

    AMS-MC158:重塑視覺邊界,引領(lǐng)LED視頻處理新風(fēng)尚

    在科技與藝術(shù)交匯的當(dāng)代,LED顯示屏已經(jīng)成為各大場(chǎng)景中的視覺焦點(diǎn)。然而,如何讓這些絢爛的屏幕呈現(xiàn)出最佳效果,卻離不開一款卓越的視頻處理器。今天,我們就來(lái)深入了解一款在市場(chǎng)上備受矚目的LED視頻處理器——AMS-MC158,它不僅
    的頭像 發(fā)表于 11-28 09:05 ?641次閱讀

    機(jī)器視覺系統(tǒng)硬件組成之工業(yè)相機(jī)篇

    工業(yè)相機(jī)是一種非常重要的機(jī)器視覺器件,它能夠?qū)⒈徊杉膱D像信息通過(guò)電路轉(zhuǎn)換成電信號(hào),再通過(guò)模數(shù)轉(zhuǎn)換器(ADC)將其轉(zhuǎn)化為數(shù)字信號(hào),最后以標(biāo)準(zhǔn)的視頻信號(hào)輸出。工業(yè)相機(jī)在機(jī)器
    的頭像 發(fā)表于 10-18 16:47 ?2657次閱讀
    機(jī)器<b class='flag-5'>視覺</b>系統(tǒng)硬件組成之工業(yè)相機(jī)篇

    常見的視頻接口有哪些

    。它是一種廣泛使用的視頻接口標(biāo)準(zhǔn),也叫做基帶視頻或RCA視頻。CVBS接口以模擬波形來(lái)傳輸數(shù)據(jù),包含色差(色調(diào)和飽和度)和亮度(光亮)信息,并將它們同步在消隱脈沖中,用同一
    的頭像 發(fā)表于 10-09 15:58 ?3233次閱讀

    PCB視頻板 —— 開啟視覺盛宴的關(guān)鍵之匙

    PCB 視頻板是一種專門用于處理視頻信號(hào)的印制電路板。它作為電子元器件的支撐體和電氣連接的載體 ,主要功能是承載與視頻處理相關(guān)的電子元件,如視頻信號(hào)處理器、解碼器、編碼器等。通過(guò)其上面
    的頭像 發(fā)表于 09-06 14:18 ?361次閱讀

    示波器的波形存儲(chǔ)與復(fù)現(xiàn),再也不怕瞬時(shí)信號(hào)抓不住了

    示波器和虛擬USB示波器來(lái)進(jìn)行。Chrent臺(tái)式示波器的波形存儲(chǔ)與復(fù)現(xiàn)使用信號(hào)源模擬一個(gè)測(cè)信號(hào)。通過(guò)BNC線將這個(gè)信號(hào)連接到示波器上。在示
    的頭像 發(fā)表于 09-05 08:06 ?3428次閱讀
    示波器的波形存儲(chǔ)與<b class='flag-5'>復(fù)現(xiàn)</b>,再也不怕瞬時(shí)<b class='flag-5'>信號(hào)</b>抓不住了

    實(shí)操: 如何在AirBox上跑Stable Diffusion 3

    StableDiffusion3Medium是一種多模態(tài)擴(kuò)散變換器(MMDiT)文本到圖像模型,在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。目前瑞莎團(tuán)隊(duì)使用StableDiffusion3Medium開源模型,通過(guò)SOPHONSDK移植到SG2300X處理器系列產(chǎn)品上進(jìn)行本地TPU硬件加速推理,實(shí)現(xiàn)在radxaAirbox上離線快速生成特
    的頭像 發(fā)表于 07-23 08:34 ?589次閱讀
    實(shí)操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3