99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用人工智能的多模態(tài)通用技術(shù)

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-02-04 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)有的大多數(shù)人工智能模型和方法仍屬于窄人工智能,也被稱為弱人工智能(weak artificial intelligence)。相對而言,強(qiáng)人工智能(strong artificial intelligence)期望機(jī)器能像人一樣思考、推理,能處理各種任務(wù),比肩人類的智能水平(human-like or human-level intelligence)。與強(qiáng)人工智能相比,現(xiàn)有通用人工智能更加強(qiáng)調(diào)機(jī)器的“泛 化”能力,包括場景泛化(即模型從單一場景泛化 至多個(gè)場景)、模態(tài)泛化(即一個(gè)模型適用于多種 模態(tài)的任務(wù))、任務(wù)泛化(即一個(gè)模型可以處理多種類型的任務(wù))等。

通用人工智能目前仍然處于發(fā)展初期,是對現(xiàn)有窄/弱人工智能的反思、補(bǔ)充和改進(jìn),也是通往強(qiáng)人工智能道路上的重要路線。通用人工智能所研究的是一個(gè)智能系統(tǒng)應(yīng)該具備哪些能力,并且運(yùn)用這些能力解決各式各樣的復(fù)雜問題。

通用人工智能的多模態(tài)通用技術(shù)

現(xiàn)實(shí)生活中,人類接收的信息模態(tài)多種多樣,如視覺、聲音、文字、嗅覺、觸覺等。人類可以綜合運(yùn)用多種模態(tài)的信息對事物進(jìn)行理解和推理。多模態(tài)學(xué)習(xí)是通用智能需要解決的關(guān)鍵問題之一,其任務(wù)可以歸結(jié)為兩個(gè)基本類:多模態(tài)表征學(xué)習(xí)和模態(tài)轉(zhuǎn)換。需要指出的是,這兩個(gè)問題并非不相關(guān),比如表征可以用來做模態(tài)轉(zhuǎn)換。下面介紹幾種典型的多模態(tài)學(xué)習(xí)任務(wù)。

多模態(tài)表征學(xué)習(xí)和融合

多模態(tài)表征學(xué)習(xí)指的是學(xué)習(xí)包含多個(gè)模態(tài)的樣本表征,比如視頻里可能包含的視覺信息、聲音信息等,使得表征能夠反映所包含的多個(gè)模態(tài)信息,以幫助理解識別等任務(wù)。最直接的方法是分別處理各個(gè)模態(tài),得到每個(gè)模態(tài)的表征,再將其直接拼接起來作為最后的表征;也可以最終只產(chǎn)生一個(gè)表征,把不同模態(tài)的表征融合成一個(gè)表征;也可以繼續(xù)把融合的表征做進(jìn)一步處理,以生成更強(qiáng)的表征;還可以在產(chǎn)生表征的過程中,不停地進(jìn)行模態(tài)之間的信息交互或者融合,以增強(qiáng)每個(gè)模態(tài)的表征。

多模態(tài)協(xié)同學(xué)習(xí)

多模態(tài)協(xié)同學(xué)習(xí)指的是利用模態(tài)之間的關(guān)聯(lián),借助其他一個(gè)或者多個(gè)模態(tài),來幫助某一模態(tài)或者多個(gè)模態(tài)建模和學(xué)習(xí)。模態(tài)之間的關(guān)聯(lián)信息非常常見,比如人在說話的時(shí)候,既有聲音模態(tài),也有視覺(唇語)模態(tài),如人臉表情或者行為動(dòng)作;比如互聯(lián)網(wǎng)上的圖片,通常有文件名等;比如在視頻中,視頻幀可能有相應(yīng)的聲音(語音或者音樂),也可能有文字腳本。人類對單一模態(tài)的理解,也是通過聯(lián)合其他模態(tài)信息進(jìn)行分析的。多模態(tài)協(xié)同學(xué)習(xí)的要領(lǐng)在于把關(guān)聯(lián)轉(zhuǎn)換成合適的約束,以及從各個(gè)模態(tài)獲取合適的信息形成約束。例如圖像和文本(比如圖像及其文件名)有一一對應(yīng)關(guān)系。

借助于物體的屬性描述來幫助圖像識別建模,在某種意義上也是多模態(tài)協(xié)同學(xué)習(xí)。例如,對狗的識別,我們都清楚地了解狗是由哪些部分組成的,具有怎樣的屬性特征,比如它有4條腿、尾巴、毛發(fā)等。但是在目前主流的物體識別中,這種信息沒有被加進(jìn)去,“狗”只是作為一個(gè)標(biāo)簽。而人類從圖像里識別狗的時(shí)候,頭腦中有很多狗的圖像認(rèn)知信息,同時(shí)也從別的渠道獲得狗的其他知識,如組成方式等。所以,建模時(shí)需要把關(guān)于狗的額外知識信息加進(jìn)去,來提升建模識別性能,也會(huì)提升模型的魯棒性。

多模態(tài)統(tǒng)一表征學(xué)習(xí)

多模態(tài)統(tǒng)一表征學(xué)習(xí)指的是把不同模態(tài)映射到 同一個(gè)特征空間,使得不同模態(tài)在這個(gè)特征空間里可以直接比較(比如歐氏距離),比較的時(shí)候不用 區(qū)分特征來自什么模態(tài)。多模態(tài)任務(wù)可以是把一幅圖片轉(zhuǎn)變成一段文字或者一首詩,或者將文字轉(zhuǎn)化成一幅圖像;以及在文字、圖片或者視頻搜索中,如果圖像和文本的特征都轉(zhuǎn)換到同一個(gè)空間中,那我們就可以進(jìn)行統(tǒng)一的搜索,而不再區(qū)分不同的模態(tài)。

人類具有在不同模態(tài)之間快速映射的能力,比如看到一個(gè)場景,我們的頭腦會(huì)快速“搜索”到應(yīng)景的一首歌、一段文字或者一首詩。多模態(tài)統(tǒng)一表示是模擬人類這個(gè)能力的一種實(shí)現(xiàn)方法。多模態(tài)統(tǒng)一表征問題的主要研究點(diǎn)在于如何定義關(guān)系保持和尋找合適的映射,以及對大規(guī)模數(shù)據(jù)和實(shí)際問題的探索。目前已經(jīng)有了實(shí)際系統(tǒng)的探索,如“小冰寫詩”。


責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249596
  • 通用技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    7293
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    世界模型:模態(tài)融合+因果推理,解鎖AI認(rèn)知邊界

    ,自然地學(xué)習(xí)世界運(yùn)作方式的知識。深度學(xué)習(xí)之父 Yann LeCun 認(rèn)為,世界模型是通往通用人工智能(AGI)的重要路徑之一。 ? 世界模型 的 關(guān)鍵技術(shù) 和應(yīng)用場景 ? 世界模型是智能體對環(huán)境的內(nèi)部表征,其核心在于通過多
    的頭像 發(fā)表于 06-23 04:49 ?2437次閱讀

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)?;瘮?shù)據(jù)平臺(tái)

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過構(gòu)建大規(guī)模、模態(tài)的真實(shí)世界數(shù)據(jù)集與
    的頭像 發(fā)表于 03-12 11:42 ?1098次閱讀
    AgiBot World Colosseo:構(gòu)建<b class='flag-5'>通用</b>機(jī)器人<b class='flag-5'>智能</b>的規(guī)模化數(shù)據(jù)平臺(tái)

    智慧路燈如何應(yīng)用人工智能技術(shù)

    叁仟智慧路燈通過整合人工智能(AI)技術(shù),顯著提升了城市的智能化程度,為城市管理工作帶來了諸多便利。以下將詳細(xì)闡述叁仟智慧路燈在應(yīng)用人工智能技術(shù)方面的幾個(gè)關(guān)鍵領(lǐng)域: 一、
    的頭像 發(fā)表于 03-07 09:18 ?429次閱讀
    智慧路燈如何應(yīng)<b class='flag-5'>用人工智能技術(shù)</b>

    亥步模態(tài)醫(yī)療大模型發(fā)布:人工智能引領(lǐng)醫(yī)療新紀(jì)元

    當(dāng)下,人工智能(AI)正以不可阻擋之勢滲透到各行各業(yè),包括醫(yī)療行業(yè)。12月14日,2024中國醫(yī)學(xué)人工智能大會(huì)的召開。會(huì)上,一款名為“亥步”的模態(tài)醫(yī)療大模型的正式發(fā)布。
    的頭像 發(fā)表于 12-19 17:56 ?545次閱讀

    光庭信息亮相2024東湖國際人工智能高峰論壇

    近日,2024東湖國際人工智能高峰論壇在中國光谷科技會(huì)展中心盛大舉辦。論壇以“智聯(lián)世界,共創(chuàng)未來”為主題,旨在加速推動(dòng)人工智能創(chuàng)新成果規(guī)?;瘧?yīng)用,進(jìn)一步搭建模態(tài)
    的頭像 發(fā)表于 11-28 10:19 ?614次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    了重要作用。在未來,隨著嵌入式系統(tǒng)和人工智能技術(shù)的不斷進(jìn)步,我們可以預(yù)見更多創(chuàng)新應(yīng)用的出現(xiàn),為社會(huì)發(fā)展和生活品質(zhì)的提升帶來更多可能性。
    發(fā)表于 11-14 16:39

    九四智能榮耀躋身智推力2024 年度廣東人工智能風(fēng)云榜

    啟航”,旨在探討通用人工智能技術(shù)的最新進(jìn)展,以及其在各行各業(yè)中的廣泛應(yīng)用和深遠(yuǎn)影響。 九四智能(94AI)作為國內(nèi)領(lǐng)先的人工智能科技企業(yè),憑借其在通用人工智能領(lǐng)域的卓越貢獻(xiàn),受邀出席此
    的頭像 發(fā)表于 10-24 16:16 ?675次閱讀
    九四<b class='flag-5'>智能</b>榮耀躋身智推力2024 年度廣東<b class='flag-5'>人工智能</b>風(fēng)云榜

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    研究的進(jìn)程。從蛋白質(zhì)結(jié)構(gòu)預(yù)測到基因測序與編輯,再到藥物研發(fā),人工智能技術(shù)在生命科學(xué)的各個(gè)層面都發(fā)揮著重要作用。特別是像AlphaFold這樣的工具,成功解決了困擾生物學(xué)界半個(gè)世紀(jì)的蛋白質(zhì)折疊問題,將
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動(dòng)科學(xué)創(chuàng)新的道路。在閱讀這一章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來的革命性變化,以下是我個(gè)人的學(xué)習(xí)心得: 1.
    發(fā)表于 10-14 09:12

    云知聲山海模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

    近日,模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單,云知聲山海模態(tài)大模型UniGPT-mMed以通用
    的頭像 發(fā)表于 10-12 14:09 ?683次閱讀
    云知聲山海<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型UniGPT-mMed登頂MMMU測評榜首

    risc-v在人工智能圖像處理應(yīng)用前景分析

    和使用該技術(shù),無需支付專利費(fèi)或使用費(fèi)。這大大降低了人工智能圖像處理技術(shù)的研發(fā)成本,并吸引了大量的開發(fā)者、企業(yè)和研究機(jī)構(gòu)參與其生態(tài)建設(shè)。 靈活性則體現(xiàn)在RISC-V可以根據(jù)不同的應(yīng)用場景進(jìn)行定制和優(yōu)化,從而
    發(fā)表于 09-28 11:00

    Meta發(fā)布模態(tài)LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破,成功推出了模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實(shí)現(xiàn)了對圖像內(nèi)容的精準(zhǔn)理解,標(biāo)志著Met
    的頭像 發(fā)表于 09-27 11:44 ?701次閱讀

    鐳神智能創(chuàng)始人胡小波榮獲全國首批首席人工智能官(CAIO)稱號

    2024年8月28日至30日,2024深圳(國際)通用人工智能大會(huì)暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會(huì)在深圳國際會(huì)展中心(寶安)舉辦。會(huì)上,深圳市人工智能產(chǎn)業(yè)協(xié)會(huì)公布了全國首批首席人工智能
    的頭像 發(fā)表于 09-27 08:08 ?888次閱讀
    鐳神<b class='flag-5'>智能</b>創(chuàng)始人胡小波榮獲全國首批首席<b class='flag-5'>人工智能</b>官(CAIO)稱號

    云知聲推出山海模態(tài)大模型

    人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海
    的頭像 發(fā)表于 08-27 15:20 ?631次閱讀

    報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會(huì)暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00