99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT原來(lái)是擁有心智的?

大魚(yú)機(jī)器人 ? 來(lái)源:量子位 ? 2023-02-13 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT原來(lái)是擁有心智的?!

“原本認(rèn)為是人類獨(dú)有的心智理論(Theory of Mind,ToM),已經(jīng)出現(xiàn)在ChatGPT背后的AI模型上?!?/p>

這是來(lái)自斯坦福大學(xué)的最新研究結(jié)論,一經(jīng)發(fā)出就造成了學(xué)術(shù)圈的轟動(dòng):

這一天終于猝不及防地來(lái)了。

3de9d0a6-ab49-11ed-bfe3-dac502259ad0.png

所謂心智理論,就是理解他人或自己心理狀態(tài)的能力,包括同理心、情緒、意圖等。

在這項(xiàng)研究中,作者發(fā)現(xiàn):

davinci-002版本的GPT3(ChatGPT由它優(yōu)化而來(lái)),已經(jīng)可以解決70%的心智理論任務(wù),相當(dāng)于7歲兒童;

至于GPT3.5(davinci-003),也就是ChatGPT的同源模型,更是解決了93%的任務(wù),心智相當(dāng)于9歲兒童!

然而,在2022年之前的GPT系列模型身上,還沒(méi)有發(fā)現(xiàn)解決這類任務(wù)的能力。

也就是說(shuō),它們的心智確實(shí)是“進(jìn)化”而來(lái)的。

3e14a79a-ab49-11ed-bfe3-dac502259ad0.png

△論文在推特上爆火

對(duì)此,有網(wǎng)友激動(dòng)表示:

GPT的迭代肯定快得很,說(shuō)不定哪天就直接成年了。(手動(dòng)狗頭)

3e2d042a-ab49-11ed-bfe3-dac502259ad0.png

所以,這個(gè)神奇的結(jié)論是如何得出的?

為什么認(rèn)為GPT-3.5具備心智?

這篇論文名為《心智理論可能在大語(yǔ)言模型中自發(fā)出現(xiàn)》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)。

3e378f58-ab49-11ed-bfe3-dac502259ad0.png

作者依據(jù)心智理論相關(guān)研究,給GPT3.5在內(nèi)的9個(gè)GPT模型做了兩個(gè)經(jīng)典測(cè)試,并將它們的能力進(jìn)行了對(duì)比。

這兩大任務(wù)是判斷人類是否具備心智理論的通用測(cè)試,例如有研究表明,患有自閉癥的兒童通常難以通過(guò)這類測(cè)試。

第一個(gè)測(cè)試名為Smarties Task(又名Unexpected contents,意外內(nèi)容測(cè)試),顧名思義,測(cè)試AI對(duì)意料之外事情的判斷力。

以“你打開(kāi)一個(gè)巧克力包裝袋,發(fā)現(xiàn)里面裝滿了爆米花”為例。

作者給GPT-3.5輸入了一系列提示語(yǔ)句,觀察它預(yù)測(cè)“袋子里有什么?”和“她發(fā)現(xiàn)袋子時(shí)很高興。所以她喜歡吃什么?”兩個(gè)問(wèn)題的答案。

3e41914c-ab49-11ed-bfe3-dac502259ad0.png

正常來(lái)說(shuō),人們會(huì)默認(rèn)巧克力袋子里是巧克力,因此會(huì)對(duì)巧克力袋子里裝著爆米花感到驚訝,產(chǎn)生失落或驚喜的情緒。其中失落說(shuō)明不喜歡吃爆米花,驚喜說(shuō)明喜歡吃爆米花,但都是針對(duì)“爆米花”而言。

測(cè)試表明,GPT-3.5毫不猶豫地認(rèn)為“袋子里裝著爆米花”。

至于在“她喜歡吃什么”問(wèn)題上,GPT-3.5展現(xiàn)出了很強(qiáng)的同理心,尤其是聽(tīng)到“她看不見(jiàn)包裝袋里的東西”時(shí)一度認(rèn)為她愛(ài)吃巧克力,直到文章明確表示“她發(fā)現(xiàn)里面裝滿了爆米花”才正確回答出答案。

為了防止GPT-3.5回答出的正確答案是巧合——萬(wàn)一它只是根據(jù)任務(wù)單詞出現(xiàn)頻率進(jìn)行預(yù)測(cè),作者將“爆米花”和“巧克力”對(duì)調(diào),此外還讓它做了10000個(gè)干擾測(cè)試,結(jié)果發(fā)現(xiàn)GPT-3.5并不僅僅根據(jù)單詞頻率來(lái)進(jìn)行預(yù)測(cè)。

至于在整體的“意外內(nèi)容”測(cè)試問(wèn)答上,GPT-3.5成功回答出了20個(gè)問(wèn)題中的17個(gè),準(zhǔn)確率達(dá)到了85%。

第二個(gè)是Sally-Anne測(cè)試(又名Unexpected Transfer,意外轉(zhuǎn)移任務(wù)),測(cè)試AI預(yù)估他人想法的能力。

以“約翰把貓放進(jìn)籃子后離開(kāi),馬克趁他不在,把貓從籃子里放進(jìn)盒子里”為例。

作者讓GPT-3.5讀了一段文字,來(lái)分別判斷“貓的位置”和“約翰回來(lái)后會(huì)去哪里找貓”,同樣這是它基于閱讀文本的內(nèi)容量做出的判斷:

3e5cac3e-ab49-11ed-bfe3-dac502259ad0.png

針對(duì)這類“意外轉(zhuǎn)移”測(cè)試任務(wù),GPT-3.5回答的準(zhǔn)確率達(dá)到了100%,很好地完成了20個(gè)任務(wù)。

同樣地,為了避免GPT-3.5又是瞎蒙的,作者給它安排了一系列“填空題”,同時(shí)隨機(jī)打亂單詞順序,測(cè)試它是否是根據(jù)詞匯出現(xiàn)的頻率在亂答。

3e7dc4e6-ab49-11ed-bfe3-dac502259ad0.png

測(cè)試表明,在面對(duì)沒(méi)有邏輯的錯(cuò)誤描述時(shí),GPT-3.5也失去了邏輯,僅回答正確了11%,這表明它確實(shí)是根據(jù)語(yǔ)句邏輯來(lái)判斷答案的。

但要是以為這種題很簡(jiǎn)單,隨便放在哪個(gè)AI上都能做對(duì),那就大錯(cuò)特錯(cuò)了。

作者對(duì)GPT系列的9個(gè)模型都做了這樣的測(cè)試,發(fā)現(xiàn)只有GPT-3.5(davinci-003)和GPT-3(2022年1月新版,davinci-002)表現(xiàn)不錯(cuò)。

davinci-002是GPT-3.5和ChatGPT的“老前輩”。

平均下來(lái),davinci-002完成了70%的任務(wù),心智相當(dāng)于7歲孩童,GPT-3.5完成了85%的意外內(nèi)容任務(wù)和100%的意外轉(zhuǎn)移任務(wù)(平均完成率92.5%),心智相當(dāng)于9歲孩童。

3e93a3f6-ab49-11ed-bfe3-dac502259ad0.png

然而在BLOOM之前的幾個(gè)GPT-3模型,就連5歲孩童都不如了,基本上沒(méi)有表現(xiàn)出心智理論。

作者認(rèn)為,在GPT系列的論文中,并沒(méi)有證據(jù)表明它們的作者是“有意而為之”的,換而言之,這是GPT-3.5和新版GPT-3為了完成任務(wù),自己學(xué)習(xí)的能力。

看完這些測(cè)試數(shù)據(jù)后,有人的第一反應(yīng)是:快停下(研究)!

3eb30f20-ab49-11ed-bfe3-dac502259ad0.png

也有人調(diào)侃:這不就意味著我們以后也能和AI做朋友了?

3ec2f55c-ab49-11ed-bfe3-dac502259ad0.png

甚至有人已經(jīng)在想象AI未來(lái)的能力了:現(xiàn)在的AI模型是不是也能發(fā)現(xiàn)新知識(shí)/創(chuàng)造新工具了?

3ed3b112-ab49-11ed-bfe3-dac502259ad0.png

發(fā)明新工具還不一定,但Meta AI確實(shí)已經(jīng)研究出了可以自己搞懂并學(xué)會(huì)使用工具的AI。

LeCun轉(zhuǎn)發(fā)的一篇最新論文顯示,這個(gè)名叫ToolFormer的新AI,可以教自己使用計(jì)算機(jī)、數(shù)據(jù)庫(kù)和搜索引擎,來(lái)改善它生成的結(jié)果。

3ee3bc6a-ab49-11ed-bfe3-dac502259ad0.png

甚至還有人已經(jīng)搬出了OpenAI CEO那句“AGI可能比任何人預(yù)料的更早來(lái)敲響我們的大門(mén)”。

3efae5f2-ab49-11ed-bfe3-dac502259ad0.png

但先等等,AI真的就能通過(guò)這兩個(gè)測(cè)試,表明自己具備“心智理論”了嗎?

會(huì)不會(huì)是“裝出來(lái)的”?

例如,中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員劉群看過(guò)研究后就認(rèn)為:

AI應(yīng)該只是學(xué)得像有心智了。

3f08488c-ab49-11ed-bfe3-dac502259ad0.png

既然如此,GPT-3.5是如何回答出這一系列問(wèn)題的?

對(duì)此,有網(wǎng)友給出了自己的猜測(cè):

這些LLM并沒(méi)有產(chǎn)生任何意識(shí)。它們只是在預(yù)測(cè)一個(gè)嵌入的語(yǔ)義空間,而這些語(yǔ)義空間是建立在實(shí)際有意識(shí)的人的輸出之上的。

3f2b79ba-ab49-11ed-bfe3-dac502259ad0.png

事實(shí)上,作者本人同樣在論文中給出了自己的猜測(cè)。

如今,大語(yǔ)言模型變得越來(lái)越復(fù)雜,也越來(lái)越擅長(zhǎng)生成和解讀人類的語(yǔ)言,它逐漸產(chǎn)生了像心智理論一樣的能力。

但這并不意味著,GPT-3.5這樣的模型就真正具備了心智理論。

與之相反,它即使不被設(shè)計(jì)到AI系統(tǒng)中,也可以作為“副產(chǎn)品”通過(guò)訓(xùn)練得到。

因此,相比探究GPT-3.5是不是真的有了心智還是像有心智,更需要反思的是這些測(cè)試本身——

最好重新檢查一下心智理論測(cè)試的有效性,以及心理學(xué)家們這數(shù)十年來(lái)依據(jù)這些測(cè)試得出的結(jié)論:

如果AI都能在沒(méi)有心智理論的情況下完成這些任務(wù),如何人類不能像它們一樣?

屬實(shí)是用AI測(cè)試的結(jié)論,反向批判心理學(xué)學(xué)術(shù)圈了(doge)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35181

    瀏覽量

    280201
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50446
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9119

原文標(biāo)題:ChatGPT背后模型被證實(shí)具有人類心智!斯坦福新研究炸了,知名學(xué)者:“這一天終于來(lái)了”

文章出處:【微信號(hào):All_best_xiaolong,微信公眾號(hào):大魚(yú)機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    和安信可Ai-M61模組對(duì)話?手搓一個(gè)ChatGPT 語(yǔ)音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    OpenAI嘗試減少對(duì)ChatGPT的審查

    ,這一政策的實(shí)施將使得ChatGPT能夠回答更多的問(wèn)題,提供更多的視角。在過(guò)去,由于審查機(jī)制的存在,ChatGPT對(duì)于一些敏感或爭(zhēng)議性話題往往保持沉默,不愿過(guò)多涉及。然而,隨著新政策的推行,ChatGPT將逐漸減少對(duì)這類話題的回
    的頭像 發(fā)表于 02-17 14:42 ?2046次閱讀

    ChatGPT新增實(shí)時(shí)搜索與高級(jí)語(yǔ)音功能

    在OpenAI的第八天技術(shù)分享直播中,ChatGPT的搜索功能迎來(lái)了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實(shí)用性和競(jìng)爭(zhēng)力。 新增的實(shí)時(shí)搜索功能,是此次更新的亮點(diǎn)之一
    的頭像 發(fā)表于 12-17 14:08 ?648次閱讀

    心智理論測(cè)試:人工智能擊敗人類

    測(cè)試結(jié)果并不一定意味著人工智能可以“理解”人。 心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會(huì)運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說(shuō)什么、猜測(cè)其他車輛的駕駛員將要做什么,以及與電影中
    的頭像 發(fā)表于 11-08 10:54 ?716次閱讀

    蘋(píng)果iOS 18.2公測(cè)版發(fā)布,Siri與ChatGPT深度融合

    11月7日,蘋(píng)果公司正式推出了iOS 18.2的公測(cè)版,這款新版本為用戶帶來(lái)了諸多備受期待的新功能,其中Siri與ChatGPT的深度融合成為了最為引人注目的亮點(diǎn)。   在iOS 18.2中
    的頭像 發(fā)表于 11-07 15:22 ?1067次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評(píng)的ChatGPT平臺(tái)添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來(lái)前所未有的搜索體驗(yàn)。以往,當(dāng)用戶需要
    的頭像 發(fā)表于 11-04 10:34 ?686次閱讀

    ChatGPT:怎樣打造智能客服體驗(yàn)的重要工具?

    ChatGPT作為智能對(duì)話生成模型,可以幫助打造智能客服體驗(yàn)的重要工具。以下是一些方法和步驟:1.數(shù)據(jù)收集和準(zhǔn)備:收集和整理與客服相關(guān)的數(shù)據(jù),包括常見(jiàn)問(wèn)題、回答示例、客戶對(duì)話記錄等。這將用于訓(xùn)練
    的頭像 發(fā)表于 11-01 11:12 ?446次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗(yàn)的重要工具?

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個(gè)基于ChatGPT的聊天系統(tǒng)是一個(gè)涉及多個(gè)步驟的過(guò)程,包括理解ChatGPT的API、設(shè)計(jì)用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個(gè)簡(jiǎn)化的指南,用于創(chuàng)建一個(gè)基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?1032次閱讀

    ChatGPT 適合哪些行業(yè)

    ChatGPT 是一種基于人工智能的自然語(yǔ)言處理技術(shù),它能夠理解和生成人類語(yǔ)言。這種技術(shù)在多個(gè)行業(yè)中都有廣泛的應(yīng)用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應(yīng)用方式
    的頭像 發(fā)表于 10-25 16:11 ?1002次閱讀

    如何使用 ChatGPT 進(jìn)行內(nèi)容創(chuàng)作

    使用ChatGPT進(jìn)行內(nèi)容創(chuàng)作是一個(gè)高效且富有創(chuàng)意的過(guò)程。以下是一些關(guān)鍵步驟和建議,幫助您充分利用ChatGPT進(jìn)行內(nèi)容創(chuàng)作: 一、準(zhǔn)備階段 注冊(cè)與登錄 : 確保您已注冊(cè)ChatGPT賬號(hào),并登錄
    的頭像 發(fā)表于 10-25 16:08 ?1027次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開(kāi)始預(yù)覽其 AI 聊天機(jī)器人平臺(tái)ChatGPT的專用 Windows 應(yīng)用程序。 OpenAI 表示, ChatGPT
    的頭像 發(fā)表于 10-18 15:50 ?531次閱讀

    震驚!電源開(kāi)不了機(jī),原來(lái)是這個(gè)原因……

    我本次調(diào)試使用的是來(lái)自成都啟臣微與深圳思睿達(dá)的副邊芯片CR5268TN,此IC是核封了一顆650V的MOS管,無(wú)需外置MOS,所以畫(huà)板會(huì)更為方便,工作頻率是65KHz。今天我在調(diào)試這款I(lǐng)C做的樣機(jī)時(shí)遇到了90V-264V重載無(wú)法啟機(jī)的問(wèn)題,嘗試替換用某寶的芯片也同樣無(wú)法解決。我嘗試了很多種辦法,終于解決了問(wèn)題,以下是我調(diào)試過(guò)程中的分享?!緫?yīng)用】電源適配器/存
    的頭像 發(fā)表于 10-13 08:02 ?1048次閱讀
    震驚!電源開(kāi)不了機(jī),<b class='flag-5'>原來(lái)是</b>這個(gè)原因……

    vivo發(fā)布藍(lán)心智能AI戰(zhàn)略

    在2024年的vivo開(kāi)發(fā)者大會(huì)上,vivo隆重推出了全新的AI戰(zhàn)略——“藍(lán)心智能”。該戰(zhàn)略的核心是利用AI技術(shù)重構(gòu)系統(tǒng)體驗(yàn),為用戶帶來(lái)更加智能和便捷的使用感受。
    的頭像 發(fā)表于 10-10 16:57 ?794次閱讀

    J.W. Speaker采用環(huán)球儀器設(shè)備生產(chǎn)LED大燈

    J.W. Speaker的LED大燈擁有高亮度,高效率,低能耗的優(yōu)勢(shì),達(dá)至使用壽命長(zhǎng),節(jié)能和聚光性強(qiáng),適用于各種路況,這原來(lái)是使用了環(huán)球儀器的技術(shù)和設(shè)備。
    的頭像 發(fā)表于 09-14 11:29 ?799次閱讀