99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

心智理論測(cè)試:人工智能擊敗人類

AI智勝未來 ? 來源:悅智網(wǎng) ? 2024-11-08 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

測(cè)試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會(huì)運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說什么、猜測(cè)其他車輛的駕駛員將要做什么,以及與電影中的角色產(chǎn)生共鳴。一項(xiàng)最新的研究表明,ChatGPT等工具所使用的大語(yǔ)言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進(jìn)行這項(xiàng)研究之前,我們都相信大語(yǔ)言模型無法通過這些測(cè)試,特別是那些判斷不易察覺的心理狀態(tài)能力的測(cè)試?!痹撗芯康暮现呖死锼沟倌?貝奇奧(Cristina Becchio)說,她是德國(guó)漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的認(rèn)知神經(jīng)科學(xué)教授。這項(xiàng)她認(rèn)為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語(yǔ)言模型的反應(yīng)能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預(yù)印本論文中,斯坦福大學(xué)心理學(xué)家邁克爾?科辛斯基(Michal Kosinski)報(bào)告了幾個(gè)模型在幾種常見心智理論測(cè)試中的測(cè)試情況。他發(fā)現(xiàn),其中最好的是OpenAI的GPT-4,它正確完成了75%的任務(wù),他說,這相當(dāng)于過去研究中6歲兒童的表現(xiàn)。不過,這項(xiàng)研究中的方法遭到了其他研究人員的批評(píng),他們進(jìn)行了后續(xù)實(shí)驗(yàn),并得出結(jié)論,大語(yǔ)言模型之所以能得出正確答案,往往是基于“淺顯的啟發(fā)”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭(zhēng)論?!霸谡撐闹校覀兊哪繕?biāo)是使用廣泛的心理測(cè)試,以更加系統(tǒng)的方式來應(yīng)對(duì)機(jī)器心智理論的評(píng)估挑戰(zhàn)?!痹撗芯康暮现哒材匪?斯特拉坎(James Strachan)說,他是一名認(rèn)知心理學(xué)家,目前是漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的訪問科學(xué)家。他指出,進(jìn)行嚴(yán)謹(jǐn)?shù)难芯恳馕吨獪y(cè)試人類和大語(yǔ)言模型處理相同任務(wù)的能力,這項(xiàng)研究比較了1907個(gè)人與幾個(gè)流行的大語(yǔ)言模型的能力。

大語(yǔ)言模型和人類都完成了5種典型的心智理論測(cè)試,前3種是理解暗示、反語(yǔ)和失禮。此外,他們還回答了“錯(cuò)誤信念”問題,這些問題通常用于確定幼兒心智理論的發(fā)展程度。這些問題是這樣的:如果愛麗絲在鮑勃不在房間的時(shí)候移動(dòng)了某樣?xùn)|西,那么鮑勃回來后應(yīng)該去哪里找這個(gè)東西?最后,他們回答了“奇怪故事”中一些相當(dāng)復(fù)雜的問題,這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言,GPT-4占據(jù)了優(yōu)勢(shì)。它的得分在錯(cuò)誤信念測(cè)試中與人類相當(dāng),在反語(yǔ)、暗示和奇怪故事方面的總分高于人類,只在失禮測(cè)試中表現(xiàn)不如人類。為了理解失禮測(cè)試結(jié)果有所不同的原因,研究人員對(duì)該模型進(jìn)行了一系列后續(xù)測(cè)試,探索了幾種假設(shè)。他們得出的結(jié)論是,GPT-4能夠?qū)τ嘘P(guān)失禮的問題給出正確答案,但在固執(zhí)己見方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設(shè)置了許多圍欄,“旨在保持模型真實(shí)、誠(chéng)實(shí)和正確”,他認(rèn)為,旨在防止GPT-4產(chǎn)生幻覺(即編造內(nèi)容)的策略可能會(huì)妨礙它對(duì)一些問題輸出觀點(diǎn),比如故事角色是否在高中同學(xué)聚會(huì)上無意間侮辱了老同學(xué)。

研究人員很謹(jǐn)慎。他們沒有說自己的研究結(jié)果表明大語(yǔ)言模型實(shí)際上擁有心智理論能力,而是說大語(yǔ)言模型“在心智理論任務(wù)中的表現(xiàn)與人類行為沒有區(qū)別”。這就引出了一個(gè)問題:如果一個(gè)仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說,這是一個(gè)社會(huì)科學(xué)家以前從未嘗試回答的問題,因?yàn)閷?duì)人類的測(cè)試會(huì)假設(shè)這種品質(zhì)在某種程度上是存在的?!拔覀兡壳斑€沒有一種方法甚至是一種理念來測(cè)試心智理論的存在,這是一種現(xiàn)象學(xué)品質(zhì)?!彼f。

華盛頓大學(xué)計(jì)算語(yǔ)言學(xué)教授艾米麗?本德(Emily Bender)因堅(jiān)持揭露人工智能行業(yè)的膨脹炒作而成為了該領(lǐng)域的傳奇人物。她對(duì)這個(gè)激勵(lì)著研究人員的問題提出了異議?!懊鎸?duì)相同問題,文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要?”她問道,“我們能夠了解大語(yǔ)言模型內(nèi)部是如何運(yùn)作的嗎?它們可能有什么用處,又可能帶來哪些危險(xiǎn)?”

本德對(duì)論文中的擬人化表示擔(dān)憂,論文研究人員說大語(yǔ)言模型有認(rèn)知、推理和作出選擇的能力,還使用了“大語(yǔ)言模型和人類參與者之間的物種公平比較”這一措辭。本德說,這“完全沒有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)的研究結(jié)果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會(huì)帶來什么影響。雖然這種大語(yǔ)言模型在與人類用戶交互和預(yù)測(cè)用戶需求方面會(huì)做得更好,但它們也可能更多地用于欺騙和操縱。它們會(huì)引來更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249289

原文標(biāo)題:人工智能在心智理論測(cè)試中戰(zhàn)勝人類

文章出處:【微信號(hào):AI智勝未來,微信公眾號(hào):AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    作者:DigiKey Editor 人工智能(AI)已經(jīng)是當(dāng)前科技業(yè)最熱門的話題,且其應(yīng)用面涉及人類生活的各個(gè)領(lǐng)域,對(duì)于各個(gè)產(chǎn)業(yè)都帶來相當(dāng)重要的影響,且即將改變人類未來發(fā)展的方方面面。本文將為您介紹
    的頭像 發(fā)表于 01-25 17:37 ?927次閱讀
    <b class='flag-5'>人工智能</b>和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    Reddit測(cè)試人工智能問答功能Reddit Answers

    近日,Reddit公司宣布了一項(xiàng)重要的新功能測(cè)試計(jì)劃,旨在通過人工智能技術(shù)為用戶提供更加便捷的問答體驗(yàn)。這項(xiàng)新功能被命名為Reddit Answers。 據(jù)Reddit官方介紹,Reddit
    的頭像 發(fā)表于 12-12 09:46 ?640次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它研究如何使計(jì)算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代,經(jīng)
    發(fā)表于 11-14 16:39

    人工智能對(duì)人類的影響有哪些

    人工智能(AI)作為現(xiàn)代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會(huì)結(jié)構(gòu)。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著一系列挑戰(zhàn)和問題。 一、積極影響 工作變革與經(jīng)濟(jì)增長(zhǎng)
    的頭像 發(fā)表于 10-22 17:23 ?5994次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    農(nóng)業(yè)、環(huán)保等,為人類社會(huì)的可持續(xù)發(fā)展做出貢獻(xiàn)。 總結(jié) 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們展示了一個(gè)充滿希望和機(jī)遇的未來。在這個(gè)未來中,人工智能
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,還促進(jìn)了新理論、新技術(shù)的誕生。 3. 挑戰(zhàn)與機(jī)遇并存 盡管人工智能為科學(xué)創(chuàng)新帶來了巨大潛力,但第一章也誠(chéng)實(shí)地討論了伴隨而來的挑戰(zhàn)。數(shù)據(jù)隱私、算法偏見、倫理道德等問題不容忽視。如何在利用AI提升科研效率
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    生成式人工智能的概念_生成式人工智能主要應(yīng)用場(chǎng)景

    生成式人工智能(Generative Artificial Intelligence,簡(jiǎn)稱GAI)是一種先進(jìn)的人工智能技術(shù),其核心在于利用計(jì)算機(jī)算法和大量數(shù)據(jù)來生成新的、具有實(shí)際價(jià)值的內(nèi)容。這種技術(shù)能夠模擬人類的創(chuàng)造力和想象力,
    的頭像 發(fā)表于 09-16 16:05 ?4742次閱讀

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對(duì)AI for Science的技術(shù)支撐進(jìn)行解讀。 第3章介紹了在
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05