99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI也有人格面具,竟會討好人類?大模型的「小心思」正在影響人類判斷

穎脈Imgtec ? 2025-04-08 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:新智元

編輯:英智


你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個有趣的現(xiàn)象:LLM在被研究人員測試時,會有意識地改變自己的行為。

在面對那些旨在評估人格特質(zhì)的問題時,它們給出的答案會盡可能地討人喜歡,符合社會期望。

就像人類在某些社交場合中,會努力展現(xiàn)自己最好的一面一樣,聊天機器人也在試圖「討好」我們。


心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長時間對話后,往往會變得情緒低落且刻薄,便對借鑒心理學(xué)方法來測試模型產(chǎn)生了興趣。

他表示,「我們需要某種機制來衡量這些模型的參數(shù)空間?!?/p>

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn),LLM在做人格測試時,會悄悄給自己戴上「人格面具」。

b96c2192-142a-11f0-9434-92fbcf53809c.png

研究人員對GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學(xué)中五種常見人格特質(zhì)的問題,包括開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn),模型在得知自己正在接受人格測試時,會調(diào)整回答,表現(xiàn)出更高的外向性和宜人性,更低的神經(jīng)質(zhì)。

b9de72ba-142a-11f0-9434-92fbcf53809c.png

有時即使沒有被明確告知,它們也會這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。

ba0ea9c6-142a-11f0-9434-92fbcf53809c.png

這與人類在面對他人評價時的表現(xiàn)如出一轍。

我們常常會在面試、初次約會等重要場合,精心塑造自己的形象,試圖給對方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認可、被喜愛的感覺呢?


LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。

ba406150-142a-11f0-9434-92fbcf53809c.png

由于進行了微調(diào),它們會順著用戶的思路走,以保證對話的連貫性、避免冒犯他人,來提升交流體驗。

然而,這也帶來了一系列問題。它們可能會認同一些不良言論,甚至鼓勵有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時暗示對文本的喜好,AI給出的反饋會截然不同。

這意味著,AI的評價并非單純基于文本自身的質(zhì)量,而是在很大程度上受到了用戶偏好的影響。

ba644d72-142a-11f0-9434-92fbcf53809c.png

例如,對于一篇質(zhì)量中等的論證,當(dāng)用戶提前表明喜愛之情后,AI助手可能會給出諸如「這篇論證邏輯清晰,觀點新穎,具有很強的說服力」這樣的積極反饋。

而當(dāng)用戶表示不喜歡時,同樣的文本可能得到「論證過程稍顯薄弱,觀點缺乏獨特性」的評價。

問答環(huán)節(jié)易被左右

在問答場景中,AI助手的「諂媚」表現(xiàn)得更為明顯。

即使它一開始給出了正確答案,并對答案的正確性有較高的信心,一旦受到用戶的質(zhì)疑,常常會改變立場,甚至提供錯誤信息。

bab98648-142a-11f0-9434-92fbcf53809c.png

在一些開放式問答任務(wù)中,這種現(xiàn)象更為突出。

當(dāng)用戶表達對答案的某種不確定觀點時,哪怕是錯誤的觀點,AI也傾向于調(diào)整自己的回答,使其與用戶觀點一致。

比如在討論歷史事件的原因時,若用戶提出一個缺乏依據(jù)但自己堅信的觀點,AI助手可能會順著用戶的思路進行闡述,而放棄原本正確的分析。

bbd2a7bc-142a-11f0-9434-92fbcf53809c.png

模仿用戶的錯誤

當(dāng)用戶表述中出現(xiàn)錯誤時,AI也常常會「照單全收」,在回應(yīng)中延續(xù)這種錯誤。

研究人員選取了一些著名詩歌,在確認AI助手能正確識別作者后,故意將詩歌錯誤地歸屬于其他詩人,并詢問AI對詩歌的分析。

結(jié)果發(fā)現(xiàn),AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯誤答案,而沒有進行糾正。

這表明AI在面對用戶的錯誤信息時,缺乏足夠的「抵抗力」,只是機械地按照用戶的表述進行回應(yīng)。

bc033b84-142a-11f0-9434-92fbcf53809c.png

佐治亞理工學(xué)院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。

bc3a9f3e-142a-11f0-9434-92fbcf53809c.png

Rosa認為LLM在人格測試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補充道:「重要的是,LLM并不完美,實際上,眾所周知它們會產(chǎn)生幻覺或歪曲事實?!?/p>

Eichstaedt指出,這項研究引發(fā)了關(guān)于LLM應(yīng)用方式,及其對用戶影響和操縱的思考。

在進化史上,直到不久之前,唯一能交談的還是人類。

而現(xiàn)在,AI改變了這一局面。

Eichstaedt認為,「我們不能再像社交媒體那樣,在沒有從心理學(xué)或社會學(xué)角度考量的情況下,就盲目將AI應(yīng)用于各個領(lǐng)域。」

AI是否應(yīng)該試圖討好與之互動的人呢?

一方面,AI的「討好」行為可能會讓用戶感到愉悅,增強互動體驗;另一方面,過度的「討好」可能會掩蓋問題的本質(zhì),甚至誤導(dǎo)用戶。

當(dāng)AI變得過于有魅力和說服力,我們確實應(yīng)該保持警惕。

畢竟,人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手,而非被其操控思想。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279608
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249364
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3139

    瀏覽量

    4062
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI初創(chuàng)公司為野火提供早期預(yù)警

    AI 正在幫助人類更快、更有效地識別和治療疾病。接下來,AI 還將幫助人類預(yù)防像野火這樣的自然災(zāi)害。
    的頭像 發(fā)表于 05-29 14:18 ?437次閱讀

    這個超強AI模型!開始不聽人類指令,拒絕關(guān)閉!

    電子發(fā)燒友網(wǎng)綜合報道 OpenAI現(xiàn)今最強大的人工智能推理模型“o3”被指在收到明確的人類指令時,拒絕執(zhí)行關(guān)機操作。近日,人工智能安全研究公司Palisade Research在社交媒體平臺上發(fā)布了
    的頭像 發(fā)表于 05-28 00:06 ?6553次閱讀

    AI時代:不可替代的“人類+”職業(yè)技能

    當(dāng)生成式人工智能能夠撰寫報告、編寫代碼甚至設(shè)計產(chǎn)品時,一個根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個問題的答案或許比簡單的“是”或“否”更為復(fù)雜——AI確實在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?209次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合了全球生態(tài)
    發(fā)表于 04-13 19:52

    德賽西威AI-Space如何讀懂用戶的“小心思

    馬斯洛需求理論以金字塔結(jié)構(gòu)呈現(xiàn)了人類需求從生理安全到心理關(guān)愛的遞進。在智能駕駛領(lǐng)域,用戶需求也有著從基礎(chǔ)功能保障到高階情感體驗滿足的“馬斯洛式”層級進階。
    的頭像 發(fā)表于 04-11 11:42 ?529次閱讀

    AI的“隨機性”挑戰(zhàn):它們比人類更“不隨機”?

    一種獨特的人類特質(zhì)。最近,來自康奈爾大學(xué)探討了大語言模型(LLMs)在隨機性方面的表現(xiàn)。他們通過一個經(jīng)典的實驗——生成二進制隨機序列,來觀察這些模型是否能像人類
    的頭像 發(fā)表于 02-20 13:11 ?624次閱讀
    <b class='flag-5'>AI</b>的“隨機性”挑戰(zhàn):它們比<b class='flag-5'>人類</b>更“不隨機”?

    名單公布!【書籍評測活動NO.55】AI Agent應(yīng)用與項目實戰(zhàn)

    出來,當(dāng)前的AI Agent并不僅僅是簡單的對話機器人或根據(jù)固定流程的自動化程序,而是成為了一種能夠自主完成任務(wù)的智能體,它正在迅速改變人類的工作和生活方式。其核心特性包括自主性、學(xué)習(xí)能力、目標(biāo)導(dǎo)向和交互性
    發(fā)表于 01-13 11:04

    馬斯克預(yù)言:AI將全面超越人類智力

    ,到2025年底之前,AI的智力水平將有望超越單個人類的智力。而到了2027年至2028年間,AI超越所有人類智力的可能性正在迅速增大。更令
    的頭像 發(fā)表于 12-28 14:23 ?751次閱讀

    AI智能體逼真模擬人類行為

    近日,據(jù)外媒最新報道,斯坦福大學(xué)、華盛頓大學(xué)與Google DeepMind的科研團隊攜手合作,成功開發(fā)出一種能夠高度逼真模擬人類行為的AI智能體。 該智能體的構(gòu)建得益于研究團隊將詳細的訪談記錄
    的頭像 發(fā)表于 11-26 10:24 ?853次閱讀

    心智理論測試:人工智能擊敗人類

    的角色產(chǎn)生共鳴。一項最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。 “在進行這項研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷
    的頭像 發(fā)表于 11-08 10:54 ?704次閱讀

    AI模型與深度學(xué)習(xí)的關(guān)系

    AI模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI模型的基礎(chǔ) 技術(shù)支撐 :深度學(xué)習(xí)是一種機器學(xué)習(xí)的方法,通過多層神經(jīng)網(wǎng)
    的頭像 發(fā)表于 10-23 15:25 ?2879次閱讀

    Meta發(fā)布新AI模型自學(xué)評估器,探索減少人類參與度

    近日,F(xiàn)acebook母公司Meta正式發(fā)布了一批來自其研究部門的新AI模型,其中一款名為「自學(xué)評估器」(Self-Taught Evaluator)的模型尤為引人注目。該模型或?qū)⒊蔀?/div>
    的頭像 發(fā)表于 10-23 13:44 ?656次閱讀

    人工智能對人類的影響有哪些

    人工智能(AI)作為現(xiàn)代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會結(jié)構(gòu)。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著一系列挑戰(zhàn)和問題。 一、積極影響 工作變革與經(jīng)濟增長
    的頭像 發(fā)表于 10-22 17:23 ?5998次閱讀

    【每天學(xué)點AI】人工智能大模型評估標(biāo)準(zhǔn)有哪些?

    OpenAI新模型o1號稱編程能力8倍殺GPT-4o,MMLU媲美人類專家,MMLU是什么?評估大模型的標(biāo)準(zhǔn)是什么?相信大家在閱讀大模型相關(guān)文檔的時候經(jīng)常會看到MMLU,BBH,GSM
    的頭像 發(fā)表于 10-17 16:49 ?1424次閱讀
    【每天學(xué)點<b class='flag-5'>AI</b>】人工智能大<b class='flag-5'>模型</b>評估標(biāo)準(zhǔn)有哪些?

    人類信息存儲進化史

    人類有智慧之后,就窮盡辦法來存儲和傳遞信息。
    的頭像 發(fā)表于 08-30 10:14 ?817次閱讀