99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NeurIPS 2023 | AI Agents先行者CAMEL:首個基于大模型的多智能體框架

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-11-26 21:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI Agents 是當下大模型領(lǐng)域備受關(guān)注的話題,用戶可以引入多個扮演不同角色的 LLM Agents 參與到實際的任務(wù)中,Agents 之間會進行競爭和協(xié)作等多種形式的動態(tài)交互,進而產(chǎn)生驚人的群體智能效果。本文介紹了來自 KAUST 研究團隊的大模型心智交互 CAMEL 框架(“駱駝”),CAMEL 框架是最早基于 ChatGPT 的 autonomous agents 知名項目,目前已被頂級人工智能會議 NeurIPS 2023 錄用。

wKgZomVjSFmAZGh7AAMUhEKDDJM406.png

論文題目:

CAMEL: Communicative Agents for “Mind” Exploration of Large Scale Language Model Society論文鏈接:https://ghli.org/camel.pdf

代碼鏈接:

https://github.com/camel-ai/camel項目主頁:https://www.camel-ai.org/

“什么神奇的技巧讓我們變得智能?竅門就是沒有竅門。智慧的力量源于我們巨大的多樣性,而不是任何單一的、完美的原則。”

——人工智能先驅(qū) 馬文·明斯基(Marvin Minsky)[1]

目前來看,在機器通向高級智能的道路上,以 ChatGPT 為代表的大模型(LLMs)應(yīng)該是必須經(jīng)過的里程碑之一,它們以聊天對話的人機交互方式在多個領(lǐng)域的復(fù)雜任務(wù)解決方面取得了非常耀眼的成就。

隨著 LLMs 的發(fā)展,AI Agents(AI 智能體)之間的交互框架也逐漸興起,尤其是在一些復(fù)雜的專業(yè)領(lǐng)域,以角色扮演等模式預(yù)置的智能體完全有能力代替人類用戶在任務(wù)中扮演的角色,同時,智能體之間通過以協(xié)作和競爭形式的動態(tài)交互往往能夠帶來意想不到的效果,這就是被 OpenAI 人工智能專家 Andrej Karpathy 等人看作是“通向 AGI 最重要的前沿研究方向”的 AI Agents。該領(lǐng)域發(fā)展的時間線如下 [2]:
  • “CAMEL”(駱駝:大模型心智交互框架)- 發(fā)布于 2023.3.21
  • “AutoGPT” - 發(fā)布于 2023.3.30
  • “BabyGPT” - 發(fā)布于 2023.4.3
  • “Westworld” simulation(斯坦福西部世界小鎮(zhèn)) — 發(fā)布于 2023.4.7

作為最早基于 ChatGPT 的 autonomous agents 知名項目,CAMEL 重點探索了一種稱為角色扮演(role-playing)的新型合作代理框架,該框架可以有效緩解智能體對話過程中出現(xiàn)的錯誤現(xiàn)象,從而有效引導(dǎo)智能體完成各種復(fù)雜的任務(wù),人類用戶只需要輸入一個初步的想法就可以啟動整個過程。目前,CAMEL 已經(jīng)被國際人工智能頂級會議 NeurIPS 2023 錄用。

wKgZomVjSFqAUwEbAAiNKsGDC8U506.png

作者對 CAMEL 框架設(shè)計了靈活的模塊化功能,包括不同代理的實現(xiàn)、各種專業(yè)領(lǐng)域的提示示例和 AI 數(shù)據(jù)探索框架等,因此 CAMEL 可以作為一個基礎(chǔ)的 Agents 后端,支持 AI 研究者和開發(fā)者更加輕松地開發(fā)有關(guān)于多智能體系統(tǒng)、合作人工智能、博弈論模擬、社會分析、人工智能倫理等方面的應(yīng)用。具體的,作者通過涉及兩種角色扮演的合作場景,生成了兩個大型的指令數(shù)據(jù)集 AI Society 和 AI Code,以及兩個單輪問答數(shù)據(jù)集 AI Math 和 AI Science,用于探索 LLM 涌現(xiàn)能力的研究。

wKgZomVjSFqAKU58AAAl6LOgh3c752.png

CAMEL框架

下圖展示了 CAMEL 中的 role-playing 框架,人類用戶需要首先制定一個想要實現(xiàn)的想法或目標,例如:開發(fā)一個用于股票市場的交易機器人。這項任務(wù)涉及的角色是 AI 助理智能體(使其扮演 Python 程序員角色)和 AI 用戶智能體(使其扮演股票交易員角色)。

wKgZomVjSFqAXXQWAAYKK6pwmm4932.png

作者首先為 CAMEL 設(shè)置了一個任務(wù)細化器(Task Specifier),該細化器會根據(jù)輸入的想法來制定一個較為詳細的實現(xiàn)步驟,隨后 AI 助理智能體(AI Assistant)和 AI 用戶智能體(AI User)通過聊天的方式來進行協(xié)作通信,各自一步步完成指定的任務(wù)。

其中協(xié)作通信通過系統(tǒng)級的消息傳遞機制來實現(xiàn),令為傳遞給 AI 助理智能體的系統(tǒng)消息,為傳遞給 AI 用戶智能體的系統(tǒng)消息。隨后為 AI 助理智能體和 AI 用戶智能體分別實例化為兩個 ChatGPT 模型,相應(yīng)得到 AI 助理智能體和 AI 用戶智能體。角色分配完成后,AI 助理智能體和 AI 用戶智能體會按照指令跟隨的方式協(xié)作完成任務(wù),令為時間時刻獲得的用戶指令消息,為 AI 助理智能體給出的解決方案,因而時刻得到的對話消息集為:

wKgZomVjSFqAfGQoAAAxY7qnz3A090.png

在下一個時刻,AI 用戶智能體會根據(jù)歷史對話消息集,來生成新的指令。然后再將新指令消息與歷史對話消息集一起傳遞給 AI 助理智能體來生成新一時刻的解決方案:

wKgZomVjSFuAeX0RAAAsNWKo9tc027.png

更多技術(shù)細節(jié),可以參考我們先前對CAMEL 的報道

wKgZomVjSFuAOKJaAAAuhh9-KLM135.png

CAMEL使用示例

2.1 協(xié)作角色扮演(cooperate role-playing)

CAMEL 內(nèi)置的協(xié)作式 role-playing 框架可以在人類用戶不具備專業(yè)知識的情況下,通過 Agents 之間的協(xié)作方式完成復(fù)雜任務(wù),下圖展示了 CAMEL 開發(fā)股票市場交易機器人的例子,其中 AI 助理智能體的扮演的角色是一名 Python 程序員,而 AI 用戶智能體扮演的角色為一名股票交易員。

wKgZomVjSFuAPs0yAAnD9TVRoo8030.png

在 role-playing 框架中,AI 智能體都具有特定領(lǐng)域的專業(yè)知識,此時我們只需要指定一個原始想法的 Prompt,隨后兩個AI智能體就會圍繞著這一想法展開工作,在上圖中,用戶智能體提出交易機器人需要有對股票評論的情緒分析功能,隨后助理智能體直接給出了安裝情緒分析和股票交易所需的 python 庫的腳本。

wKgZomVjSFuAGtTEAAYQeHpbstk318.png

隨著任務(wù)的進行,用戶智能體給出的指示也會越來越明確,上圖中的指示為:定義一個函數(shù)以使用 Yahoo Finance API 獲取特定股票的最新股價。助理智能體會根據(jù)該指示直接生成一段代碼來解決需求。2.2 具身智能體(embodied agent)在先前的研究中,AI Agents 可以理解為在模擬一些操作,而沒有與現(xiàn)實世界交互或使用外部工具執(zhí)行操作,目前的 LLMs 已經(jīng)具備與互聯(lián)網(wǎng)或其他工具API交互的能力,CAMEL 也提供了能夠在物理世界中執(zhí)行各種操作的具身智能體(embodied agent),它們可以瀏覽互聯(lián)網(wǎng)、閱讀文檔、創(chuàng)建圖像、音頻視頻等內(nèi)容,甚至可以直接執(zhí)行代碼。wKgaomV1f7iAdS4qAAPWIU3JPf8135.png

上圖展示了 CAMEL 通過使用 embodied agent 調(diào)用 HuggingFace 提供的 Stable Diffusion 工具鏈生成駱駝科圖像的樣例,在這一過程中,embodied agent 首先會推理出駱駝科所包含的所有動物,隨后調(diào)用擴散模型生成圖像并進行保存。

2.3 critic在環(huán)(critic-in-the-loop)

為了增強 role-playing 框架的可控性,作者團隊還為 CAMEL 設(shè)計了一種 critic-in-the-loop,這種機制受到了蒙特卡洛樹搜索(MTCS)方法的啟發(fā),它可以結(jié)合人類偏好實現(xiàn)樹搜索的決策邏輯來解決任務(wù),CAMEL 可以設(shè)置一個中間評價智能體(critic)來根據(jù)用戶智能體和助理智能體出的各種觀點進行決策來完成最終任務(wù),整體流程如下圖所示。

wKgZomVjSFyAcgHlAAKFz7AM7lM444.png

考慮這樣一個場景,我們讓 CAMEL 主持一場很具體的科研項目討論會,而科研項目的主題“大型語言模型”,CAMEL 可以將用戶智能體的角色設(shè)置為一個博士后,將助理智能體的角色設(shè)置為博士生,而中間評價智能體的角色設(shè)置為教授。任務(wù)指示博士生來幫助博士后制定研究計劃,需要圍繞大模型的倫理展開研究。

wKgZomVjSFyAItxyAAiYLx6-Ffc627.png

在接到任務(wù)后,博士后智能體首先拋出了關(guān)于這一項目的三個觀點,表明項目應(yīng)該首先從調(diào)研大模型倫理方面的相關(guān)工作著手。隨后教授智能體會根據(jù)這三個觀點給出自己的看法。并且認為觀點 2 最為合理的,即研究大模型歧視性算法。同時還會給出另外兩個觀點的缺陷,例如觀點 1 缺乏更加清晰的結(jié)構(gòu),觀點 3 的研究范圍太窄等等。

wKgZomVjSF2AIoqsABRoLVPKcfc606.png在教授發(fā)言之后,博士生智能體會進行更加具體的項目規(guī)劃,例如直接列出一些大模型倫理安全方向的相關(guān)文獻,并且討論如何開展具體的研究。 wKgZomVjSF2Ab5tyAAAtJ0fTuoM170.png

實驗效果

本文的性能評估主要從三個方面進行,并且采用兩個 gpt-3.5-turbo 作為實驗智能體,實驗的數(shù)據(jù)集使用 CAMEL 框架生成的四個 AI 數(shù)據(jù)集,其中 AI Society 和 AI Code 側(cè)重于智能體的對話效果,而 AI Math 和 AI Science 側(cè)重于智能體的問題解決能力。3.1 Agent評估在這一部分,作者從 AI Society 和 AI Code 數(shù)據(jù)集中分別隨機選擇 100 個任務(wù)進行評估,然后使用 CAMEL 框架和單個 gpt-3.5-turbo 進行對比實驗,結(jié)果評估方面分為兩部分,一方面由人類受試者對兩種方法給出的解決方案給出 453 份投票數(shù)據(jù),來決定哪種方案更加可行另一方面,作者提示 GPT4 模型對兩種方案直接給出評分,具體的對比數(shù)據(jù)如下表所示。

wKgZomVjSF2AId46AAIfhnJDJ3Q498.png

從上表中可以看出,CAMEL 框架給出的解決方案在人類評估和 GPT4 評估中均大幅優(yōu)于 gpt-3.5-turbo 給出的解決方案,其中人類評估和 GPT4 評估的總體趨勢高度一致3.2 使用GPT-4對ChatBot評估在這一部分,作者在 CAMEL 生成的四個數(shù)據(jù)集上對 LLaMA-7B 模型進行了逐步的微調(diào),通過向 LLM 中不斷注入來自社會、代碼、數(shù)學(xué)和科學(xué)等不同領(lǐng)域的知識,來觀察模型對知識發(fā)現(xiàn)的接受效果。

作者首先從 AI Society 數(shù)據(jù)集開始,讓模型了解人類的互動常識和社會動態(tài),隨后 AI Code 和其他數(shù)據(jù)集的注入,模型獲得了編程邏輯和語法的知識,同時拓寬了模型對科學(xué)理論、經(jīng)驗觀察和實驗方法的理解。

wKgZomVjSF2AK1RZAAOvIfKaD1o016.png

上表展示了模型在20 個 Society 任務(wù)、20 個代碼編寫任務(wù)、20 個數(shù)學(xué)任務(wù)和 60 個科學(xué)任務(wù)上的測試效果,可以看到在每次添加數(shù)據(jù)集時,模型在已訓(xùn)練過的任務(wù)域上都會表現(xiàn)得更好。3.3 HumanEval

為了進一步評估 CAMEL 框架的代碼編寫任務(wù)解決能力,作者在 HumanEval 和 HumanEval+ 兩個評估基準上進行了實驗,實驗結(jié)果如下表所示。

wKgZomVjSF6ATJzCAALMVWnWA_A809.png

上表中清楚地證明了 CAMEL 框架的卓越性能,它不僅遠遠超過了 LLaMA-7B 模型,而且還大大超過了 Vicuna-7B 模型,這表明使用 CAMEL 生成的數(shù)據(jù)集在增強 LLM 處理編碼相關(guān)任務(wù)方面有獨特的效果。 wKgZomVjSF6AGh69AAAC0jQz1zo980.svg

參考文獻

wKgZomVjSF6AGh69AAAC0jQz1zo980.svg ?

[1]Minsky M. Society of mind[M]. Simon and Schuster, 1988.

[2] https://towardsdatascience.com/4-autonomous-ai-agents-you-need-to-know-d612a643fa92


原文標題:NeurIPS 2023 | AI Agents先行者CAMEL:首個基于大模型的多智能體框架

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:NeurIPS 2023 | AI Agents先行者CAMEL:首個基于大模型的多智能體框架

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    聯(lián)友科技亮相2025未來汽車先行者大會

    近日,由中國國際貿(mào)易促進委員會汽車行業(yè)分會、中國機械國際合作股份有限公司主辦的深圳2025(第三屆)未來汽車先行者大會在深圳國際會展中心盛大舉行,與2025(第二十九屆)粵港澳大灣區(qū)車展同期拉開帷幕。
    的頭像 發(fā)表于 06-06 17:04 ?482次閱讀

    基本半導(dǎo)體亮相2025未來汽車先行者大會

    近日,2025粵港澳大灣區(qū)車展在深圳國際會展中心(寶安)隆重開幕,在同期舉辦的2025未來汽車先行者大會上,基本半導(dǎo)體正式成為深圳全球新能源汽車高端零部件設(shè)計制造中心成員,董事長汪之涵博士受邀參加啟動儀式。
    的頭像 發(fā)表于 06-06 13:38 ?408次閱讀

    芯馳科技亮相2025未來汽車先行者大會

    近日,2025(第三屆)未來汽車先行者大會在深圳國際會展中心隆重開幕。作為與粵港澳大灣區(qū)車展同步舉行的汽車產(chǎn)業(yè)年度盛會,以“競渡”為主題,本次大會匯聚了來自廣汽集團、長安汽車、小鵬汽車、蔚來
    的頭像 發(fā)表于 06-06 13:32 ?425次閱讀

    中科創(chuàng)達亮相2025未來汽車先行者大會

    近日,以「競渡」為主題的2025 未來汽車先行者大會在深圳成功舉行。作為粵港澳大灣區(qū)車展官方配套論壇,這場行業(yè)盛會匯聚了汽車領(lǐng)域頂流大咖與產(chǎn)業(yè)鏈上下游領(lǐng)軍企業(yè)的先鋒代表,共探汽車產(chǎn)業(yè)智能化轉(zhuǎn)型的未來圖景。
    的頭像 發(fā)表于 06-05 17:48 ?627次閱讀

    上汽集團亮相2025未來汽車先行者大會

    近日,2025(第三屆)未來汽車先行者大會在深圳國際會展中心(寶安)正式揭幕。此次大會以“競渡”為主題,設(shè)置π動未來創(chuàng)新峰會、智能網(wǎng)聯(lián)汽車商業(yè)化論壇、AI浪潮峰會和未來圖景峰會4場高端峰會,以及
    的頭像 發(fā)表于 06-05 16:56 ?487次閱讀

    廣汽集團亮相2025未來汽車先行者大會

    近日,廣汽集團副總經(jīng)理閤先慶出席了以“競渡”為主題的2025未來汽車先行者大會。大會旨在匯聚汽車行業(yè)頂尖專家學(xué)者、業(yè)界領(lǐng)軍人物,共同探討汽車產(chǎn)業(yè)發(fā)展新趨勢、新機遇與新挑戰(zhàn)。
    的頭像 發(fā)表于 06-05 16:23 ?427次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會上,聯(lián)發(fā)科定義了“智能化用戶體驗”的五大特征:主動及時、知你懂你、互動協(xié)作、學(xué)習(xí)進化和專屬隱私信息守護。這五大特征需要跨越從芯片、模型、應(yīng)
    發(fā)表于 04-13 19:52

    智能仿真中的統(tǒng)一混合模型框架研究

    隨著GPT大語言模型的成功,越來越多的工作嘗試使用類GPT架構(gòu)的離散模型來表征駕駛場景中的交通參與者行為,從而生成智能仿真。這些方法展現(xiàn)
    的頭像 發(fā)表于 04-01 14:31 ?312次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>仿真中的統(tǒng)一混合<b class='flag-5'>模型</b><b class='flag-5'>框架</b>研究

    維智科技陶闖:AI模型時代下時空智能的發(fā)展機遇

    近日,由知名科技媒體泰伯網(wǎng)主辦的WIF2024創(chuàng)新先行者論壇成功舉辦。
    的頭像 發(fā)表于 12-16 14:49 ?840次閱讀

    AI智能生態(tài)圈和軟件棧

    層: 智能托管/服務(wù) 智能框架 LLM模型與存儲 二,從LLM到LLM
    的頭像 發(fā)表于 12-03 15:49 ?647次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>生態(tài)圈和軟件棧

    興威帆電子:RTC時鐘芯片領(lǐng)域的先行者、專注者(中)

    深圳鴻合智遠|興威帆電子:RTC時鐘芯片領(lǐng)域的先行者、專注者(中)
    的頭像 發(fā)表于 11-26 11:09 ?519次閱讀
    興威帆電子:RTC時鐘芯片領(lǐng)域的<b class='flag-5'>先行者</b>、專注者(中)

    深圳鴻合智遠 興威帆電子:RTC時鐘芯片領(lǐng)域的先行者、專注者(上)

    深圳鴻合智遠|興威帆電子:RTC時鐘芯片領(lǐng)域的先行者、專注者(上)
    的頭像 發(fā)表于 11-25 11:17 ?660次閱讀
    深圳鴻合智遠 興威帆電子:RTC時鐘芯片領(lǐng)域的<b class='flag-5'>先行者</b>、專注者(上)

    商湯發(fā)布國內(nèi)首個病理大模型,開啟病理診斷新篇章

    2024世界人工智能大會(WAIC)期間,作為全球醫(yī)療大模型創(chuàng)新先行者,商湯醫(yī)療攜手瑞金醫(yī)院、華西醫(yī)院、新華醫(yī)院、西京醫(yī)院、中科大附屬第一醫(yī)院、北京清華長庚醫(yī)院,在行業(yè)內(nèi)率先啟動醫(yī)療
    的頭像 發(fā)表于 09-02 09:21 ?1262次閱讀

    啟明智顯:深度融合AI技術(shù),引領(lǐng)硬件產(chǎn)品全面智能化升級

    啟明智顯,作為AI領(lǐng)域的先行者,正以前所未有的決心和行動力,深度融合先進的人工智能技術(shù),引領(lǐng)硬件產(chǎn)品全面智能化升級
    的頭像 發(fā)表于 07-18 16:11 ?709次閱讀
    啟明智顯:深度融合<b class='flag-5'>AI</b>技術(shù),引領(lǐng)硬件產(chǎn)品全面<b class='flag-5'>智能</b>化升級

    AI算法/模型/框架/模型庫的含義、區(qū)別與聯(lián)系

    在人工智能(Artificial Intelligence,簡稱AI)的廣闊領(lǐng)域中,算法、模型、框架模型庫是構(gòu)成其技術(shù)生態(tài)的重要基石。它們
    的頭像 發(fā)表于 07-17 17:11 ?8193次閱讀