99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

識(shí)別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測(cè)器來(lái)了

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來(lái)源:未知 ? 2023-06-06 11:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 造假的成功率很高,前幾天「10 分鐘騙 430萬(wàn)」還上了熱搜。在最熱門的大語(yǔ)言模型上,研究人員最近探索了一種識(shí)別方法。

隨著生成式大模型的不斷進(jìn)步,它們生成的語(yǔ)料正逐步逼近人類。雖然大模型正在解放無(wú)數(shù)文書的雙手,它以假亂真的強(qiáng)勁能力也為一些不法分子所利用,造成了一系列社會(huì)問(wèn)題:

a3c9c258-0415-11ee-90ce-dac502259ad0.jpg

a3d3def0-0415-11ee-90ce-dac502259ad0.png

a3e93af2-0415-11ee-90ce-dac502259ad0.jpg

來(lái)自北大、華為的研究者們提出了一種識(shí)別各式 AI 生成語(yǔ)料的可靠文本檢測(cè)器。根據(jù)長(zhǎng)短文本的不同特性,提出了一種基于 PU 學(xué)習(xí)的多尺度 AI 生成文本檢測(cè)器訓(xùn)練方法。通過(guò)對(duì)檢測(cè)器訓(xùn)練過(guò)程的改進(jìn),在同等條件下能取得在長(zhǎng)、短 ChatGPT 語(yǔ)料上檢測(cè)能力的可觀提升,解決了目前檢測(cè)器對(duì)于短文本識(shí)別精度低的痛點(diǎn)。

a3fa0b3e-0415-11ee-90ce-dac502259ad0.jpg

  • 論文地址:https://arxiv.org/abs/2305.18149

  • 代碼地址 (MindSpore):https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt

  • 代碼地址 (PyTorch):https://github.com/YuchuanTian/AIGC_text_detector

引言

隨著大語(yǔ)言模型的生成效果越發(fā)逼真,各行各業(yè)迫切需要一款可靠的 AI 生成文本檢測(cè)器。然而,不同行業(yè)對(duì)檢測(cè)語(yǔ)料的要求不同,例如在學(xué)術(shù)界,普遍需要對(duì)大段完整的學(xué)術(shù)文本進(jìn)行檢測(cè);在社交平臺(tái)上,需要對(duì)相對(duì)簡(jiǎn)短而較為支離破碎的假消息進(jìn)行檢測(cè)。然而,既有檢測(cè)器往往無(wú)法兼顧各式需求。例如,主流的一些 AI 文本檢測(cè)器對(duì)較短的語(yǔ)料預(yù)測(cè)能力普遍較差。

對(duì)于不同長(zhǎng)度語(yǔ)料的不同檢測(cè)效果,作者觀察到較短的 AI 生成文本可能存在著一部分歸屬上的「不確定性」;或者更直白地說(shuō),由于一些 AI 生成短句同時(shí)也常常被人類使用,因而很難界定 AI 生成的短文本是否來(lái)自于人或 AI。這里列舉了幾個(gè)人和 AI 分別對(duì)同一問(wèn)題做出回答的例子:

a40572d0-0415-11ee-90ce-dac502259ad0.jpg

由這些例子可見(jiàn),很難對(duì) AI 生成的簡(jiǎn)短回答進(jìn)行識(shí)別:這類語(yǔ)料與人的區(qū)別過(guò)小,很難嚴(yán)格判斷其真實(shí)屬性。因此,將短文本簡(jiǎn)單標(biāo)注為人類 / AI 并按照傳統(tǒng)的二分類問(wèn)題進(jìn)行文本檢測(cè)是不合適的。

針對(duì)這個(gè)問(wèn)題,本研究將人類 / AI 的二分類檢測(cè)部分轉(zhuǎn)化為了一個(gè)部分 PU(Positive-Unlabeled)學(xué)習(xí)問(wèn)題,即在較短的句子中,人的語(yǔ)言為正類(Positive),機(jī)器語(yǔ)言為無(wú)標(biāo)記類(Unlabeled),以此對(duì)訓(xùn)練的損失函數(shù)進(jìn)行了改進(jìn)。此改進(jìn)可觀地提升了檢測(cè)器在各式語(yǔ)料上的分類效果。

算法細(xì)節(jié)

在傳統(tǒng)的 PU 學(xué)習(xí)設(shè)定下,一個(gè)二分類模型只能根據(jù)正訓(xùn)練樣本和無(wú)標(biāo)記訓(xùn)練樣本進(jìn)行學(xué)習(xí)。一個(gè)常用的 PU 學(xué)習(xí)方法是通過(guò)制定 PU loss 來(lái)估計(jì)負(fù)樣本對(duì)應(yīng)的二分類損失:

a40beb4c-0415-11ee-90ce-dac502259ad0.jpg

其中,a414d34c-0415-11ee-90ce-dac502259ad0.jpg表示正樣本與正標(biāo)簽計(jì)算的二分類損失;a428b0f6-0415-11ee-90ce-dac502259ad0.jpg表示將無(wú)標(biāo)記樣本全部假定為負(fù)標(biāo)簽計(jì)算的二分類損失;a438ba82-0415-11ee-90ce-dac502259ad0.jpg表示將正樣本假定為負(fù)標(biāo)簽計(jì)算的二分類損失;a4413202-0415-11ee-90ce-dac502259ad0.jpg表示的是先驗(yàn)正樣本概率,即正樣本在全部 PU 樣本中的預(yù)估占比。在傳統(tǒng)的 PU 學(xué)習(xí)中,通常將先驗(yàn)a4413202-0415-11ee-90ce-dac502259ad0.jpg設(shè)置為一個(gè)固定的超參數(shù)。然而在文本檢測(cè)的場(chǎng)景中,檢測(cè)器需要處理各式長(zhǎng)度不同的文本;而對(duì)于不同長(zhǎng)度的文本而言,其正樣本在所有和該樣本相同長(zhǎng)度的 PU 樣本中的預(yù)估占比也是不同的。因此,本研究對(duì) PU Loss 進(jìn)行了改進(jìn),提出了長(zhǎng)度敏感的多尺度 PU(MPU)loss 損失函數(shù)。

具體地,本研究提出了一個(gè)抽象的循環(huán)模型對(duì)較短文本檢測(cè)進(jìn)行建模。傳統(tǒng)的 NLP 模型在處理序列時(shí),通常是一個(gè)馬爾可夫鏈的結(jié)構(gòu),如 RNN、LSTM 等。此類循環(huán)模型的這個(gè)過(guò)程通??梢岳斫鉃橐粋€(gè)逐漸迭代的過(guò)程,即每個(gè) token 輸出的預(yù)測(cè),都是由上一個(gè) token 及之前序列的預(yù)測(cè)結(jié)果和該 token 的預(yù)測(cè)結(jié)果經(jīng)過(guò)變換、融合得到的。即以下過(guò)程:

a45364cc-0415-11ee-90ce-dac502259ad0.jpg

為了根據(jù)這個(gè)抽象的模型進(jìn)行先驗(yàn)概率的估計(jì),需要假定該模型的輸出為某個(gè)句子為正類(Positive)的置信度,即判定為人說(shuō)出的樣本的概率。假設(shè)每個(gè) token 的貢獻(xiàn)大小為句子 token 長(zhǎng)度的反比,是非正(Positive)即無(wú)標(biāo)記(Unlabeled)的,且為無(wú)標(biāo)記的概率遠(yuǎn)遠(yuǎn)大于為正的概率。因?yàn)殡S著大模型的詞匯量逐漸逼近人類,絕大部分詞匯會(huì)同時(shí)出現(xiàn)在 AI 和人類語(yǔ)料中。根據(jù)這個(gè)簡(jiǎn)化后的模型和設(shè)定好的正 token 概率,通過(guò)求出不同輸入情況下模型輸出置信度的總期望,來(lái)得到最終的先驗(yàn)估計(jì)。

a46956f6-0415-11ee-90ce-dac502259ad0.jpg

通過(guò)理論推導(dǎo)和實(shí)驗(yàn),估計(jì)得到先驗(yàn)概率隨著文本長(zhǎng)度的上升而上升,最終逐漸穩(wěn)定。這種現(xiàn)象也符合預(yù)期,因?yàn)殡S著文本變長(zhǎng),檢測(cè)器可以捕捉的信息更多,文本的 「來(lái)源不確定性」也逐漸減弱:

a47e50b0-0415-11ee-90ce-dac502259ad0.jpg

之后,對(duì)于每個(gè)正樣本,根據(jù)其樣本長(zhǎng)度得到的獨(dú)特先驗(yàn)對(duì) PU loss 進(jìn)行計(jì)算。最后,由于較短文本僅有部分 “不確定性”(即較短文本也會(huì)含有一些人或者 AI 的文本特征),可以對(duì)二分類 loss 和 MPU loss 進(jìn)行加權(quán)相加,作為最終的優(yōu)化目標(biāo):

a48c7a78-0415-11ee-90ce-dac502259ad0.jpg

此外需要注意的是,MPU loss 適配的是長(zhǎng)度較為多樣的訓(xùn)練語(yǔ)料。倘若既有的訓(xùn)練數(shù)據(jù)單質(zhì)化明顯,大部分語(yǔ)料為大段冗長(zhǎng)的文本,則無(wú)法全面發(fā)揮 MPU 方法的功效。為了使得訓(xùn)練語(yǔ)料的長(zhǎng)度更多樣化,本研究還引入了一個(gè)在句子層面進(jìn)行多尺度化的模塊。該模塊隨機(jī)遮蓋訓(xùn)練語(yǔ)料中的部分句子,并對(duì)余下句子在保留原有順序的前提下進(jìn)行重組。經(jīng)過(guò)訓(xùn)練語(yǔ)料的多尺度化操作,訓(xùn)練文本得到了長(zhǎng)度上的極大豐富,從而充分利用了 PU 學(xué)習(xí)進(jìn)行 AI 文本檢測(cè)器訓(xùn)練。

實(shí)驗(yàn)結(jié)果

a4963482-0415-11ee-90ce-dac502259ad0.jpg

如上表所示,作者先在較短的 AI 生成語(yǔ)料數(shù)據(jù)集 Tweep-Fake 上檢驗(yàn) MPU loss 的效果。該數(shù)據(jù)集中的語(yǔ)料均為推特上較為短小的語(yǔ)段。作者又在傳統(tǒng)的語(yǔ)言模型微調(diào)基礎(chǔ)上將傳統(tǒng)二分類 loss 替換為含有 MPU loss 的優(yōu)化目標(biāo)。改進(jìn)之后的語(yǔ)言模型檢測(cè)器效果較為突出,超過(guò)了其它基線算法。

a4ac3962-0415-11ee-90ce-dac502259ad0.jpg

作者又對(duì) chatGPT 生成文本進(jìn)行了檢測(cè),經(jīng)過(guò)傳統(tǒng)微調(diào)得到的語(yǔ)言模型檢測(cè)器在短句上表現(xiàn)較差;經(jīng)過(guò) MPU 方式在同等條件下訓(xùn)練得到的檢測(cè)器在短句上表現(xiàn)良好,且同時(shí)能夠在完整語(yǔ)料上取得可觀的效果提升,F(xiàn)1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。

a4ca26d4-0415-11ee-90ce-dac502259ad0.jpg

如上表所示,作者在消融實(shí)驗(yàn)中觀察了每個(gè)部分帶來(lái)的效果增益。MPU loss 加強(qiáng)了長(zhǎng)、短語(yǔ)料的分類效果。

a4dd29a0-0415-11ee-90ce-dac502259ad0.jpg

作者還對(duì)比了傳統(tǒng) PU 和 Multiscale PU(MPU)。由上表可見(jiàn) MPU 效果更勝一籌,能更好地適配 AI 多尺度文本檢測(cè)的任務(wù)。

總結(jié)

作者通過(guò)提出基于多尺度 PU 學(xué)習(xí)的方案,解決了文本檢測(cè)器對(duì)于短句識(shí)別的難題,隨著未來(lái) AIGC 生成模型的泛濫,對(duì)于這類內(nèi)容的檢測(cè)將會(huì)越來(lái)越重要。這項(xiàng)研究在 AI 文本檢測(cè)的問(wèn)題上邁出了堅(jiān)實(shí)的一步,希望未來(lái)會(huì)有更多類似的研究,把 AIGC 內(nèi)容進(jìn)行更好的管控,防止 AI 生成內(nèi)容的濫用。


原文標(biāo)題:識(shí)別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測(cè)器來(lái)了

文章出處:【微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:識(shí)別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測(cè)器來(lái)了

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開(kāi)關(guān)已開(kāi)啟

    AI現(xiàn)在就像一個(gè)小朋友,很容易就學(xué)壞了!OpenAI剛剛發(fā)現(xiàn),如果用錯(cuò)誤的數(shù)據(jù)微調(diào)自家的模型的一個(gè)領(lǐng)域,ChatGPT就會(huì)把在這個(gè)領(lǐng)域?qū)W到的「惡」和「壞」泛化到其他領(lǐng)域。比如「刻意」用錯(cuò)誤數(shù)據(jù)在汽車
    的頭像 發(fā)表于 06-20 12:41 ?1628次閱讀
    <b class='flag-5'>AI</b>真會(huì)人格分裂!<b class='flag-5'>OpenAI</b>最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開(kāi)關(guān)已開(kāi)啟

    OpenAI嘗試減少對(duì)ChatGPT的審查

    近日,OpenAI宣布了一項(xiàng)新政策,旨在改變其訓(xùn)練人工智能模型的方式,以明確擁護(hù)“知識(shí)自由”的理念。OpenAI強(qiáng)調(diào),無(wú)論一個(gè)話題多么具有挑戰(zhàn)性或爭(zhēng)議性,都應(yīng)當(dāng)被平等對(duì)待和呈現(xiàn)。 據(jù)OpenAI表示
    的頭像 發(fā)表于 02-17 14:42 ?2009次閱讀

    OpenAI計(jì)劃開(kāi)發(fā)可替代手機(jī)的生成AI專用終端

    近日,據(jù)日經(jīng)報(bào)道,人工智能研究公司 OpenAI 的 CEO Sam Altman 在接受采訪時(shí)透露,OpenAI 計(jì)劃開(kāi)發(fā)一款可替代手機(jī)的生成AI 專用終端。 據(jù)了解,
    的頭像 發(fā)表于 02-05 14:50 ?489次閱讀

    OpenAIChatGPT宕機(jī)事件致歉

    近日,全球領(lǐng)先的AI研究機(jī)構(gòu)OpenAI遭遇了一次重大的服務(wù)中斷事件,其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。與此同時(shí),Sora及相關(guān)的API服務(wù)也受到了波及,無(wú)法正常運(yùn)作
    的頭像 發(fā)表于 12-16 09:47 ?821次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與Ope
    的頭像 發(fā)表于 12-12 09:40 ?721次閱讀

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項(xiàng)重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強(qiáng)大的處理能力和更高質(zhì)量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?824次閱讀

    OpenAI推出Windows桌面版ChatGPT應(yīng)用

    近日,OpenAI正式為微軟Windows 10和Windows 11用戶帶來(lái)了桌面版ChatGPT應(yīng)用程序,這一創(chuàng)新之舉為用戶提供了更加便捷和高效的交互體驗(yàn)。 據(jù)OpenAI產(chǎn)品開(kāi)發(fā)
    的頭像 發(fā)表于 11-18 14:04 ?712次閱讀

    ChatGPT服務(wù)中斷,OpenAI正積極恢復(fù)

    近日,據(jù)OpenAI官方報(bào)道,他們發(fā)現(xiàn)ChatGPT服務(wù)出現(xiàn)了用戶暫時(shí)無(wú)法接入的問(wèn)題。這一突發(fā)狀況引發(fā)了廣泛關(guān)注,許多用戶紛紛表達(dá)了對(duì)服務(wù)中斷的不滿和擔(dān)憂。 面對(duì)這一突發(fā)狀況,OpenAI迅速作出
    的頭像 發(fā)表于 11-11 13:38 ?858次閱讀

    OpenAI收購(gòu)chat.com,強(qiáng)化ChatGPT品牌

    近日有消息報(bào)道,OpenAI在成功收購(gòu)ai.com域名后,再次出手買下了chat.com這一極具價(jià)值的域名。相較于ai.com,chat.com更貼合OpenAI旗下熱門產(chǎn)品
    的頭像 發(fā)表于 11-08 11:08 ?833次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評(píng)的ChatGPT平臺(tái)添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來(lái)前所未有的搜索體驗(yàn)。以往,當(dāng)用戶需要
    的頭像 發(fā)表于 11-04 10:34 ?685次閱讀

    OpenAIChatGPT增添搜索功能

    近日,OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能,此舉標(biāo)志著該公司對(duì)Alphabet旗下谷歌的直接挑戰(zhàn)進(jìn)一步升級(jí)。OpenAI周四正式揭曉了這一名為“ChatGPT
    的頭像 發(fā)表于 11-01 17:01 ?761次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    理解ChatGPT和API ChatGPT是由OpenAI開(kāi)發(fā)的一種先進(jìn)的自然語(yǔ)言處理模型,它能夠理解和生成自然語(yǔ)言文本。要使用ChatGPT
    的頭像 發(fā)表于 10-25 16:23 ?1030次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開(kāi)始預(yù)覽其 AI 聊天機(jī)器人平臺(tái)ChatGPT的專用 Windows 應(yīng)用程序。
    的頭像 發(fā)表于 10-18 15:50 ?530次閱讀

    OpenAIChatGPT周活躍用戶突破2億

    OpenAI近日宣布了一項(xiàng)令人矚目的成就:其明星產(chǎn)品ChatGPT的周活躍用戶量已突破2億大關(guān),僅用一年時(shí)間便實(shí)現(xiàn)了用戶數(shù)量的翻倍增長(zhǎng)。自2022年問(wèn)世以來(lái),ChatGPT憑借其能夠根據(jù)用戶輸入
    的頭像 發(fā)表于 09-02 16:29 ?824次閱讀

    OpenAI承認(rèn)正研發(fā)ChatGPT文本水印

    識(shí)別效果并不理想。而且因?yàn)槎嘀仡檻]OpenAI尚未正式發(fā)布這項(xiàng)工具。 據(jù)悉,OpenAI的這個(gè)識(shí)別工具本質(zhì)上是在文字中創(chuàng)建一個(gè)不可見(jiàn)的水印
    的頭像 發(fā)表于 08-05 15:56 ?1297次閱讀