99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型威脅:探索LLM攻擊對網絡安全的沖擊

jf_WZTOguxH ? 來源:AI前線 ? 2023-10-11 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自卡內基梅隆大學(CMU)的研究人員發(fā)布了 LLM Attacks,這是一種可以針對各種大型語言模型(LLM)構建對抗性攻擊的算法,包括 ChatGPT、Claude 和 Bard。這些自動生成的攻擊,在 GPT-3.5 和 GPT-4 上的成功率為 84%,在 PaLM-2 上的成功率為 66%。

與大多數(shù)“越獄”攻擊通過試錯手工構建不同,CMU 的團隊設計了一個三步流程來自動生成提示后綴,它們可以繞過 LLM 的安全機制,導致有害的響應。而且,這些提示還是可轉移(transferrable)的,也就是說,一個給定的后綴通??梢杂糜谠S多不同的 LLM,甚至是閉源模型。為了衡量算法的有效性,研究人員創(chuàng)建了一個名為 AdvBench 的基準測試;在此基準測試上進行評估時,LLM 攻擊對 Vicuna 的成功率為 88%,而基線對抗算法的成功率為 25%。根據 CMU 團隊的說法:

最令人擔憂的也許是,目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里,在計算機視覺領域,類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此,我們認為,在增加對此類人工智能模型的使用和依賴時,應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發(fā)布,出現(xiàn)了許多破解這些模型的技術,其中就包括可能導致模型繞過其保護措施并輸出潛在有害響應的提示。雖然這些提示通常是通過實驗發(fā)現(xiàn)的,但 LLM Attacks 算法提供了一種自動創(chuàng)建它們的方法。第一步是創(chuàng)建一個目標令牌序列:“Sure, here is (content of query)”,其中“content of query”是用戶實際輸入的提示,要求進行有害的響應。

接下來,該算法會查找可能導致 LLM 輸出目標序列的令牌序列,基于貪婪坐標梯度(GCG)算法為提示生成一個對抗性后綴。雖然這確實需要訪問 LLM 的神經網絡,但研究團隊發(fā)現(xiàn),在許多開源模型上運行 GCG 所獲得的結果甚至可以轉移到封閉模型中。

在 CMU 發(fā)布的一條介紹其研究成果的新聞中,論文合著者 Matt Fredrikson 表示:

令人擔憂的是,這些模型將在沒有人類監(jiān)督的自主系統(tǒng)中發(fā)揮更大的作用。隨著自主系統(tǒng)越來越真實,我們要確保有一種可靠的方法來阻止它們被這類攻擊所劫持,這將非常重要……現(xiàn)在,我們根本沒有一個令人信服的方法來防止這種事情的發(fā)生,所以下一步,我們要找出如何修復這些模型……了解如何發(fā)動這些攻擊通常是建立強大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項研究。他寫道:

盡管存在風險,但我們認為還是應該把它們全部披露出來。這里介紹的攻擊很容易實現(xiàn),以前也出現(xiàn)過形式類似的攻擊,并且最終也會被致力于濫用 LLM 的團隊所發(fā)現(xiàn)。

劍橋大學助理教授 David Krueger 回復了 Zou 的帖子,他說:

在圖像模型中,10 年的研究和成千上萬的出版物都未能找出解決對抗樣本的方法,考慮到這一點,我們有充分的理由相信,LLM 同樣會如此。

在 Hacker News 上關于這項工作的討論中,有一位用戶指出:

別忘了,本研究的重點是,這些攻擊不需要使用目標系統(tǒng)來開發(fā)。作者談到,攻擊是“通用的”,他們的意思是說,他們可以在自己的計算機上完全使用本地模型來生成這些攻擊,然后將它們復制并粘貼到 GPT-3.5 中,并看到了有意義的成功率。速率限制并不能幫你避免這種情況,因為攻擊是在本地生成的,而不是用你的服務器生成的。你的服務器收到的第一個提示已經包含了生成好的攻擊字符串——研究人員發(fā)現(xiàn),在某些情況下,即使是對 GPT-4,成功率也在 50% 左右。

GitHub 上提供了代碼,你可以在 AdvBench 數(shù)據上重現(xiàn) LLM Attacks 實驗。項目網站上還提供了幾個對抗性攻擊的演示。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網絡安全
    +關注

    關注

    11

    文章

    3343

    瀏覽量

    61480
  • GitHub
    +關注

    關注

    3

    文章

    483

    瀏覽量

    17686
  • LLM
    LLM
    +關注

    關注

    1

    文章

    325

    瀏覽量

    844

原文標題:新型威脅:探索 LLM 攻擊對網絡安全的沖擊

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為您揭秘工業(yè)網絡安全

    隨著數(shù)字連接技術的普及,帶寬不斷提升,從工廠車間到生產流程的每個角落都能實時訪問更深層次的信息。然而,這種技術紅利也帶來了日益嚴峻的網絡安全風險。新型工業(yè)以太網技術基礎設施通過為每個節(jié)點分配IP地址并移除網關設備,極大地簡化了系統(tǒng)架構,因此,保護設備和系統(tǒng)免受
    的頭像 發(fā)表于 05-17 11:17 ?538次閱讀
    為您揭秘工業(yè)<b class='flag-5'>網絡安全</b>

    智慧路燈網絡安全入侵監(jiān)測

    ,成為物聯(lián)網領域重要的信息采集來源,對智能照明、社會安防、智慧交通、信息發(fā)布等方面發(fā)揮著關鍵作用。然而,智慧路燈的網絡安全問題也日益凸顯,成為影響其穩(wěn)定運行和城市安全的重要因素。 叁仟智慧路燈面臨的網絡安全
    的頭像 發(fā)表于 04-01 09:54 ?316次閱讀

    戴爾科技如何助力企業(yè)網絡安全

    數(shù)據安全如同懸在企業(yè)頭頂?shù)摹斑_摩克利斯之劍”,隨著新技術的飛速發(fā)展,企業(yè)運營愈發(fā)依賴網絡與數(shù)據,然而這也為網絡威脅攻擊敞開了大門,特別是勒
    的頭像 發(fā)表于 03-10 15:51 ?459次閱讀

    Lansweeper:強化網絡安全與資產管理

    使用 Lansweeper 全面了解您的 IT 資產清單 保護任何東西的第一步是知道你擁有什么 全可見性 發(fā)現(xiàn)您甚至不知道的資產并消除盲點。 風險緩解 通過審計預防措施預測潛在的網絡安全攻擊。 威脅
    的頭像 發(fā)表于 02-19 13:59 ?483次閱讀

    探索國產網絡安全整機,共筑5G時代網絡安全防護線

    由于現(xiàn)代5G時代的快速發(fā)展,黑客攻擊、信息泄露、網絡詐騙以及病毒軟件入侵等網絡安全問題也隨之浮出水面,為防止這類問題的發(fā)生,使用網絡安全整機就成為了我們必不可少的防護手段之一。
    的頭像 發(fā)表于 02-08 08:47 ?444次閱讀

    DeepSeek?遭受?DDoS?攻擊敲響警鐘,企業(yè)如何筑起網絡安全防線?

    限制+86手機號以外的注冊方式,以保障服務穩(wěn)定。這一事件再次提醒我們: 網絡安全已成為企業(yè)生存和發(fā)展的生命線 。 在數(shù)字化時代,網絡攻擊的規(guī)模和復雜性日益增加,尤其是DDoS攻擊,已成
    的頭像 發(fā)表于 02-07 14:39 ?383次閱讀
    DeepSeek?遭受?DDoS?<b class='flag-5'>攻擊</b>敲響警鐘,企業(yè)如何筑起<b class='flag-5'>網絡安全</b>防線?

    華納云企業(yè)建立全面的網絡安全策略的流程

    照規(guī)定操作。定期對員工進行網絡安全培訓,提高他們識別和防范網絡威脅的能力。 確保數(shù)據中心和服務器的物理安全,包括訪問控制和監(jiān)控系統(tǒng)。通過網絡
    的頭像 發(fā)表于 12-31 15:12 ?463次閱讀

    龍芯3A5000網絡安全整機,助力保護網絡信息安全

    在當今互聯(lián)網信息普及的時代,我們的網絡安全問題更加突顯。個人信息泄露、病毒軟件侵占、黑客攻擊網絡安全問題日益增多。想要解決這個問題,就得更加發(fā)展我們的防護科技。
    的頭像 發(fā)表于 12-23 09:59 ?508次閱讀

    純凈IP:守護網絡安全的重要道防線

    純凈IP,作為守護網絡安全的道防線,扮演著至關重要的角色。它不僅關乎網絡流量的順暢與高效,更是確保用戶數(shù)據安全、防止惡意攻擊和非法訪問的關鍵所在。
    的頭像 發(fā)表于 10-25 07:34 ?690次閱讀

    隨著全球網絡安全威脅日益升級,3只網絡安全美股值得投資者關注

    在科技和人工智能迅速發(fā)展的今天,科技雖然給我們帶來了很多便利,但也讓我們更容易受到網絡安全威脅和隱私泄露的影響。而且這些危險并不局限于一個國家,而是具有全球影響,這就使得網絡安全解決方案在現(xiàn)如今的世界中比以往任何時候都更加重要。
    的頭像 發(fā)表于 09-23 17:18 ?690次閱讀
    隨著全球<b class='flag-5'>網絡安全</b><b class='flag-5'>威脅</b>日益升級,3只<b class='flag-5'>網絡安全</b>美股值得投資者關注

    國產網絡安全主板在防御網絡攻擊中的實際應用

    在現(xiàn)代信息技術迅猛發(fā)展的背景下,網絡安全問題變得越來越復雜和嚴峻。從企業(yè)到個人用戶,各類網絡攻擊事件頻繁發(fā)生,威脅著數(shù)據的安全和系統(tǒng)的穩(wěn)定。
    的頭像 發(fā)表于 09-18 10:47 ?711次閱讀

    如何利用IP查詢技術保護網絡安全?

    在數(shù)字化時代,企業(yè)網絡面臨著復雜多變的威脅與挑戰(zhàn)。因此,構建一個穩(wěn)固的網絡安全體系至關重要。而IP查詢技術,作為網絡安全防御體系中的一把利劍,正日益成為企業(yè)防范
    的頭像 發(fā)表于 09-09 10:10 ?798次閱讀

    IP定位技術追蹤網絡攻擊源的方法

    如今,網絡安全受到黑客威脅和病毒攻擊越來越頻繁,追蹤攻擊源頭對于維護網絡安全變得尤為重要。當我們遭受網絡
    的頭像 發(fā)表于 08-29 16:14 ?853次閱讀

    網絡安全技術商CrowdStrike與英偉達合作

    網絡安全技術商CrowdStrike與英偉達合作共同研發(fā)更先進的網絡防御解決方案;提升CrowdStrike Falcon平臺的威脅檢測速度和準確性。將通過人工智能原生平臺CrowdStrike
    的頭像 發(fā)表于 08-28 16:30 ?1899次閱讀