世界數(shù)字技術(shù)院發(fā)布：生成式AI安全測(cè)試標(biāo)準(zhǔn)及大語(yǔ)言模型

4月17日公布，第27屆聯(lián)合國(guó)科技大會(huì)于4月15至19日在瑞士日內(nèi)瓦舉行，期間，世界數(shù)字技術(shù)院（WDTA）于4月16日發(fā)布了多項(xiàng)重要科研成果，包括《生成式人工智能應(yīng)用安全測(cè)試標(biāo)準(zhǔn)》與《大語(yǔ)言模型安全測(cè)試方法》兩款國(guó)際標(biāo)準(zhǔn)。

據(jù)悉，上述兩款標(biāo)準(zhǔn)主要針對(duì)大型模型與生成式AI應(yīng)用領(lǐng)域的安全檢測(cè)設(shè)定了新基準(zhǔn)。參與制定工作的單位有OpenAI、螞蟻集團(tuán)、科大訊飛、谷歌、微軟、英偉達(dá)、百度、騰訊等多家知名企業(yè)，其中，《大語(yǔ)言模型安全測(cè)試方法》由螞蟻集團(tuán)主導(dǎo)完成。

這兩份標(biāo)準(zhǔn)為生成式AI應(yīng)用（特別是基于大語(yǔ)言模型的應(yīng)用）的安全性測(cè)試提供了明確的框架，涵蓋了基礎(chǔ)模型選取、嵌入和矢量數(shù)據(jù)庫(kù)、RAG或檢索增強(qiáng)生成、AI應(yīng)用運(yùn)行時(shí)的安全等多個(gè)方面。

另一方面，《大語(yǔ)言模型安全測(cè)試方法》為大模型自身的安全性評(píng)估提供了全面、嚴(yán)謹(jǐn)且實(shí)用性強(qiáng)的解決方案，提出了大語(yǔ)言模型的安全風(fēng)險(xiǎn)分類(lèi)、攻擊分類(lèi)分級(jí)方法以及測(cè)試方法。據(jù)稱(chēng)，該方法能有效應(yīng)對(duì)大語(yǔ)言模型的復(fù)雜性，全面測(cè)試其防御敵對(duì)攻擊的能力，幫助開(kāi)發(fā)者和組織識(shí)別并修復(fù)潛在漏洞，從而提升使用大語(yǔ)言模型構(gòu)建的人工智能系統(tǒng)的安全性與可靠性。

值得注意的是，WDTA是一個(gè)總部位于日內(nèi)瓦的國(guó)際非政府組織，遵循聯(lián)合國(guó)的指導(dǎo)原則，致力于推動(dòng)全球數(shù)字技術(shù)發(fā)展和國(guó)際合作。AI STR（安全、可信、負(fù)責(zé)任）計(jì)劃是WDTA的核心倡議，旨在保障人工智能系統(tǒng)的安全性、可信性和責(zé)任感。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1807

文章
49029

瀏覽量
249698
語(yǔ)言模型

語(yǔ)言模型

+關(guān)注

關(guān)注
0

文章
561

瀏覽量
10799
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1210

瀏覽量
8943

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

世界數(shù)字技術(shù)院發(fā)布：生成式AI安全測(cè)試標(biāo)準(zhǔn)及大語(yǔ)言模型

評(píng)論