4月17日公布,第27屆聯(lián)合國(guó)科技大會(huì)于4月15至19日在瑞士日內(nèi)瓦舉行,期間,世界數(shù)字技術(shù)院(WDTA)于4月16日發(fā)布了多項(xiàng)重要科研成果,包括《生成式人工智能應(yīng)用安全測(cè)試標(biāo)準(zhǔn)》與《大語(yǔ)言模型安全測(cè)試方法》兩款國(guó)際標(biāo)準(zhǔn)。
據(jù)悉,上述兩款標(biāo)準(zhǔn)主要針對(duì)大型模型與生成式AI應(yīng)用領(lǐng)域的安全檢測(cè)設(shè)定了新基準(zhǔn)。參與制定工作的單位有OpenAI、螞蟻集團(tuán)、科大訊飛、谷歌、微軟、英偉達(dá)、百度、騰訊等多家知名企業(yè),其中,《大語(yǔ)言模型安全測(cè)試方法》由螞蟻集團(tuán)主導(dǎo)完成。
這兩份標(biāo)準(zhǔn)為生成式AI應(yīng)用(特別是基于大語(yǔ)言模型的應(yīng)用)的安全性測(cè)試提供了明確的框架,涵蓋了基礎(chǔ)模型選取、嵌入和矢量數(shù)據(jù)庫(kù)、RAG或檢索增強(qiáng)生成、AI應(yīng)用運(yùn)行時(shí)的安全等多個(gè)方面。
另一方面,《大語(yǔ)言模型安全測(cè)試方法》為大模型自身的安全性評(píng)估提供了全面、嚴(yán)謹(jǐn)且實(shí)用性強(qiáng)的解決方案,提出了大語(yǔ)言模型的安全風(fēng)險(xiǎn)分類(lèi)、攻擊分類(lèi)分級(jí)方法以及測(cè)試方法。據(jù)稱(chēng),該方法能有效應(yīng)對(duì)大語(yǔ)言模型的復(fù)雜性,全面測(cè)試其防御敵對(duì)攻擊的能力,幫助開(kāi)發(fā)者和組織識(shí)別并修復(fù)潛在漏洞,從而提升使用大語(yǔ)言模型構(gòu)建的人工智能系統(tǒng)的安全性與可靠性。
值得注意的是,WDTA是一個(gè)總部位于日內(nèi)瓦的國(guó)際非政府組織,遵循聯(lián)合國(guó)的指導(dǎo)原則,致力于推動(dòng)全球數(shù)字技術(shù)發(fā)展和國(guó)際合作。AI STR(安全、可信、負(fù)責(zé)任)計(jì)劃是WDTA的核心倡議,旨在保障人工智能系統(tǒng)的安全性、可信性和責(zé)任感。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249698 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10799 -
OpenAI
+關(guān)注
關(guān)注
9文章
1210瀏覽量
8943
發(fā)布評(píng)論請(qǐng)先 登錄
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺(tái)
聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證
聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證 助力企業(yè)加速生成式AI應(yīng)用落地
生成式人工智能模型的安全可信評(píng)測(cè)

安霸發(fā)布N1-655前端生成式AI芯片
NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布
Google兩款先進(jìn)生成式AI模型登陸Vertex AI平臺(tái)
大語(yǔ)言模型優(yōu)化生成管理方法
NVIDIA推出全新生成式AI模型Fugatto
在設(shè)備上利用AI Edge Torch生成式API部署自定義大語(yǔ)言模型

IDC生成式AI白皮書(shū)亮點(diǎn)速遞
AI大模型在自然語(yǔ)言處理中的應(yīng)用
三行代碼完成生成式AI部署

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

評(píng)論