99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,科技公司谷歌和微軟相繼在一份權(quán)威自然語言理解榜單中超越人類的表現(xiàn),微軟宣稱這“標(biāo)志著邁向通用人工智能的重要里程碑?!?/p>

自然語言理解(Natural Language Understanding,簡稱NLU)任務(wù)在人工智能領(lǐng)域歷史悠久,被譽(yù)為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實現(xiàn)高質(zhì)量的自然語言理解有相當(dāng)?shù)碾y度。

為了衡量人工智能模型的自然語言理解能力,紐約大學(xué)、華盛頓大學(xué)、Facebook和DeepMind在2019年合作提出一個名為SuperGLUE的人工智能基準(zhǔn)測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務(wù)難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準(zhǔn)線(human baseline)。這是人工智能首次在SuperGLUE中表現(xiàn)超越人類。

盡管在SuperGLUE測試上取得令人滿意的結(jié)果,但微軟坦言,DeBERTa模型還沒有達(dá)到人類智能的自然語言理解水平。人類非常善于利用從不同任務(wù)中學(xué)到的知識來解決新的任務(wù),這是AI模型需要學(xué)習(xí)的地方。

排名第一的微軟模型DeBERTa共有15億個參數(shù)。在SuperGLUE測試中,單個DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(xiàn)(89.8分);模型整體得分(90.3分)也超過人類基準(zhǔn)線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準(zhǔn)線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個孩子對疾病產(chǎn)生了免疫力”,問“這是由什么導(dǎo)致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個簡單的因果推理任務(wù),人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰(zhàn)。為了得出正確答案,模型需要理解已知條件和選項之間的因果關(guān)系。

2021年1月6日,微軟在博客發(fā)文詳細(xì)介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個基于Transformer架構(gòu)的神經(jīng)語言模型,采用自監(jiān)督學(xué)習(xí)方法對大量原始文本語料庫進(jìn)行預(yù)訓(xùn)練。DeBERTa的目標(biāo)是學(xué)習(xí)通用的語言表達(dá)形式,適用于各種自然語言理解任務(wù)。DeBERTa主要用到三種新技術(shù),分別是分離注意力機(jī)制、增強(qiáng)的掩碼解碼器和用于微調(diào)的虛擬對抗訓(xùn)練方法。

排名第二的T5+Meena技術(shù)來自谷歌。谷歌團(tuán)隊尚未詳細(xì)解釋其模型在SuperGLUE創(chuàng)紀(jì)錄的原因。但微軟在博客文章中評價稱,谷歌的T5模型由110億個參數(shù)組成,相比之下,15億參數(shù)的DeBERTa在訓(xùn)練和維護(hù)上更加節(jié)能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準(zhǔn)備向公眾公開15億參數(shù)的DeBERTa模型及其源代碼。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6685

    瀏覽量

    105730
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249311
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13654
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?2410次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 P
    的頭像 發(fā)表于 02-07 15:07 ?713次閱讀

    大舉投資750億、800億美元押注AI!抗衡DeepSeek,谷歌微軟財報揭秘

    AI 模型的效率可與DeepSeek相媲美。 1月29日,美國微軟公司公布了2025財年第二季度財報,值得關(guān)注的
    的頭像 發(fā)表于 02-06 09:10 ?2868次閱讀
    大舉投資750億、800億美元押注<b class='flag-5'>AI</b>!抗衡DeepSeek,<b class='flag-5'>谷歌</b>和<b class='flag-5'>微軟</b>財報揭秘

    微軟尋求365 Copilot多元化AI模型

    此舉旨在應(yīng)對企業(yè)用戶對于成本和速度的擔(dān)憂。目前,Microsoft 365 Copilot主要依賴于OpenAI的技術(shù),但微軟正尋求通過引入更多元化的AI模型來降低這種單一依賴的風(fēng)險。 微軟
    的頭像 發(fā)表于 12-26 10:25 ?464次閱讀

    微軟尋求365 Copilot引入非OpenAI模型

    擔(dān)心企業(yè)用戶使用365 Copilot時面臨的成本和速度問題,因此正在尋求更多樣化的技術(shù)來源。盡管微軟與OpenAI之間有著緊密的合作關(guān)系,并允許微軟定制OpenAI的模型,但
    的頭像 發(fā)表于 12-25 10:41 ?609次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?640次閱讀

    微軟GitHub與Anthropic和谷歌合作

    近日,微軟旗下的GitHub宣布了一項重要合作,將Anthropic和谷歌AI模型整合到其代碼助理,為數(shù)百萬軟件開發(fā)者提供新的
    的頭像 發(fā)表于 10-30 16:25 ?512次閱讀

    AI模型智能座艙軟件測試的應(yīng)用與思考

    背景下,AI模型作為一種強(qiáng)大的工具,有望提升自動化測試效率、改善用戶體驗,進(jìn)而推動整個行業(yè)的發(fā)展。 01 智能座艙軟件測試現(xiàn)狀 智能座艙嵌入了大量的軟件系統(tǒng),包括娛樂信息、導(dǎo)航、安全
    的頭像 發(fā)表于 10-28 16:49 ?850次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>在</b>智能座艙軟件<b class='flag-5'>測試</b><b class='flag-5'>中</b>的應(yīng)用與思考

    名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應(yīng)用百科全書

    一次大模型變革,完全不缺態(tài)度,只缺認(rèn)知與落地的經(jīng)驗。 在過去的兩年中,我們看到了全球太多的巨頭和普通中小企業(yè),進(jìn)入All in AI的投資周期。有的已經(jīng)開始落地到具體的生產(chǎn)流程,例如企業(yè)內(nèi)部客服、優(yōu)化
    發(fā)表于 10-28 15:34

    如何評估AI模型的效果

    、SuperGLUE、SQuAD等。這些數(shù)據(jù)集提供了不同任務(wù)上的基準(zhǔn)評估,使得不同模型同一任務(wù)上的性能可以進(jìn)行直接比較。 二、多樣性和覆蓋性測試
    的頭像 發(fā)表于 10-23 15:21 ?3074次閱讀

    AI模型圖像識別的優(yōu)勢

    AI模型圖像識別展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強(qiáng)大的計算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI
    的頭像 發(fā)表于 10-23 15:01 ?2417次閱讀

    AI模型自然語言處理的應(yīng)用

    AI模型自然語言處理(NLP)的應(yīng)用廣泛且深入,其強(qiáng)大的語義理解和生成能力為NLP任務(wù)帶來了顯著的性能提升。以下是對AI
    的頭像 發(fā)表于 10-23 14:38 ?1535次閱讀

    新火種AI模型公司紛紛被收編!創(chuàng)始人們逐漸變成了“最討厭的自己”?

    谷歌微軟一類的大廠正在快速展開行動,不過,它們并不是單純要給大模型公司進(jìn)行投資回血,而是對其展開了圍剿行動。 就在本月初,谷歌就“買下”了AI
    的頭像 發(fā)表于 08-21 15:05 ?513次閱讀
    新火種<b class='flag-5'>AI</b> 大<b class='flag-5'>模型</b>公司紛紛被收編!創(chuàng)始人們逐漸變成了“最討厭的自己”?

    谷歌獲Character.AI模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達(dá)成了一項重要合作,非獨(dú)家授權(quán)谷歌使用其先進(jìn)的大型語言模型技術(shù)。此次合
    的頭像 發(fā)表于 08-05 14:35 ?754次閱讀

    微軟計劃在搜索引擎Bing引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing引入先進(jìn)的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發(fā)表于 07-26 14:23 ?773次閱讀