99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌語義文本最新進(jìn)展 開源兩個(gè)新模型

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-23 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自然語言理解研究的快速發(fā)展,特別是在學(xué)習(xí)語義文本表示方面的發(fā)展可以促進(jìn)一些新穎的產(chǎn)品,如自動(dòng)寫作和“TalktoBooks”搜索等。本文介紹了谷歌在語義文本表示方面的最新進(jìn)展,以及開源的兩個(gè)新模型。

基于神經(jīng)網(wǎng)絡(luò)的自然語言理解研究的快速發(fā)展,它還可以幫助提高數(shù)據(jù)量有限的各種自然語言任務(wù)的性能,比如基于僅有的幾百個(gè)標(biāo)簽樣例來構(gòu)建強(qiáng)大的文本。

下面,我們將討論兩篇關(guān)于Google語義表示最新進(jìn)展的論文,以及在TensorFlow Hub上可以下載使用的兩個(gè)新模型,我們希望開發(fā)者能夠使用這些模型來構(gòu)建新的、令人興奮的應(yīng)用程序。

語義文本相似度

在“從對(duì)話中學(xué)習(xí)語義文本相似性(Learning Semantic Textual Similarity from Conversations)”這篇論文中,我們引入了一種新的方法來學(xué)習(xí)語義文本相似性的句子表示。基于的想法是:如果句子有相似的反應(yīng)分布,那么它們?cè)谡Z義上是相似的。例如,“你多大了?”和“你的年齡是多少?”這兩個(gè)問題都是關(guān)于年齡的問題,可以用類似的回答作為響應(yīng),比如“我20歲”。相比之下,“你好嗎?”和“你多大了?”"包含幾乎相同的單詞,它們有非常不同的含義并會(huì)對(duì)應(yīng)不同的響應(yīng)。

在這項(xiàng)工作中,我們的目標(biāo)是通過一種響應(yīng)式的分類任務(wù)來學(xué)習(xí)語義相似性,具體方法如下:給定一個(gè)對(duì)話輸入,我們希望從一組隨機(jī)選擇的響應(yīng)中對(duì)正確的響應(yīng)進(jìn)行分類。但是,最終的目標(biāo)是學(xué)習(xí)一種能夠返回表示各種自然語言關(guān)系編碼的模型,包括相似性和關(guān)聯(lián)性。通過添加另一個(gè)預(yù)測(cè)任務(wù)(在本例中是SNLI entailment數(shù)據(jù)集),并通過共享編碼層強(qiáng)制執(zhí)行,我們?cè)谙嗨贫攘糠矫娅@得了更好的性能,相似度的衡量指標(biāo)有很多,例如用于句子相似性基準(zhǔn)性度量的STSBenchmark和用于衡量一個(gè)問題/問題相似任務(wù)的CQA task B指標(biāo)。這是因?yàn)檫壿嬐评砼c簡(jiǎn)單的等價(jià)性有很大的不同,并且為學(xué)習(xí)復(fù)雜的語義表示提供了更多的借鑒意義。

通用句子編碼器

在“通用句子編碼器(Universal Sentence Encoder)”中,我們引入了一個(gè)模型,它對(duì)上面描述的多任務(wù)訓(xùn)練進(jìn)行了擴(kuò)展,并增加了更多的任務(wù),并使用一個(gè)類似于skip-thought的模型來訓(xùn)練它們,它可以在給定的文本范圍內(nèi)來預(yù)測(cè)句子。

然而,最初的skip-thought模型,是一種只使用編碼器的體系結(jié)構(gòu),而非在最初的skip-thought模型中使用編碼-解碼體系結(jié)構(gòu)來驅(qū)動(dòng)預(yù)測(cè)任務(wù)的模型。通過這種方式可以大大減少訓(xùn)練時(shí)間,同時(shí)保留各種傳遞任務(wù)的性能,包括情感和語義相似的關(guān)系。其目的是提供一個(gè)單一的編碼器,它可以支持盡可能廣泛的應(yīng)用程序,包括解釋檢測(cè)、關(guān)聯(lián)、集群和自定義文本分類。

正如我們的論文中所描述的,通用句子編碼器模型的一個(gè)版本使用了一個(gè)深度平均網(wǎng)絡(luò)(DAN)編碼器,而第二個(gè)版本使用了更復(fù)雜的自我參與的網(wǎng)絡(luò)架構(gòu):變壓器(Transformer)。

基于更復(fù)雜的體系結(jié)構(gòu)的模型比簡(jiǎn)單的DAN模型在各種情緒和相似的處理任務(wù)上表現(xiàn)得更好,而對(duì)于短句來說它只是反應(yīng)的稍微慢一些。然而,隨著句子長(zhǎng)度的增加,使用Transformer的模型的計(jì)算時(shí)間會(huì)顯著增加,而DAN模型的計(jì)算時(shí)間則保持不變。

新模型

除了上面描述的通用句子編碼器模型之外,我們還在TensorFlow Hub上共享兩個(gè)新模型:通用句子編碼器-large版(Universal Sentence Encoder - Large)和通用句子編碼器-Lite版(Universal Sentence Encoder - Lite)。這些都是預(yù)先訓(xùn)練的張量模型,它的返回值是可變長(zhǎng)度文本輸入的語義編碼。這些編碼可用于語義相似度測(cè)量、相似性關(guān)系檢測(cè)、分類或自然語言文本的聚類。

在我們的第二篇論文中描述了這個(gè)Large模型。它針對(duì)需要高精度語義表示的場(chǎng)景,以及以速度和大小為代價(jià)的最佳模型性能。

Lite模型是通過一個(gè)句子的詞匯表而不是單詞來訓(xùn)練的,這樣就可以減少詞匯的大小,這是模型大小的主要貢獻(xiàn)者。它針對(duì)的是內(nèi)存和CPU等資源有限的場(chǎng)景,比如基于設(shè)備或基于瀏覽器實(shí)現(xiàn)。

我們很高興能與社區(qū)分享這項(xiàng)研究,以及這些模型。我們認(rèn)為,我們?cè)谶@里展示的只是一個(gè)開始,還有一些重要的研究問題需要解決,比如將技術(shù)擴(kuò)展到更多的語言之上(上面討論的模型目前支持英語)。我們還希望進(jìn)一步開發(fā)這種技術(shù),使它能夠理解段落甚至文檔級(jí)別的文本。在完成這些任務(wù)的過程中,有可能制造出真正“通用”的編碼器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3794

    瀏覽量

    137997
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3678

    瀏覽量

    43813

原文標(biāo)題:谷歌語義文本最新進(jìn)展+兩個(gè)開源新模型

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享最新進(jìn)展

    近日,在2025英特爾代工大會(huì)上,英特爾展示了多代核心制程和先進(jìn)封裝技術(shù)的最新進(jìn)展,這些突破不僅體現(xiàn)了英特爾在技術(shù)開發(fā)領(lǐng)域的持續(xù)創(chuàng)新,也面向客戶需求提供了更高效、更靈活的解決方案。 在制程技術(shù)方面
    的頭像 發(fā)表于 05-09 11:42 ?223次閱讀
    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享<b class='flag-5'>最新進(jìn)展</b>

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開發(fā)者大會(huì),與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展
    的頭像 發(fā)表于 04-30 10:14 ?607次閱讀

    谷歌Gemini API最新進(jìn)展

    體驗(yàn)的 Live API 的最新進(jìn)展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯(cuò)過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1008次閱讀

    京東方華燦光電氮化鎵器件的最新進(jìn)展

    日前,京東方華燦的氮化鎵研發(fā)總監(jiān)馬歡應(yīng)半導(dǎo)體在線邀請(qǐng),分享了關(guān)于氮化鎵器件的最新進(jìn)展,引起了行業(yè)的廣泛關(guān)注。隨著全球半導(dǎo)體領(lǐng)域?qū)Ω咝阅?、高效率器件的需求不斷加大,氮化鎵(GaN)技術(shù)逐漸成為新一代電子器件的熱點(diǎn),其優(yōu)越的性能使其在電源轉(zhuǎn)換和射頻應(yīng)用中展現(xiàn)出巨大的潛力。
    的頭像 發(fā)表于 03-13 11:44 ?810次閱讀

    垂直氮化鎵器件的最新進(jìn)展和可靠性挑戰(zhàn)

    過去年中,氮化鎵雖然發(fā)展迅速,但似乎已經(jīng)遇到了瓶頸。與此同時(shí),不少垂直氮化鎵的初創(chuàng)企業(yè)倒閉或者賣盤,這引發(fā)大家對(duì)垂直氮化鎵未來的擔(dān)憂。為此,在本文中,我們先對(duì)氮化鎵未來的發(fā)展進(jìn)行分析,并討論了垂直氮化鎵器件開發(fā)的最新進(jìn)展以及相關(guān)的可靠性挑戰(zhàn)。
    的頭像 發(fā)表于 02-17 14:27 ?1161次閱讀
    垂直氮化鎵器件的<b class='flag-5'>最新進(jìn)展</b>和可靠性挑戰(zhàn)

    Qorvo在手機(jī)RF和Wi-Fi 7技術(shù)上的最新進(jìn)展及市場(chǎng)策略

    供應(yīng)商保持著長(zhǎng)期合作關(guān)系。近日,Qorvo資深產(chǎn)品行銷經(jīng)理陳慶鴻(Footmark Chen)與Qorvo亞太區(qū)無線連接事業(yè)部高級(jí)行銷經(jīng)理林健富(Jeff Lin)接受了DigiTimes的專訪,深入探討了Qorvo在手機(jī)RF和Wi-Fi 7技術(shù)上的最新進(jìn)展及市場(chǎng)策略,以下是根據(jù)此次專訪整理的報(bào)告。
    的頭像 發(fā)表于 01-15 14:45 ?810次閱讀

    FF將發(fā)布FX品牌最新進(jìn)展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發(fā)布以來的最新進(jìn)展,包括最新項(xiàng)目進(jìn)展、重大里程碑、新產(chǎn)品品類戰(zhàn)略及下一步計(jì)劃。
    的頭像 發(fā)表于 01-03 15:58 ?651次閱讀

    我國(guó)“祖沖之三號(hào)”量子計(jì)算機(jī)亮相超過谷歌最新進(jìn)展

    行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年12月18日 13:52:13

    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進(jìn)展(2024Q4)

    近期,由博通、思科、Arista、微軟、Meta等國(guó)際頂級(jí)半導(dǎo)體、設(shè)備和云廠商牽頭成立的超以太網(wǎng)聯(lián)盟(UEC)在OCP Global Summit上對(duì)外公布其最新進(jìn)展——UEC規(guī)范1.0的預(yù)覽版本。讓我們一睹為快吧!
    的頭像 發(fā)表于 11-18 16:53 ?1335次閱讀
    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范<b class='flag-5'>最新進(jìn)展</b>(2024Q4)

    Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展

    了半導(dǎo)體行業(yè)的重大變革,還成功引領(lǐng)Qorvo成為射頻技術(shù)的領(lǐng)導(dǎo)者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展,并探討HPA事業(yè)部如何通過技術(shù)創(chuàng)新應(yīng)對(duì)全球電氣化和互聯(lián)化的挑戰(zhàn)。
    的頭像 發(fā)表于 11-17 10:57 ?902次閱讀

    Meta發(fā)布Llama 3.2量化版模型

    近日,Meta在開源Llama 3.2的1B與3B模型后,再次為人工智能領(lǐng)域帶來了新進(jìn)展。10月24日,Meta正式推出了這兩個(gè)模型的量化版
    的頭像 發(fā)表于 10-29 11:05 ?842次閱讀

    芯片和封裝級(jí)互連技術(shù)的最新進(jìn)展

    近年來,計(jì)算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計(jì)算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實(shí)現(xiàn)計(jì)算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計(jì)算機(jī)架構(gòu)創(chuàng)新的焦點(diǎn)。本文探討了通用、專用和量子計(jì)算系統(tǒng)中芯片和封裝級(jí)互連的最新進(jìn)展,并強(qiáng)調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑戰(zhàn)和機(jī)遇。
    的頭像 發(fā)表于 10-28 09:50 ?1141次閱讀

    AI大模型的最新研究進(jìn)展

    AI大模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式AI技術(shù)正在迅速發(fā)展,其強(qiáng)大的生成能力使得AI大模型在多個(gè)領(lǐng)域得
    的頭像 發(fā)表于 10-23 15:19 ?1501次閱讀

    高燃回顧|第三屆OpenHarmony技術(shù)大會(huì)精彩瞬間

    第三屆OpenHarmony技術(shù)大會(huì)圓滿落幕 全球開源精英齊聚 共同展示OpenHarmony技術(shù)、生態(tài)、人才的最新進(jìn)展 見證OpenHarmony南北向生態(tài)繁榮 共繪開源生態(tài)發(fā)展藍(lán)圖 星光璀璨致謝
    發(fā)表于 10-16 18:47

    5G新通話技術(shù)取得新進(jìn)展

    在探討5G新通話這一話題時(shí),我們需首先明確其背景與重要性。自2022年4月國(guó)內(nèi)運(yùn)營(yíng)商正式推出以來,5G新通話作為傳統(tǒng)語音通話的升級(jí)版,迅速吸引了公眾的目光,并引起了社會(huì)的廣泛關(guān)注。它基于5G網(wǎng)絡(luò),代表了通信技術(shù)的新進(jìn)展。
    的頭像 發(fā)表于 10-12 16:02 ?1309次閱讀