99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于NLP基準(zhǔn)數(shù)據(jù)集的快速概覽,以及最新技術(shù)的進(jìn)展

DPVg_AI_era ? 來源:lq ? 2019-02-16 11:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文是一個(gè)自然語言處理資源索引,涵蓋了目前NLP領(lǐng)域常用任務(wù)的最佳實(shí)驗(yàn) 結(jié)果和數(shù)據(jù)集資源,可以作為進(jìn)一步從事NLP研究的基礎(chǔ)。讀者也可以自行在Github頁面上添加新的結(jié)果,本文中大部分為英文NLP資源,還有少數(shù)漢語、印地語和越南語資源。

本文實(shí)際上是一個(gè)索引,旨在記錄自然語言處理(NLP)領(lǐng)域的新進(jìn)展,并概述最常見的NLP任務(wù)及其相應(yīng)數(shù)據(jù)集的新技術(shù)。

這篇索引旨在涵蓋主要的傳統(tǒng)和核心NLP任務(wù),如語義依賴性解析和詞性標(biāo)注等,以及最近不斷取得新突破的任務(wù),比如閱讀理解和自然語言推理。本文主要目標(biāo)是為感興趣的讀者提供關(guān)于NLP基準(zhǔn)數(shù)據(jù)集的快速概覽,以及最新技術(shù)的進(jìn)展,這些數(shù)據(jù)集和新進(jìn)展可以作為進(jìn)一步NLP研究的基礎(chǔ)。

因此,本文有意將這些NLP領(lǐng)域的新研究進(jìn)展做一個(gè)簡(jiǎn)單匯總,便于研究人員集中查閱參考。

讀者也可以通過瀏覽器訪問nlpprogress.com或nlpsota.com來閱讀本文。

簡(jiǎn)易使用指南

實(shí)驗(yàn)結(jié)果

本文首選在已發(fā)表的論文中的實(shí)驗(yàn)結(jié)果,但對(duì)少數(shù)影響力很大的預(yù)印本論文也可能入選。

數(shù)據(jù)集

本文中收錄的數(shù)據(jù)集,除了利用該數(shù)據(jù)集的論文之外,還應(yīng)經(jīng)過至少一篇已發(fā)表的其他論文的評(píng)估。

代碼

我們建議添加指向?qū)崿F(xiàn)的鏈接(如果可用)。如果代碼不存在,您可以向表中添加代碼列(見下文)。在Code列,建議使用官方實(shí)現(xiàn)。如果有非官方實(shí)現(xiàn),請(qǐng)使用鏈接(見下文)。如果沒有可用的實(shí)現(xiàn),可以將單元格留空。

向本索引中添加新結(jié)果

如果要添加新結(jié)果,只需單擊文件右上角的小編輯按鈕以執(zhí)行相應(yīng)任務(wù)(如下圖所示)。

讀者可以在Markdown中編輯文件。只需以相同的格式將一行添加到相應(yīng)的表中即可。確保表格中數(shù)據(jù)排序正確(將最佳結(jié)果位于頂部)。完成更改后,單擊頁面頂部的“預(yù)覽更改”選項(xiàng)卡,確保表格看起來還不錯(cuò)。如果一切看起來都OK,請(qǐng)轉(zhuǎn)到頁面底部確認(rèn)更改。

此處需要為建議更改添加名稱,可以選擇添加說明文字,可以選擇“創(chuàng)建新分支并啟動(dòng)拉取請(qǐng)求”,然后單擊“提交更改”。

具體索引內(nèi)容和研究領(lǐng)域如下,絕大部分為英語,有少量資源為漢語、印地語和越南語。

英語

自動(dòng)語音識(shí)別

CCG超級(jí)標(biāo)準(zhǔn)

常識(shí)

選區(qū)解析

共同決議

依賴解析

對(duì)話

域適應(yīng)

實(shí)體鏈接

語法糾錯(cuò)

信息提取

語言建模

詞匯規(guī)范化

機(jī)器翻譯

多任務(wù)學(xué)習(xí)

多模態(tài)

命名實(shí)體識(shí)別

自然語言推理

詞性標(biāo)注

問答

關(guān)系預(yù)測(cè)

關(guān)系提取

語義文本相似度

語義解析

語義角色標(biāo)記

情緒分析

淺語法

簡(jiǎn)單化

狀態(tài)檢測(cè)

概要

分類學(xué)習(xí)

時(shí)間處理

文字分類

詞義消歧

中文

實(shí)體鏈接

中文詞匯分割

印地語

分塊

詞性標(biāo)注

機(jī)器翻譯

越南語

依賴解析

機(jī)器翻譯

命名實(shí)體識(shí)別

詞性標(biāo)注

分詞

最后以”中文-詞匯分割”子類目為例,簡(jiǎn)單說明這個(gè)索引資源的呈現(xiàn)方式。

點(diǎn)擊相應(yīng)鏈接進(jìn)入,首先是中文詞匯分割這個(gè)任務(wù)的簡(jiǎn)要介紹。

下面列出了不同作者建立的基于不同搜索方式的單詞分割模型,以及相應(yīng)模型的發(fā)表時(shí)間。

接下來是評(píng)估指標(biāo),此類中為F1分?jǐn)?shù)。下面以表格形式給出每種模型在不同數(shù)據(jù)集上獲得的最佳F1分?jǐn)?shù)。每個(gè)分?jǐn)?shù)對(duì)應(yīng)的研究論文鏈接和部分Github資源地址。

可以看到,表中中文詞匯分割模型的最優(yōu)F1分?jǐn)?shù)均超過了96分,感興趣的讀者可以點(diǎn)擊查看論文或Github資源。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25459
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14168
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22629

原文標(biāo)題:盤點(diǎn)NLP最新進(jìn)展:多語種40+任務(wù)最優(yōu)結(jié)果任你查

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    士模微電子獲得國家高新技術(shù)企業(yè)認(rèn)定

    近日,《北京市2024年認(rèn)定的第一批高新技術(shù)企業(yè)名單》正式公布,士模微電子榮獲高新技術(shù)企業(yè)資格并取得證書。創(chuàng)新是企業(yè)發(fā)展的原動(dòng)力。高新技術(shù)企業(yè)資格認(rèn)定是國家為鼓勵(lì)重點(diǎn)高新技術(shù)領(lǐng)域內(nèi),持
    的頭像 發(fā)表于 02-24 10:20 ?693次閱讀
    士模微電子獲得國家高<b class='flag-5'>新技術(shù)</b>企業(yè)認(rèn)定

    SMT加工中的故障排除:寧波中電創(chuàng)的系統(tǒng)化實(shí)踐

    和診斷至關(guān)重要。公司通過建立完善的故障記錄系統(tǒng),確保技術(shù)人員能夠快速獲取關(guān)鍵信息。 接下來,通過視覺檢查初步查找明顯的物理異常,例如焊料橋接、短路、開路、元件錯(cuò)位或缺失等。寧波中電創(chuàng)在生產(chǎn)線上廣泛應(yīng)用
    發(fā)表于 02-14 12:48

    如何根據(jù)數(shù)據(jù)轉(zhuǎn)換器的位數(shù)來選擇合適的電壓基準(zhǔn)芯片?

    Drift 以及噪聲三個(gè)參數(shù)中計(jì)算1LSB的誤差,好像根本不能滿足16BIT數(shù)據(jù)采集系統(tǒng),請(qǐng)問如何從數(shù)據(jù)手冊(cè)的以上三個(gè)參數(shù)來估算誤差,請(qǐng)使用詳細(xì)的計(jì)算說明,謝謝。也可以說明一下如何根據(jù)數(shù)據(jù)
    發(fā)表于 01-14 06:55

    2024 OpenHarmony年度技術(shù)分享會(huì)來啦,預(yù)約直播有好禮~

    聯(lián)合開源鴻蒙技術(shù)專家、老師、開發(fā)者為大家?guī)鞳penHarmony的最新技術(shù)進(jìn)展、開發(fā)心得以及應(yīng)用實(shí)踐,共同推動(dòng)OpenHarmony生態(tài)的繁榮與發(fā)展! 直播時(shí)間: 2024/12/2
    發(fā)表于 12-25 09:10

    如何設(shè)計(jì)ADC和DAC的基準(zhǔn)源,以及基準(zhǔn)源如何影響ADC與DAC那些性能?

    如何設(shè)計(jì)ADC和DAC的基準(zhǔn)源,以及基準(zhǔn)源如何影響ADC與DAC那些性能?有沒有相關(guān)的資料參考?
    發(fā)表于 12-17 06:27

    求助,關(guān)于DAC81416基準(zhǔn)電壓的問題求解

    芯片都使用外部基準(zhǔn)電壓; 目前我需要在1和2之間進(jìn)行抉擇,并將更好的方案連同3一起保留在板子上,通過跳線帽來決定功能的物理選擇。請(qǐng)問關(guān)于功能2這種實(shí)現(xiàn)是否有電路可以參考?如果我直接將兩個(gè)芯片的REF口相連是否可行? 謝謝!
    發(fā)表于 12-02 07:10

    NLP技術(shù)在聊天機(jī)器人中的作用

    聊天機(jī)器人,也稱為聊天AI,是一種通過文本或語音與人類進(jìn)行交流的軟件。它們廣泛應(yīng)用于客戶服務(wù)、在線購物、個(gè)人助理等領(lǐng)域。NLP技術(shù)是實(shí)現(xiàn)聊天機(jī)器人智能對(duì)話能力的關(guān)鍵。 1. 理解用戶意圖 NLP
    的頭像 發(fā)表于 11-11 10:33 ?1037次閱讀

    當(dāng)今數(shù)據(jù)中心新技術(shù)趨勢(shì)

    當(dāng)今數(shù)據(jù)中心的新技術(shù)趨勢(shì)正以前所未有的速度推動(dòng)著行業(yè)的變革與創(chuàng)新。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)快速發(fā)展,
    的頭像 發(fā)表于 10-24 15:15 ?1000次閱讀

    康謀分享 | AD/ADAS的性能概覽:在AD/ADAS的開發(fā)與驗(yàn)證中“大海撈針”!

    在AD/ADAS開發(fā)與驗(yàn)證中,如何從海量數(shù)據(jù)快速獲得性能概覽,進(jìn)而快速定位關(guān)鍵事件?本文康謀帶您了解,如何利用IVEX智能概覽功能,結(jié)合安
    的頭像 發(fā)表于 10-23 09:24 ?2703次閱讀
    康謀分享 | AD/ADAS的性能<b class='flag-5'>概覽</b>:在AD/ADAS的開發(fā)與驗(yàn)證中“大海撈針”!

    關(guān)于數(shù)據(jù)轉(zhuǎn)換器的基準(zhǔn)電壓選擇和設(shè)計(jì)提示

    電子發(fā)燒友網(wǎng)站提供《關(guān)于數(shù)據(jù)轉(zhuǎn)換器的基準(zhǔn)電壓選擇和設(shè)計(jì)提示.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 09:38 ?0次下載
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>數(shù)據(jù)</b>轉(zhuǎn)換器的<b class='flag-5'>基準(zhǔn)</b>電壓選擇和設(shè)計(jì)提示

    NVIDIA 在 Hot Chips 大會(huì)展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    為 NVIDIA Blackwell 平臺(tái)提供動(dòng)力的最新技術(shù)進(jìn)展,以及新的數(shù)據(jù)中心液冷研究成果和用于芯片設(shè)計(jì)的 AI 代理。 他們
    的頭像 發(fā)表于 08-28 16:38 ?665次閱讀
    NVIDIA 在 Hot Chips 大會(huì)展示提升<b class='flag-5'>數(shù)據(jù)</b>中心性能和能效的創(chuàng)<b class='flag-5'>新技術(shù)</b>

    應(yīng)用驅(qū)動(dòng)協(xié)議演進(jìn),擁抱智能創(chuàng)新技術(shù)

    切片等協(xié)議的開發(fā)上取得了重要的里程碑式進(jìn)展。這些協(xié)議有力地保障了無縫集成、高效運(yùn)行與可靠服務(wù)。 當(dāng)前人工智能正在跨越式發(fā)展,智能化時(shí)代對(duì)網(wǎng)絡(luò)提出了新的訴求和變化。華為積極擁抱智能創(chuàng)新技術(shù),結(jié)合智能化時(shí)代的業(yè)務(wù)特點(diǎn),在Networks for AI
    的頭像 發(fā)表于 08-20 21:22 ?1179次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書概覽與時(shí)間序列概述

    ,可以將相似的時(shí)間序列分組,以便進(jìn)一步理解時(shí)間序列數(shù)據(jù)中的結(jié)構(gòu)和模式。 ●第6章“多維時(shí)間序列”:介紹多維時(shí)間序列在廣告分析和業(yè)務(wù)運(yùn)維領(lǐng)域的應(yīng)用,包括如何利用OLAP技術(shù)對(duì)多維時(shí)間序列進(jìn)行有效處理,以及
    發(fā)表于 08-07 23:03

    ADS1220成PGA和基準(zhǔn)的4通道、2kSPS、低功耗、24位ADC數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《ADS1220成PGA和基準(zhǔn)的4通道、2kSPS、低功耗、24位ADC數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-23 11:24 ?1次下載
    ADS1220<b class='flag-5'>集</b>成PGA和<b class='flag-5'>基準(zhǔn)</b>的4通道、2kSPS、低功耗、24位ADC<b class='flag-5'>數(shù)據(jù)</b>表