99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜數(shù)據(jù)集

深度學(xué)習(xí)自然語言處理 ? 來源:哈工大SCIR 張寧 ? 作者:哈工大SCIR 張寧 ? 2021-06-08 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.摘要

本數(shù)據(jù)集由哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心(哈工大SCIR)秦兵教授和劉銘教授主持開發(fā),是一個(gè)通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類語料,包含四個(gè)類別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識(shí)圖譜。該數(shù)據(jù)集的提出能夠?yàn)闂l件性知識(shí)圖譜的研究提供數(shù)據(jù)支持。

2.條件性知識(shí)圖譜

在大多數(shù)情況下,事實(shí)的成立都是有條件的。條件和事實(shí)起著同樣重要的作用,然而目前的知識(shí)圖譜只關(guān)注事實(shí)而忽略了條件的存在。與此同時(shí),信息提取技術(shù)也只關(guān)注從給定文本中提取事實(shí),而忽略了條件信息。

為了能夠讓知識(shí)圖譜建模條件信息更加充分,我們提出了一個(gè)三層的網(wǎng)絡(luò)結(jié)構(gòu)條件性知識(shí)圖譜(Conditional-KG)。條件性知識(shí)圖譜和傳統(tǒng)知識(shí)圖譜都是由三元組組成,但是條件性知識(shí)圖譜同時(shí)包含事實(shí)元組和條件元組,以及元組之間的條件關(guān)系。

3.數(shù)據(jù)集

為了支持條件性知識(shí)圖譜的研究,我們手動(dòng)標(biāo)注了一個(gè)條件性知識(shí)圖譜數(shù)據(jù)集。我們選擇了AG News文本分類語料作為條件性知識(shí)圖譜的語料。AG News語料具有三大優(yōu)勢:

AG News中的數(shù)據(jù)是新聞的標(biāo)題和一部分正文,每條數(shù)據(jù)平均包含2.1個(gè)句子、6.4個(gè)元組和3.5個(gè)條件關(guān)系;

AG News中的數(shù)據(jù)具有完整的語法結(jié)構(gòu),長度較長,語言嚴(yán)謹(jǐn),代詞、口語、習(xí)語等較少。

AG News的文本數(shù)量足夠大,多樣性豐富。它包含12萬條訓(xùn)練數(shù)據(jù)和7600條測試數(shù)據(jù),涉及World、Sports、Business、 和Sci/Tech四個(gè)類別。

我們標(biāo)注的數(shù)據(jù)集追求信息的完整性和元組的原子性。完整性的意思是標(biāo)注者應(yīng)該嘗試從句子中提取所有斷言和條件,我們將原子性定義為每個(gè)元組必須是一個(gè)不可分割的單元。只要有可能,標(biāo)注者必須從帶有連詞的句子中提取多個(gè)原子元組。

我們通過兩輪標(biāo)注最終得到了人工標(biāo)注的通用領(lǐng)域條件性知識(shí)圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類語料,包含四個(gè)類別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識(shí)圖譜。

4.結(jié)語

為了建模條件信息,我們提出了一個(gè)具有三層網(wǎng)絡(luò)結(jié)構(gòu)的條件性知識(shí)圖譜,并且為社區(qū)貢獻(xiàn)了一個(gè)人工標(biāo)注的通用領(lǐng)域大規(guī)模條件性知識(shí)圖譜。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25453
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8008

原文標(biāo)題:賽爾筆記 | 通用領(lǐng)域條件性知識(shí)圖譜數(shù)據(jù)集

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    偉創(chuàng)力高效電源模塊在超大規(guī)模數(shù)據(jù)中心的應(yīng)用

    受云端存儲(chǔ)和數(shù)據(jù)處理需求持續(xù)增長的推動(dòng),數(shù)據(jù)中心正以前所未有的速度擴(kuò)張。當(dāng)前全球超大規(guī)模數(shù)據(jù)中心,即規(guī)模最大的那些數(shù)據(jù)中心,總?cè)萘吭谶^去四年
    的頭像 發(fā)表于 07-07 15:41 ?367次閱讀

    CMOS超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識(shí)

    本節(jié)將介紹 CMOS 超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識(shí),重點(diǎn)將放在工藝流程的概要和不同工藝步驟對(duì)器件及電路性能的影響上。
    的頭像 發(fā)表于 06-04 15:01 ?702次閱讀
    CMOS超<b class='flag-5'>大規(guī)模</b>集成電路制造工藝流程的基礎(chǔ)<b class='flag-5'>知識(shí)</b>

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    仍未得到探索。本文提出一種基于立體相機(jī)的三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)LSG-SLAM。通過在EuRoC數(shù)據(jù)上的廣泛評(píng)估,LSG-SLAM展示了其在大規(guī)模室外場景中的優(yōu)越性能。在
    的頭像 發(fā)表于 05-27 14:13 ?347次閱讀
    三維高斯?jié)姙R<b class='flag-5'>大規(guī)模</b>視覺SLAM系統(tǒng)解析

    薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,薄型、多頻段、大規(guī)模
    發(fā)表于 05-15 18:32
    薄型、多頻段、<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)前端模塊 skyworksinc

    輕輕松松學(xué)電工(識(shí)圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實(shí)際需要,主要介紹了常用電工電路識(shí)圖的基礎(chǔ)知識(shí)、方法及技巧,內(nèi)容包括常用電氣符號(hào)、電工識(shí)圖基本方法,以及識(shí)讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動(dòng)系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    典型電路原理、電路識(shí)圖從入門到精通等資料

    1、電路識(shí)圖從入門到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?7050次閱讀
    典型電路原理、電路<b class='flag-5'>識(shí)圖</b>從入門到精通等資料

    5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝
    發(fā)表于 04-11 15:21
    5G <b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)系統(tǒng)級(jí)封裝 skyworksinc

    電路識(shí)圖從入門到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,以及典型小家電、電動(dòng)車、洗衣機(jī)、
    發(fā)表于 04-10 16:22

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模數(shù)據(jù)平臺(tái)

    的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過構(gòu)建大規(guī)模、多模態(tài)的真實(shí)世界數(shù)據(jù)
    的頭像 發(fā)表于 03-12 11:42 ?1097次閱讀
    AgiBot World Colosseo:構(gòu)建<b class='flag-5'>通用</b>機(jī)器人智能的<b class='flag-5'>規(guī)模</b>化<b class='flag-5'>數(shù)據(jù)</b>平臺(tái)

    傳音旗下人工智能項(xiàng)目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項(xiàng)目獎(jiǎng)”一等獎(jiǎng)

    和華東師范大學(xué)聯(lián)合申報(bào)的“跨語言知識(shí)圖譜構(gòu)建與推理技術(shù)研究及應(yīng)用”項(xiàng)目憑借創(chuàng)新性和技術(shù)先進(jìn)性榮獲一等獎(jiǎng)。該項(xiàng)目成功突破了多形態(tài)信息抽取技術(shù)、跨語言知識(shí)圖譜對(duì)齊技術(shù)和知識(shí)問答對(duì)
    的頭像 發(fā)表于 12-16 17:04 ?658次閱讀
    傳音旗下人工智能項(xiàng)目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項(xiàng)目獎(jiǎng)”一等獎(jiǎng)

    三星自主研發(fā)知識(shí)圖譜技術(shù),強(qiáng)化Galaxy AI用戶體驗(yàn)與數(shù)據(jù)安全

    據(jù)外媒11月7日?qǐng)?bào)道,三星電子全球AI中心總監(jiān)Kim Dae-hyun近日透露,公司正致力于自主研發(fā)知識(shí)圖譜技術(shù),旨在進(jìn)一步優(yōu)化Galaxy AI的功能,提升其易用性,并加強(qiáng)用戶數(shù)據(jù)的隱私保護(hù)。
    的頭像 發(fā)表于 11-07 15:19 ?1391次閱讀

    云平臺(tái)在大規(guī)模設(shè)備管理和數(shù)據(jù)分析中的作用

    在當(dāng)代數(shù)字化轉(zhuǎn)型的浪潮中,云平臺(tái)作為信息技術(shù)基礎(chǔ)設(shè)施的核心組件,扮演著無可替代的角色,尤其在大規(guī)模設(shè)備管理和數(shù)據(jù)分析領(lǐng)域,其重要性和影響力日益凸顯。本文旨在深入探討云平臺(tái)如何通過其獨(dú)特的優(yōu)勢,促進(jìn)
    的頭像 發(fā)表于 09-19 17:22 ?716次閱讀
    云平臺(tái)在<b class='flag-5'>大規(guī)模</b>設(shè)備管理和<b class='flag-5'>數(shù)據(jù)</b>分析中的作用

    Zettabyte與緯創(chuàng)攜手打造臺(tái)灣首個(gè)超大規(guī)模AI數(shù)據(jù)中心

    在推動(dòng)亞太地區(qū)AI計(jì)算領(lǐng)域邁向新紀(jì)元的征程中,Zettabyte與緯創(chuàng)資通(Wistron Corporation)攜手宣布了一項(xiàng)重大合作——共同建設(shè)臺(tái)灣地區(qū)首個(gè)超大規(guī)模AI數(shù)據(jù)中心,這一里程碑式的項(xiàng)目不僅標(biāo)志著臺(tái)灣AI基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 09-05 16:26 ?796次閱讀

    通用汽車中國裁員并籌劃大規(guī)模業(yè)務(wù)改革

    據(jù)外媒最新報(bào)道,通用汽車(GM)正在中國市場進(jìn)行一系列重大調(diào)整,以應(yīng)對(duì)全球最大汽車市場的快速變化。知情人士透露,通用汽車已啟動(dòng)裁員計(jì)劃,并計(jì)劃在未來幾周內(nèi)與合作伙伴上汽集團(tuán)會(huì)面,共同探討更大規(guī)模的結(jié)構(gòu)性改革方案。
    的頭像 發(fā)表于 08-14 16:24 ?710次閱讀

    萬里紅入選《嘶吼2024網(wǎng)絡(luò)安全產(chǎn)業(yè)圖譜》8個(gè)細(xì)分領(lǐng)域

    近日,國內(nèi)信息安全領(lǐng)域權(quán)威媒體嘶吼正式發(fā)布了《嘶吼2024網(wǎng)絡(luò)安全產(chǎn)業(yè)圖譜》(以下簡稱“網(wǎng)絡(luò)安全產(chǎn)業(yè)圖譜”)。本次網(wǎng)絡(luò)安全產(chǎn)業(yè)圖譜通過市場調(diào)研、數(shù)據(jù)
    的頭像 發(fā)表于 07-23 14:42 ?1587次閱讀
    萬里紅入選《嘶吼2024網(wǎng)絡(luò)安全產(chǎn)業(yè)<b class='flag-5'>圖譜</b>》8個(gè)細(xì)分<b class='flag-5'>領(lǐng)域</b>