99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詞義消歧與實體消歧

深度學習自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-08-02 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在前面

最近剛開始調(diào)研實體消歧方面的相關(guān)工作,這里先開一個頭吧。希望大家可以通過這篇簡要的文章對實體消歧任務(wù)本身有一個基本的認識。

1. 背景:詞義消歧與實體消歧

1.1 詞義消歧

自然語言文本中存在著大量的多義詞,而多義詞的存在也會影響人對文本的語義理解,讓人對文本的意思產(chǎn)生混淆。

詞義消岐(Word Sense Disambiguation,簡稱WSD) 是NLP中一個非?;镜娜蝿?wù),旨在確定多義詞在具體語境中的確切意義。

在詞義消歧中,同一詞語的不同義項會作為候選詞。我們需要在所有候選詞中找到與文本中目標詞語最接近的那個義項。這里“義項”指的是詞是詞典中的某個具體表示。

0ffbd464-118e-11ed-ba43-dac502259ad0.png

如上圖所示,「蘋果」在百度百科中共有25個義項,單說「蘋果」我們可能并不知道說的是「蘋果公司」還是「水果里的蘋果」。但結(jié)合具體的上下文語境,我們就可以很好地對「蘋果」消歧,從而明確「蘋果」的具體含義:

10309532-118e-11ed-ba43-dac502259ad0.png

1.2 實體消歧

實體鏈指/實體鏈接(Entity Linking,簡稱 EL) 在知識圖譜構(gòu)建、信息檢索和問答系統(tǒng)等領(lǐng)域具有廣泛的應(yīng)用價值。

實體鏈指的主要目標是識別上下文中的實體指稱具體指代現(xiàn)實世界中的哪一個實體,也就是將實體指稱項映射到知識庫中的相應(yīng)實體上去。

具體而言,實體鏈指一般包括實體識別、候選實體獲取、實體消歧這三個主要環(huán)節(jié)。之所以需要實體消歧,而不是直接將實體識別的結(jié)果放入知識圖譜的原因主要有兩方面:

多樣性(即多詞同義):同一實體在文本中會有不同的指稱。比如:甜瓜、安東尼、和瓜哥都指美國職業(yè)籃球運動員卡梅隆·凱恩·安東尼。

歧義性(即一詞多義):相同的實體指稱在不同的上下文中可以指不同的實體。比如:邁克爾·喬丹可能指美國籃球運動員,也可能指愛爾蘭政治家等。

1.3 總結(jié)

從以上說明來看,其實詞義消歧與實體消歧具有一定相似性, 二者的目的都是處理文本中詞匯歧義的問題. 主要區(qū)別在于:

在詞義消歧中的詞義通常是固定的, 可根據(jù)目標詞在詞典中的義項來列舉;

在實體消歧中, 實體詞義無法列舉,所以需要前序步驟候選實體獲?。?/p>

此外,實體詞的詞義數(shù)目大于普通詞,這個主要還是跟知識庫的量級相關(guān)。

2. 相關(guān)論文

這里我們主要給大家推薦兩篇近期發(fā)表的論文:

詞義消歧:《ESC: Redesigning WSD with Extractive Sense Comprehension》

實體消歧:《ExtEnD: Extractive Entity Disambiguation》

兩篇論文的模型都非常簡單,個人覺得關(guān)鍵或者說亮點主要在于他們對問題的轉(zhuǎn)換。其實,從這兩篇論文的名字就能看出端倪:都是將消歧問題轉(zhuǎn)換成了抽取式問題。

2.1 EXTENE 實體消歧

論文名稱:《ExtEnD: Extractive Entity Disambiguation》

論文鏈接:https://aclanthology.org/2022.acl-long.177.pdf

代碼地址:https://github.com/SapienzaNLP/extend.

105e153e-118e-11ed-ba43-dac502259ad0.png

如上圖所示,EXTEND將實體消歧任務(wù)轉(zhuǎn)換為了抽取式任務(wù),或者說MRC類任務(wù)。具體地:

將含有目標實體指稱項的文本當作Query;

將知識庫中對應(yīng)的所有候選實體及其描述當作Context;

二者拼接然后預(yù)測Answer的Span(startend prediction,start-end matching),這里的Answer就是在知識庫中目標實體指稱實際關(guān)聯(lián)的實體。

好了,這就是EXTEND論文的核心思想。是不是感覺模型已經(jīng)躍然紙上了,整體上應(yīng)該和我們之前在 一文詳解關(guān)系抽取模型 CasRel、實體識別LEAR論文閱讀筆記、 實體識別BERT-MRC論文閱讀筆記中介紹過的模型類似。

2.2 ESC 詞義消歧

論文名稱:《ESC: Redesigning WSD with Extractive Sense Comprehension》

論文鏈接:https://aclanthology.org/2021.naacl-main.371.pdf

代碼地址:https://github.com/SapienzaNLP/esc

1070bb3a-118e-11ed-ba43-dac502259ad0.png

ESC的模型架構(gòu)和EXTEND是相似的。整體上首先將輸入的上下文和目標詞的所有義項拼接,模型的輸出則是目標詞真正義項的起始和終止位置。

2.3 總結(jié)

論文的具體細節(jié)就不在本文里贅述了,大家可根據(jù)鏈接下載原文閱讀。此外,兩篇論文都公布了源碼,大家也可以快速利用源碼在一些開源數(shù)據(jù)上進行實驗。

當然也有一些相關(guān)比賽,比如百度:實體鏈指[1]目前就還在進行中:

10a33e7a-118e-11ed-ba43-dac502259ad0.png

我目前看到的幾個還是比較一致的做法,打分排序:

比如實體鏈指比賽方案分享[2]:

10b95016-118e-11ed-ba43-dac502259ad0.png

CCKS&百度 2019中文短文本的實體鏈指 第一名解決方案[3]:

10e2a970-118e-11ed-ba43-dac502259ad0.png

大家可以將論文的模型適配到中文場景下,然后嘗試在這個比賽的實體消歧環(huán)節(jié)使用,看看效果如何。

還是一樣,如果本文對你有幫助的話,歡迎點贊&在看&分享,這對我繼續(xù)分享&創(chuàng)作優(yōu)質(zhì)文章非常重要。感謝!

參考資料

[1]

百度:實體鏈指: https://aistudio.baidu.com/aistudio/competition/detail/83/0/introduction

[2]

實體鏈指比賽方案分享: https://aistudio.baidu.com/aistudio/projectdetail/1331020?channelType=0&channel=0

[3]

CCKS&百度 2019中文短文本的實體鏈指 第一名解決方案: https://github.com/panchunguang/ccks_baidu_entity_link

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    17452
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22621

原文標題:一文簡要了解詞義消歧與實體消歧

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一次諧器選型

    諧裝置
    aozhuogeng
    發(fā)布于 :2025年07月14日 10:15:35

    雙電機驅(qū)動系統(tǒng)隙技術(shù)分析

    摘要: 雙電機驅(qū)動系統(tǒng)是電力系統(tǒng)中重要的電機系統(tǒng),雙電機驅(qū)動的隙技術(shù)是雙電機驅(qū)動系統(tǒng)中的關(guān)鍵技術(shù),雙電機驅(qū)動系統(tǒng)能否實現(xiàn)正常運行關(guān)鍵在于隙技術(shù)本身的水平。在人們對電機系統(tǒng)的要求越來越高的背景下
    發(fā)表于 06-19 11:01

    微機諧裝置優(yōu)勢

    微機諧裝置(也稱為微機諧器或智能諧裝置)具有顯著優(yōu)勢。以下是其核心優(yōu)勢: 1. ?強大的諧振識別能力: ? ? 能夠?qū)崟r、精確地識別系統(tǒng)發(fā)生的多種類型的鐵磁諧振(如分頻、工頻、高頻諧振),以及
    的頭像 發(fā)表于 06-16 15:50 ?210次閱讀
    微機<b class='flag-5'>消</b>諧裝置優(yōu)勢

    微機諧器核心價值

    諧裝置
    aozhuogeng
    發(fā)布于 :2025年06月12日 08:24:34

    微機諧裝置功能特點

    諧裝置
    aozhuogeng
    發(fā)布于 :2025年05月28日 15:27:29

    一次諧裝置與二次諧裝置區(qū)別、一次諧器與二次諧器的區(qū)別

    一次諧器與二次諧器是電力系統(tǒng)中用于抑制諧振過電壓的不同裝置,主要區(qū)別如下: 安裝位置:一次諧器串聯(lián)于電壓互感器(PT)一次側(cè)中性點與地之間,直接承受高電壓;二次諧器并聯(lián)在PT
    的頭像 發(fā)表于 05-07 09:58 ?1101次閱讀
    一次<b class='flag-5'>消</b>諧裝置與二次<b class='flag-5'>消</b>諧裝置區(qū)別、一次<b class='flag-5'>消</b>諧器與二次<b class='flag-5'>消</b>諧器的區(qū)別

    一次諧器與二次諧器區(qū)別與聯(lián)系

    諧裝置
    aozhuogeng
    發(fā)布于 :2025年05月07日 09:33:44

    #微機諧裝置安裝位置

    微機
    aozhuogeng
    發(fā)布于 :2025年04月29日 08:31:07

    諧裝置的作用

    諧裝置是電力系統(tǒng)中防止鐵磁諧振過電壓的關(guān)鍵設(shè)備,主要用于保護電壓互感器(PT)及電網(wǎng)安全。當系統(tǒng)因單相接地、操作過電壓或雷擊引發(fā)PT鐵芯飽和時,可能產(chǎn)生分頻、工頻或高頻諧振,導(dǎo)致PT過熱、絕緣損壞
    的頭像 發(fā)表于 04-24 10:23 ?683次閱讀
    <b class='flag-5'>消</b>諧裝置的作用

    微機諧器與一次諧器區(qū)別與聯(lián)系

    微機諧器與一次諧器都是用于電力系統(tǒng)中抑制諧波和消除鐵磁諧振的設(shè)備,
    的頭像 發(fā)表于 04-22 16:21 ?289次閱讀

    STM32F334比較器隱和HRTIM的事件隱功能如何實現(xiàn)?

    1,使用STM32F334制作的數(shù)字電源,用EVENT事件來實現(xiàn)逐周期電流檢測功能,現(xiàn)在開關(guān)管開通瞬間過沖較大,導(dǎo)致比較器誤觸發(fā),比較器隱功能一直配置不起作用,不明白比較器的窗口隱的PWM
    發(fā)表于 03-11 06:08

    微機諧裝置的定義

    微機諧裝置是一種智能保護設(shè)備,專門應(yīng)用于電力系統(tǒng)。
    的頭像 發(fā)表于 01-24 15:58 ?486次閱讀

    微機諧裝置功能是否正常該如何測試

    微機諧裝置功能是否正常該如何測試?在微機諧正常使用之前我們?nèi)绾尾拍苤肋@個諧裝置各個功能合不合格,又測試哪些方面呢?今天我把這幾個問題一一做個解答! ? ? ? 測試微機諧我們
    的頭像 發(fā)表于 11-11 10:57 ?469次閱讀

    超聲波泡器的工作原理及特點

    超聲波泡器作為一種物理泡方式,不需要添加任何化學物質(zhì),因此不會對環(huán)境造成二次污染。
    的頭像 發(fā)表于 10-09 15:07 ?857次閱讀

    WXZ196微機諧對諧振故障是如何判斷的

    微機諧裝置,采用高性能的單片微機作為核心元件,對PT開口三角電壓進行循環(huán)檢測。正常工作下,該電壓小于30V,裝置內(nèi)的大功率諧元件(固態(tài)繼電器)處于阻斷狀態(tài),對系統(tǒng)運行不產(chǎn)生影響。當系統(tǒng)發(fā)生故障后
    的頭像 發(fā)表于 07-23 09:27 ?594次閱讀