首頁: 電子電路圖,電子技術資料網(wǎng)站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設計、新的設計構(gòu)想等可下載的電子資料！

電子技術應用: 電子技術應用頻道 -- 為電子工程師提供電子產(chǎn)品設計所需的技術分析、設計技巧、設計工具、測試工具等技術文章！

電子元器件: 專業(yè)的電子元器件平臺 -- 及時發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術論壇: 構(gòu)建電子工程師交流的平臺 -- 在交流中進一步學習設計技巧、規(guī)劃技術人生、提升自我價值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅(qū)動程序單片機編程數(shù)值算法/人工智能

您的位置：電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種新聞關鍵信息的提取算法

大?。?/span>0.87 MB 人氣： 2017-12-13 需要積分：0

推薦 + 挑錯 + 收藏(0) + 用戶評論（0）

前往下載地址

分享到:

標簽：提取算法(6816)

　　針對網(wǎng)頁正文提取算法缺乏通用性，以及對新聞網(wǎng)頁的提取缺乏標題、時間、來源信息的問題，提出一種新聞關鍵信息的提取算法newsExtractor。該算法首先通過預處理將網(wǎng)頁轉(zhuǎn)換成行號和文本的集合，然后根據(jù)字數(shù)最長的一句話出現(xiàn)在新聞正文的概率極高的特點，從正文中間開始向兩端尋找正文的起點和終點提取新聞正文，根據(jù)最長公共子串算法提取標題，構(gòu)造正則表達式并以行號輔助判斷提取時間，根據(jù)來源的格式特點并輔以行號提取來源；最后構(gòu)造了數(shù)據(jù)集與國外開源軟件newsPaper進行提取準確率的對比實驗。實驗結(jié)果表明，newsExtractor在正文、標題、時間、來源的平均提取準確率上均優(yōu)于newsPaper，具有通用性和魯棒性。

一種新聞關鍵信息的提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

下載地址

不能下載？請通知我們

一種新聞關鍵信息的提取算法下載

普通下載普通下載

用戶評論

發(fā)表評論即可獲得積分！ 詳見積分規(guī)則

發(fā)表評論

用戶評論

評價:好評中評差評

發(fā)表評論，獲取積分！請遵守相關規(guī)定！

注冊會員

游客:

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

一種新聞關鍵信息的提取算法

下載地址

一種新聞關鍵信息的提取算法下載

相關電子資料下載

用戶評論

發(fā)表評論

分享你我的電子世界

實用電子設計資料下載

源碼下載排行

熱門詞