99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于隱含狄列克雷分配LDA分類特征擴(kuò)展的廣告過濾方法

大?。?/span>0.82 MB 人氣: 2017-12-14 需要積分:1

  傳統(tǒng)的微博廣告過濾方法忽略了微博廣告文本的數(shù)據(jù)稀疏性、語義信息和廣告背景領(lǐng)域特征等因素的影響。針對(duì)這些問題,提出一種基于隱含狄列克雷分配( LDA)分類特征擴(kuò)展的廣告過濾方法。首先,將微博分為正常微博和廣告型微博,并分別構(gòu)建LDA主題模型預(yù)測短文本對(duì)應(yīng)的主題分布,將主題中的詞作為特征擴(kuò)展的基礎(chǔ);其次,在特征擴(kuò)展時(shí)結(jié)合文本類別信息提取背景領(lǐng)域特征,以降低其對(duì)文本分類的影響;最后,將擴(kuò)展后的特征向量作為分類器的輸入,根據(jù)支持向量機(jī)(SVM)的分類結(jié)果過濾廣告。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的僅基于短文本分類的過濾方法相比,其準(zhǔn)確率平均提升4個(gè)百分點(diǎn)。因此,該方法能有效擴(kuò)展文本特征,并降低背景領(lǐng)域特征的影響,更適用于數(shù)據(jù)量較大的微博廣告過濾。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?