基于免疫克隆特征選擇和US集成的二元分類器算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
為解決垃圾網(wǎng)頁檢測(cè)過程中的“維數(shù)災(zāi)難”和不平衡分類問題,提出一種基于免疫克隆特征選擇和欠采樣(US)集成的二元分類器算法。首先,使用欠采樣技術(shù)將訓(xùn)練樣本集大類抽樣成多個(gè)與小類樣本數(shù)相近的樣本集,再將其分別與小類樣本合并構(gòu)成多個(gè)平衡的子訓(xùn)練樣本集;然后,設(shè)計(jì)一種免疫克隆算法遴選出多個(gè)最優(yōu)的特征子集;基于最優(yōu)特征子集對(duì)平衡的子樣本集進(jìn)行投影操作,生成平衡數(shù)據(jù)集的多個(gè)視圖;最后,用隨機(jī)森林(RF)分類器對(duì)測(cè)試樣本進(jìn)行分類,采用簡(jiǎn)單投票法確定測(cè)試樣本的最終類別。在WEBSPAM UK-2006數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該集成分類器算法應(yīng)用于垃圾網(wǎng)頁檢測(cè):與隨機(jī)森林算法及其Bagging和AdaBoost集成分類器算法相比,準(zhǔn)確率、F1測(cè)度、AUC等指標(biāo)均提高11%以上;與其他最優(yōu)的研究結(jié)果相比,該集成分類器算法在F1測(cè)度上提高2%,在AUC上達(dá)到最優(yōu)。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于免疫克隆特征選擇和US集成的二元分類器算法下載
相關(guān)電子資料下載
- OpenAI發(fā)布圖像檢測(cè)分類器,可區(qū)分AI生成圖像與實(shí)拍照片 204
- 機(jī)器學(xué)習(xí)多分類任務(wù)深度解析 625
- 電池研發(fā)再現(xiàn)黑科技,鋰電巨頭正借此突破關(guān)鍵瓶頸! 701
- 揭秘大語言模型可信能力的五個(gè)關(guān)鍵維度 240
- 機(jī)器視覺之Halcon入門學(xué)習(xí) 780
- 使用RayDF方法突破3D形狀重建方案 328
- 一套試題看看您對(duì)深度學(xué)習(xí)了解多少? 136
- 機(jī)器學(xué)習(xí)常用的5種采樣方法盤點(diǎn) 571
- SLAM/SfM相似非回環(huán)場(chǎng)景應(yīng)該如何處理? 492
- faster rcnn網(wǎng)絡(luò)結(jié)構(gòu)詳解(四個(gè)切入點(diǎn)) 677