99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于數(shù)據(jù)劃分和融合策略的并行DBSCAN算法

大?。?/span>1.15 MB 人氣: 2018-02-08 需要積分:2

  大數(shù)據(jù)是近年來計算機領(lǐng)域興起的熱點研究方向,通過聚類可以解決諸如機器學(xué)習(xí)、數(shù)據(jù)挖掘、生物信息分析等諸多大數(shù)據(jù)領(lǐng)域的問題。聚類是研究分類問題的重要方法,通過聚類分析可以將樣本中具有相同或者相似特征的項歸為一類,而將不具有該特征的項排除在外。主流的聚類方法包括基于劃分的聚類方法,如K-means;層次聚類方法,如CURE和BIRCH等;基于統(tǒng)計模型的方法,如EM算法等;基于密度的方法,如DBSCAN,OPTICS等。在基于密度的方法中,DBSCAN是較為典型的一種,它以超球狀區(qū)域內(nèi)數(shù)據(jù)對象的數(shù)量來衡量此區(qū)域密度的高低,能夠發(fā)現(xiàn)任意形狀的聚類并有效識別噪聲點。

  在并行RDD-DBSCAN算法的數(shù)據(jù)劃分和區(qū)域查詢過程中會對數(shù)據(jù)集進(jìn)行重復(fù)訪問,降低了算法效率。為此,提出基于數(shù)據(jù)劃分和融合策略的并行DBSCAN算法(DBSCAN-PSM)。利用KD樹進(jìn)行數(shù)據(jù)劃分,實現(xiàn)數(shù)據(jù)分區(qū)與區(qū)域查詢步驟的合并,從而減少數(shù)據(jù)集的訪問次數(shù)以及降低I/O過程對算法效率的影響。采用判定數(shù)據(jù)點自身屬性的方式,對標(biāo)注為邊緣點的數(shù)據(jù)進(jìn)行融合,避免全局標(biāo)記的額外時間開銷。實驗結(jié)果表明,DBSCAN-PSM算法相比RDD-DBSCAN算法可節(jié)省18%左右的運行時間,適用于處理海量數(shù)據(jù)聚類問題。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?