99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解數(shù)據(jù)挖掘的概念和特點(diǎn)

如意 ? 來源:百家號 ? 作者:看數(shù)據(jù)說事兒 ? 2020-06-29 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)挖掘源自《從數(shù)據(jù)庫中發(fā)現(xiàn)知識》(縮寫為KDD)。它首次出現(xiàn)在1989年8月在底特律舉行的第十一屆國際聯(lián)合人工智能會(huì)議上。為了統(tǒng)一理解,F(xiàn)ayyad,Piatetsky-Shapiro和Smyth在權(quán)威文章集《知識發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中給出了KDD和數(shù)據(jù)挖掘的最新定義。從中總結(jié)了1996年該領(lǐng)域的進(jìn)展,并予以區(qū)分:

KDD的定義是:KDD是從數(shù)據(jù)中識別有效,新穎,潛在有用且最終可以理解的模式的過程。

數(shù)據(jù)挖掘的定義是:數(shù)據(jù)挖掘是KDD中的一步,它使用特定算法在可接受的計(jì)算效率限制內(nèi)生成特定模式。

數(shù)據(jù)挖掘技術(shù)的特點(diǎn)

1.基于大量數(shù)據(jù):不是說無法挖掘小數(shù)據(jù)量。實(shí)際上,大多數(shù)數(shù)據(jù)挖掘算法都可以在較小的數(shù)據(jù)量上運(yùn)行并獲得結(jié)果。但是,一方面,過小的數(shù)據(jù)量可以通過手動(dòng)分析來總結(jié),另一方面,小數(shù)據(jù)量通常不能反映現(xiàn)實(shí)世界的一般特征。

2.非平凡性:所謂非平凡的意思是指所挖掘的知識是不簡單的。一定不能與著名體育評論員所說的相似:“經(jīng)過我的計(jì)算,直到比賽結(jié)束我才發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象。本屆世界杯的進(jìn)球數(shù)和失球數(shù)都是相同的。非常巧合!”這種知識。這似乎沒有必要,但是許多不了解業(yè)務(wù)知識的數(shù)據(jù)挖掘新手經(jīng)常會(huì)犯此錯(cuò)誤。

3.隱含性:數(shù)據(jù)挖掘是發(fā)現(xiàn)數(shù)據(jù)深處的知識,而不是直接出現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具(例如億信BI和豌豆BI)完全可以讓用戶找到此信息。

4.新奇性:挖掘的知識以前應(yīng)該是未知的,否則僅是為了驗(yàn)證業(yè)務(wù)專家的經(jīng)驗(yàn)。只有新知識才能幫助公司獲得進(jìn)一步的洞察力。

5.價(jià)值性:挖掘的結(jié)果必須為企業(yè)帶來直接或間接的利益。有人說數(shù)據(jù)挖掘只是“殺龍技術(shù)”。它看起來牛氣哄哄,但沒有用。這只是一個(gè)錯(cuò)誤的想法。不可否認(rèn)的是,在某些數(shù)據(jù)挖掘項(xiàng)目中,由于缺乏明確的業(yè)務(wù)目標(biāo),或者由于數(shù)據(jù)質(zhì)量不足,或者由于人們抵制不斷變化的業(yè)務(wù)流程,又或者由于挖掘人員缺乏經(jīng)驗(yàn),都會(huì)導(dǎo)致結(jié)果不佳甚至根本沒有效果。但是,大量成功的案例也證明了數(shù)據(jù)挖掘確實(shí)可以成為提高效率的武器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48996

    瀏覽量

    249244
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24699
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    三一挖掘機(jī)一鍵啟動(dòng)開關(guān)易壞的原因及更換注意事項(xiàng)

    三一挖掘機(jī)一鍵啟動(dòng)開關(guān)易壞的原因雖然三一挖掘機(jī)的一鍵啟動(dòng)系統(tǒng)設(shè)計(jì)旨在提高便利性和安全性,但在實(shí)際使用中,可能會(huì)出現(xiàn)一些問題導(dǎo)致開關(guān)易壞。這些問題可能包括:頻繁使用:挖掘機(jī)在施工過程中頻繁啟動(dòng)和關(guān)閉
    發(fā)表于 03-12 09:29

    數(shù)據(jù)I/O模塊的概念特點(diǎn)以及作用

    ? 本文簡單介紹了數(shù)據(jù)I/O模塊的概念、特點(diǎn)以及作用。 一、數(shù)據(jù) I/O 模塊是什么 1. 承接內(nèi)外數(shù)據(jù)交互的“橋梁”
    的頭像 發(fā)表于 01-21 11:10 ?901次閱讀

    硬件處理模塊的概念、特點(diǎn)和在系統(tǒng)中的位置

    本文介紹了硬件處理模塊的概念、特點(diǎn)和在系統(tǒng)中的位置。 一、硬件處理模塊的基本概念?專注于特定功能? 硬件處理模塊可以理解為在芯片內(nèi)部專門“定制”出來的一塊邏輯電路,用于完成某類固定的計(jì)算或操作。它不
    的頭像 發(fā)表于 01-20 13:52 ?698次閱讀
    硬件處理模塊的<b class='flag-5'>概念</b>、<b class='flag-5'>特點(diǎn)</b>和在系統(tǒng)中的位置

    了解虛擬電廠的基本概念

    虛擬電廠的基本概念: 虛擬電廠是一種基于現(xiàn)代信息技術(shù)和能源互聯(lián)網(wǎng)的能源管理模式,它將分散的、可再生能源和儲(chǔ)能設(shè)備通過虛擬化技術(shù)進(jìn)行集成和管理,形成一個(gè)具有集中調(diào)度、統(tǒng)一運(yùn)營和優(yōu)化控制的虛擬化電力系統(tǒng)
    的頭像 發(fā)表于 12-24 17:12 ?931次閱讀
    <b class='flag-5'>了解</b>虛擬電廠的基本<b class='flag-5'>概念</b>

    什么是大屏數(shù)據(jù)可視化?特點(diǎn)有哪些?

    介紹: 特點(diǎn) 直觀易懂:大屏數(shù)據(jù)可視化通過圖表、圖形和其他可視化元素,將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為直觀易懂的形式,使得用戶無需深入挖掘數(shù)據(jù)細(xì)節(jié)即可快速
    的頭像 發(fā)表于 12-16 16:59 ?675次閱讀

    DAC81408的建立時(shí)間為12uS,如何理解數(shù)據(jù)手冊中的12uS建立時(shí)間這個(gè)參數(shù)呢?

    中建立時(shí)間曲線,±20V輸出,如果按照數(shù)據(jù)手冊中4V/uS爬升速率計(jì)算,0到20V跳變時(shí)間為5uS,從以上兩圖頁可以看出,信號在5uS內(nèi)達(dá)到設(shè)定值20V,該時(shí)間也小于建立時(shí)間典型值12uS。 請問如何理解數(shù)據(jù)手冊中的12uS建立時(shí)間這個(gè)參數(shù)呢
    發(fā)表于 12-09 08:33

    了解無功補(bǔ)償?shù)?b class='flag-5'>概念

    關(guān)注“acrelzx”微信號,了解更多產(chǎn)品資訊,可咨詢相關(guān)案例 (具體咨詢安科瑞187021張欣11310) 無功補(bǔ)償,是一種在電力供電系統(tǒng)中起提高電網(wǎng)的功率因數(shù)的作用,降低供電變壓器及輸送線
    的頭像 發(fā)表于 11-15 09:08 ?617次閱讀
    <b class='flag-5'>了解</b>無功補(bǔ)償?shù)?b class='flag-5'>概念</b>

    精準(zhǔn)定位隧道挖掘通訊難題:虹科PCAN卡如何滿足專業(yè)通訊需求?

    在現(xiàn)代隧道挖掘行業(yè)中,電控系統(tǒng)作為設(shè)備的“大腦”,其性能優(yōu)劣直接關(guān)系到設(shè)備的整體運(yùn)作效率與安全性。本文將深入探討虹科PCAN卡在隧道挖掘機(jī)器電控系統(tǒng)中的應(yīng)用,了解它是如何提升設(shè)備性能,確保工程
    的頭像 發(fā)表于 11-14 01:01 ?529次閱讀
    精準(zhǔn)定位隧道<b class='flag-5'>挖掘</b>通訊難題:虹科PCAN卡如何滿足專業(yè)通訊需求?

    如何進(jìn)行有效的eda分析

    進(jìn)行有效的EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)分析,是數(shù)據(jù)科學(xué)中的關(guān)鍵步驟,它能夠幫助分析人員深入了解數(shù)據(jù)、發(fā)現(xiàn)潛在的模式,并為進(jìn)一步的分析和建模提供
    的頭像 發(fā)表于 11-13 10:48 ?973次閱讀

    了解MSP430閃存數(shù)據(jù)保留

    電子發(fā)燒友網(wǎng)站提供《了解MSP430閃存數(shù)據(jù)保留.pdf》資料免費(fèi)下載
    發(fā)表于 10-21 09:34 ?0次下載
    <b class='flag-5'>了解</b>MSP430閃存<b class='flag-5'>數(shù)據(jù)</b>保留

    開關(guān)量和模擬量的基本概念、特點(diǎn)及應(yīng)用

    、開關(guān)量的基本概念 開關(guān)量是一種數(shù)字信號,它只有兩種狀態(tài):高電平(通常為1)和低電平(通常為0)。這種信號的特點(diǎn)是簡單、直觀,易于處理和控制。在實(shí)際應(yīng)用中,開關(guān)量通常用于控制電路的通斷,實(shí)現(xiàn)設(shè)備的啟停、切換等功能。
    的頭像 發(fā)表于 08-30 11:10 ?2310次閱讀

    如何利用traceroute命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡

    在網(wǎng)絡(luò)管理和故障排除中,了解數(shù)據(jù)包的路徑和識別負(fù)載均衡節(jié)點(diǎn)是非常重要的。traceroute 命令是一個(gè)用于跟蹤數(shù)據(jù)包在網(wǎng)絡(luò)中經(jīng)過的路由路徑的工具。本文將詳細(xì)介紹如何利用 traceroute 命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡,并解釋相關(guān)的概念
    的頭像 發(fā)表于 08-07 15:13 ?915次閱讀
    如何利用traceroute命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡

    中科曙光受邀參加第十屆中國數(shù)據(jù)挖掘會(huì)議

    近日,國內(nèi)數(shù)據(jù)挖掘領(lǐng)域最主要的學(xué)術(shù)活動(dòng)之一—第十屆中國數(shù)據(jù)挖掘會(huì)議(CCDM2024)于山東泰安舉行,中科曙光參與并分享了曙光AI構(gòu)建產(chǎn)學(xué)研用的生態(tài)實(shí)踐。
    的頭像 發(fā)表于 08-01 10:43 ?861次閱讀

    數(shù)字電路的基礎(chǔ)概念:MOS晶體管

    對于從事芯片行業(yè)的人員來說,還是有必要了解數(shù)字電路中的一些基本概念,例如用作邏輯開關(guān)的 MOS 晶體管。當(dāng)然,我們的目的是了解現(xiàn)代芯片中的行為本質(zhì),而不需要陷入半導(dǎo)體物理方程。
    的頭像 發(fā)表于 07-29 10:02 ?1651次閱讀
    數(shù)字電路的基礎(chǔ)<b class='flag-5'>概念</b>:MOS晶體管

    BP網(wǎng)絡(luò)的基本概念和訓(xùn)練原理

    )的多層前饋神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)自1985年提出以來,因其強(qiáng)大的學(xué)習(xí)和適應(yīng)能力,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識別等領(lǐng)域得到了廣泛應(yīng)用。以下將對BP網(wǎng)絡(luò)的基本概念、訓(xùn)練原理及其優(yōu)缺點(diǎn)進(jìn)行詳細(xì)闡述。
    的頭像 發(fā)表于 07-19 17:24 ?3172次閱讀