99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

5歲孩子都能理解的機(jī)器學(xué)習(xí)

汽車玩家 ? 來源:今日頭條 ? 作者:聞數(shù)起舞 ? 2020-05-03 17:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡可能簡單地解釋ML模型的工作方式

如果您是數(shù)據(jù)科學(xué)的新手,那么這個標(biāo)題并不是要侮辱您。 這是我的第二篇帖子,主題是一個受歡迎的面試問題,內(nèi)容類似于:"像我五歲那樣向我解釋[插入技術(shù)主題]。"

事實證明,達(dá)到5歲的理解水平相當(dāng)困難。 因此,盡管這篇文章可能對幼稚園學(xué)習(xí)者來說不是很清楚,但對于沒有或幾乎沒有數(shù)據(jù)科學(xué)背景的人來說,它應(yīng)該是清楚的(如果不是最后,請在評論中讓我知道)。

我將首先解釋什么是機(jī)器學(xué)習(xí)以及不同類型的機(jī)器學(xué)習(xí),然后再介紹常見的模型。 我不會進(jìn)行任何數(shù)學(xué)運算,但是將來我會在另一篇文章中考慮這樣做。 請享用!

監(jiān)督機(jī)器學(xué)習(xí)的定義

監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí),其中您放入模型中的數(shù)據(jù)被"標(biāo)記"。 標(biāo)記只是簡單地表示觀測結(jié)果(也就是數(shù)據(jù)行)是已知的。 例如,如果您的模型試圖預(yù)測您的朋友是否會打高爾夫球,那么您可能會有諸如溫度,星期幾等變量。如果您的數(shù)據(jù)帶有標(biāo)簽,那么您的變量也將包含 如果您的朋友實際打高爾夫球,則值為1;否則,則為0。

無監(jiān)督機(jī)器學(xué)習(xí)的定義

您可能已經(jīng)猜到了,在涉及標(biāo)簽數(shù)據(jù)時,無監(jiān)督學(xué)習(xí)與有監(jiān)督學(xué)習(xí)相反。 在無監(jiān)督學(xué)習(xí)的情況下,您不知道朋友是否打高爾夫球,這取決于計算機(jī)通過模型找到模式來猜測發(fā)生的事情或預(yù)測發(fā)生的事情。

監(jiān)督機(jī)器學(xué)習(xí)模型

[需要成人監(jiān)督]

邏輯回歸

遇到分類問題時,將使用邏輯回歸。 這意味著您的目標(biāo)變量(也就是您要預(yù)測的變量)由類別組成。 這些類別可以是"是/否",也可以是代表客戶滿意度的介于1到10之間的數(shù)字。

邏輯回歸模型使用方程式創(chuàng)建包含數(shù)據(jù)的曲線,然后使用該曲線預(yù)測新觀測的結(jié)果。

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of Logistic Regression

在上圖中,新觀測值的預(yù)測值為0,因為它位于曲線的左側(cè)。 如果查看此曲線所基于的數(shù)據(jù),這是有道理的,因為在圖形的"預(yù)測值為0"區(qū)域中,大多數(shù)數(shù)據(jù)點的y值為0。

線性回歸

線性回歸通常是人們學(xué)習(xí)的最早的機(jī)器學(xué)習(xí)模型之一。 這是因為僅使用一個x變量時,它的算法(即幕后方程式)相對容易理解-它只是畫出一條最合適的線,這是在小學(xué)階段教授的一種概念。 然后,該最佳擬合線用于做出有關(guān)新數(shù)據(jù)點的預(yù)測(參見插圖)。

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of Linear Regression

線性回歸與邏輯回歸相似,但是當(dāng)目標(biāo)變量是連續(xù)的時使用線性回歸,這意味著它可以采用任何數(shù)值。 實際上,任何具有連續(xù)目標(biāo)變量的模型都可以歸類為"回歸"。 連續(xù)變量的一個例子是房屋的售價。

線性回歸也很容易解釋。 模型方程式包含每個變量的系數(shù),并且這些系數(shù)指示目標(biāo)變量針對自變量(x變量)中的每個小變化而變化了多少。 以房價為例,這意味著您可以看一下回歸方程,并說"哦,這告訴我,每增加1平方英尺的房屋大?。▁變量),便要賣出價格(目標(biāo)變量) 增加25美元。"

K最近鄰居(KNN)

該模型可用于分類或回歸! 名稱" K最近的鄰居"并不旨在造成混淆。 該模型首先繪制出所有數(shù)據(jù)。 標(biāo)題的" K"部分是指模型為了確定預(yù)測值應(yīng)使用的最鄰近數(shù)據(jù)點的數(shù)量(請參見下圖)。 您作為未來的數(shù)據(jù)科學(xué)家,可以選擇K,然后您可以使用這些值來查看哪個值提供最佳預(yù)測。

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of K Nearest Neighbors

K = __圈中的所有數(shù)據(jù)點都會對此新數(shù)據(jù)點的目標(biāo)變量值進(jìn)行"投票"。 得票最多的那個值是KNN為新數(shù)據(jù)點預(yù)測的值。 在上圖中,最近的鄰居中有2個是1類,而鄰居中的1個是2類。因此,模型將為此數(shù)據(jù)點預(yù)測1類。 如果模型試圖預(yù)測數(shù)值而不是類別,則所有"投票"都是對數(shù)值進(jìn)行平均以獲得預(yù)測。

支持向量機(jī)(SVM)

支持向量機(jī)通過在數(shù)據(jù)點之間建立邊界來工作,其中一類的大多數(shù)位于邊界的一側(cè)(在2D情況下也稱為線),而另一類的大多數(shù)位于另一側(cè)。

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of Support Vector Machines

它的工作方式是機(jī)器尋求找到最大邊距的邊界。 邊距定義為每個類的最近點與邊界之間的距離(請參見插圖)。 然后繪制新的數(shù)據(jù)點,并根據(jù)它們落在邊界的哪一側(cè)將其分類。

我對此模型的解釋是針對分類情況的,但是您也可以使用SVM進(jìn)行回歸!

決策樹和隨機(jī)森林

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of Machine Learning

機(jī)器學(xué)習(xí)是指將大量數(shù)據(jù)加載到計算機(jī)程序中并選擇一種模型以"擬合"數(shù)據(jù)時,這將使計算機(jī)(無需您的幫助)可以得出預(yù)測。 計算機(jī)制作模型的方式是通過算法進(jìn)行的,算法的范圍從簡單的方程式(如直線方程式)到非常復(fù)雜的邏輯/數(shù)學(xué)系統(tǒng),可以使計算機(jī)獲得最佳預(yù)測。

無監(jiān)督機(jī)器學(xué)習(xí)模型

[謹(jǐn)慎使用]

現(xiàn)在,我們正在嘗試無監(jiān)督的學(xué)習(xí)(又稱"雙關(guān)")。 提醒一下,這意味著我們的數(shù)據(jù)集未標(biāo)記,因此我們不知道觀察結(jié)果。

K均值聚類

當(dāng)使用K表示聚類時,必須首先假設(shè)數(shù)據(jù)集中有K個聚類。 由于您不知道數(shù)據(jù)中實際上有多少個組,因此必須嘗試不同的K值,并使用可視化和度量標(biāo)準(zhǔn)來查看哪個K值有意義。 K表示最適合圓形和相似大小的簇。

K Means算法首先選擇最佳的K個數(shù)據(jù)點,以形成K個聚類中每個聚類的中心。 然后,它對每個點重復(fù)以下兩個步驟:

· 將數(shù)據(jù)點分配到最近的集群中心

· 通過獲取此集群中所有數(shù)據(jù)點的平均值來創(chuàng)建一個新中心

5歲孩子都能理解的機(jī)器學(xué)習(xí)

> Illustration of K Means Clustering

DBSCAN集群

DBSCAN集群模型與K的不同之處在于,它不需要您輸入K的值,并且它還可以找到任何形狀的集群(請參見下圖)。 您無需輸入簇的數(shù)量,而是輸入簇中所需的最小數(shù)據(jù)點數(shù)以及搜索簇的數(shù)據(jù)點周圍的半徑。 DBSCAN將為您找到集群! 然后,您可以更改用于制作模型的值,直到獲得對數(shù)據(jù)集有意義的聚類為止。

5歲孩子都能理解的機(jī)器學(xué)習(xí)

此外,DBSCAN模型會為您分類"噪聲"點(即,遠(yuǎn)離所有其他觀測值的點)。 當(dāng)數(shù)據(jù)點非??拷鼤r,此模型比K表示的效果更好。

神經(jīng)網(wǎng)絡(luò)

在我看來,神經(jīng)網(wǎng)絡(luò)是最酷,最神秘的模型。 它們之所以稱為神經(jīng)網(wǎng)絡(luò),是因為它們是按照我們大腦中神經(jīng)元的工作方式建模的。 這些模型用于在數(shù)據(jù)集中查找模式。 有時他們發(fā)現(xiàn)人類可能永遠(yuǎn)無法識別的模式。

神經(jīng)網(wǎng)絡(luò)可以很好地處理圖像和音頻等復(fù)雜數(shù)據(jù)。 它們是當(dāng)今我們一直看到的許多軟件功能的背后,從面部識別(不再令人毛骨悚然,F(xiàn)acebook)到文本分類。

對于本文而言,即使只是觸及神經(jīng)網(wǎng)絡(luò)的運行方式,也可能過于復(fù)雜。 如果您想了解更多信息,請參閱"初學(xué)者"指南:https://pathmind.com/wiki/neural-network。

結(jié)論

希望本文不僅增加了您對這些模型的理解,還使您意識到它們是多么的酷和有用! 當(dāng)我們讓計算機(jī)進(jìn)行工作/學(xué)習(xí)時,我們可以坐下來看看它能找到什么模式。 有時可能會造成混淆,因為即使專家也無法理解計算機(jī)得出其結(jié)論的確切邏輯,但是在某些情況下,我們關(guān)心的只是它擅長預(yù)測!

但是,有時候我們確實會關(guān)心計算機(jī)如何達(dá)到其預(yù)測,例如是否正在使用模型來確定哪些求職者將獲得第一輪面試。 有關(guān)此的更多信息,以下是TED的精彩演講,您不必成為數(shù)據(jù)科學(xué)家即可理解或欣賞:

與往常一樣,非常感謝您的閱讀,如果發(fā)現(xiàn)有用,請分享這篇文章! :)

所有圖形都是我在www.canva.com上制作的(充滿愛意)。 如果您希望使用它們,請與我聯(lián)系。

還要向Sean Davern,Scott Kroeger,Dotun Opasina和Bhanu Yerra表示感謝,以幫助他們通過我們的數(shù)據(jù)科學(xué)訪談實踐課程更好地理解這些模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機(jī)器學(xué)習(xí)模型市場前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機(jī)器
    的頭像 發(fā)表于 12-30 09:16 ?1194次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺因其彈性擴(kuò)展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?459次閱讀

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學(xué)領(lǐng)域的一個分支,它致力于研究如何讓計算機(jī)能夠理解、解釋和生成人類語言。機(jī)器學(xué)習(xí)(Machine
    的頭像 發(fā)表于 12-05 15:21 ?1989次閱讀

    ASR和機(jī)器學(xué)習(xí)的關(guān)系

    自動語音識別(ASR)技術(shù)的發(fā)展一直是人工智能領(lǐng)域的一個重要分支,它使得機(jī)器能夠理解和處理人類語言。隨著機(jī)器學(xué)習(xí)(ML)技術(shù)的迅猛發(fā)展,ASR系統(tǒng)的性能和準(zhǔn)確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?784次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動機(jī)是讓計算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?967次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1230次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?911次閱讀

    機(jī)器人技術(shù)的發(fā)展趨勢

    能力。 機(jī)器人能夠通過學(xué)習(xí)和訓(xùn)練,不斷優(yōu)化自身的行為和性能,實現(xiàn)更高效、更智能的工作。 自然語言處理與理解 : 隨著自然語言處理技術(shù)的進(jìn)步,機(jī)器人開始具備
    的頭像 發(fā)表于 10-25 09:27 ?2356次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2982次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    如何幫助孩子高效學(xué)習(xí)Python:開源硬件實踐是最優(yōu)選擇

    顯著提升孩子學(xué)習(xí)興趣和對Python原理的理解。本文將探討為何使用Raspberry Pi(樹莓派)或Unihiker(行空板)等開源硬件是孩子們掌握Python的最佳途徑。 讓
    的頭像 發(fā)表于 09-06 09:49 ?679次閱讀

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【《時間序列與機(jī)器學(xué)習(xí)》閱讀體驗】+ 時間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時間序列與機(jī)器學(xué)習(xí)》閱讀體驗】+ 了解時間序列

    收到《時間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學(xué)習(xí)時間序列及應(yīng)用的機(jī)會! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時間序列進(jìn)行大數(shù)
    發(fā)表于 08-11 17:55