99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)科學(xué)和機器學(xué)習(xí)所需要的基本數(shù)學(xué)技能

如意 ? 來源:讀芯術(shù) ? 作者:讀芯術(shù) ? 2020-07-06 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一切科學(xué)的基礎(chǔ),數(shù)學(xué)在數(shù)據(jù)科學(xué)領(lǐng)域也占據(jù)著重要地位。如果你是一名數(shù)據(jù)科學(xué)愛好者,一定想過這些問題:

· 我可以在幾乎沒有數(shù)學(xué)背景的情況下,成為一名數(shù)據(jù)科學(xué)家嗎?

· 在數(shù)據(jù)科學(xué)中,哪些基本的數(shù)學(xué)技能是重要的?

有很多好用的包可以用來構(gòu)建預(yù)測模型,或生成數(shù)據(jù)可視化。一些最常用的描述性分析和預(yù)測性分析包包括:Ggplot2、Matplotlib、Seaborn、Scikit-learn、Caret、TensorFlow、PyTorch、Keras等。

有了這些包,任何人都可以構(gòu)建模型或者生成數(shù)據(jù)可視化。然而,想要微調(diào)模型,使之能產(chǎn)生具有最佳性能的可靠模型,確實需要非常扎實的數(shù)學(xué)基礎(chǔ)知識。

建立模型是一回事,但是解釋模型,并且總結(jié)出有意義的,且可用于數(shù)據(jù)驅(qū)動的決策制定的結(jié)論是另一回事。重要的是,在使用這些包之前,讀者必須要對每一個包的數(shù)學(xué)基礎(chǔ)有所了解,不僅限將這些包作為黑盒子工具來使用。

案例研究:構(gòu)建多元回歸模型

假設(shè)現(xiàn)在要建立一個多元回歸模型。在此之前,我們需要問自己幾個問題:

· 數(shù)據(jù)集有多大?

· 我的特征變量和目標(biāo)變量是什么?

· 哪些預(yù)測特征與目標(biāo)變量最相關(guān)?

· 哪些功能很重要?

· 應(yīng)該縮放特征嗎?

· 如何提高模型的預(yù)測能力?

· 應(yīng)該使用正則回歸模型嗎?

· 回歸系數(shù)是多少?

· 什么是攔截?

· 如何將數(shù)據(jù)集劃分為訓(xùn)練集和測試集?

· 什么是主成分分析(PCA)?

· 應(yīng)該使用主成分分析來刪除冗余的特征嗎?

· 應(yīng)不應(yīng)該使用非參數(shù)回歸模型,如k鄰近回歸(或支持向量回歸)?

· 模型中有哪些超參數(shù),如何對它們進行微調(diào)以獲得性能最優(yōu)的模型?

· 如何評估模型?是用R2-score(決定系數(shù)),MSE(均方誤差),還是MAE(平均絕對誤差)?

沒有良好的數(shù)學(xué)背景,就無法回答上述問題。在數(shù)據(jù)科學(xué)和機器學(xué)習(xí)中,數(shù)學(xué)技能和編程技能同等重要。作為一名數(shù)據(jù)科學(xué)愛好者,一定要投入時間來研究數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的理論和數(shù)學(xué)基礎(chǔ)。

能否建立可靠而有效的模型,使其應(yīng)用于現(xiàn)實世界的問題,取決于讀者的數(shù)學(xué)技能有多好。接下來我們來討論一下在數(shù)據(jù)科學(xué)和機器學(xué)習(xí)中所需要的一些基本數(shù)學(xué)技能。

數(shù)據(jù)科學(xué)與機器學(xué)習(xí)的基本數(shù)學(xué)技能

1. 線性代數(shù)

線性代數(shù)是機器學(xué)習(xí)中最重要的數(shù)學(xué)技能。數(shù)據(jù)集表示為矩陣,線性代數(shù)用于數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、降維和模型評估。

以下是大家需要熟悉的:向量;向量的范數(shù);矩陣;矩陣的轉(zhuǎn)置;逆矩陣;矩陣的行列式;矩陣的跡;點積;特征值;特征向量。

2. 統(tǒng)計與概率

統(tǒng)計與概率用于特征可視化、數(shù)據(jù)預(yù)處理、特征轉(zhuǎn)換、數(shù)據(jù)插補、降維、特征工程、模型評價等。

以下是大家需要熟悉的:均值、中值、模式、標(biāo)準(zhǔn)差/方差、相關(guān)系數(shù)和協(xié)方差矩陣、概率分布(二項式、泊松分布、正態(tài)分布)、p值、貝葉斯定理(精度、召回率、正預(yù)測值、負預(yù)測值、混淆矩陣、ROC曲線)、中心極限定理,R-2 score,均方誤差(MSE),A/B檢驗,蒙特卡羅模擬

3. 多變量微積分

大多數(shù)機器學(xué)習(xí)模型都是由一個具有多個特征或預(yù)測器的數(shù)據(jù)集建立的。因此,熟悉多變量微積分對于建立機器學(xué)習(xí)模型非常重要。

以下是大家需要熟悉的:多元函數(shù);導(dǎo)數(shù)和梯度;階躍函數(shù)、S形函數(shù)、Logit效用函數(shù)、ReLU(修正線性單元)函數(shù);成本函數(shù);函數(shù)繪圖;函數(shù)的最小值和最大值。

4.優(yōu)化方法

大多數(shù)機器學(xué)習(xí)算法是通過最小化目標(biāo)函數(shù)進行預(yù)測建模,從而學(xué)習(xí)為獲得預(yù)測標(biāo)簽而必須應(yīng)用于測試數(shù)據(jù)的權(quán)重。

以下是大家需要熟悉的:成本函數(shù)/目標(biāo)函數(shù);似然函數(shù);誤差函數(shù);梯度下降算法及其變體(例如隨機梯度下降算法)。

本文討論了數(shù)據(jù)科學(xué)和機器學(xué)習(xí)所需的基本數(shù)學(xué)和理論技能?;ヂ?lián)網(wǎng)時代,你能很輕松找到學(xué)習(xí)資源。作為數(shù)據(jù)科學(xué)愛好者一定要記住,數(shù)據(jù)科學(xué)的理論基礎(chǔ)對于高效可靠的模型建立至關(guān)重要。你應(yīng)該花足夠的時間來鉆研每種機器學(xué)習(xí)算法背后的數(shù)學(xué)理論,這對于數(shù)據(jù)科學(xué)來說是必不可少的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    通過NVIDIA Cosmos模型增強機器人學(xué)習(xí)

    通用機器人的時代已經(jīng)到來,這得益于機械電子技術(shù)和機器人 AI 基礎(chǔ)模型的進步。但目前機器人技術(shù)的發(fā)展仍面臨一個關(guān)鍵挑戰(zhàn):機器需要大量的訓(xùn)練
    的頭像 發(fā)表于 07-14 11:49 ?189次閱讀
    通過NVIDIA Cosmos模型增強<b class='flag-5'>機器人學(xué)習(xí)</b>

    數(shù)學(xué)專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習(xí)路徑全揭秘

    隨著AI技術(shù)的不斷進步,專業(yè)人才的需求也日益增長。數(shù)學(xué)作為AI的基石,為機器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等提供了理論基礎(chǔ)和工具,因此越來越多的
    的頭像 發(fā)表于 02-07 11:14 ?1122次閱讀
    <b class='flag-5'>數(shù)學(xué)</b>專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習(xí)</b>路徑全揭秘

    如何使用自然語言處理分析文本數(shù)據(jù)

    使用自然語言處理(NLP)分析文本數(shù)據(jù)是一個復(fù)雜但系統(tǒng)的過程,涉及多個步驟和技術(shù)。以下是一個基本的流程,幫助你理解如何使用NLP來分析文本數(shù)據(jù): 1. 數(shù)據(jù)收集 收集文本數(shù)據(jù) :從各種
    的頭像 發(fā)表于 12-05 15:27 ?1594次閱讀

    自然語言處理與機器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一個核心領(lǐng)域,它使計算機能夠從數(shù)據(jù)學(xué)習(xí)并做出預(yù)測或決策。自然語言處理與機器學(xué)習(xí)之間有著密切的關(guān)系,因為
    的頭像 發(fā)表于 12-05 15:21 ?1989次閱讀

    ADS54J69EVM輸出的樣本數(shù)據(jù)變化幅度很大的原因?怎么解決?

    您好,我在測試ADS54J69EVM的數(shù)據(jù)輸時,選擇將VCM、AINP、AINM與板上到的GND連接在一起,本以為這樣輸出的樣本數(shù)據(jù)應(yīng)該時接近0V的數(shù)據(jù),出現(xiàn)的波動也會很小,但實時是該通道對應(yīng)
    發(fā)表于 11-27 06:39

    光電效應(yīng)的數(shù)學(xué)模型及解析

    光電效應(yīng)是指光照射在物質(zhì)上,引起電子從物質(zhì)表面逸出的現(xiàn)象。以下是光電效應(yīng)的數(shù)學(xué)模型及詳細解析: 一、光電效應(yīng)的基本數(shù)學(xué)模型 光子能量公式 : 表達式:E = hν 含義:E代表光子的能量,h是普朗克
    的頭像 發(fā)表于 11-25 13:46 ?4893次閱讀

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進行分析
    的頭像 發(fā)表于 11-16 01:07 ?967次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機器學(xué)習(xí)算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-15 09:19 ?1230次閱讀

    eda在機器學(xué)習(xí)中的應(yīng)用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果一個數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是一個異常值,需要進一步調(diào)查。 2. 特
    的頭像 發(fā)表于 11-13 10:42 ?911次閱讀

    LLM和傳統(tǒng)機器學(xué)習(xí)的區(qū)別

    在人工智能領(lǐng)域,LLM(Large Language Models,大型語言模型)和傳統(tǒng)機器學(xué)習(xí)是兩種不同的技術(shù)路徑,它們在處理數(shù)據(jù)、模型結(jié)構(gòu)、應(yīng)用場景等方面有著顯著的差異。 1. 模型結(jié)構(gòu)
    的頭像 發(fā)表于 11-08 09:25 ?1900次閱讀

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識。特別是書中提到的基于大數(shù)據(jù)機器學(xué)習(xí)的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)、深度學(xué)習(xí)等先進技術(shù),AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機器
    發(fā)表于 08-17 21:12

    技術(shù)干貨驛站 ▏深入理解C語言:基本數(shù)據(jù)類型和變量

    語言的知識,為后續(xù)的編程學(xué)習(xí)打下堅實的基礎(chǔ)。1基本數(shù)據(jù)類型在C語言中,數(shù)據(jù)類型指的是用于聲明不同類型的變量或函數(shù)的一個廣泛的系統(tǒng),用于定義變量的類型,以及在編程過程
    的頭像 發(fā)表于 07-26 17:53 ?2753次閱讀
    技術(shù)干貨驛站 ▏深入理解C語言:基<b class='flag-5'>本數(shù)據(jù)</b>類型和變量