99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習找一個好用的函數(shù)的原因是什么

wFVr_Hardware_1 ? 來源:硬件十萬個為什么 ? 作者:硬件十萬個為什么 ? 2022-11-02 16:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1、機器學習定義

我們一起看看AI界的大牛對機器學習的定義

(1)機器學習中經(jīng)典的“支持向量機(SVM)”的主要提出者弗拉基米爾·萬普尼克(Vladimir Vapnik),在其著作《統(tǒng)計學習理論的本質(zhì)》中這樣定義機器學習“機器學習就是一個基于經(jīng)驗數(shù)據(jù)的函數(shù)估計問題”。

(2)卡耐基梅隆大學的機器學習和人工智能領(lǐng)域知名教授湯姆·米切爾(Tom Mitchell),在他經(jīng)典教材《機器學習》中很抽象的定義了機器學習:對于某類任務(Task,簡稱T)和某項性能評價準則(Performance,簡稱P),如果一個計算機程序在T上以P作為性能度量,隨著經(jīng)驗(Experience,簡稱E)的積累,不斷自我完善,那么我們稱這個計算機程序從經(jīng)驗E中進行了學習。比如學習圍棋的程序AlphaGo,它可以通過和自己下棋獲取經(jīng)驗,那么它的任務T就是“參與圍棋對弈”,它的性能P就是用“贏得比賽的百分比”來度量的。米切爾教授認為,在機器學習中我們需要明確三個特征:任務的類型、衡量任務性能提升的標準以及獲取經(jīng)驗的來源。

(3)南京大學的機器學習專家周志華在經(jīng)典教材《機器學習》中這樣定義:機器學習致力于研究如何通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能,而在計算機系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,因此機器學習研究的主要內(nèi)容是關(guān)于在計算機上從數(shù)據(jù)中產(chǎn)生“模型”(model)的算法,即“學習算法”。有了學習算法,我們把經(jīng)驗數(shù)據(jù)提供給它,它就能基于這些數(shù)據(jù)產(chǎn)生模型,而在面對新的情況時,模型會給我們提供相應的判斷。比如我們在買瓜的時候看到一個沒剖開的西瓜,我們可以利用經(jīng)驗對這個瓜的好壞進行判斷。

結(jié)合這些行業(yè)大牛的定義,我們可以這樣理解機器學習,“從數(shù)據(jù)中學習,形成有效經(jīng)驗,提升執(zhí)行任務/工作的表現(xiàn)”,而我們對于機器學習的研究就是一個不斷找尋更有效算法的過程。對于計算機系統(tǒng)而言,所有的“經(jīng)驗”都是以數(shù)據(jù)的形式存在的,而數(shù)據(jù)作為學習的對象類型是多樣的,可以是數(shù)字、文字、圖像、音頻視頻,也可以是它們的各種組合。經(jīng)典機器學習中還要依賴人類的先驗知識,把原始數(shù)據(jù)預處理成各種特征,然后對特征進行分類。而這種分類的效果,高度取決于特征選取的好壞,因此傳統(tǒng)的機器學習專家們,把大部分時間都花在如何尋找更加合適的特征上。我們進入在“數(shù)據(jù)泛濫,信息超量”的大數(shù)據(jù)時代后,能自動從大數(shù)據(jù)中獲取知識的機器學習一定會扮演重要角色。

2、機器學習的主要形式

機器學習的主要形式有監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習及強化學習,我們再來回顧一下每一種形式的特點

(1)有監(jiān)督學習:有監(jiān)督學習使用有標簽的訓練數(shù)據(jù),“監(jiān)督”可以理解為已經(jīng)知道訓練樣本(輸入數(shù)據(jù))中期待的輸出信號(標簽)。監(jiān)督學習過程是,先為機器學習算法提供打過標簽的訓練數(shù)據(jù)以擬合預測模型,然后用該模型對未打過標簽的新數(shù)據(jù)進行預測。以垃圾郵件過濾為例,可以采用監(jiān)督機器學習算法在打過標簽的(正確標識垃圾與非垃圾)電子郵件的語料庫上訓練模型,然后用該模型來預測新郵件是否屬于垃圾郵件。當前火熱的神經(jīng)網(wǎng)絡就屬于有監(jiān)督學習。

(2)無監(jiān)督學習:無監(jiān)督學習的使用未標記過的訓練數(shù)據(jù),“無監(jiān)督”就不知道輸入對應的輸出結(jié)果了,無監(jiān)督學習讓算法自身發(fā)現(xiàn)數(shù)據(jù)的模型和規(guī)律。比如“聚類”,利用距離的親疏遠近來衡量不同類型。還有“異常檢測”,判斷某些點不合群?!爱惓z測”也是“聚類”的反向應用。

(3)半監(jiān)督學習:則采用“中庸之道”,利用聚類技術(shù)擴大已知標簽范圍,也就是說,訓練中使用的數(shù)據(jù)只有一小部分是標記過的,而大部分是沒有標記的,然后逐漸擴大標記數(shù)據(jù)的范圍。

(4)強化學習:強化學習也使用未標記的數(shù)據(jù),它可以通過某種方法(獎懲函數(shù))知道你是離正確答案越來越近,還是越來越遠。強化學習的目標是開發(fā)一個系統(tǒng),通過與環(huán)境的交互來提高其性能,我們也可以把強化學習看作一個與監(jiān)督學習相關(guān)的領(lǐng)域,然而強化學習的反饋并非標定過的正確標簽或數(shù)值,而是獎勵函數(shù)對行動度量的結(jié)果。強化學習的常見示例是國際象棋,系統(tǒng)根據(jù)棋盤的狀態(tài)或環(huán)境來決定一系列的行動,獎勵定義為比賽的輸或贏。

3、機器學習系統(tǒng)的路線圖

9a0f4dc6-4c89-11ed-a3b6-dac502259ad0.png

(1)預處理:我們能夠獲得的原始數(shù)據(jù)很少以理想形式出現(xiàn),無法滿足學習算法的最佳性能,因此數(shù)據(jù)的預處理是所有機器學習應用中最關(guān)鍵的步驟。為了獲得模型的最佳性能,許多機器學習算法要求所選特征的測量結(jié)果單位相同,通常通過把特征數(shù)據(jù)變換到[0,1]的取值范圍,或者均值為0、方差為1的標準正態(tài)分布來實現(xiàn)。由于某些選定的特征相互之間可能高度相關(guān),因此在某種程度上呈現(xiàn)冗余的現(xiàn)象。在這種情況下,可以通過降維技術(shù)將特征壓縮到低維子空間,減少存儲空間,提高算法的運行速度。預處理中為了確定機器學習算法不僅在訓練數(shù)據(jù)集上表現(xiàn)良好,而且對新數(shù)據(jù)也有很好的適應性,我們將數(shù)據(jù)集隨機分成單獨的訓練數(shù)據(jù)集和測試數(shù)據(jù)集。用訓練數(shù)據(jù)集來訓練和優(yōu)化機器學習模型,同時把測試數(shù)據(jù)集保留到最后以評估最終的模型。

(2)訓練和選擇預測模型:為了完成各種不同的任務,目前開發(fā)了許多不同的機器學習算法,但沒有哪個分類算法是完美的。例如,每個分類算法都存在著固有的偏置,如果不對分類任務做任何假設,沒有哪個分類模型會占上風。因此,在實際應用中我們至少要比較幾種不同的算法,以便訓練和選擇性能最好的模型。在比較不同的模型之前,我們首先要確定度量性能的指標,通常用分類準確率作為度量指標,其定義為正確分類的個體占所有個體的百分比。我們不能期望軟件庫所提供的不同機器學習算法的默認參數(shù)值對特定問題最優(yōu),因此使用超參數(shù)調(diào)優(yōu)技術(shù)來調(diào)優(yōu)模型的性能就特別重要,我們可以這樣理解超參數(shù),這不是從數(shù)據(jù)中學習的參數(shù),而是模型的調(diào)節(jié)旋鈕,可以來回旋轉(zhuǎn)調(diào)整模型的性能。

(3)評估模型并對未曾謀面的數(shù)據(jù)進行預測:在訓練數(shù)據(jù)集上擬合并選擇模型之后,我們可以用測試數(shù)據(jù)集來評估它在從來沒見過的新數(shù)據(jù)上的表現(xiàn),以評估泛化誤差。如果我們對模型的表現(xiàn)滿意,那么就可以用它來預測未來的新數(shù)據(jù)。

4、機器學習函數(shù)化

(1)機器學習就是找一個好用的函數(shù)

《未來簡史》的作者赫拉利這樣定義,人工智能實際上就是找到一種高效的“電子算法”,用以代替或在某項指標上超越人類的“生物算法”。那么,任何一個“電子算法”都要實現(xiàn)一定的功能(Function)才有意義,這種“功能”就是我們使用的“函數(shù)”。

臺灣大學李宏毅博士的說法更通俗一些,機器學習在形式上可近似等同于在數(shù)據(jù)對象中通過統(tǒng)計或推理的方法,尋找一個有關(guān)特定輸入和預期輸出的功能函數(shù)f。

通常我們把輸入變量空間記作X,也就是特征,變量既可以是標量(scalar),也可以是向量(vector),包括各種數(shù)據(jù)表或矩陣的列;而把輸出變量空間記作Y,也就是目標。所謂的機器學習就是完成如下變換:Y=f (X)。

在這樣的函數(shù)中,針對語音識別功能,如果輸入一個音頻信號,就能輸出諸如“你好”或“How are you?”等這類識別信息;針對圖片識別功能,如果輸入的是一張圖片,在這個函數(shù)的加工下,就能輸出一個或貓或狗的判定;針對下棋博弈功能,如果輸入的是一個圍棋的棋譜局勢,它能輸出這盤圍棋下

一步的“最佳”走法;而對于具備智能交互功能的系統(tǒng)(比如微軟小冰),當我們給這個函數(shù)輸入諸如“How are you?”,它就能輸出諸如“I am fine,thank you,and you?”等智能的回應。

總結(jié)這一下,機器學習的過程和目標就是在尋找一個“好用的”函數(shù)。

(2)如何才能尋找到一個好用的函數(shù)

“好用的”函數(shù)并不那么好找,輸入一只貓的圖像后,這個f函數(shù)并不一定就能輸出一只貓,可能它會錯誤地輸出為一條狗或一條蛇,開發(fā)者想要找到好的函數(shù)必須要走好三大步

如何找一系列的函數(shù)來實現(xiàn)預期的功能,這是建模問題。

如何找出一系列評價標準來評估函數(shù)的好壞,這是評估問題。

如何快速找到性能最佳的函數(shù),這是優(yōu)化問題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64858
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134601

原文標題:機器學習為什么要找一個好用的函數(shù)?

文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ADC的諧波產(chǎn)生的原因是什么?

    ADC的諧波產(chǎn)生的原因是什么
    發(fā)表于 02-08 08:25

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)的機器學習方法。盡管深度學習般指神經(jīng)網(wǎng)絡算法)是強大的工具,目前也非常
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設法對數(shù)據(jù)進行分析學習,這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之,
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關(guān)系

    在人工智能領(lǐng)域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?1214次閱讀

    eda在機器學習中的應用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是異常值,需要進
    的頭像 發(fā)表于 11-13 10:42 ?899次閱讀

    具身智能與機器學習的關(guān)系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環(huán)境的交互來獲得、發(fā)展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環(huán)境適應能力。具身智能強調(diào)智能體的身體和環(huán)境在智能發(fā)展中的重要性。 2. 機器學習的定義
    的頭像 發(fā)表于 10-27 10:33 ?1049次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術(shù),但其中很大的子集是機器學習——讓算法從數(shù)據(jù)中學習。
    發(fā)表于 10-24 17:22 ?2978次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    用STM32的芯片測PWM輸入,頻率有的時候不對是什么原因造成的?

    最近用STM32的芯片測PWM輸入,發(fā)現(xiàn)頻率有的時候不對,原因是HAL_TIM_IC_CaptureCallback函數(shù)里測量的上升沿之間間隔和上升沿下降沿之間間隔,發(fā)現(xiàn)有的時候丟
    發(fā)表于 09-27 08:21

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止。削減成本通常被認為是主要原因——但盡管通過云遷移降低成本無疑是
    的頭像 發(fā)表于 09-14 17:38 ?529次閱讀

    調(diào)相信號經(jīng)過鉗位電路后產(chǎn)生了同頻信號,原因是什么?

    請教問題:調(diào)相信號經(jīng)過鉗位電路后產(chǎn)生了同頻信號,原因是什么?如何解決
    發(fā)表于 08-16 07:59

    OPA828ID發(fā)燙的原因是什么?

    你好,下面是我的DAC部分電路圖,運放用的是OPA828ID,封裝SOIC-8,±15V供電,現(xiàn)在上電就發(fā)燙,用紅外成像儀顯示能達到67℃,網(wǎng)上查詢了解到,運放發(fā)熱的主要原因是自激振蕩和負載過大(電流過大),但電路功能目前正常,且工作電流最大6m 請問此電路中運放發(fā)
    發(fā)表于 08-09 08:10

    XTR105不能正常工作的原因是什么?

    XTR105不能正常工作的原因是什么?
    發(fā)表于 08-08 08:23

    OPA820同樣的建波電路mutisim仿真與TINA輸出結(jié)果差異較大,原因是什么?

    同樣的建波電路 mutisim 仿真與TINA 輸出結(jié)果差異較大,原因是什么?如何調(diào)整電路才能讓兩軟件仿真結(jié)果致,實現(xiàn)檢波?
    發(fā)表于 08-07 07:45

    LMV321同型號生產(chǎn)工藝上晶圓差異較大的原因是什么?

    型號生產(chǎn)工藝上晶圓差異較大的原因是?
    發(fā)表于 08-07 07:02

    ESP8266與服務器通信停止的原因是什么?

    我正在使用 ESP8266 模塊,我遇到了奇怪的問題,當我通過 Android 平板電腦與設備通信時,我有連接,也可以進行通信,但問題是在通信過程中它會停止,幾秒鐘然后重新開始。我已經(jīng)檢查了平板
    發(fā)表于 07-19 07:18