99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習就是現(xiàn)代統(tǒng)計學

電子工程師 ? 來源:fqj ? 2019-05-17 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)學最重要的魅力在于幫助我們提出解決問題的思路或途徑。

機器學習在一定程度上正是數(shù)學和工程的完美結合,畢竟用數(shù)學里面的概率論、隨機分析等工具研究AI早已不是什么新鮮事情。例如機器學習的四個基本原則性的問題,即泛化性、穩(wěn)定性、可計算性和可解釋性就可以用數(shù)學工程手段來解決。

在5月 9日的北京智源人工智能研究院主辦的“智源論壇——人工智能的數(shù)理基礎”系列報告中,北京?學的張志華教授對機器學習和數(shù)學工程的內(nèi)在關系進行了闡述。在報告中,他提到:統(tǒng)計為求解問題提供了數(shù)據(jù)驅(qū)動的建模途徑;概率論、隨機分析、微分方程、微分流形等工具可以引入來研究 AI 的數(shù)學機理等等。

除此之外,張志華教授還回顧了機器學習發(fā)展的?個重要階段,以及重點強調(diào)機器學習和人工智能之間并不能畫等號,畢竟機器學習實際上是研究算法的學科,而人工智能志在模擬人的思維和行為。

機器學習發(fā)展現(xiàn)狀的認識

機器學習與人工智能有著本質(zhì)上的不同,前者志不在模擬人的思維和行為,主要是想通過經(jīng)驗和交互的方式改善性能,是基于規(guī)則的學習。機器學習實際上是研究算法的學科,算法是基于數(shù)據(jù)型算法,然后反饋到數(shù)據(jù)中去。 可以簡單地把機器學習的過程看作這樣一個思路,然后可以基于此看看機器學習發(fā)展的歷程:

傳統(tǒng)方法:基于規(guī)則學習

機器學習就是現(xiàn)代統(tǒng)計學

第一個歷程是基于規(guī)則的學習,它的目的就是為了規(guī)則,有規(guī)則它就可以做預測。但是重點不是怎么形成規(guī)則,而是數(shù)據(jù)到表示,即通過認知的手段,把人對數(shù)據(jù)的認識過程,用計算機記錄下來。從而成一種形式化的方式,自然而然就有一種規(guī)則和邏輯的方式去做預測。它主要代表有兩個,一個是專家系統(tǒng),包括知識庫和推理基,其中重點就是知識庫。另外一個是句法模式識別,模式的目的也是怎么樣把一個對象通過一種形式化的方式表示出來。

但這一階段也暴露出一些問題,其一便是基于規(guī)則學習的方法雖然對于淺層推理比較有效,但遇上深層推理需求,如果形成規(guī)則過多,在其中搜索就容易出現(xiàn)前面的分享提到過的維數(shù)災難問題。

為了解決問題,一個用一個強大的非線性學習模型來弱化數(shù)據(jù)到表示過程的作用,基于這樣的理論,機器學習發(fā)展至第二個階段。

統(tǒng)計機器學習黃金發(fā)展的十年

機器學習就是現(xiàn)代統(tǒng)計學

第二階段是90年代中期到2005年左右十年的時間。在這一階段為了解決維數(shù)災難,出現(xiàn)了一個數(shù)論:即基于規(guī)則的方式,環(huán)成一個非線性的一種模型,或者用計算的手段運作模型,然后反過來可以弱化數(shù)據(jù)到表示的過程。

這一階段的神經(jīng)網(wǎng)絡(80 年代就已經(jīng)出現(xiàn)神經(jīng)網(wǎng)絡模型)則相對趨于比較低落的時期,表現(xiàn)平平,發(fā)展遇冷。主要原因在于時期的機器學習方法比神經(jīng)網(wǎng)絡要更為簡單,性能也要更好,屬性性質(zhì)相對完美,自然而然地就取代了神經(jīng)網(wǎng)絡。

但隨著統(tǒng)計方法發(fā)展到一定階段,大家發(fā)現(xiàn)“數(shù)據(jù)到表示”這件事情還是繞不過去。而應對這一問題地一個簡單的思路就是通過學習的途徑來求解表示問題,從而弱化研究者對于領域背景高度掌握的要求,也就是通過一個自動化的方式來解決這一問題。

基于深度表示的學習

機器學習就是現(xiàn)代統(tǒng)計學

大模型+大數(shù)據(jù)+大計算使得這種思路變得可行,機器學習也進入了第三階段。AlexNet 網(wǎng)絡的提出在后來為問題帶來了突破性進展,很多做計算機視覺的人在網(wǎng)絡方面不停跟進,這些發(fā)展主要是基于視覺的。

那么在機器翻譯、自然語言處理,自然而然也想到深度學習既然可以解決視覺問題,當然就可以把深度學習拿到機器學習來,所以現(xiàn)在在機器學習里面它的主要的模型也是基于深度。雖然模型可能不是卷積神經(jīng)網(wǎng)絡,但是核心確是LSTM這種東西。但是不管怎么樣,相對于機器學習,自然語言處理深度學習,在自然語言處理它的效果或者它的作用遠遠沒有那么好。

在上述時期,用深度學習它的目的還不是為了表示,主要是為了什么?還是為了非線性的擬合,在自然語言處理,個人理解目前為止還沒有找到一種非常有效的,像卷積神經(jīng)網(wǎng)絡有效表示圖像的網(wǎng)絡,所以導致自然語言處理沒有像圖像那么強大。

那這整個過程,知道都是在一個有監(jiān)督的方式里面去做的,本質(zhì)上就是把數(shù)據(jù)到表示用一個模型和計算的方式做。而表示到預測、決策也是通過模型計算的,整個可以看到從數(shù)據(jù)到預測是端到端的優(yōu)化學習過程。

深度學習目前現(xiàn)狀:無監(jiān)督問題突出

深度學習發(fā)展到現(xiàn)在,主要講是有監(jiān)督的學習,但是現(xiàn)在很多問題是無監(jiān)督的,就是無監(jiān)督的問題遠遠比有監(jiān)督的問題要多,而且要復雜。那么一個簡單的思想就是要把無監(jiān)督的問題要形成與有監(jiān)督類似的學習的過程,有一個優(yōu)化的過程,用機器學習的方法解決事情,在統(tǒng)計里面,現(xiàn)在假設X要生成它,那么如果X是連續(xù)的,可以假設X是高斯,但是如果X來自高斯假設很強,但是可以說X是來自什么?是一個高斯混合體,如果X是一個連續(xù)的向量,那它總是可以用一個高斯混合體去逼近它,是沒有任何問題的。

但是時候發(fā)現(xiàn)X是一個抽象的數(shù)學意識,并沒有具體的物理意義,那么自然神經(jīng)網(wǎng)絡這些技術能不能對一個圖像進行生成了,對語言進行生成,而不是對數(shù)學意義上的X去生成?,F(xiàn)在發(fā)展比如有一個生成對抗網(wǎng)絡,它就是解決這樣的問題,它的目的不是為了生成一個抽象數(shù)學意義上的X,是生成一個真正的圖像或者語言,那么它的框架實際上就是怎么樣形成一個優(yōu)化問題。

強化學習目前的復興是因為深度學習

另一個發(fā)展方向是強化學習,強化學習是什么呢?它利用規(guī)則與環(huán)境交互或者獎賞,然后形成一個學習優(yōu)化問題,形成一個優(yōu)化問題。

對于強化學習,不是最近才發(fā)明出來的。其主要的數(shù)學手段是馬爾可夫決策過程,它通過馬爾可夫決策過程去描述問題,描述問題之后要去解問題,發(fā)現(xiàn)問題最優(yōu)解,最后把它定成貝爾曼方程,那么解貝爾曼方程的話發(fā)現(xiàn)是可以用不動點定理來描述貝爾曼方程。那么有了不動點定理支撐,現(xiàn)在主要是有兩個思路,第一個思路是基于Value,也就是用Value迭代找到最優(yōu)值。另外一種就是Polic迭代,因為本質(zhì)上不是找Value,是找Polic,所以就直接在Polic方面去做迭代。

現(xiàn)在很多實際問題實際上對環(huán)境是不會已知的,也就是說對卷積概率是不會知道的。這時候發(fā)展就是一個所謂的Q-Learning,實際上Q-Learning定義了一個新的函數(shù)叫Q函數(shù)。那么在Q-Learning基礎上,就發(fā)展出來深度的Q網(wǎng)絡,目前現(xiàn)在主要做的比如像Polic的梯度方法,這是強化學習或者深度強化學習目前發(fā)展的一個主要結點。

機器學習的技術路線

機器學習有三個問題。一個是有監(jiān)督、無監(jiān)督和強化學習。原來認為機器學習是統(tǒng)計的分支,現(xiàn)在認為機器學習就是現(xiàn)代統(tǒng)計學。機器學習和統(tǒng)計還有微妙的關系,機器學習是分類問題,而統(tǒng)計是回歸問題,分類和回歸也沒有太本質(zhì)的區(qū)別。

第二,機器學習往往會形成優(yōu)化問題。剛才說要形成優(yōu)化過程,它跟優(yōu)化是什么區(qū)別?一個優(yōu)化的學者,或者優(yōu)化領域里面它純粹就關注找到最優(yōu)值。但是對于機器學習的學者來說,最緊急的是要找到預測數(shù)據(jù)。

現(xiàn)在看來,現(xiàn)代的機器學習它主要成功就在于表示,就是深度學習是一個表示,它不是單純的是一個非線性模型,主要是一個非線性的表示。當然想到機器學習它的目的是預測,而預測是通過計算得出。

但是深度學習也遇到很多挑戰(zhàn),第一個是需要大數(shù)據(jù)的要求,大家網(wǎng)絡是非常多,所以往往導致過參數(shù)的問題。另外就是在做表述是基于多層的表述,所以問題是高度的非凸化。

另外,現(xiàn)在機器學習要關注的重點問題有四個方面。第一個是可預測性、第二個可計算性、第三個是穩(wěn)定性、第四個就是可解釋性。可能現(xiàn)在認為主要重點就是在穩(wěn)定性和泛化性方面,因為覺得神經(jīng)網(wǎng)絡沒有可解釋性。

最后,張志華教授就機器學習和數(shù)學工程之間的關系給出了這樣的闡述:

統(tǒng)計為求解問題提供了數(shù)據(jù)驅(qū)動的建模途徑;

概率論、隨機分析、微分方程、微分流形等工具可以引入來研究 AI 的數(shù)學機理;

無論從統(tǒng)計角度還是從數(shù)學角度來研究 AI,其實際性能最后都要通過計算呈現(xiàn)出來:

1.數(shù)值分析,即求解連續(xù)數(shù)學問題的算法;

2.離散算法,即求解離散結構問題的算法;

3.大規(guī)模計算架構

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:北大張志華:機器學習就是現(xiàn)代統(tǒng)計學

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習賦能的智能光子器件系統(tǒng)研究與應用

    騰訊會議---六月直播 1.機器學習賦能的智能光子器件系統(tǒng)研究與應用 2.COMSOL聲學多物理場仿真技術與應用 3.超表面逆向設計及前沿應用(從基礎入門到論文復現(xiàn)) 4.智能光學計算成像技術
    的頭像 發(fā)表于 06-04 17:59 ?167次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>賦能的智能光子<b class='flag-5'>學</b>器件系統(tǒng)研究與應用

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    人工智能和機器學習以及Edge AI的概念與應用

    與人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發(fā)展與相關應用。 人工智能和機器學習現(xiàn)代科技的核心技術 人工智能(AI)和機器
    的頭像 發(fā)表于 01-25 17:37 ?931次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>以及Edge AI的概念與應用

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物數(shù)據(jù)的機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?454次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言領域的一個分支,它致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習(Machine
    的頭像 發(fā)表于 12-05 15:21 ?1981次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發(fā)表于 11-15 09:19 ?1214次閱讀

    什么是光子?

    包括發(fā)射、傳輸、偏轉(zhuǎn)和放大等過程。 光子的應用非常廣泛,從能源生產(chǎn)和檢測到電信和信息處理,無所不包。它對通信、醫(yī)療保健、導航和天文學等各個領域產(chǎn)生了重大影響,成為現(xiàn)代技術和科學認識的重要組成部分。 二、歷史背景
    的頭像 發(fā)表于 10-29 06:21 ?692次閱讀

    具身智能與機器學習的關系

    具身智能(Embodied Intelligence)和機器學習(Machine Learning)是人工智能領域的兩個重要概念,它們之間存在著密切的關系。 1. 具身智能的定義 具身智能是指智能體
    的頭像 發(fā)表于 10-27 10:33 ?1047次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數(shù)據(jù)中學習。
    發(fā)表于 10-24 17:22 ?2974次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機器學習
    發(fā)表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    提高機器學習模型效果與性能的過程。 而我對特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)集,而這個找出特征數(shù)據(jù)的過程就是信息提取。 隨后給出了一系列定義,包括特征的最小最大
    發(fā)表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    。 可以探索現(xiàn)象發(fā)展變化的規(guī)律,對某些社會經(jīng)濟現(xiàn)象進行預測。 利用時間序列可以在不同地區(qū)或國家之間進行對比分析,這也是統(tǒng)計分析的重要方法之一。 而《時間序列與機器學習》一書的后幾章分別介紹了時間序列在廣告
    發(fā)表于 08-11 17:55