機器學(xué)習(xí) (ML) 采用算法和統(tǒng)計模型,使計算機系統(tǒng)能夠在大量數(shù)據(jù)中找到規(guī)律,然后使用可識別這些模式的模型來預(yù)測或描述新數(shù)據(jù)。
什么是機器學(xué)習(xí)?其工作原理是什么?
簡而言之,機器學(xué)習(xí)就是訓(xùn)練機器去學(xué)習(xí),而不需要明確編程。機器學(xué)習(xí)作為 AI 的一個子集,以其最基本的形式使用算法來解析數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù),然后對現(xiàn)實世界中的某些內(nèi)容做出預(yù)測或判斷。
換句話說,機器學(xué)習(xí)使用算法從輸入到機器學(xué)習(xí)平臺的數(shù)據(jù)中自動創(chuàng)建模型。典型的程序化或基于規(guī)則的系統(tǒng)獲取程序化規(guī)則中的專家知識,但當(dāng)數(shù)據(jù)發(fā)生變化時,這些規(guī)則可能會變得難以更新和維護。機器學(xué)習(xí)的優(yōu)勢在于,它能夠從越來越多輸入算法的數(shù)據(jù)中學(xué)習(xí),并且可以給出數(shù)據(jù)驅(qū)動的概率預(yù)測。這種在當(dāng)今大數(shù)據(jù)應(yīng)用中快速有效地利用和應(yīng)用高度復(fù)雜算法的能力是一種相對較新的發(fā)展。
幾乎任何可以用數(shù)據(jù)定義的模式或一組規(guī)則來完成的離散任務(wù)都可以通過自動化方式進行,因此使用機器學(xué)習(xí)可以大大提高效率。這使得公司可以改變以前只有人工才能完成的流程,包括客戶服務(wù)電話路由以及履歷審查等等。
機器學(xué)習(xí)系統(tǒng)的性能取決于一些算法將數(shù)據(jù)集轉(zhuǎn)換為模型的能力。不同算法適用于不同問題和任務(wù),而這些問題的解決和任務(wù)的完成也取決于輸入數(shù)據(jù)的質(zhì)量以及計算資源的能力。
機器學(xué)習(xí)采用兩種主要技術(shù),將算法的使用劃分為不同類型:監(jiān)督式、無監(jiān)督式以及這兩種技術(shù)的組合。監(jiān)督式學(xué)習(xí)算法使用已標(biāo)記數(shù)據(jù),無監(jiān)督式學(xué)習(xí)算法在未標(biāo)記數(shù)據(jù)中找規(guī)律。半監(jiān)督式學(xué)習(xí)混合使用已標(biāo)記和未標(biāo)記數(shù)據(jù)。增強學(xué)習(xí)訓(xùn)練算法,基于反饋更大限度地利用獎勵。
監(jiān)督式學(xué)習(xí)
監(jiān)督式機器學(xué)習(xí)(也稱為預(yù)測分析)使用算法來訓(xùn)練模型,以在包含標(biāo)簽和特征的數(shù)據(jù)集中找規(guī)律。然后,它使用經(jīng)過訓(xùn)練的模型預(yù)測新數(shù)據(jù)集的特征標(biāo)簽。
監(jiān)督式學(xué)習(xí)可以進一步分為分類和回歸。
分類
分類根據(jù)已知項目的已標(biāo)簽示例來確定一個項目屬于哪個類別。邏輯回歸用于根據(jù)已知為/非欺詐交易的特征(交易金額、時間以及上次交易地點)來估計信用卡交易為欺詐交易的概率(標(biāo)簽)。
其他分類示例包括:
垃圾郵件檢測
文本情感分析
預(yù)測患者風(fēng)險、敗血癥或癌癥
回歸
回歸可估算目標(biāo)結(jié)果標(biāo)簽與一個或多個特征變量之間的關(guān)系,以預(yù)測連續(xù)數(shù)值。在下面的簡單示例中,線性回歸用于根據(jù)房屋面積(特征)估算房價(標(biāo)簽)。
回歸的其他示例包括:
預(yù)測欺詐數(shù)量
預(yù)測銷售額
監(jiān)督式學(xué)習(xí)算法包括:
邏輯回歸
線性回歸
支持向量機
決策樹
隨機森林
梯度提升決策樹
無監(jiān)督式學(xué)習(xí)
無監(jiān)督式學(xué)習(xí)(也稱為描述性分析)事先未提供已標(biāo)記數(shù)據(jù),因此有助于數(shù)據(jù)科學(xué)家發(fā)現(xiàn)先前未知數(shù)據(jù)規(guī)律。這些算法嘗試“學(xué)習(xí)”輸入數(shù)據(jù)中的固有結(jié)構(gòu),并發(fā)現(xiàn)相似性或規(guī)律性。常見的無監(jiān)督式任務(wù)包括聚類和關(guān)聯(lián)。
聚類
在聚類中,算法通過分析輸入示例之間的相似性將輸入分為不同類別。聚類的一個示例是,為了更好地定制產(chǎn)品和服務(wù),公司希望對其客戶進行細(xì)分??蛻艨梢园慈丝诮y(tǒng)計數(shù)據(jù)和購買記錄等特征進行分組。為了得到更有價值的結(jié)果,通常將無監(jiān)督式學(xué)習(xí)聚類與監(jiān)督式學(xué)習(xí)聚類相結(jié)合。
其他聚類示例包括:
搜索結(jié)果分組
對相似患者進行分組
文本分類
異常檢測(從集群中找出不相似的地方,即異常值)
關(guān)聯(lián)學(xué)習(xí)
關(guān)聯(lián)或頻繁模式挖掘可以在大型數(shù)據(jù)項集合中發(fā)現(xiàn)頻繁同時發(fā)生的關(guān)聯(lián)(關(guān)系、依賴關(guān)系)。一個同時發(fā)生的關(guān)聯(lián)示例是經(jīng)常一起購買的產(chǎn)品,例如有名的啤酒和紙尿褲。對購物者行為的分析發(fā)現(xiàn),購買紙尿褲的男性通常也會買啤酒。
無監(jiān)督式學(xué)習(xí)算法包括:
K-means
隱含狄利克雷分布 (LDA)
高斯混合模型 (GMM)
交替最小二乘法 (ALS)
FP 增長
機器學(xué)習(xí)的優(yōu)勢
機器學(xué)習(xí)對企業(yè)的好處是多種多樣的,包括:
以足夠及時的方式進行快速分析、預(yù)測和處理,使企業(yè)能夠快速做出基于數(shù)據(jù)的決策
通過快速識別高風(fēng)險患者、推薦一系列藥物以及預(yù)測再入院率,促進準(zhǔn)確的醫(yī)學(xué)預(yù)測和診斷
通過顯著減少由數(shù)據(jù)重復(fù)和其他不準(zhǔn)確造成的錯誤,簡化數(shù)據(jù)輸入中的時間密集型文檔,同時使工作人員擺脫繁重的數(shù)據(jù)輸入任務(wù)
提高金融規(guī)則和模型的精確度,促進投資組合管理;實現(xiàn)算法交易、貸款承銷,重要的是推進欺詐檢測
通過制定高效預(yù)測性維護計劃,提高預(yù)測性維護效率
改善客戶分割和生命周期價值預(yù)測,為營銷人員提供寶貴信息以優(yōu)化潛在客戶,更大限度地提高網(wǎng)絡(luò)流量,以及提高郵件和電子郵件活動的回報。
機器學(xué)習(xí)用例
加速計算和 ML 正推動醫(yī)療健康領(lǐng)域的智能計算。NVIDIA Clara 提供單一平臺,整合醫(yī)學(xué)影像、基因組學(xué)、患者監(jiān)控以及藥物研發(fā),并可將該平臺部署在嵌入式系統(tǒng)、邊緣、每個云端等任何地方,助力醫(yī)療健康行業(yè)進行創(chuàng)新并加快實現(xiàn)精準(zhǔn)醫(yī)療的目標(biāo)。
領(lǐng)先的零售商正利用 ML 來減少損耗、改善預(yù)測、實現(xiàn)倉庫物流自動化、確定店內(nèi)促銷活動和實時定價、為客戶提供個性化服務(wù)和建議,以及在實體店和網(wǎng)店提供更出色的購物體驗。
了解消費者行為對于零售商而言變得更為重要。為了推動發(fā)展,采用智能推薦進行個性化營銷。為提高收入,在線零售商使用由 GPU 提供支持的機器學(xué)習(xí) (ML) 和深度學(xué)習(xí) (DL) 算法來打造更快速、更準(zhǔn)確的推薦引擎。購物者的購買以及網(wǎng)絡(luò)操作歷史記錄為機器學(xué)習(xí)模型的分析提供了數(shù)據(jù),從而得出建議,并支持零售商在促銷方面所作的努力。
金融機構(gòu)正在采用 ML 來提供更智能、更安全的服務(wù)。GPU 驅(qū)動的 ML 解決方案可以在大量數(shù)據(jù)中識別關(guān)鍵見解,通過自動化減輕員工的日常任務(wù)負(fù)擔(dān),加速風(fēng)險計算和欺詐檢測,并借助更準(zhǔn)確的推薦系統(tǒng)改善客戶服務(wù)。
NVIDIA 提供預(yù)訓(xùn)練模型和軟件解決方案,可大幅簡化 ML 應(yīng)用程序。例如,NVIDIA Metropolis 平臺讓開發(fā)者能夠構(gòu)建 ML 應(yīng)用程序,以改進零售庫存管理、增強損失預(yù)防措施,并簡化消費者的結(jié)賬體驗。
作為一個實際示例,沃爾瑪利用 NVIDIA 的技術(shù)來管理員工工作流程,并確保某些商店的肉類和農(nóng)產(chǎn)品的新鮮度。同樣地,寶馬采用 NVIDIA 的先進 AI 解決方案,在其制造廠中自動進行光學(xué)檢查。中國移動運營著超大無線網(wǎng)絡(luò),利用 NVIDIA 的平臺通過 5G 網(wǎng)絡(luò)提供 AI 功能。
機器學(xué)習(xí)的重要意義
企業(yè)越來越受數(shù)據(jù)驅(qū)動:感知市場和環(huán)境數(shù)據(jù),并使用分析和機器學(xué)習(xí)來識別復(fù)雜模式、檢測變化,并做出直接影響利潤的預(yù)測。數(shù)據(jù)驅(qū)動型公司使用數(shù)據(jù)科學(xué)來管理和理解海量數(shù)據(jù)。
數(shù)據(jù)科學(xué)是每個行業(yè)的一部分。零售、金融、醫(yī)療健康和物流等行業(yè)的大型企業(yè)利用數(shù)據(jù)科學(xué)技術(shù)提高其競爭力、響應(yīng)速度和效率。廣告公司用它更有效地定位廣告。按揭貸款公司用它來準(zhǔn)確預(yù)測默認(rèn)風(fēng)險,以獲得最大收益。零售商用它來簡化供應(yīng)鏈。事實上,正是本世紀(jì)頭中期 Hadoop、NumPy、scikitlearn、Pandas 和 Spark 等開源、大規(guī)模數(shù)據(jù)分析和機器學(xué)習(xí)軟件的出現(xiàn),引發(fā)了這場大數(shù)據(jù)革命。
如今,數(shù)據(jù)科學(xué)和機器學(xué)習(xí)已成為全球超大的計算領(lǐng)域。預(yù)測機器學(xué)習(xí)模型的精度即便提升微小,最低也能帶來數(shù)十億的價值。預(yù)測模型訓(xùn)練是數(shù)據(jù)科學(xué)的核心。事實上,大部分?jǐn)?shù)據(jù)科學(xué) IT 預(yù)算都用于構(gòu)建機器學(xué)習(xí)模型,其中包括數(shù)據(jù)轉(zhuǎn)換、特征工程、訓(xùn)練、評估和可視化。要構(gòu)建更好的模型,數(shù)據(jù)科學(xué)家需要通過大量迭代進行訓(xùn)練、評估和再訓(xùn)練?,F(xiàn)今,這些迭代可能需要數(shù)天時間,這不僅會限制產(chǎn)品部署之前完成的迭代周期數(shù)量,還會影響最終結(jié)果的質(zhì)量。
在企業(yè)間運行分析和機器學(xué)習(xí)需要大量的基礎(chǔ)設(shè)施?!敦敻弧?00 強企業(yè)擴展計算能力,并投資數(shù)千臺 CPU 服務(wù)器以構(gòu)建大量數(shù)據(jù)科學(xué)集群。CPU 橫向擴展不再有效。每年,全球數(shù)據(jù)量都會翻倍,而隨著摩爾定律的終結(jié),CPU 計算也遭遇了瓶頸。GPU 擁有一個大規(guī)模并行架構(gòu),當(dāng)中包含數(shù)千個高效小核心,專為同時處理多重任務(wù)而設(shè)計。類似于科學(xué)計算和深度學(xué)習(xí)如何轉(zhuǎn)向 NVIDIA GPU 加速,數(shù)據(jù)分析和機器學(xué)習(xí)也將受益于 GPU 并行化和加速。
原文標(biāo)題:NVIDIA 大講堂 | 什么是機器學(xué)習(xí)?
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106418 -
gpu
+關(guān)注
關(guān)注
28文章
4948瀏覽量
131251 -
工作原理
+關(guān)注
關(guān)注
4文章
277瀏覽量
38294 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134628
原文標(biāo)題:NVIDIA 大講堂 | 什么是機器學(xué)習(xí)?
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
IGBT正弦波調(diào)光器的工作原理和優(yōu)勢

工業(yè)機器人工作站的建設(shè)意義
如何選擇云原生機器學(xué)習(xí)平臺
深入解析激光焊縫跟蹤器的工作原理與應(yīng)用優(yōu)勢

評論