99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)在現(xiàn)實世界中的真相

汽車玩家 ? 來源:AI公園 ? 作者:Delip ? 2020-05-04 11:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

當(dāng)你在現(xiàn)實世界中工作時,有幾個事實是你必須面對的,這也是本文的主要內(nèi)容。

上個月,我在一個親密的朋友聚會上做了一個非正式的演講,我把這個題目記下來。這篇文章主要是寫給那些使用機(jī)器學(xué)習(xí)來構(gòu)造東西的人,而不是那些研究機(jī)器學(xué)習(xí)的人,盡管后一組人會很好地傾聽這些真理并反省他們的工作。

0. 你不是一個科學(xué)家

是的,雖然你們的 title 是“科學(xué)家”,包括你們所有擁有博士學(xué)位的人,以及涉足這個行業(yè)的學(xué)者。但是,機(jī)器學(xué)習(xí)(以及其他人工智能應(yīng)用領(lǐng)域,如 NLP、視覺、語音……)是一門工程研究學(xué)科(與科學(xué)研究相對)。

你會問,科學(xué)研究和工程研究有什么區(qū)別?George A. Hazelrigg 在他的“HONING YOUR PROPOSAL WRITING SKILLS”中寫道:

一些科學(xué)家會學(xué)習(xí)如何制定研究計劃。很少有工程師是博士級別的工程師。讓我們先試著理解科學(xué)研究和工程研究之間的區(qū)別。對我來說,區(qū)別很明顯??茖W(xué)家力圖了解大自然的本質(zhì),以了解其根本的本質(zhì)。為了做到這一點(diǎn),科學(xué)家通常剝離無關(guān)的影響,深入到一個非常狹窄的自然元素。這就是我們所說的自然法則:能量和質(zhì)量是一樣的,每一個作用力都有一個大小相等、方向相反的反作用力,依此類推。有許多自然法則,它們隨時隨地都適用。工程師遵循自然法則。他們別無選擇。他們的目標(biāo)是設(shè)計出在自然允許的范圍內(nèi)工作的東西。要做到這一點(diǎn),他們必須能夠預(yù)測系統(tǒng)的行為。所以工程師們面臨的一個大問題是,我們?nèi)绾卫斫夂皖A(yù)測一個系統(tǒng)的行為,在這個系統(tǒng)中,所有的自然法則在任何時候都適用于任何地方。這是一個整合的問題,它就像找到一開始的規(guī)律一樣困難。每時每刻把所有的自然規(guī)律都考慮進(jìn)去是不可能的。因此,工程師必須找到方法來確定哪些定律是重要的,哪些可以忽略,以及如何近似那些在時間和空間上都很重要的定律。工程師不僅僅是預(yù)測未來。他們做出的決定部分是基于他們的預(yù)測,因為他們知道自己的預(yù)測不可能既準(zhǔn)確又確定。理解和應(yīng)用數(shù)學(xué)也很重要。這包括概率論、決策理論、博弈論、最優(yōu)化、控制理論和其他數(shù)學(xué)在工程決策環(huán)境中的應(yīng)用。這也是一個合理的工程研究領(lǐng)域。

作為 ML 的研究人員和實踐者,你必須考慮你擁有的數(shù)據(jù)的正確模型,而不是你擁有的模型的正確數(shù)據(jù)集(就像許多研究論文一樣)。如果你曾經(jīng)問過“這個模型的正確數(shù)據(jù)集是什么”,那么你并不是在現(xiàn)實世界中。到底什么是真實的世界?在現(xiàn)實世界中,你對要處理的數(shù)據(jù)是沒有選擇的。在這里,數(shù)據(jù)定義了問題,而不是相反。有時,在現(xiàn)實世界中,ML 實踐者創(chuàng)建了一個自己的世界作為他們的建模游樂場,從而假裝他們是“科學(xué)家”,例如“發(fā)明”一種用于做 NLP 的語言,或者通過簡化假設(shè)來創(chuàng)建封閉的環(huán)境來強(qiáng)化學(xué)習(xí)。這些研究得出了有趣的結(jié)果,但它們的范圍僅限于它們所來自的世界,即使研究人員喜歡在論文中把它們當(dāng)作適用于現(xiàn)實世界的東西來兜售。在現(xiàn)實世界中,輸入的分布更有可能發(fā)生變化,長尾的“curve balls”不知從何而來,你并不總是有答案。

當(dāng)你在現(xiàn)實世界中工作時,有幾個事實是你必須面對的,這也是本文的主要內(nèi)容。但這個開場白是必不可少的。如果你在現(xiàn)實世界中做 ML 研究,你是工程師而不是科學(xué)家。

1. 需要可以工作

雖然這聽起來很簡單,但我很驚訝有多少人,不管是新手還是有經(jīng)驗的人,都被一些聽起來很花哨的名字吸引住了,或者因為一些東西來自 DeepMind、OpenAI、斯坦福大學(xué)、麻省理工學(xué)院等等。如果你的模型確實只能夠在它們的環(huán)境和資源約束下處理他們的數(shù)據(jù)集和,那么現(xiàn)實世界將無情地拒絕它。arXiv 上的許多結(jié)果只能在少數(shù)數(shù)據(jù)集上工作,或者只能在只有谷歌基礎(chǔ)設(shè)施支持的百兆級 gpu 上工作。幫社區(qū)一個忙,不要再發(fā)布那些一般性的結(jié)果了。它必須能工作。這也是為什么我們今天不考慮在沒有卷積神經(jīng)網(wǎng)絡(luò)計算機(jī)視覺中做任何事情,或者為什么我們很容易在序列模型中使用注意力的原因。它必須要能工作。

推測:這么多人,特別是 ML 的新手,被花哨的模型名稱沖昏了頭腦,迫不及待地想要嘗試它們,或者寫關(guān)于它們的博客帖子,等等。我覺得這就像一個初學(xué)寫作的人。他們認(rèn)為使用華麗的詞語會使他們的寫作更好,但經(jīng)驗會告訴他們其他的。

2. 無論你如何努力,無論你的優(yōu)先級是什么,你都不能提高光速

緩存層次結(jié)構(gòu)已經(jīng)是固定的,你必須在這個前提下工作,網(wǎng)絡(luò)開銷會讓分布式訓(xùn)練變慢,在向量中只能塞入那么多內(nèi)容,等等。

3. 只要有足夠的推力,豬就能飛得很高,然而,這并不一定是一個好主意

一個研究生或大型的超參數(shù)掃描器可以在一個巨大的數(shù)據(jù)中心中可以找到一組超參數(shù),可以讓非常復(fù)雜的模型工作得很好,甚至產(chǎn)生優(yōu)秀的結(jié)果。但沒有人在現(xiàn)實世界中調(diào)試那么大的模型。我在幫助公司管理他們的 ML 團(tuán)隊時發(fā)現(xiàn)了一個秘密 — 大多數(shù)人不知道/不關(guān)心超參數(shù)調(diào)優(yōu)。

4. 生活中的一些事情,除非親身經(jīng)歷過,否則永遠(yuǎn)不會被完全欣賞或理解

對于既不構(gòu)建生產(chǎn) ML 模型也不維護(hù)它們的人來說,機(jī)器學(xué)習(xí)中的某些東西是永遠(yuǎn)無法完全理解的。再多的課件,再多的 mooc,再多的 Kaggling,都無法讓你為此做好準(zhǔn)備。沒有什么可以替代部署模型、觀察用戶與模型的交互、處理代碼/模型分解等等。

5. 總是有可能將多個獨(dú)立的問題聚合成一個復(fù)雜的相互依賴的解決方案,在大多數(shù)情況下,這是一個壞主意

端到端學(xué)習(xí)在理論上聽起來是一個好主意,但是對于大多數(shù)部署場景,分段優(yōu)化的管道架構(gòu)將繼續(xù)存在。這并不意味著我們將完全沒有端到端系統(tǒng)(語音識別和機(jī)器翻譯有很好的端到端生產(chǎn)價值解決方案),但在大多數(shù)情況下,具有可觀察的調(diào)試路徑將勝過其他選擇。

6. 把一個問題轉(zhuǎn)移到別處,甚至是忽略它,都比解決它要容易得多

例如,在語音方面,聲學(xué)建模是困難的,但是你可以讓網(wǎng)絡(luò)在解決不同問題(例如語音識別)的方法中找出這些細(xì)節(jié)。在 NLP 中,很難進(jìn)行正確的解析。但值得慶幸的是,對于 99%的現(xiàn)實任務(wù),我們可以不進(jìn)行解析。

推論:除非迫不得已,否則不要解決問題。

7. 你總是要在一些事情上做權(quán)衡

速度 vs 內(nèi)存,電池壽命 vs 準(zhǔn)確性,公平性 vs 準(zhǔn)確性,易于實現(xiàn) vs 可維護(hù)性,……

8. 一切都比你想象的復(fù)雜

與購物時的價格沖擊類似,工作中也有“努力沖擊”。大多數(shù)經(jīng)驗豐富的研究人員和工程師都經(jīng)歷過“努力沖擊”,要么是因為他們低估了處理大型數(shù)據(jù)集的工程問題,要么是因為他們低估了正在與之搏斗的領(lǐng)域的復(fù)雜性,要么是因為他們低估了對手。大多數(shù)論文讓讀者讀起來覺得事情很簡單,而忽略了這背后是經(jīng)過了幾百萬次失敗才有的成功。因此,論文不是研究,而是做研究的結(jié)果。因為這個原因,你永遠(yuǎn)可能通過閱讀論文來體驗做研究的過程。

9. 你永遠(yuǎn)都會是準(zhǔn)備不足

這可以和第 8 點(diǎn)結(jié)合起來,事實上任何遠(yuǎn)程調(diào)用的成功的模型如果沒有適當(dāng)?shù)挠媱潱伎赡苡捎谧陨淼某晒Χ罎ⅰ?/p>

10. 一個尺碼不可能適合所有人,你的模型會一直犯令人尷尬的錯誤,盡管你的出發(fā)點(diǎn)是好的

角落案例和長尾失敗模式將困擾你。值得慶幸的是,對于許多非關(guān)鍵的 ML 部署來說,這并不是什么大問題。最壞的情況下,它會成為一條搞笑的推文。但是,如果你在醫(yī)療保健或其他高風(fēng)險情況下工作,ML 部署將因此成為一場噩夢。

11. 每一個舊的想法都會以不同的名字和不同的形式被再次提出,不管它是否有效

Schimdhuber 可能提出了一個更大的觀點(diǎn)。沒有人聽他的,像他一樣,我們把舊酒重新裝進(jìn)新瓶子,被迫重復(fù)錯誤的歷史。

12. 達(dá)到完美不是因為沒有什么可以補(bǔ)充的,而是因為沒有什么可以去掉的

生活中的每件事都是如此,現(xiàn)實世界中的機(jī)器學(xué)習(xí)也是如此。唉,我們的會議回顧了他們對“新穎性”的嗜好,產(chǎn)生了不想要的 arxi -spam,其中包含了大量本來就不需要存在的垃圾。除非做“科學(xué)”能夠鼓勵宣傳什么是有效的,而不是什么是新的,否則我不認(rèn)為這種情況會改變。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA機(jī)器學(xué)習(xí)的具體應(yīng)用

    ,越來越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)。本文將探討 FPGA 機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-16 15:34 ?206次閱讀

    機(jī)器人測試:從虛擬到現(xiàn)實,機(jī)器人如何才能變成真正的打工牛馬?

    從虛擬世界的算法優(yōu)化,到現(xiàn)實的 “抗造” 考驗,再到細(xì)節(jié)處的容錯能力,機(jī)器人的每一輪測試,本質(zhì)上都是模仿人類 “打工人” 的成長路徑:先
    的頭像 發(fā)表于 07-11 09:16 ?352次閱讀
    <b class='flag-5'>機(jī)器</b>人測試:從虛擬到<b class='flag-5'>現(xiàn)實</b>,<b class='flag-5'>機(jī)器</b>人如何才能變成真正的打工牛馬?

    使用英偉達(dá) NVIDIA Air 服務(wù)將仿真與現(xiàn)實世界連接

    優(yōu)勢之一是能夠?qū)⒛姆抡媾c現(xiàn)實世界連接起來。通過啟用外部連接,可以您的環(huán)境顯著增強(qiáng)其功能、性能和靈活性。通過集成云資源、API、第三方數(shù)據(jù)、協(xié)作工具或高級
    的頭像 發(fā)表于 07-07 19:41 ?375次閱讀
    使用英偉達(dá) NVIDIA Air 服務(wù)將仿真與<b class='flag-5'>現(xiàn)實</b><b class='flag-5'>世界</b>連接

    人工智能之機(jī)器學(xué)習(xí)推薦系統(tǒng)的應(yīng)用

    機(jī)器學(xué)習(xí)推薦系統(tǒng)中發(fā)揮著關(guān)鍵作用,提升用戶體驗和業(yè)務(wù)價值。 協(xié)同過濾算法是常用方法?;谟脩粜袨閿?shù)據(jù),如購買記錄、瀏覽歷史,計算用戶或物品間相似度。比如,用戶 A 和用戶 B 購買過很多相同商品
    的頭像 發(fā)表于 01-21 16:19 ?504次閱讀

    NVIDIA技術(shù)推動機(jī)器人仿真

    借助機(jī)器人仿真,開發(fā)人員能夠基于物理學(xué)的現(xiàn)實世界數(shù)字呈現(xiàn)機(jī)器人進(jìn)行虛擬訓(xùn)練、測試和驗證。
    的頭像 發(fā)表于 01-03 14:10 ?485次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。本文中,我們會介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)具身人工智能的價值

    100 倍 。此外,Sim2Real 技術(shù)的進(jìn)步也促進(jìn)了技能與知識從模擬環(huán)境到實際應(yīng)用的轉(zhuǎn)移。這項技術(shù)虛擬空間中訓(xùn)練機(jī)器人和 AI 系統(tǒng),使它們能夠安全有效地學(xué)習(xí)任務(wù),而不受現(xiàn)實
    發(fā)表于 12-24 00:33

    zeta機(jī)器學(xué)習(xí)的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    探討ZETA機(jī)器學(xué)習(xí)的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時,需要明確的是,ZETA一詞不同領(lǐng)域可能
    的頭像 發(fā)表于 12-20 09:11 ?1123次閱讀

    cmp機(jī)器學(xué)習(xí)的作用 如何使用cmp進(jìn)行數(shù)據(jù)對比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個術(shù)語可能并不是一個常見的術(shù)語,它可能是指"比較"(comparison)的縮寫。 比較機(jī)器
    的頭像 發(fā)表于 12-17 09:35 ?878次閱讀

    傅立葉變換機(jī)器學(xué)習(xí)的應(yīng)用 常見傅立葉變換的誤區(qū)解析

    傅里葉變換機(jī)器學(xué)習(xí)的應(yīng)用 傅里葉變換是一種將信號分解為其組成頻率分量的數(shù)學(xué)運(yùn)算,它在機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-06 17:06 ?1060次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計算機(jī)系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”計算機(jī)系統(tǒng)主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    eda機(jī)器學(xué)習(xí)的應(yīng)用

    機(jī)器學(xué)習(xí)項目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過程不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器
    的頭像 發(fā)表于 11-13 10:42 ?891次閱讀

    魯棒性機(jī)器學(xué)習(xí)的重要性

    金融風(fēng)險評估。這些應(yīng)用場景對模型的魯棒性提出了極高的要求。 魯棒性的定義 魯棒性通常被定義為系統(tǒng)面對不確定性和變化時仍能保持其功能的能力。機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-11 10:19 ?1259次閱讀

    具身智能與機(jī)器學(xué)習(xí)的關(guān)系

    (如機(jī)器人、虛擬代理等)通過與物理世界或虛擬環(huán)境的交互來獲得、發(fā)展和應(yīng)用智能的能力。這種智能不僅包括認(rèn)知和推理能力,還包括感知、運(yùn)動控制和環(huán)境適應(yīng)能力。具身智能強(qiáng)調(diào)智能體的身體和環(huán)境智能發(fā)展
    的頭像 發(fā)表于 10-27 10:33 ?1047次閱讀

    NVIDIA Isaac Lab訓(xùn)練四足機(jī)器人運(yùn)動

    由于涉及復(fù)雜的動力學(xué),為四足機(jī)器人制定有效的運(yùn)動策略是機(jī)器人領(lǐng)域面臨的重大挑戰(zhàn)。現(xiàn)實世界訓(xùn)練
    的頭像 發(fā)表于 09-06 14:48 ?1741次閱讀
    <b class='flag-5'>在</b>NVIDIA Isaac Lab<b class='flag-5'>中</b>訓(xùn)練四足<b class='flag-5'>機(jī)器</b>人運(yùn)動