99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習引發(fā)對科學見解的反思簡析

中科院半導體所 ? 來源:悅智網 ? 2023-03-03 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)學和物理是一對老朋友。長期以來,它們見證了技術發(fā)展的起落,包括計算尺、計算器和Wolfram Alpha等輔助工具。如今,隨著機器學習的最新進展應用于解決數(shù)學和物理問題,這些進展提出了一個根本性的問題:讓算法學會我們思考方式有何意義?

為什么要這么做?

“計算機非常擅長數(shù)學,指的是它們很擅長解決非常具體的問題?!惫雀柩芯吭旱臋C器學習專家蓋伊?古爾阿里(Guy Gur-Ari)說。計算機擅長運算,填入數(shù)字并計算是相對簡單的。但在形式結構之外,計算機則舉步維艱。

解決數(shù)學文字問題或“定量推理”看起來比較棘手,因為它需要更為穩(wěn)健和嚴密,而解決許多其他問題也許并不需要。雖然機器學習模型接受訓練的數(shù)據越多,產生的錯誤越少,但對于定量推理,改進的程度卻很有限。研究人員開始意識到,對于機器學習生成模型在解決語言文字問題時產生的錯誤,需要更有針對性的方法。

2021年,來自加州大學伯克利分校和OpenAI的兩個不同團隊分別發(fā)布了MATH和GSM8K兩個數(shù)據集,這兩個數(shù)據集包含了涉及幾何、代數(shù)和微積分基礎等的數(shù)千個數(shù)學問題?!拔覀兙褪窍胍纯矗瑪?shù)據集是否有問題?!痹?a target="_blank">人工智能安全中心研究MATH的研究員史蒂文?巴薩特(Steven Basart)說。用格式更好的、更大的數(shù)據集進行訓練,是否能夠修復機器學習定量推理的錯誤?MATH團隊發(fā)現(xiàn),定量推理對最高級的機器學習語言模型也頗具挑戰(zhàn),其得分不到7%。(人類研究生的得分為40%,而國際數(shù)學奧林匹克競賽冠軍的得分為90%。)

GSM8K數(shù)據集則是更簡單的小學階段問題,受訓模型的準確率達到了約20%。為了實現(xiàn)這種準確率,OpenAI的研究人員使用了兩種技術:精調和驗證。在精調中,研究人員采用一個包含不相關信息的預訓練語言模型,在訓練中僅展示相關信息(數(shù)學問題);驗證則允許模型重新審視其錯誤。

當時,OpenAI預測,需要使用100倍的數(shù)據對模型進行訓練,才能在GSM8K上達到80%的準確率。但2022年6月,谷歌的Minerva宣布,小規(guī)模擴大訓練即可實現(xiàn)78%的準確率。OpenAI的機器學習專家卡爾·科布(Karl Cobbe)說:“這超出我們所有的預期。”巴薩特表示同意,他說:“這太令人震驚了,我還以為要花很長的時間?!?br />
Minerva使用了谷歌自己的通路語言模型(PaLM),根據來自arXiv的科學論文和其他來源進行格式化數(shù)學精調。此外,幫助Minerva的還有另外兩個策略。在“思維鏈提示”中,要求Minerva將較大的問題分解為更容易接受的小問題。該模型還使用多數(shù)投票,而不是僅要它提供一個答案或將一個問題解算100次。在這些結果中,Minerva選出最常見的答案。

這些新策略帶來了巨大的好處。Minerva在MATH上實現(xiàn)了高達50%的準確率,在GSM8K上的準確率接近80%。在MMLU上也是這樣,MMLU是一個包含化學和生物的STEM普通問題集。對問題略微調整后隨機取樣,讓Minerva重新進行計算,其表現(xiàn)也很好,這表明,這個能力不僅源自記憶。

關于數(shù)學,Minerva了解哪些、不了解哪些,是很模糊的。這與數(shù)學家使用的帶有內置結構的“證明助手”不同,Minerva和其他語言模型沒有形式結構。它們可能會產生奇怪、混亂的推理,但仍然可得出正確的答案。隨著數(shù)字的增大,語言模型的準確度會下降,這對于可靠的老式TI-84 Plus計算器,是絕不會發(fā)生的。

“它到底是聰明?還是不聰明?”科布問。雖然像Minerva一樣的模型也許能夠得出與人類一樣的答案,但其遵循的實際過程可能完全不相同。另一方面,曾被要求“展示自己的作業(yè)”的學生都很熟悉“思維鏈提示”。

谷歌研究院的機器學習專家伊桑?戴爾(Ethan Dyer)說:“我認為人們有這樣一個概念,做數(shù)學的人有某種嚴格的推理系統(tǒng),在已知和未知之間有明顯的區(qū)別。”但人也可能得出不一致的答案、會犯錯誤和未能應用核心概念。在機器學習的這一前沿,邊界是模糊的。

像物理學家一樣思考

粒子物理的數(shù)據與眾不同。雖然已經證實卷積神經網絡(CNN)對樹木、貓和食物等日常物體圖片的分類非常高效,但它并不適合粒子碰撞。加州大學圣地亞哥分校的粒子物理學家哈維爾?杜爾特(Javier Duarte)表示,問題在于來自大型強子對撞機(LHC)的碰撞數(shù)據無法作為圖像。

華而不實地描述LHC碰撞可誤導甚至堵塞整個探測器。實際上,在數(shù)百萬個輸入中只有少量幾個輸入在記錄信號,就像白屏中有幾個黑色像素。這導致卷積神經網絡中的圖像質量很差,但在一個被稱為圖形神經網絡(GNN)的不同新框架中,效果則很好。

除了格式奇怪以外,還有大量的數(shù)據,大約為每秒約1拍字節(jié),其中只有少量高質量數(shù)據被保存下來。為了更好地篩選數(shù)據,研究人員想要訓練更敏銳的算法。杜爾特說,要想提高效率,這種算法要具備驚人的速度,在微秒內執(zhí)行。剪裁和量化等機器學習技術能使算法達到目標。

借助機器學習,粒子物理學家可以從不同的角度觀察數(shù)據。他們不僅關注單個事件,還學習和思考碰撞期間發(fā)生的幾十個其他事件,例如希格斯玻色子衰變?yōu)閮蓚€光子。雖然任意兩個事件之間沒有因果關系,但研究人員現(xiàn)在接受一個更全面的數(shù)據視圖,而不僅是單個事件分析得出的零碎視圖。

更引人注目的是,機器學習還迫使物理學家重新審視基本概念。麻省理工學院的理論粒子物理學家杰西?泰勒(Jesse Thaler)說:“過去,我自己對對稱性的看法不嚴密,強迫自己教授計算機什么是對稱,也是幫助自己理解對稱到底是什么?!睂ΨQ需要參考系,換言之,鏡子中變形的球體圖像到底是否對稱?如果不知道鏡子本身是否變形,就無法知道答案。

粒子物理學中的機器學習仍然處于早期階段,實際上,研究人員現(xiàn)在對待相關技術就像對待廚房的洗碗池。杜爾特承認:“它也許不適合粒子物理學中的每一個問題?!?br />
在一些粒子物理學家深入研究機器學習的同時,腦中浮現(xiàn)出一個令人不安的問題:他們是在研究物理學還是在研究計算機科學?往往不被視為“真正的物理學”的編程已經存在;類似的擔憂也在困擾機器學習。有的研究人員擔心機器學習會遮掩非常復雜的情況,他們正在構建算法,使用人類能夠理解的語言來提供反饋。而算法也許不是唯一負責溝通的主體。

泰勒說:“另一方面,我們希望機器能夠學習如何像物理學家那樣思考。我們也要多學習如何像機器那樣思考。我們需要學會講對方的語言?!?/p>







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 探測器
    +關注

    關注

    14

    文章

    2701

    瀏覽量

    74328
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103480
  • 計算機
    +關注

    關注

    19

    文章

    7657

    瀏覽量

    90687
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134532
  • GNN
    GNN
    +關注

    關注

    1

    文章

    31

    瀏覽量

    6551

原文標題:機器學習引發(fā)對科學見解的反思

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    2024年諾貝爾物理學獎為何要頒給機器學習

    (Geoffrey Hinton),表彰他們在使用人工神經網絡的機器學習方面的基礎性發(fā)現(xiàn)和發(fā)明。 ? 作為在科學界具有舉足輕重的地位和深遠影響的諾貝爾獎,它不僅是對科學家個人成就的最高
    的頭像 發(fā)表于 10-10 00:11 ?4400次閱讀

    Modbus與MQTT的區(qū)別

    Modbus和MQTT是工業(yè)領域中兩種不同的通信協(xié)議,在設計目標、應用場景、通信模式等方面存在顯著差異,以下從多個維度兩者的區(qū)別: 1.設計目標與起源 Modbus 誕生于1979年,由施耐德
    的頭像 發(fā)表于 07-10 14:10 ?109次閱讀

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?356次閱讀

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機器
    的頭像 發(fā)表于 12-30 09:16 ?1172次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?446次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?957次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發(fā)表于 11-15 09:19 ?1190次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數(shù)據中學習。
    發(fā)表于 10-24 17:22 ?2961次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    工業(yè)機器人集成滑環(huán)特點

    工業(yè)機器人也是滑環(huán)的重要應用領域
    的頭像 發(fā)表于 10-23 15:05 ?502次閱讀

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    、優(yōu)化等方面的應用有了更清晰的認識。特別是書中提到的基于大數(shù)據和機器學習的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據,實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人工智能在能源科學
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究中的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數(shù)據集,從而發(fā)現(xiàn)隱藏在數(shù)據中的模式和規(guī)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    AI引擎機器學習陣列指南

    云端動態(tài)工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數(shù)據科學家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應用的性能。AI 引擎機器學習擁有先進的張量計算能力,非常適合用于高度優(yōu)化的 AI 和 M
    的頭像 發(fā)表于 09-18 09:16 ?810次閱讀
    AI引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發(fā)揮巨
    發(fā)表于 08-12 11:21

    Scrum框架的模式、過程和見解

    電子發(fā)燒友網站提供《Scrum框架的模式、過程和見解.pdf》資料免費下載
    發(fā)表于 08-12 09:36 ?0次下載