99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能中訓練和推理的區(qū)別是什么,需要關注哪些要點

wFVr_Hardware_1 ? 來源:硬件十萬個為什么 ? 作者:硬件十萬個為什么 ? 2022-12-16 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們在學習人工智能時常會遇到訓練(Training)和推理(Inference)兩個概念,這是人工智能實現(xiàn)的兩個環(huán)節(jié)。今天我們一起討論一下以下兩個問題。

訓練和推理的區(qū)別是什么?

區(qū)分人工智能訓練和推理芯片/產品需要關注哪些要點?

1、訓練和推理的區(qū)別是什么?

訓練過程:又稱學習過程,是指通過大數(shù)據(jù)訓練出一個復雜的神經網絡模型,通過大量數(shù)據(jù)的訓練確定網絡中權重和偏置的值,使其能夠適應特定的功能。在訓練中需要調整神經網絡權重以使損失函數(shù)最小,通過反向傳播來執(zhí)行訓練以更新每層中的權重。訓練過程需要較高的計算性能、需要海量的數(shù)據(jù)、訓練出的網絡具有一定通用性。

推理過程:又稱判斷過程,是指利用訓練好的模型,使用新數(shù)據(jù)推理出各種結論。推理是預測或推斷的過程,借助在訓練中已確定參數(shù)的神經網絡模型進行運算,利用輸入的新數(shù)據(jù)來一次性進行分類或輸出預測結果。

我們可以類比我們自己進行學習,并用自己學到的知識進行判斷的過程。學習的過程(訓練)是這樣的,當我們在學校開始學習一門新學科,為了掌握大量的知識,我們必須讀大量的書、專心聽老師講解,課后我們還要做大量的習題鞏固自己對知識的理解,并通過考試來驗證學習的結果,當我們考試通過后我們才算是完成了整個學習過程。每次考試,有的同學考分高,有的同學考分低,這個就是學習效果的差別了。當然,如果你不幸考試沒有通過,還要繼續(xù)重新學習,不斷提升你對知識的掌握程度,直到最終通過考試為止。而判斷的過程(推理)如下,我們應用所學的知識進行判斷,比如你從醫(yī)學專業(yè)畢業(yè),開始了你治病救人的工作,這時候你對病人病因的判斷就是你在做“推理”的工作,你診斷100個病人,其中99個你都能準確的判斷出病因,大家都夸你是一個好醫(yī)生,學有所成、判斷準確。

綜上,人工智能的這種訓練過程和推理過程,和人類大腦學習過程和判斷的過程非常相似。通常需要花很長時間來學習(即訓練),而學會之后進行判斷(即推理)的時間只需要一剎那就行了。

2、區(qū)分人工智能訓練和推理芯片/產品需要關注哪些要點? 根據(jù)承擔任務的不同,AI芯片/產品可以分為兩類,分別是訓練AI芯片和推理AI芯片,他們的主要區(qū)別是以下幾點。

(1)部署的位置不一樣

大量的訓練芯片都在云端,即部署于數(shù)據(jù)中心內,利用海量的數(shù)據(jù)和龐大而復雜的神經網絡進行模型訓練,這類芯片都很復雜。目前,除了英偉達、超威、英特爾等芯片公司,谷歌等這些互聯(lián)網公司都有云端訓練芯片,國內華為、寒武紀還有好多初創(chuàng)公司也在做云端訓練芯片。

很多的推理芯片也會放置在云端,數(shù)據(jù)中心中很多服務器都會配置推理用的PCIE插卡,還有大量的推理芯片用在邊緣側(各種數(shù)據(jù)中心外的設備),如自動駕駛汽車、機器人、智能手機無人機物聯(lián)網設備,它們都是用訓練好的模型進行推理。布局云端推理芯片和邊緣側推理芯片的公司更多,產品種類豐富,定制化程度也會高很多。

(2)性能要求不一樣

準確度/精度要求不一樣

我們從性能角度評價一個人工智能系統(tǒng)的效果,可以通過準確度/精度這樣的指標,比如在100個樣本中,能預測了 85 個樣本,準確率為 85%,人工智能 算法是基于概率論和統(tǒng)計學的,不可能達到 100% 的預測準確率,并且實現(xiàn)越高的準確度需要付出越大的努力和代價越大。我們經常提到的數(shù)據(jù)精度,也會直接影響系統(tǒng)準確性,我們可以把數(shù)據(jù)的精度類比為照片中的像素數(shù),像素越多則分辨率越高,同樣,精度越高,表征事物越準確。提高精度也是有代價的,它需要系統(tǒng)提供更多的內存,并要耗費更長的處理時間,比如有數(shù)據(jù)證明采用int4精度與int8相比具有59%的加速。

實際應用中,并不是準確度越高越好或支持的數(shù)據(jù)精度越高越好,不同的應用場景對于性能指標的要求也是不一樣的。以圖像識別應用為例,在零售店人員跟蹤中,識別經過某個過道的顧客,這種應用5% ~10%的誤差是可以接受的;但是在醫(yī)療診斷或汽車視覺的等應用中,準確度的要求就要高很多,準確度低了就無法應用。總之,不同應用對于準確度和精度的容忍度是不一樣的,需要我們進行權衡。

回到推理和訓練產品,選擇時就有很大區(qū)別,比如在邊緣側的推理產品中,由于它對準確度的要求不高,我們可能只要支持int8甚至更低的精度就可以了。但是訓練產品,比如用于高性能計算(HPC)場景中,必須有能力實現(xiàn)高的準確度,支持的數(shù)據(jù)精度范圍也需要更加豐富,比如需要支持FP32、FP64這樣精度的數(shù)據(jù)。10月7日美國對我國新一期的芯片限制法案中,就有一條是對我們支持FP64計算類芯片的研發(fā)和生產進行限制。

計算量要求不一樣

訓練需要密集的計算,通過神經網絡算出結果后,如果發(fā)現(xiàn)錯誤或未達到預期,這時這個錯誤會通過網絡層反向傳播回來(參考 機器學習中的函數(shù)(3) - “梯度下降”走捷徑,“BP算法”提效率 ),該網絡需要嘗試做出新的推測,在每一次嘗試中,它都要調整大量的參數(shù),還必須兼顧其它屬性。再次做出推測后再次校驗,通過一次又一次循環(huán)往返,直到其得到“最優(yōu)”的權重配置,達成預期的正確答案。如今,神經網絡復雜度越來越高,一個網絡的參數(shù)可以達到百萬級以上,因此每一次調整都需要進行大量的計算。曾在斯坦福大學做過研究,在谷歌和百度都任職過的吳恩達這樣舉例“訓練一個百度的漢語語音識別模型不僅需要4TB的訓練數(shù)據(jù),而且在整個訓練周期中還需要20 exaflops(百億億次浮點運算)的算力”,訓練是一個消耗巨量算力的怪獸。 推理是利用訓練好的模型,使用新數(shù)據(jù)推理出各種結論,它是借助神經網絡模型進行運算,利用輸入的新數(shù)據(jù)“一次性”獲得正確結論的過程,他不需要和訓練一樣需要循環(huán)往復的調整參數(shù),因此對算力的需求也會低很多。

存儲要求不一樣

訓練的時候反向調整會應用到前饋網絡計算的中間結果,所以需要很大的顯存,訓練的芯片存儲的設計和使用的方案是復雜的。訓練好的模型,需要使用大量數(shù)據(jù),大量數(shù)據(jù)要讀入顯存,顯存帶寬要足夠大、時延要足夠低。同時,我們在神經網絡的訓練中使用梯度下降算法,顯存中除了加載模型參數(shù),還需要保存梯度信息的中間狀態(tài),因此訓練相比于推理,顯存需求大大增加,顯存足夠大才能運轉起來。

綜上,訓練和推理的芯片/產品部署的位置不一樣,對于性能準確度和精度的要求不一樣,對于算力能力和存儲大小的要求也不一樣,除了這些關鍵指標差異外。用于訓練場景的芯片高精度、高吞吐量,因此單芯片功耗大(甚至可以達到300W),這種芯片成本也很高;用于云端推理的芯片,更加關注算力、時延等的平衡,對功耗成本也非常敏感。參考英偉達的產品,它每一代產品并沒有開發(fā)專門的推理卡,其使用的是訓練卡的低配版本來做推理的。但邊緣測應用推理芯片,就一定要結合應用場景,做到低功耗、低成本。

3、我們如何去學習理解人工智能里的訓練和推理?

要學習理解人工智能,訓練和推理相關的知識是必須都要掌握的,如果你只學習了“訓練”中如何搭建網絡,參數(shù)調整等,那么你就無法了解結合實際應用“推理”是如何發(fā)揮作用的,接不了地氣;同樣,如果你只做過“推理”的操作,那么你也不能理解在實現(xiàn)推理判斷之前,需要做哪些準備工作,進行大量的計算,才能訓練出一個可用的、好的神經網絡。 審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103596
  • 人工智能
    +關注

    關注

    1806

    文章

    49014

    瀏覽量

    249416

原文標題:人工智能中訓練和推理的區(qū)別是什么?

文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    云計算和人工智能有什么區(qū)別和聯(lián)系

    云計算和人工智能雖然各自具有獨特的特點和應用領域,但它們之間存在著緊密的聯(lián)系和互動。接下來,AI部落小編帶您了解云計算和人工智能區(qū)別與聯(lián)系。
    的頭像 發(fā)表于 02-06 10:08 ?508次閱讀

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體,使它們能夠感知、學習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠在人類社會中有效地提供商品及服務。 數(shù)據(jù)是一種貨幣化工具 數(shù)據(jù)是互聯(lián)網
    發(fā)表于 12-24 00:33

    人工智能推理及神經處理的未來

    人工智能行業(yè)所圍繞的是一個受技術進步、社會需求和監(jiān)管政策影響的動態(tài)環(huán)境。機器學習、自然語言處理和計算機視覺方面的技術進步,加速了人工智能的發(fā)展和應用。包括醫(yī)療保健、金融和制造業(yè)在內的各個行業(yè)對自動化
    的頭像 發(fā)表于 12-23 11:18 ?593次閱讀
    <b class='flag-5'>人工智能</b><b class='flag-5'>推理</b>及神經處理的未來

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應性和靈活性,能夠根據(jù)用戶需求進行定制化設計。它廣泛應用于各種
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    、優(yōu)化等方面的應用有了更清晰的認識。特別是書中提到的基于大數(shù)據(jù)和機器學習的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人工智能在能源科學
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感

    研究的進程。從蛋白質結構預測到基因測序與編輯,再到藥物研發(fā),人工智能技術在生命科學的各個層面都發(fā)揮著重要作用。特別是像AlphaFold這樣的工具,成功解決了困擾生物學界半個多世紀的蛋白質折疊問題,將
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)的模式和規(guī)律。 2. 高性能
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得

    的效率,還為科學研究提供了前所未有的洞察力和精確度。例如,在生物學領域,AI能夠幫助科學家快速識別基因序列的關鍵變異,加速新藥研發(fā)進程。 2. 跨學科融合的新范式 書中強調,人工智能的應用促進了多個
    發(fā)表于 10-14 09:12

    人工智能云計算是什么

    人工智能云計算,簡而言之,是指將人工智能技術與云計算平臺相結合,利用云計算的強大計算力、存儲能力和靈活可擴展性,來加速AI模型的訓練、推理和優(yōu)化過程,同時實現(xiàn)AI服務的廣泛部署和按需使
    的頭像 發(fā)表于 10-12 09:46 ?765次閱讀

    risc-v在人工智能圖像處理應用前景分析

    滿足人工智能圖像處理對于高性能、低功耗和特定功能的需求。 低功耗 : 在人工智能圖像處理,低功耗是一個重要的考量因素。RISC-V架構的設計使其在處理任務時能夠保持較低的功耗水平
    發(fā)表于 09-28 11:00

    智能制造與人工智能區(qū)別

    智能制造與人工智能在定義、技術組成、應用領域以及發(fā)展重點等方面存在明顯的區(qū)別
    的頭像 發(fā)表于 09-15 14:27 ?1962次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創(chuàng)新

    每個交叉領域,本書通過案例進行了詳盡的介紹,梳理了產業(yè)地圖,并給出了相關政策啟示。 《AI for Science:人工智能驅動科學創(chuàng)新》適合所有關注人工智能技術和產業(yè)發(fā)展的讀者閱讀,特別適合材料科學
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、煤科工、中國聯(lián)通、云天勵飛、考拉悠然、智航、力維智聯(lián)等國內人工智能企業(yè)的深度參與和大力支持。 報名后即可到現(xiàn)場領取禮品,總計5000份,先到先選! 點擊報名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    FPGA在人工智能的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練推理過程加速:FPGA可以用來加速深度學習的訓練
    發(fā)表于 07-29 17:05