經(jīng)驗告訴我們,組織規(guī)模與技術(shù)采用之間存在關(guān)系:更大,資源更豐富的企業(yè)通常會首先采用新技術(shù),而隨后是規(guī)模較小,資源受限的組織會緊隨其后(前提是,小型組織不在企業(yè)內(nèi)部)。技術(shù)業(yè)務(wù))。這種模式已經(jīng)在多種技術(shù)中重復了好幾代。但是,一旦較小的組織掌握了一項技術(shù),他們的創(chuàng)造力便會以前所未有的方式推動其發(fā)展。恰當?shù)睦樱簜€人計算機最初是在大型公司中部署的,主要用于文字處理和電子表格,但是在十年之內(nèi)被用于創(chuàng)作音樂,控制建筑物,前端復雜的醫(yī)療設(shè)備以及成千上萬的其他應(yīng)用程序。聯(lián)想
NetApp使用AI的漂亮描述作為數(shù)據(jù)管道。由于我們是合作伙伴,因此我將毫不客氣地竊取該描述。管道始于(1)在邊緣創(chuàng)建和攝取數(shù)據(jù),然后(2)移至位于中心的數(shù)據(jù)清理和準備階段,在此階段將其匯總為(3)訓練階段,這是資源消耗最大的階段。過程。如果數(shù)據(jù)是石油,則將培訓視為通過煉油廠生產(chǎn)石油。最后,(4)部署和推理階段,其中訓練后的數(shù)據(jù)以推理模式發(fā)送回邊緣,并收集更多數(shù)據(jù)以重新開始引入流水線。
我們的解決方案專注于關(guān)鍵的第三階段培訓。它是一種參考架構(gòu)(RA),它將配備了NVIDIA GPU的Lenovo ThinkSystem服務(wù)器和基于NetApp技術(shù)的Lenovo ThinkSystem存儲結(jié)合在一起。通過為客戶和合作伙伴提供“最佳配方”,聯(lián)想,NetApp和NVIDIA消除了配置和優(yōu)化培訓平臺的猜測。它可以作為單個向上擴展實例,其中多個用戶使用共享存儲在單個節(jié)點上運行作業(yè),也可以作為多節(jié)點向外擴展群集,其中在所有節(jié)點上依次執(zhí)行作業(yè),并且節(jié)點訪問共享存儲同時。這是一個關(guān)鍵的區(qū)別,因為大多數(shù)較小的組織都將從擴大規(guī)模開始,但最終可能會遷移到擴大規(guī)模的方法。
培訓,尤其是依賴于神經(jīng)網(wǎng)絡(luò)進行培訓的深度學習,可能需要數(shù)百GB的存儲空間,最多需要PB的存儲空間。在清理和準備階段,數(shù)據(jù)被組裝成大的,預(yù)打包的文件,例如TFRecords(TensorFlow記錄),然后依次讀取它們。對于利用GPU的任何工作負載而言,至關(guān)重要的是使它們不斷地處理數(shù)據(jù)。這使得系統(tǒng)范圍內(nèi)的吞吐量對于保持所有計算資源都至關(guān)重要。
責任編輯:lq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103693 -
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280169 -
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122811
發(fā)布評論請先 登錄
最新人工智能硬件培訓AI基礎(chǔ)入門學習課程參考2025版(離線AI語音視覺識別篇)
海思SD3403邊緣計算AI數(shù)據(jù)訓練概述
NetApp與Google Cloud合作,簡化云端高性能工作負載的擴展
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
數(shù)據(jù)采集在AI行業(yè)的應(yīng)用分析
NetApp革新塊存儲,賦能現(xiàn)代工作負載
AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍海

【NetApp數(shù)據(jù)恢復】NetApp存儲數(shù)據(jù)恢復案例#服務(wù)器數(shù)據(jù)恢復 #數(shù)據(jù)恢復 #netapp數(shù)據(jù)恢復
NetApp與Google Cloud深化合作,強化分布式云存儲
NetApp數(shù)據(jù)恢復—NetApp存儲WAFL文件系統(tǒng)下誤刪除的數(shù)據(jù)恢復案例
國內(nèi)常見的石油管道外徑測量方法?
聲波定位技術(shù)在地下管道中如何應(yīng)用
NetApp數(shù)據(jù)恢復—NetApp存儲誤刪除的數(shù)據(jù)恢復案例

評論