99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)「黃氏定律」讓未來的AI算力每年能夠提升一倍

454398 ? 來源:機(jī)器之心 ? 作者:李澤南 ? 2020-12-20 07:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年的 GTC China 黃仁勛沒有露面,但黃式定律無處不在。

從翻倍提高 TensorCore 計(jì)算效能的新技術(shù),到下一代光通信技術(shù),再到一行代碼為所有模型提供 GPU 加速的軟件工具,為了讓未來的 AI 算力每年能夠提升一倍,英偉達(dá)找到了不少新方向。

12 月 15 日上午,英偉達(dá) GTC 大會(huì)中國站在線上舉行,全球最負(fù)盛名的計(jì)算機(jī)科學(xué)家之一、NVIDIA 研究院負(fù)責(zé)人 Bill Dally 在活動(dòng)中發(fā)表了主題演講。

科技領(lǐng)域里,很多人都知道摩爾定律:前英特爾 CEO 大衛(wèi)·豪斯(David House)曾提出,人類制造出的芯片,每 18 個(gè)月計(jì)算效率就會(huì)提高一倍。這一「規(guī)律」在過去長達(dá)五十年間一直被實(shí)踐驗(yàn)證,但在最近五六年中,由于晶體管尺寸越來越小,制程陷入瓶頸,摩爾定律逐漸失效。

而另一方面,人類對(duì)于計(jì)算機(jī)的算力需求是無限的,人工智能技術(shù)的發(fā)展更是加大了這種需求。近十年來,GPU正在讓人工智能算法的性能每年都在成倍提升,英偉達(dá)的研究人員通過架構(gòu)的提升,正在不斷尋找進(jìn)一步加快AI推理速度的芯片。

英偉達(dá)提出了以自己創(chuàng)始人黃仁勛名字命名的黃氏定律(Huang’s Law)對(duì)單芯片AI推理能力進(jìn)行了預(yù)測(cè),提出每 12 月其數(shù)字將翻一倍。

如果我們還需要在未來的一段時(shí)間里使用硅芯片,那么摩爾定律之后,我們還可以仰賴「黃氏定律」保持AI技術(shù)的發(fā)展速度。

在芯片本身無法快速提升的情況下,英偉達(dá)把目光轉(zhuǎn)向了計(jì)算架構(gòu)的很多其他方面,Bill Dally 認(rèn)為「這些方向其中的任何一個(gè)如果有效,都可以在接下來幾代的產(chǎn)品中幫助我們延續(xù)性能每年提升一倍的目標(biāo)。」

首先是單卡計(jì)算效率。即使是英偉達(dá)目前的二代 Tensor Core,在進(jìn)行推理時(shí)也無法把所有功耗用在數(shù)學(xué)運(yùn)算上——效率被浪費(fèi)在了數(shù)據(jù)傳輸上。英偉達(dá)設(shè)計(jì)了 MAGNet 系統(tǒng),用于探索更為高效的芯片架構(gòu)設(shè)計(jì)。

如果可以通過一個(gè)全局控制器,把數(shù)據(jù)從內(nèi)存不同的部分移動(dòng)到不同計(jì)算單元以執(zhí)行計(jì)算,并針對(duì)神經(jīng)網(wǎng)絡(luò)計(jì)算的特性在數(shù)據(jù)流中加入一個(gè)存儲(chǔ)層,便可以解除瓶頸,將大部分能量用于計(jì)算。在特定的單元上,英偉達(dá)尚未發(fā)布的硬件產(chǎn)品可以實(shí)現(xiàn)每瓦 100 Teraops 的推理能力,而在 2019 年達(dá)到的效率還只有 29 Teraops。

看來下一代的 Tensor Core 性能又要有巨大的提升了。

其次是多卡的數(shù)據(jù)傳輸,英偉達(dá)的 GPU 通過 NVlink 和 NVswitch 互相連接,然而基于電信號(hào)的方式目前已經(jīng)接近極限了,人們預(yù)估,想要繼續(xù)讓 NVLink 中信號(hào)傳輸?shù)膸捗看嵘槐叮瑢⒆兊脴O其困難。目前英偉達(dá)能夠?qū)崿F(xiàn)的數(shù)字是每線對(duì) 50Gb/s,可預(yù)見的未來大約可以實(shí)現(xiàn)到 100-200Gb/s。英偉達(dá)也在和英特爾等科技巨頭一樣思考如何盡快把基于光學(xué)通信技術(shù)應(yīng)用于實(shí)踐。

作為一名研究者,Bill Dally 曾牽頭研發(fā)英偉達(dá)對(duì)于光信號(hào)傳輸?shù)脑妇埃汗馔ㄐ挪粌H可以大幅度提升帶寬(從幾百 Gb/s 到幾 Tb/s),提升傳輸空間(從幾十厘米到 20-100 米)并減少系統(tǒng)的復(fù)雜程度。

在英偉達(dá)的設(shè)計(jì)中,DGX 卡縱置排列,右側(cè)為光源,可為光線提供多種不同波長的光線,光學(xué)引擎以極高的數(shù)據(jù)速率把光轉(zhuǎn)換為信號(hào)。每根光纖都可以同時(shí)傳輸不同波長的光,而每種波長的光都可以用 25-50Gb/s 的速度傳輸信號(hào)。這樣一來,總數(shù)據(jù)速率將為 400Gb/s,而每根光纖的傳輸速率「保守估計(jì)」就可以達(dá)到數(shù)個(gè) Tb/s,而且能耗還要比電信號(hào)要小。英偉達(dá)的研究團(tuán)隊(duì)正在與哥倫比亞大學(xué)的研究人員密切合作,探討如何利用電信供應(yīng)商在其核心網(wǎng)絡(luò)中所采用的技術(shù),通過一條光纖來傳輸數(shù)十路信號(hào)——有了光通信,僅需一條 NVLink 就可以連接規(guī)模更大的系統(tǒng)。

英偉達(dá)還在嘗試一種名為「密集波分復(fù)用」的技術(shù), 有望在僅一毫米大小的芯片上實(shí)現(xiàn) Tb/s 級(jí)數(shù)據(jù)的傳輸,是如今互連密度的十倍以上。

除了更大的吞吐量,光鏈路也有助于打造更為密集型的系統(tǒng)。Dally 舉例展示了一個(gè)未來將搭載 160 多個(gè) GPU 的 NVIDIA DGX 系統(tǒng)模型。

除了硬件方面的革新,還有軟件。今天有很多應(yīng)用都在被 GPU 加速,遠(yuǎn)超英偉達(dá)開發(fā)者們更新 CUDA 程序的速度,人們急需一種簡化的編程方式。NVIDIA 的研究人員開發(fā)了全新編程系統(tǒng)原型 Legate。開發(fā)者借助 Legate,即可在任何規(guī)模的系統(tǒng)上,運(yùn)行針對(duì)單一 GPU 編寫的程序——甚至適用于諸如 Selene 等搭載數(shù)千個(gè) GPU 的巨型超級(jí)計(jì)算機(jī)。

對(duì)于大多數(shù)人來說,使用 Legate 我們就可以無需更改代碼即讓 Python 程序無感運(yùn)行在從 Jetson Nano 到 DGX SuperPOD 等所有包含英偉達(dá) cuda 核心的設(shè)備上。開發(fā)者所做的是基于原始的 Python 代碼,將原本的「import NumPy as NP」更改為「import legate.numpy as NP」就可以了。隨后 Legate 庫會(huì)開始運(yùn)行,自動(dòng)完成之后的操作。

它的運(yùn)行速率有多快呢?從上表中可以看到,Legate 的處理速度不僅快于目前效率最高的庫,同時(shí)在并行化時(shí)也能盡量保持住自己的優(yōu)勢(shì)。

英偉達(dá)也分享了目前國內(nèi)合作伙伴使用新一代芯片的情況:阿里云、百度智能云、滴滴云、騰訊云的大型數(shù)據(jù)中心正在遷移至基于英偉達(dá) Ampere 架構(gòu)的平臺(tái)。圖像識(shí)別、語音識(shí)別,以及包括計(jì)算流體動(dòng)力學(xué)、計(jì)算金融學(xué)、分子動(dòng)力學(xué)在內(nèi)的 GPU 加速高性能計(jì)算場(chǎng)景的快速增長,催生了更多對(duì)云實(shí)例的需求。

在硬件方面,新華三、浪潮、聯(lián)想、寧暢等中國領(lǐng)先系統(tǒng)制造商也在將 A100 GPU 引入到自身產(chǎn)品中,并推出了多款針對(duì)不同應(yīng)用場(chǎng)景的系列產(chǎn)品,為超大型數(shù)據(jù)中心提供基于 Ampere 架構(gòu)的加速系統(tǒng),進(jìn)而為用戶提供兼具超強(qiáng)性能與靈活性的 AI 計(jì)算平臺(tái)。
編輯:hfy
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4945

    瀏覽量

    131230
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7662

    瀏覽量

    90792
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35138

    瀏覽量

    279802
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3952

    瀏覽量

    93758
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    2024年3月19日,[英偉達(dá)]CEO[仁勛]在GTC大會(huì)上公布了新AI芯片架構(gòu)BLACKWELL,并推出基于該架構(gòu)的超級(jí)芯片GB20
    發(fā)表于 05-13 17:16

    【AD新聞】AI時(shí)代,美元能夠買到多強(qiáng)的?

    當(dāng)真正需要在嵌入式終端設(shè)備中使用AI技術(shù)時(shí),客戶的訴求更多的集中在功耗、響應(yīng)時(shí)間、成本等方面,對(duì)性能的無盡追求反而不是重點(diǎn),這和很多人之前的預(yù)想并不致?;?b class='flag-5'>一美元或瓦電能買到多強(qiáng)的
    發(fā)表于 03-23 15:27

    英偉達(dá)GPU慘遭專業(yè)礦機(jī)碾壓,仁勛宣布砍掉加密貨幣業(yè)務(wù)!

    加密貨幣專用產(chǎn)品上的預(yù)期營收降至1億美元,實(shí)際營收只有1800萬美元。預(yù)計(jì)未來業(yè)務(wù)對(duì)公司的貢獻(xiàn)可以忽略不計(jì)?!?b class='flag-5'>英偉達(dá)CEO仁勛也做出類
    發(fā)表于 08-24 10:11

    英偉達(dá)DPU的過“芯”之處

    AI硬件正成為越來越多數(shù)據(jù)中心擴(kuò)容建設(shè)的關(guān)鍵所在。當(dāng)超強(qiáng)AI成為數(shù)據(jù)中心的剛需,英偉達(dá)GP
    發(fā)表于 03-29 14:42

    英偉達(dá)嵌入式電腦可為機(jī)器人設(shè)計(jì)引入AI

    英偉達(dá)在硅谷召開了GTC 2019主題演講,英偉達(dá) CEO仁勛發(fā)表演講,正式發(fā)布了機(jī)器人開發(fā)者工具箱Jetson Nano,可以為機(jī)器人設(shè)
    發(fā)表于 08-12 17:09 ?1094次閱讀

    英偉達(dá)正式發(fā)布NVIDIA A100,擁有比原來強(qiáng)大20AI

    GPU,為此前在網(wǎng)上盛傳的,被稱為安培(Ampere)的產(chǎn)品。公司創(chuàng)始人兼 CEO 仁勛介紹稱,其包含 540 億晶體管,擁有比原來強(qiáng)大 20 AI
    發(fā)表于 05-15 11:34 ?6896次閱讀

    英偉達(dá):GPUAI的性能每年都成倍提升

    英偉達(dá)首席科學(xué)家Bill Dally在一年一度的中國GPU技術(shù)大會(huì)召開前接受第財(cái)經(jīng)記者獨(dú)家專訪時(shí)表示,GPU人工智能(
    的頭像 發(fā)表于 12-15 13:37 ?2853次閱讀

    英偉達(dá)官方認(rèn)可“定律”,摩爾定律會(huì)失效嗎?

    :摩爾定律失效后,該如何進(jìn)步提高處理器的能效?針對(duì)這個(gè)問題,些公司已經(jīng)找到了自己的答案,比如英偉達(dá)。 過去幾年來,
    的頭像 發(fā)表于 12-18 16:27 ?3431次閱讀

    英偉達(dá)霸主之路 “卷王”英偉達(dá)的真面目

    了臺(tái)積電4納米制程工藝,集成1800億個(gè)晶體管,浮點(diǎn)計(jì)算能力相比前代A100快了三,被看作英偉達(dá)的新代“核彈”。
    的頭像 發(fā)表于 04-05 14:11 ?2959次閱讀

    角逐AI,比英偉達(dá)最多快10,光芯片能成為國產(chǎn)之光嗎?

    中信建投指出,近年來光計(jì)算在AI領(lǐng)域呈現(xiàn)高速的發(fā)展,具有廣闊的應(yīng)用前景。以Lightmatter和Lightelligence為代表的公司,推出了新型的硅光計(jì)算芯片,性能遠(yuǎn)超目前的AI
    的頭像 發(fā)表于 07-17 14:47 ?1852次閱讀
    角逐<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,比<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>最多快10<b class='flag-5'>倍</b>,光芯片能成為國產(chǎn)之光嗎?

    英偉達(dá)A100的是多少?

    ,但 A100 的是前者的 20 。 A100是英偉達(dá)推出的款強(qiáng)大的數(shù)據(jù)中心GPU,采用
    的頭像 發(fā)表于 08-08 15:28 ?4.1w次閱讀

    英偉達(dá)H200怎么樣

    英偉達(dá)H200的非常強(qiáng)大。作為新AI芯片,H200在性能上有了顯著的
    的頭像 發(fā)表于 03-07 16:15 ?3308次閱讀

    英偉達(dá)最新AI芯片Blackwell GPU,AI力能力較上代提升30!

    仁勛說:"我們已經(jīng)來到了個(gè)臨界點(diǎn),因此需要種新的計(jì)算方式來加速整個(gè)行業(yè)的發(fā)展效率。那么英偉達(dá)能夠
    的頭像 發(fā)表于 03-19 13:39 ?2945次閱讀

    英偉達(dá)宣布每年設(shè)計(jì)代全新AI芯片,加快其他產(chǎn)品線更新速度

    英偉達(dá)CEO仁勛宣布,公司將每年推出全新AI芯片,以滿足市場(chǎng)需求。他表示,Blackwell后將有新款芯片問世,且
    的頭像 發(fā)表于 05-23 10:41 ?1128次閱讀

    英偉達(dá)Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉達(dá)創(chuàng)始人兼CEO仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉達(dá)A
    的頭像 發(fā)表于 06-04 09:23 ?2258次閱讀