哈啊,,嗯啊,哈哼啊,,哈操视频无码,无码精区久久久一区

今年的 GTC China 黃仁勛沒有露面，但黃式定律無處不在。

從翻倍提高 TensorCore 計(jì)算效能的新技術(shù)，到下一代光通信技術(shù)，再到一行代碼為所有模型提供 GPU 加速的軟件工具，為了讓未來的 AI 算力每年能夠提升一倍，英偉達(dá)找到了不少新方向。

12 月 15 日上午，英偉達(dá) GTC 大會(huì)中國站在線上舉行，全球最負(fù)盛名的計(jì)算機(jī)科學(xué)家之一、NVIDIA 研究院負(fù)責(zé)人 Bill Dally 在活動(dòng)中發(fā)表了主題演講。

在科技領(lǐng)域里，很多人都知道摩爾定律：前英特爾 CEO 大衛(wèi)·豪斯（David House）曾提出，人類制造出的芯片，每 18 個(gè)月計(jì)算效率就會(huì)提高一倍。這一「規(guī)律」在過去長達(dá)五十年間一直被實(shí)踐驗(yàn)證，但在最近五六年中，由于晶體管尺寸越來越小，制程陷入瓶頸，摩爾定律逐漸失效。

而另一方面，人類對(duì)于計(jì)算機(jī)的算力需求是無限的，人工智能技術(shù)的發(fā)展更是加大了這種需求。近十年來，GPU正在讓人工智能算法的性能每年都在成倍提升，英偉達(dá)的研究人員通過架構(gòu)的提升，正在不斷尋找進(jìn)一步加快AI推理速度的芯片。

英偉達(dá)提出了以自己創(chuàng)始人黃仁勛名字命名的黃氏定律（Huang’s Law）對(duì)單芯片AI推理能力進(jìn)行了預(yù)測(cè)，提出每 12 月其數(shù)字將翻一倍。

如果我們還需要在未來的一段時(shí)間里使用硅芯片，那么摩爾定律之后，我們還可以仰賴「黃氏定律」保持AI技術(shù)的發(fā)展速度。

在芯片本身無法快速提升的情況下，英偉達(dá)把目光轉(zhuǎn)向了計(jì)算架構(gòu)的很多其他方面，Bill Dally 認(rèn)為「這些方向其中的任何一個(gè)如果有效，都可以在接下來幾代的產(chǎn)品中幫助我們延續(xù)性能每年提升一倍的目標(biāo)。」

首先是單卡計(jì)算效率。即使是英偉達(dá)目前的二代 Tensor Core，在進(jìn)行推理時(shí)也無法把所有功耗用在數(shù)學(xué)運(yùn)算上——效率被浪費(fèi)在了數(shù)據(jù)傳輸上。英偉達(dá)設(shè)計(jì)了 MAGNet 系統(tǒng)，用于探索更為高效的芯片架構(gòu)設(shè)計(jì)。

如果可以通過一個(gè)全局控制器，把數(shù)據(jù)從內(nèi)存不同的部分移動(dòng)到不同計(jì)算單元以執(zhí)行計(jì)算，并針對(duì)神經(jīng)網(wǎng)絡(luò)計(jì)算的特性在數(shù)據(jù)流中加入一個(gè)存儲(chǔ)層，便可以解除瓶頸，將大部分能量用于計(jì)算。在特定的單元上，英偉達(dá)尚未發(fā)布的硬件產(chǎn)品可以實(shí)現(xiàn)每瓦 100 Teraops 的推理能力，而在 2019 年達(dá)到的效率還只有 29 Teraops。

看來下一代的 Tensor Core 性能又要有巨大的提升了。

其次是多卡的數(shù)據(jù)傳輸，英偉達(dá)的 GPU 通過 NVlink 和 NVswitch 互相連接，然而基于電信號(hào)的方式目前已經(jīng)接近極限了，人們預(yù)估，想要繼續(xù)讓 NVLink 中信號(hào)傳輸?shù)膸捗看嵘槐叮瑢⒆兊脴O其困難。目前英偉達(dá)能夠?qū)崿F(xiàn)的數(shù)字是每線對(duì) 50Gb/s，可預(yù)見的未來大約可以實(shí)現(xiàn)到 100-200Gb/s。英偉達(dá)也在和英特爾等科技巨頭一樣思考如何盡快把基于光學(xué)的通信技術(shù)應(yīng)用于實(shí)踐。

作為一名研究者，Bill Dally 曾牽頭研發(fā)英偉達(dá)對(duì)于光信號(hào)傳輸?shù)脑妇埃汗馔ㄐ挪粌H可以大幅度提升帶寬（從幾百 Gb/s 到幾 Tb/s），提升傳輸空間（從幾十厘米到 20-100 米）并減少系統(tǒng)的復(fù)雜程度。

在英偉達(dá)的設(shè)計(jì)中，DGX 卡縱置排列，右側(cè)為光源，可為光線提供多種不同波長的光線，光學(xué)引擎以極高的數(shù)據(jù)速率把光轉(zhuǎn)換為信號(hào)。每根光纖都可以同時(shí)傳輸不同波長的光，而每種波長的光都可以用 25-50Gb/s 的速度傳輸信號(hào)。這樣一來，總數(shù)據(jù)速率將為 400Gb/s，而每根光纖的傳輸速率「保守估計(jì)」就可以達(dá)到數(shù)個(gè) Tb/s，而且能耗還要比電信號(hào)要小。英偉達(dá)的研究團(tuán)隊(duì)正在與哥倫比亞大學(xué)的研究人員密切合作，探討如何利用電信供應(yīng)商在其核心網(wǎng)絡(luò)中所采用的技術(shù)，通過一條光纖來傳輸數(shù)十路信號(hào)——有了光通信，僅需一條 NVLink 就可以連接規(guī)模更大的系統(tǒng)。

英偉達(dá)還在嘗試一種名為「密集波分復(fù)用」的技術(shù), 有望在僅一毫米大小的芯片上實(shí)現(xiàn) Tb/s 級(jí)數(shù)據(jù)的傳輸，是如今互連密度的十倍以上。

除了更大的吞吐量，光鏈路也有助于打造更為密集型的系統(tǒng)。Dally 舉例展示了一個(gè)未來將搭載 160 多個(gè) GPU 的 NVIDIA DGX 系統(tǒng)模型。

除了硬件方面的革新，還有軟件。今天有很多應(yīng)用都在被 GPU 加速，遠(yuǎn)超英偉達(dá)開發(fā)者們更新 CUDA 程序的速度，人們急需一種簡化的編程方式。NVIDIA 的研究人員開發(fā)了全新編程系統(tǒng)原型 Legate。開發(fā)者借助 Legate，即可在任何規(guī)模的系統(tǒng)上，運(yùn)行針對(duì)單一 GPU 編寫的程序——甚至適用于諸如 Selene 等搭載數(shù)千個(gè) GPU 的巨型超級(jí)計(jì)算機(jī)。

對(duì)于大多數(shù)人來說，使用 Legate 我們就可以無需更改代碼即讓 Python 程序無感運(yùn)行在從 Jetson Nano 到 DGX SuperPOD 等所有包含英偉達(dá) cuda 核心的設(shè)備上。開發(fā)者所做的是基于原始的 Python 代碼，將原本的「import NumPy as NP」更改為「import legate.numpy as NP」就可以了。隨后 Legate 庫會(huì)開始運(yùn)行，自動(dòng)完成之后的操作。

它的運(yùn)行速率有多快呢？從上表中可以看到，Legate 的處理速度不僅快于目前效率最高的庫，同時(shí)在并行化時(shí)也能盡量保持住自己的優(yōu)勢(shì)。

英偉達(dá)也分享了目前國內(nèi)合作伙伴使用新一代芯片的情況：阿里云、百度智能云、滴滴云、騰訊云的大型數(shù)據(jù)中心正在遷移至基于英偉達(dá) Ampere 架構(gòu)的平臺(tái)。圖像識(shí)別、語音識(shí)別，以及包括計(jì)算流體動(dòng)力學(xué)、計(jì)算金融學(xué)、分子動(dòng)力學(xué)在內(nèi)的 GPU 加速高性能計(jì)算場(chǎng)景的快速增長，催生了更多對(duì)云實(shí)例的需求。

在硬件方面，新華三、浪潮、聯(lián)想、寧暢等中國領(lǐng)先系統(tǒng)制造商也在將 A100 GPU 引入到自身產(chǎn)品中，并推出了多款針對(duì)不同應(yīng)用場(chǎng)景的系列產(chǎn)品，為超大型數(shù)據(jù)中心提供基于 Ampere 架構(gòu)的加速系統(tǒng)，進(jìn)而為用戶提供兼具超強(qiáng)性能與靈活性的 AI 計(jì)算平臺(tái)。
編輯：hfy

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4945

瀏覽量
131230
計(jì)算機(jī)

計(jì)算機(jī)

+關(guān)注

關(guān)注
19

文章
7662

瀏覽量
90792
AI

AI

+關(guān)注

關(guān)注
88

文章
35138

瀏覽量
279802
英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3952

瀏覽量
93758

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

英偉達(dá)「黃氏定律」讓未來的AI算力每年能夠提升一倍

評(píng)論