99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華人學(xué)者Nature上發(fā)表最新成果 世界最快光子AI加速器

工程師鄧生 ? 來(lái)源:《Light: Science & App ? 作者:徐興元 ? 2021-01-11 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于人臉識(shí)別、語(yǔ)音翻譯、醫(yī)療診斷、自動(dòng)駕駛等重要領(lǐng)域,其性能主要由硬件算力決定,目前所廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)硬件都基于數(shù)字電子架構(gòu)。然而,該架構(gòu)的兩個(gè)本質(zhì)局限—馮諾曼依瓶頸與電子速率瓶頸,極大限制了神經(jīng)網(wǎng)絡(luò)硬件的潛在算力。首先,數(shù)字架構(gòu)中,數(shù)據(jù)的存儲(chǔ)和運(yùn)算是分布式的,因而在計(jì)算過(guò)程中,會(huì)有大量的能源和算力消耗在數(shù)據(jù)的反復(fù)讀取和存儲(chǔ)中,此限制被稱(chēng)為馮諾曼依瓶頸。其次,由于電子微處理器中的寄生電容和互聯(lián)時(shí)延問(wèn)題,電子系統(tǒng)存在著本質(zhì)的帶寬限制,導(dǎo)致電子微處理器的主頻事實(shí)上在過(guò)去十年已沒(méi)有明顯提升,此限制也被稱(chēng)為電子速率瓶頸。

光子神經(jīng)網(wǎng)絡(luò)工作于模擬架構(gòu)中,即數(shù)據(jù)在硬件系統(tǒng)中的實(shí)時(shí)位置與進(jìn)行運(yùn)算的位置相同,因而規(guī)避了馮諾曼依瓶頸。此外,寬達(dá)數(shù)十太赫茲的光譜也為高速運(yùn)算提供了充足的帶寬。目前已有來(lái)自加州大學(xué)、麻省理工學(xué)院、明斯特大學(xué)等單位的研究團(tuán)隊(duì)做出了一系列在網(wǎng)絡(luò)尺度、可集成性、片上存儲(chǔ)等方面的突破,然而尚未能實(shí)現(xiàn)較高運(yùn)算速度與高維數(shù)據(jù)處理能力,光子神經(jīng)網(wǎng)絡(luò)的超高運(yùn)算潛力尚未得到證實(shí)。

近日,澳大利亞研究人員徐興元博士(莫納什大學(xué))、譚朦曦博士、David Moss教授(斯文本科技大學(xué))、Arnan Mitchell教授(皇家墨爾本理工大學(xué))等首次提出并實(shí)現(xiàn)了基于波長(zhǎng)、時(shí)間交織的光子卷積加速器。該文章以“ 11 TOPS photonic convolutional accelerator for optical neural networks”為題發(fā)表在Nature。

研究人員通過(guò)采用集成高品質(zhì)因素、高非線性微環(huán)與波導(dǎo)色散調(diào)控,實(shí)現(xiàn)了高相干度、易于產(chǎn)生的集成克爾孤子晶體光頻梳。

研究人員將該光頻梳進(jìn)行頻域整形并且與高速光電調(diào)制相結(jié)合,實(shí)現(xiàn)了輸入數(shù)據(jù)在并行波長(zhǎng)通道上的組播與加權(quán),然后采用光學(xué)色散介質(zhì)作為緩存,對(duì)組播信號(hào)進(jìn)行了步進(jìn)延時(shí)(步長(zhǎng)為單個(gè)碼元時(shí)長(zhǎng)),從而在時(shí)域上對(duì)齊了不同波長(zhǎng)通道中需要加權(quán)求和的碼元,最后通過(guò)光電轉(zhuǎn)換實(shí)現(xiàn)處理結(jié)果的高速實(shí)時(shí)讀?。ㄈ鐖D1所示)。通過(guò)這一系列步驟,波長(zhǎng)構(gòu)架的卷積窗口(感知域)即可在時(shí)域以超過(guò)60GBaud的速率滑動(dòng),結(jié)合克爾光頻梳所實(shí)現(xiàn)的高并行度(C波段90個(gè)波長(zhǎng)通道),實(shí)現(xiàn)了11 TOPS(太運(yùn)算每秒)的運(yùn)算速度,即每秒可完成11萬(wàn)億次運(yùn)算。

1610351104722.jpg

圖1 卷積加速器工作原理

圖源:Nature 589, 44–51 (2021)。 Fig 1

通過(guò)這一系列步驟,數(shù)學(xué)模型抽象的神經(jīng)元突觸就被光頻梳在實(shí)際物理系統(tǒng)中實(shí)現(xiàn),其中突觸連接的權(quán)重由光頻梳的光功率體現(xiàn)。最終實(shí)驗(yàn)驗(yàn)證了高維圖片處理(實(shí)驗(yàn)結(jié)果如圖2所示)以及深度學(xué)習(xí)光子卷積神經(jīng)網(wǎng)絡(luò)(實(shí)驗(yàn)結(jié)果如圖3所示)。

1610351144513.jpg

圖2 卷積圖像處理結(jié)果

圖源:Nature 589, 44–51 (2021)。 Fig 3

在國(guó)際相關(guān)研究成果的基礎(chǔ)上實(shí)現(xiàn)了數(shù)個(gè)突破,包括:

1. 由于集成克爾光頻梳所提供的大量波長(zhǎng)通道,運(yùn)算速度首次突破到11 TOPS以上;

2. 首次實(shí)現(xiàn)了利用光學(xué)手段進(jìn)行高維數(shù)據(jù)處理(25萬(wàn)像素點(diǎn)),為光子神經(jīng)網(wǎng)絡(luò)的進(jìn)一步實(shí)際應(yīng)用如人臉識(shí)別等展現(xiàn)了可能;

3. 實(shí)現(xiàn)了500張MINIST手寫(xiě)數(shù)字圖片的高速分類(lèi)預(yù)測(cè),準(zhǔn)確率達(dá)到88%以上;

4. 實(shí)現(xiàn)了具備高速光電接口的硬件加速器,速度可達(dá)64G Baud以上,并且可與現(xiàn)有電子或者光學(xué)硬件兼容互聯(lián);

5. 結(jié)合應(yīng)用了集成克爾光頻梳,為實(shí)現(xiàn)光子神經(jīng)網(wǎng)絡(luò)的單片集成奠定了基礎(chǔ)。

1610351182692.jpg

圖3 卷積神經(jīng)網(wǎng)絡(luò)50張手寫(xiě)數(shù)字識(shí)別結(jié)果。上圖為全連接層神經(jīng)元輸出幅度,下圖為混淆矩陣。

圖源:Nature 589, 44–51 (2021)。 Fig 6

后續(xù),研究人員將繼續(xù)優(yōu)化本方案的性能指標(biāo),如處理速度、并行度、體積與可集成性、功耗等。本工作實(shí)驗(yàn)證明了光子神經(jīng)網(wǎng)絡(luò)硬件的運(yùn)算潛力,并且具有高速光電接口,未來(lái)可作為通用卷積特征提取前端與其他光電模數(shù)架構(gòu)互聯(lián),在卷積神經(jīng)網(wǎng)絡(luò)中可承擔(dān)70%以上的運(yùn)算負(fù)荷,大幅提升系統(tǒng)整體算力,在未來(lái)實(shí)時(shí)人工智能應(yīng)用場(chǎng)景如無(wú)人駕駛、醫(yī)療診斷等方面有重要應(yīng)用。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    10019

    瀏覽量

    141616
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249331
  • 光子芯片
    +關(guān)注

    關(guān)注

    3

    文章

    102

    瀏覽量

    24840
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    9090
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱(chēng)“荷電粒子加速器”,是一種利用電磁場(chǎng)在高真空環(huán)境中對(duì)帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?489次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    基于雙向塊浮點(diǎn)量化的大語(yǔ)言模型高效加速器設(shè)計(jì)

    本文提出雙向塊浮點(diǎn)(BBFP)量化格式及基于其的LLMs加速器BBAL,通過(guò)雙向移位與重疊位設(shè)計(jì)顯著降低量化誤差,提升非線性計(jì)算效率,實(shí)現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關(guān)成果被國(guó)際頂級(jí)會(huì)議 DAC 2025 接收。
    的頭像 發(fā)表于 05-14 13:40 ?1611次閱讀
    基于雙向塊浮點(diǎn)量化的大語(yǔ)言模型高效<b class='flag-5'>加速器</b>設(shè)計(jì)

    光子 AI 處理的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計(jì)算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?2628次閱讀

    曦智科技時(shí)隔八年再登《Nature》,光電混合計(jì)算架構(gòu)首次公開(kāi)

    英國(guó)倫敦時(shí)間4月9日,全球頂級(jí)學(xué)術(shù)期刊《自然》(Nature)刊載了曦智科技的光電混合計(jì)算成果:《超低延遲大規(guī)模集成光子加速器》(An integrated large-scale p
    發(fā)表于 04-10 09:50 ?354次閱讀
     曦智科技時(shí)隔八年再登《<b class='flag-5'>Nature</b>》,光電混合計(jì)算架構(gòu)首次公開(kāi)

    嵌入式AI加速器DRP-AI 詳細(xì)介紹

    的嵌入式設(shè)備。此外,人工智能正在不斷發(fā)展,新的算法不時(shí)被開(kāi)發(fā)出來(lái)。 在人工智能快速發(fā)展的過(guò)程中,瑞薩開(kāi)發(fā)了人工智能加速器(DRP-AI)和軟件(DRP-AI翻譯),既提供高性能又提供
    的頭像 發(fā)表于 03-15 16:13 ?1002次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細(xì)介紹

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    。? AI加速器的開(kāi)發(fā):FPGA被廣泛用于開(kāi)發(fā)專(zhuān)為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理加速器。這種定制化的硬件設(shè)計(jì)能夠顯著提升
    發(fā)表于 03-03 11:21

    消息稱(chēng)AMD Instinct MI400 AI加速器將配備8個(gè)計(jì)算芯片

    近日,據(jù)外媒 videocardz 報(bào)道,參考 AMD 最新推出的 AMD - GFX 補(bǔ)丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器設(shè)計(jì)將有重大變革,其將配備 8
    的頭像 發(fā)表于 02-05 15:07 ?953次閱讀

    蘋(píng)果加入U(xiǎn)ALink聯(lián)盟,共推AI加速器新標(biāo)準(zhǔn)

    蘋(píng)果公司已正式成為Ultra Accelerator Link(UALink)聯(lián)盟的一員,并獲得了該聯(lián)盟董事會(huì)席位。UALink聯(lián)盟由超過(guò)65家成員組成,專(zhuān)注于開(kāi)發(fā)下一代人工智能加速器架構(gòu),旨在推動(dòng)AI技術(shù)的快速發(fā)展。
    的頭像 發(fā)表于 01-22 18:18 ?756次閱讀

    英偉達(dá)AI加速器新藍(lán)圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    加速器設(shè)計(jì)的愿景。 英偉達(dá)認(rèn)為未來(lái)整個(gè) AI 加速器復(fù)合體將位于大面積先進(jìn)封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設(shè)計(jì),3D 垂直堆疊 DRAM 內(nèi)存
    的頭像 發(fā)表于 12-13 11:37 ?695次閱讀
    英偉達(dá)<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍(lán)圖:集成硅<b class='flag-5'>光子</b>I/O,3D垂直堆疊 DRAM 內(nèi)存

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力

    舉措預(yù)計(jì)將于2025年上半年正式推出。 此次合作的核心目標(biāo)是提升通用人工智能(AI)模型的性能與能效,并為企業(yè)客戶(hù)提供高性能計(jì)算(HPC)應(yīng)用的強(qiáng)大支持。AMD的Instinct MI300X加速器憑借其
    的頭像 發(fā)表于 11-21 11:07 ?725次閱讀

    IBM將在云平臺(tái)部署AMD加速器

    IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶(hù)在生成式AI模型方面的性能和能效,進(jìn)一步推動(dòng)AI技術(shù)的創(chuàng)新與應(yīng)用。
    的頭像 發(fā)表于 11-19 16:24 ?596次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢(shì)挑戰(zhàn)市場(chǎng)

    英特爾近期震撼發(fā)布了專(zhuān)為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門(mén)型號(hào)H100與H200 GPU,但英特爾巧妙地將競(jìng)爭(zhēng)優(yōu)勢(shì)聚焦于其更為親民的價(jià)格與總擁有成本(TCO)。
    的頭像 發(fā)表于 09-26 16:16 ?1185次閱讀

    SiFive發(fā)布MX系列高性能AI加速器IP

    AI技術(shù)日新月異的今天,RISC-V IP設(shè)計(jì)領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這一創(chuàng)新產(chǎn)品專(zhuān)為
    的頭像 發(fā)表于 09-24 14:46 ?823次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b>中更快的嵌入處理