99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI新興應(yīng)用通過(guò)帶可配置加速的片上系統(tǒng)器件來(lái)滿(mǎn)足嚴(yán)格性能、效率需求

YCqV_FPGA_EETre ? 來(lái)源:YXQ ? 2019-08-06 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著智能安全、機(jī)器人無(wú)人駕駛汽車(chē)等應(yīng)用越來(lái)越依靠嵌入式人工智能技術(shù)來(lái)提高性能,交付全新的用戶(hù)體驗(yàn),傳統(tǒng)計(jì)算平臺(tái)上的推斷引擎很難在有限的功耗、時(shí)延和物理尺寸限制下滿(mǎn)足實(shí)際要求。推斷引擎必須滿(mǎn)足嚴(yán)格定義的推斷精度,還受限于總線寬度,而且存儲(chǔ)器難以為最佳速度、效率和芯片面積進(jìn)行調(diào)整優(yōu)化。我們需要靈活應(yīng)變的計(jì)算平臺(tái)來(lái)滿(mǎn)足運(yùn)行一流卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的嵌入式 AI 的要求。

放眼未來(lái),適應(yīng)于更多前沿神經(jīng)網(wǎng)絡(luò)的靈活性是我們的主要關(guān)注點(diǎn)。今天廣受歡迎的 CNN 正加速被新型的先進(jìn)架構(gòu)所取代。然而,傳統(tǒng)的 SoC 設(shè)計(jì)要使用當(dāng)前的神經(jīng)網(wǎng)絡(luò)架構(gòu)知識(shí),從開(kāi)發(fā)開(kāi)始到未來(lái)部署通常需要大約三年時(shí)間。RNN 或 Capsule Network 等新型神經(jīng)網(wǎng)絡(luò)可能會(huì)讓傳統(tǒng) SoC 變得低效,也難以提供保持競(jìng)爭(zhēng)力所需的性能。

嵌入式 AI 要滿(mǎn)足最終用戶(hù)期望,特別是要跟上可預(yù)見(jiàn)的未來(lái)不斷提升的需求,就必須采用更加靈活的自適應(yīng)計(jì)算平臺(tái)。我們可利用用戶(hù)可配置的多核片上系統(tǒng) (MPSoC) 器件,整合主應(yīng)用處理器和可擴(kuò)展的可編程邏輯結(jié)構(gòu),包含可配置的存儲(chǔ)器架構(gòu)和滿(mǎn)足可變精度推斷所需的信號(hào)處理技術(shù),從而滿(mǎn)足上述要求。

推斷精度

在傳統(tǒng)的 SoC 中,決定性能的特性如存儲(chǔ)器架構(gòu)和計(jì)算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過(guò)就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優(yōu)化至晶體管層面,這就能根據(jù)需要讓推斷精度降低到 1 位。此外,這類(lèi)器件還包含成千上萬(wàn)可配置的 DSP slice,能高效處理乘積累加 (MAC) 計(jì)算。

能自由優(yōu)化推斷精度,根據(jù)平方律提供剛好滿(mǎn)足需求的計(jì)算效率,也就是說(shuō)單位的運(yùn)算用 1 位核心執(zhí)行,相對(duì)于用 8 位核心完成相同計(jì)算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對(duì)神經(jīng)網(wǎng)絡(luò)的每層做出不同優(yōu)化,從而以最大的效率提供所需的性能。

存儲(chǔ)器架構(gòu)

除了通過(guò)改變推斷精度來(lái)提高計(jì)算效率之外,配置可編程片上存儲(chǔ)器的帶寬和結(jié)構(gòu)能進(jìn)一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對(duì)于運(yùn)行相同推斷引擎的傳統(tǒng)計(jì)算平臺(tái)而言,片上存儲(chǔ)器可能達(dá)到 4 倍多,存儲(chǔ)器—接口帶寬可能達(dá)到 6 倍。存儲(chǔ)器的可配置性使得用戶(hù)能減少瓶頸,并優(yōu)化芯片資源的利用率。此外,典型的子系統(tǒng)只有有限的片上集成高速緩存,必須與片外存儲(chǔ)設(shè)備頻繁交互,這就會(huì)增加時(shí)延和功耗。在 MPSoC 中,大多數(shù)存儲(chǔ)器交換都在片上進(jìn)行,這就會(huì)大幅提高速度,而且相對(duì)于片外存儲(chǔ)器交互而言功耗降低超過(guò) 99%。

芯片面積

解決方案的尺寸也越來(lái)越重要,特別就采用移動(dòng) AI 的無(wú)人機(jī)、機(jī)器人或無(wú)人/自動(dòng)駕駛汽車(chē)而言尤其如此。MPSoC 的 FPGA 結(jié)構(gòu)上實(shí)現(xiàn)的推斷引擎可能僅占用傳統(tǒng) SoC 八分之一的芯片面積,這就能讓開(kāi)發(fā)人員在更小的器件中構(gòu)建功能更強(qiáng)大的引擎。

此外,MPSoC 器件系列為設(shè)計(jì)人員提供了實(shí)現(xiàn)推斷引擎的豐富選擇,能支持最節(jié)能、成本效率最高、面積占用最小的方案,從而滿(mǎn)足系統(tǒng)性能要求。一些通過(guò)汽車(chē)應(yīng)用認(rèn)證的部件具備硬件功能安全特性,達(dá)到業(yè)界標(biāo)準(zhǔn)的 ISO 26262 ASIL-C 安全規(guī)范,這對(duì)自動(dòng)駕駛應(yīng)用而言至關(guān)重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統(tǒng)以及可擴(kuò)展的可編程邏輯結(jié)構(gòu),這就能在單個(gè)芯片上整合控制處理、機(jī)器學(xué)習(xí)算法和安全電路,同時(shí)提供故障容錯(cuò)功能。

今天,嵌入式推斷引擎可用單個(gè) MPSoC 器件實(shí)現(xiàn),功耗低至 2 瓦,這對(duì)移動(dòng)機(jī)器人或自動(dòng)駕駛汽車(chē)而言都是比較合適的功耗水平。傳統(tǒng)計(jì)算平臺(tái)即便現(xiàn)在也無(wú)法用這么低的功耗運(yùn)行實(shí)時(shí) CNN 應(yīng)用,未來(lái)也不太可能在更嚴(yán)格的功耗限制條件下滿(mǎn)足更快響應(yīng)和更復(fù)雜功能的日益嚴(yán)格的要求?;诳删幊?MPSoC 的平臺(tái)能夠提供更高的計(jì)算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開(kāi)發(fā)人員不能在自己的項(xiàng)目中輕松地實(shí)現(xiàn)這些優(yōu)勢(shì),那么這種可配置型多平行計(jì)算架構(gòu)的優(yōu)勢(shì)就僅限于學(xué)術(shù)領(lǐng)域。成功需要適當(dāng)?shù)墓ぞ邅?lái)幫助開(kāi)發(fā)人員優(yōu)化目標(biāo)推斷引擎的實(shí)現(xiàn)。為了滿(mǎn)足有關(guān)需求,賽靈思不斷擴(kuò)展開(kāi)發(fā)工具生態(tài)系統(tǒng)和機(jī)器學(xué)習(xí)軟件堆棧,并與專(zhuān)業(yè)合作伙伴合作,一起簡(jiǎn)化和加速計(jì)算機(jī)視覺(jué)和視頻監(jiān)控等應(yīng)用的實(shí)現(xiàn)。

面向未來(lái)的靈活性

利用 SoC 的可配置性為手頭應(yīng)用創(chuàng)建最佳平臺(tái),也使得 AI 開(kāi)發(fā)人員能夠靈活地跟上神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展演進(jìn)的要求。業(yè)界可能遷移到新型神經(jīng)網(wǎng)絡(luò)的可能性,對(duì)于平臺(tái)開(kāi)發(fā)人員來(lái)說(shuō)是一個(gè)巨大的風(fēng)險(xiǎn)??芍嘏渲玫?MPSoC 通過(guò)重配置并用當(dāng)前最先進(jìn)的策略來(lái)構(gòu)建最高效的處理引擎,能夠讓開(kāi)發(fā)人員靈活地響應(yīng)神經(jīng)網(wǎng)絡(luò)架構(gòu)方式的變化。

AI 越來(lái)越多地嵌入到各種設(shè)備中,包括工業(yè)控制、醫(yī)療設(shè)備、安全系統(tǒng)、機(jī)器人和自動(dòng)駕駛汽車(chē)等。利用可編程邏輯結(jié)構(gòu)的 MPSoC 器件的靈活應(yīng)變加速技術(shù),是提供保持競(jìng)爭(zhēng)力所需的快速響應(yīng)和高級(jí)功能的關(guān)鍵。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1797

    瀏覽量

    132367
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35181

    瀏覽量

    280193

原文標(biāo)題:靈活應(yīng)變的加速是將人工智能從云端帶到邊緣的關(guān)鍵

文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開(kāi)發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工合成石墨與天然石墨的差別

    電極等傳統(tǒng)領(lǐng)域,傲琪提供的天然石墨厚度≥0.1mm,通過(guò)UL防火認(rèn)證,滿(mǎn)足大規(guī)模工業(yè)化生產(chǎn)需求。 ※ 人工石墨主戰(zhàn)場(chǎng)1. 消費(fèi)電子:傲琪0.025mm超薄人工石墨
    發(fā)表于 05-23 11:22

    MAX22005 12通道工廠校準(zhǔn)可配置工業(yè)模擬輸入技術(shù)手冊(cè)

    MAX22005是一款12通道工業(yè)級(jí)模擬輸入電壓模式器件通過(guò)在每個(gè)通道中使用一個(gè)外部精密電阻也可將其配置為模擬輸入電流模式器件。此外,通過(guò)
    的頭像 發(fā)表于 05-21 10:26 ?264次閱讀
    MAX22005 12通道工廠校準(zhǔn)<b class='flag-5'>可配置</b>工業(yè)模擬輸入技術(shù)手冊(cè)

    Intel-Altera FPGA:通信行業(yè)的加速引擎,開(kāi)啟高速互聯(lián)新時(shí)代

    Agilex(高端)、Stratix(高性能)、Arria(中端)、Cyclone(低成本)等系列,滿(mǎn)足從數(shù)據(jù)中心到工業(yè)自動(dòng)化的多樣化需求。技術(shù)特點(diǎn):可重構(gòu)性:支持“現(xiàn)場(chǎng)編程”,靈活適配AI
    發(fā)表于 04-25 10:19

    第二代AMD Versal Premium系列SoC滿(mǎn)足各種CXL應(yīng)用需求

    第二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能且可配置的平臺(tái),提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿(mǎn)足從簡(jiǎn)單到復(fù)雜的各種 CXL 應(yīng)用
    的頭像 發(fā)表于 04-24 14:52 ?515次閱讀
    第二代AMD Versal Premium系列SoC<b class='flag-5'>滿(mǎn)足</b>各種CXL應(yīng)用<b class='flag-5'>需求</b>

    DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升

    對(duì)DeepSeek模型增強(qiáng)融合了RAG能力,從生成機(jī)制協(xié)同降低模型幻象,并同時(shí)提升生成模型的準(zhǔn)確性和相關(guān)性。 RAG檢索增強(qiáng)的核心機(jī)制是通過(guò)“檢索-生成”分離架構(gòu),將模型輸出嚴(yán)格約束在可信數(shù)據(jù)范圍內(nèi)
    發(fā)表于 04-18 14:43

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    性能方面展現(xiàn)了出色的優(yōu)勢(shì),滿(mǎn)足當(dāng)前AI算力需求的快速增長(zhǎng)。 高可靠性: 光模塊經(jīng)過(guò)溫度、靜電放電及機(jī)械耐久性等嚴(yán)格測(cè)試,確保在數(shù)據(jù)中
    發(fā)表于 03-25 12:00

    如何通過(guò)濾波器的優(yōu)化來(lái)滿(mǎn)足嚴(yán)格的電磁兼容性(EMC)標(biāo)準(zhǔn)?

    濾波器在高性能電源系統(tǒng)中起著關(guān)鍵作用,通過(guò)精準(zhǔn)選擇濾波器類(lèi)型和性能參數(shù),以及與電源系統(tǒng)其他部件協(xié)同設(shè)計(jì),可以有效濾除高頻干擾,保證電源
    的頭像 發(fā)表于 03-08 15:04 ?687次閱讀

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    ,由大量的邏輯門(mén)和觸發(fā)器組成,可以通過(guò)編程來(lái)定制其功能和連接。FPGA的靈活性和高性能使其在多個(gè)領(lǐng)域得到了廣泛應(yīng)用。 1.FPGA的定義 FPGA是一種集成電路,可以在制造后由用戶(hù)通過(guò)
    發(fā)表于 03-03 11:21

    當(dāng)我問(wèn)DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    提高了系統(tǒng)的整體性能。 綜上所述,F(xiàn)PGA在AI時(shí)代的重要性不僅體現(xiàn)在其強(qiáng)大的硬件加速能力和高能效比上,更在于其高度的靈活性和定制化能力,使其能夠適應(yīng)不斷變化的
    發(fā)表于 02-19 13:55

    新一代GaN器件,滿(mǎn)足AI服務(wù)器電源需求

    電子發(fā)燒友網(wǎng)站提供《新一代GaN器件,滿(mǎn)足AI服務(wù)器電源需求.pdf》資料免費(fèi)下載
    發(fā)表于 01-24 13:56 ?0次下載
    新一代GaN<b class='flag-5'>器件</b>,<b class='flag-5'>滿(mǎn)足</b><b class='flag-5'>AI</b>服務(wù)器電源<b class='flag-5'>需求</b>

    Qorvo推出車(chē)規(guī)級(jí)UWB SoC芯片QPF5100Q,憑借可配置軟件推動(dòng)創(chuàng)新

    來(lái)源:Qorvo半導(dǎo)體 ? 全球領(lǐng)先的連接和電源解決方案供應(yīng)商Qorvo??(納斯達(dá)克代碼:QRVO)今日宣布,推出全新已通過(guò)車(chē)規(guī)級(jí)認(rèn)證的超寬帶(UWB)系統(tǒng)(SoC)—— QPF
    的頭像 發(fā)表于 01-10 11:18 ?574次閱讀

    PHY6236—藍(lán)牙低功耗 (BLE)/私有 2.4GHz 系統(tǒng)芯片

    PHY6236 是一款用于低功耗藍(lán)牙和專(zhuān)有 2.4G 應(yīng)用的系統(tǒng) (SoC)。它具有高性能低功耗 32 位 RISC-V MCU,具有 8KB 保留 SRAM、80KB ROM、8
    發(fā)表于 12-04 00:31

    66AK2Hx系統(tǒng)(SoC)器件系列的功耗摘要

    電子發(fā)燒友網(wǎng)站提供《66AK2Hx系統(tǒng)(SoC)器件系列的功耗摘要.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 09:11 ?0次下載
    66AK2Hx<b class='flag-5'>片</b><b class='flag-5'>上</b><b class='flag-5'>系統(tǒng)</b>(SoC)<b class='flag-5'>器件</b>系列的功耗摘要

    HS6601H:低功耗、高性能、可配置度高的非定頻雷達(dá)芯片數(shù)據(jù)手冊(cè)

    HS6601H是具有高性能的傳感信號(hào)處理集成電路,內(nèi)置3.3V 、4.4V或5.0V的高壓LDO,可以給PIR傳感器探頭供電。具備可配置功能,可以減少外圍元器件。 可配以熱釋電紅外傳感
    發(fā)表于 07-31 11:58

    嚴(yán)格性能測(cè)試確保連接器可滿(mǎn)足復(fù)雜環(huán)境的應(yīng)用需求

    嚴(yán)苛環(huán)境下,連接器的使用安全性正面臨嚴(yán)峻挑戰(zhàn)。嚴(yán)格性能測(cè)試可確保連接器能滿(mǎn)足客戶(hù)的多種應(yīng)用環(huán)境需求。 耐電壓測(cè)試:當(dāng)設(shè)備出現(xiàn)短時(shí)過(guò)載時(shí),耐電壓性能
    的頭像 發(fā)表于 07-23 08:48 ?482次閱讀