99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI推理應(yīng)用設(shè)計(jì)的發(fā)展

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Geoff Tate ? 2022-07-10 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過(guò)去的三四年里,人工智能推理市場(chǎng)發(fā)生了巨大變化。以前,甚至不存在邊緣人工智能,大多數(shù)推理能力都發(fā)生在數(shù)據(jù)中心、超級(jí)計(jì)算機(jī)或政府應(yīng)用程序中,這些應(yīng)用程序通常也是大型計(jì)算項(xiàng)目。在所有這些情況下,性能都是至關(guān)重要的,并且始終是重中之重??爝M(jìn)到今天,邊緣人工智能市場(chǎng)與此截然不同,尤其是當(dāng)它進(jìn)入更多商業(yè)應(yīng)用時(shí)。對(duì)于這些用例,主要關(guān)注點(diǎn)更多的是低成本、功耗和小尺寸;而更少關(guān)于原始性能。

通過(guò)硬件-軟件協(xié)同設(shè)計(jì)平衡更好的性能

在查看推理芯片時(shí),很明顯一種芯片與另一種不同。設(shè)計(jì)師總是在他們的設(shè)計(jì)中做出選擇,而好的選擇會(huì)考慮他們的最終應(yīng)用以及他們?cè)谶@些應(yīng)用中的限制。例如,當(dāng) Flex Logix 設(shè)計(jì)其第一個(gè)推理芯片時(shí),它最初的大小是現(xiàn)在的 4 倍。我們很快意識(shí)到,芯片需要更小才能在成本更低、功耗更低、外形尺寸更小的邊緣 AI 市場(chǎng)中占據(jù)一席之地。

有趣的是,大多數(shù)人最初認(rèn)為大多數(shù)推理總是在數(shù)據(jù)中心完成。這種觀點(diǎn)最終發(fā)生了變化,因?yàn)樾袠I(yè)意識(shí)到它有太多的數(shù)據(jù)需要移動(dòng),因此,這些數(shù)據(jù)開(kāi)始向邊緣移動(dòng)。隨著 5G 開(kāi)始出現(xiàn),更清楚的是,不可能始終將原始數(shù)據(jù)發(fā)送到云端進(jìn)行處理。顯然,邊緣必須有一定的智能才能解決 99.9% 的場(chǎng)景,而數(shù)據(jù)中心實(shí)際上只需要用于極端情況。一個(gè)完美的例子是安全攝像頭。邊緣 AI 需要能夠確定是否發(fā)生了任何可疑活動(dòng)以及周圍是否有人。然后,如果發(fā)現(xiàn)任何有趣的東西,這些部分可以發(fā)送到數(shù)據(jù)中心進(jìn)行進(jìn)一步處理。然而,發(fā)送到數(shù)據(jù)中心的數(shù)據(jù)實(shí)際上只是整體推理的一小部分。邊緣推理 AI 通常意味著要滿足很多約束,有時(shí)如果你想運(yùn)行非常大的復(fù)雜模型,你實(shí)際上只需要在很小一部分?jǐn)?shù)據(jù)上運(yùn)行這些模型。

早期邊緣 AI 推理設(shè)計(jì)的另一個(gè)誤解是,一刀切的方法就足夠了。這也被證明是錯(cuò)誤的,因?yàn)槌霈F(xiàn)了展示其優(yōu)勢(shì)和力量的專用芯片。關(guān)鍵是圍繞算法構(gòu)建芯片,因?yàn)槿绻娴哪茉谒惴ㄉ夏ゾ殻憧梢垣@得更好的性能。正確的平衡實(shí)際上是像專用硬件一樣獲得最有效的計(jì)算,但在編譯時(shí)具有可編程性。

可編程性是關(guān)鍵

該行業(yè)確實(shí)處于人工智能發(fā)展的風(fēng)口浪尖。在接下來(lái)的幾十年里,我們將在這個(gè)領(lǐng)域看到的創(chuàng)新將是驚人的。就像任何長(zhǎng)壽的市場(chǎng)一樣,您可以期待變化。這就是為什么不為某些客戶模型設(shè)計(jì)超級(jí)專業(yè)的芯片變得至關(guān)重要的原因。如果我們今天這樣做,那么當(dāng)芯片在兩年后到達(dá)客戶手中時(shí),模型可能會(huì)發(fā)生重大變化——客戶的要求也會(huì)發(fā)生變化。這就是我們不斷聽(tīng)到有關(guān)公司最終獲得他們的人工智能推理芯片的故事的主要原因——然后發(fā)現(xiàn)它們的表現(xiàn)并沒(méi)有像他們需要的那樣。如果將可編程性內(nèi)置到芯片架構(gòu)中,則可以輕松解決該問(wèn)題。

如今,在任何邊緣 AI 處理器中,AI 的靈活性和可編程性都至關(guān)重要??蛻舻乃惴〞?huì)定期發(fā)生變化,系統(tǒng)設(shè)計(jì)也會(huì)發(fā)生變化。隨著 Edge AI 功能在主流中的推廣,越來(lái)越清楚的是,芯片設(shè)計(jì)人員需要能夠適應(yīng)和改變客戶模型,而不是根據(jù)他們“認(rèn)為”的模型來(lái)選擇它。我們一次又一次地看到這一點(diǎn),這就是編譯器如此重要的原因。編譯器中有很多對(duì)最終用戶隱藏的技術(shù),這些技術(shù)是圍繞分配資源以確保一切都以最少的功率高效完成的。

另一個(gè)被密切關(guān)注的關(guān)鍵特性是吞吐量。現(xiàn)在正在構(gòu)建好的推理芯片,以便它們可以非常快速地通過(guò)它們移動(dòng)數(shù)據(jù),這意味著它們必須非??焖俚靥幚磉@些數(shù)據(jù),并且非常快速地將其移入和移出內(nèi)存。通常,芯片供應(yīng)商會(huì)拋出各種各樣的性能數(shù)據(jù),例如 TOPS 或 ResNet-50,但研究這些數(shù)據(jù)的系統(tǒng)/芯片設(shè)計(jì)人員很快就會(huì)意識(shí)到這些數(shù)據(jù)通常毫無(wú)意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過(guò)程以及 PVT(過(guò)程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現(xiàn)的第一個(gè)衡量標(biāo)準(zhǔn),但令人驚訝的是,很少有供應(yīng)商提供它。

邊緣人工智能向前發(fā)展

今天的許多客戶都渴望吞吐量,并正在尋找能夠以與他們現(xiàn)在使用的相同功率/價(jià)格為他們提供更高吞吐量和更大圖像尺寸的解決方案。當(dāng)他們得到它時(shí),他們的解決方案將比競(jìng)爭(zhēng)解決方案更準(zhǔn)確和可靠,然后他們的市場(chǎng)采用和擴(kuò)展將加速。因此,盡管今天的應(yīng)用程序有數(shù)千或數(shù)萬(wàn)個(gè)單位,但我們預(yù)計(jì)隨著推理的可用性,這種情況會(huì)迅速增長(zhǎng),從而提供越來(lái)越多的吞吐量/美元和吞吐量/瓦特。

邊緣人工智能市場(chǎng)正在迅速增長(zhǎng),芯片供應(yīng)商也在這個(gè)市場(chǎng)上爭(zhēng)奪一席之地。事實(shí)上,到 2020 年代中期,人工智能銷售額迅速增長(zhǎng)至數(shù)百億美元,其中大部分增長(zhǎng)來(lái)自邊緣人工智能推理。沒(méi)有人可以預(yù)測(cè)未來(lái)的模型,這就是為什么在設(shè)計(jì)時(shí)考慮到靈活性和可編程性更為重要

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19892

    瀏覽量

    235156
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52503

    瀏覽量

    440736
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35129

    瀏覽量

    279683
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI推理的存儲(chǔ),看好SRAM?

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近幾年,生成式AI引領(lǐng)行業(yè)變革,AI訓(xùn)練率先崛起,帶動(dòng)高帶寬內(nèi)存HBM一飛沖天。但我們知道AI推理的廣泛應(yīng)用才能推動(dòng)A
    的頭像 發(fā)表于 03-03 08:51 ?1678次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲(chǔ),看好SRAM?

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(
    發(fā)表于 07-16 15:29

    邊緣AI盒子技術(shù)解析:ASIC/FPGA/GPU芯片及邊緣-云端協(xié)同與自適應(yīng)推理

    ? 電子發(fā)燒友網(wǎng)綜合報(bào)道 邊緣AI盒子是一種集成了高性能芯片、AI算法和數(shù)據(jù)處理能力的硬件設(shè)備,部署在數(shù)據(jù)源的邊緣側(cè),如工廠、商場(chǎng)、交通路口等,能在本地進(jìn)行數(shù)據(jù)采集、預(yù)處理、分析和決策
    的頭像 發(fā)表于 07-13 08:25 ?2238次閱讀

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    與 Nordic 的 nRF54 系列超低功耗無(wú)線 SoC 結(jié)合,使得即使是資源極為有限的設(shè)備也能高效運(yùn)行邊緣 AI。Nordic 目前正在將 Neuton 深度集成到自身開(kāi)發(fā)生態(tài)中,未來(lái)會(huì)提供更多工具、固件
    發(fā)表于 06-28 14:18

    GAITC2025|張科:端云一體大模型推理應(yīng)用實(shí)戰(zhàn)

    出席并在《行業(yè)大模型應(yīng)用與發(fā)展》論壇發(fā)表演講,首次深入介紹京東零售在端云一體大模型推理架構(gòu)的實(shí)戰(zhàn)經(jīng)驗(yàn)與技術(shù)探索,并分享AI推理方向的未來(lái)發(fā)展
    的頭像 發(fā)表于 06-26 09:33 ?150次閱讀

    STM32F769是否可以部署邊緣AI?

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    TI邊緣AI技術(shù)如何融入實(shí)時(shí)控制系統(tǒng)

    談及人工智能,大家往往想到生成式 AI。但邊緣 AI正在我們的日常生活和工業(yè)制造中發(fā)揮著重要作用——在控制系統(tǒng)中融入邊緣 AI,可在電機(jī)驅(qū)動(dòng)
    的頭像 發(fā)表于 05-08 09:47 ?376次閱讀

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    華為AI WAN在智算邊緣推理網(wǎng)絡(luò)中的關(guān)鍵優(yōu)勢(shì)

    WAN:智算邊緣推理網(wǎng)絡(luò)架構(gòu)、實(shí)踐及產(chǎn)業(yè)進(jìn)展”的演講,詳細(xì)闡述了AI WAN在智算邊緣推理網(wǎng)絡(luò)中的關(guān)鍵優(yōu)勢(shì)及其對(duì)產(chǎn)業(yè)
    的頭像 發(fā)表于 04-09 09:53 ?466次閱讀

    2025邊緣AI預(yù)測(cè):昇騰310B邊緣將占工業(yè)推理市場(chǎng)35%的三大動(dòng)因

    據(jù)工信部《2025 智能算力發(fā)展白皮書(shū)》預(yù)測(cè),到 2025 年我國(guó)邊緣 AI 推理芯片市場(chǎng)規(guī)模將突破 580 億元,其中工業(yè)場(chǎng)景占比達(dá) 42%。在這場(chǎng)變革中,昇騰 310B
    的頭像 發(fā)表于 03-24 14:09 ?924次閱讀
    2025<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>預(yù)測(cè):昇騰310B<b class='flag-5'>邊緣</b>將占工業(yè)<b class='flag-5'>推理</b>市場(chǎng)35%的三大動(dòng)因

    當(dāng)我問(wèn)DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    資源浪費(fèi)。例如,在深度學(xué)習(xí)模型推理階段,F(xiàn)PGA可以針對(duì)特定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行硬件加速,提高推理速度。 3.支持邊緣計(jì)算與實(shí)時(shí)應(yīng)用 ? 邊緣計(jì)算:隨著物聯(lián)網(wǎng)的
    發(fā)表于 02-19 13:55

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    。這一變革不僅帶來(lái)了技術(shù)架構(gòu)的革新,更為產(chǎn)業(yè)發(fā)展開(kāi)辟了新的增長(zhǎng)空間。 傳統(tǒng)邊緣網(wǎng)關(guān)受限于計(jì)算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡(jiǎn)單處理,大量原始數(shù)據(jù)需要回傳云端處理,導(dǎo)致響應(yīng)延遲和帶寬壓力。AI技術(shù)
    發(fā)表于 02-15 11:41

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 02-08 09:59 ?713次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成式AI推理技術(shù)、市場(chǎng)與未來(lái)

    (reasoning)能力,這一轉(zhuǎn)變將極大推動(dòng)上層應(yīng)用的發(fā)展。 紅杉資本近期指出,在可預(yù)見(jiàn)的未來(lái),邏輯推理推理時(shí)計(jì)算將是一個(gè)重要主題,并開(kāi)啟生成式AI的下一階段。新一輪競(jìng)賽已然開(kāi)始。
    的頭像 發(fā)表于 01-20 11:16 ?839次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、市場(chǎng)與未來(lái)

    新品| LLM630 Compute Kit,AI 大語(yǔ)言模型推理開(kāi)發(fā)平臺(tái)

    LLM630LLM推理,視覺(jué)識(shí)別,可開(kāi)發(fā),靈活擴(kuò)展···LLM630ComputeKit是一款AI大語(yǔ)言模型推理開(kāi)發(fā)平臺(tái),專為邊緣計(jì)算和智能交互應(yīng)用而設(shè)計(jì)。該套件的主板搭載愛(ài)芯AX63
    的頭像 發(fā)表于 01-17 18:48 ?693次閱讀
    新品| LLM630 Compute Kit,<b class='flag-5'>AI</b> 大語(yǔ)言模型<b class='flag-5'>推理</b>開(kāi)發(fā)平臺(tái)