99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TVM中將計(jì)算算符分成四種

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2022-02-08 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:安平博,Xilinx高級(jí)工程師;來(lái)源:AI加速微信公眾號(hào)

算符融合將多個(gè)計(jì)算單元揉進(jìn)一個(gè)計(jì)算核中進(jìn)行,減少了中間數(shù)據(jù)的搬移,節(jié)省了計(jì)算時(shí)間。TVM中將計(jì)算算符分成四種:

1 injective。一一映射函數(shù),比如加法,點(diǎn)乘等。

2 reduction。輸入到輸出具有降維性質(zhì)的,比如sum。

3 complex-out。這是計(jì)算比較復(fù)雜的,比如卷積運(yùn)算等。

4 opaque。無(wú)法被融合的算符,比如sort。

根據(jù)以上對(duì)算符的不同類(lèi)型,TVM提供了三種融合規(guī)則:

pIYBAGAJ2T6AJeJJAADW3l6UdT0832.png

從一定角度看,這種融合實(shí)際上是數(shù)據(jù)計(jì)算pipeline化,即兩次計(jì)算中間數(shù)據(jù)不再經(jīng)歷store-load的過(guò)程,而是直接給到下一個(gè)計(jì)算單元完成計(jì)算。

在走入fuse ops代碼之前,還需要了解一些算法基礎(chǔ)知識(shí)。算符融合中應(yīng)用了支配樹(shù)算法。在一個(gè)有向無(wú)環(huán)圖中,對(duì)于一個(gè)節(jié)點(diǎn)n來(lái)說(shuō),從初始節(jié)點(diǎn)s出發(fā)到達(dá)n的所有路徑都經(jīng)歷一個(gè)節(jié)點(diǎn)m,那么m就是n的支配點(diǎn)。而距離n最近的支配點(diǎn)被稱(chēng)作立即支配點(diǎn)。以r為樹(shù)根,將所有立即支配點(diǎn)按照支配關(guān)系連接起來(lái)就形成了支配樹(shù)。立即后支配點(diǎn)是從一個(gè)點(diǎn)n出發(fā)所有到終止節(jié)點(diǎn)的路徑中通過(guò)的最近節(jié)點(diǎn),形成的支配樹(shù)是后支配樹(shù)。

在DAG中,對(duì)于一個(gè)點(diǎn),所有能到達(dá)它的點(diǎn)在支配樹(shù)中的LCA,就是它支配樹(shù)中的父親。為什么算符融合要建立在后支配樹(shù)的基礎(chǔ)上呢?我猜測(cè)可能是因?yàn)閷?duì)于兩個(gè)可融合算符在DAG中位置分為兩種,一種是父子關(guān)系,那么可以直接執(zhí)行算符融合算法;另外一種是它們之間是后支配關(guān)系。對(duì)于具有后支配關(guān)系的兩個(gè)節(jié)點(diǎn)(n->m),就要判斷未來(lái)路徑上的節(jié)點(diǎn)是否都能夠和點(diǎn)m發(fā)生融合,如果可以,那么n也可以和m發(fā)生融合。比如下圖:

o4YBAGAJ2XyAGjlUAAAaksTA-qU713.png

Conv2d要和elemwise add融合,必須判斷它的三個(gè)op是否能和elemwise add融合。

TVM中融合流程分為三步:

1 遍歷relay樹(shù),建立DAG用于后支配樹(shù)分析;

2 建立后支配樹(shù);

3 應(yīng)用算符融合算法。

一 建立DAG圖

算符融合代碼在src/relay/transforms/fuse_ops.cc中。其中算符融合也應(yīng)用在常量折疊中。

首先TVM中通過(guò)如下代碼來(lái)遍歷relay樹(shù)結(jié)構(gòu)并建立DAG圖。

pIYBAGAJ2buADAxoAACiH4i61bc319.png

o4YBAGAJ2hCAXqd5AAKMwZogBVY140.png

VisitExpr可以遞歸的調(diào)用在類(lèi)IndexedforwardGraph中定義的VisitExpr_函數(shù),通過(guò)深度優(yōu)先搜索遍歷relay樹(shù),并且建立DAG圖。深度優(yōu)先搜索是從exit節(jié)點(diǎn)作為根節(jié)點(diǎn)反向搜鎖的,因此搜索樹(shù)是一個(gè)后序搜索樹(shù)。Outputs中保存了一個(gè)節(jié)點(diǎn)的輸入的邊,在構(gòu)建后序支配樹(shù)會(huì)通過(guò)這些輸入邊求取LCA。那么在這個(gè)搜索樹(shù)基礎(chǔ)上應(yīng)用支配樹(shù)算法,就能夠得到一個(gè)后序支配樹(shù)了。在這個(gè)類(lèi)中針對(duì)不同節(jié)點(diǎn)類(lèi)型重寫(xiě)visitExpr_函數(shù),節(jié)點(diǎn)類(lèi)型有FunctionNode,ConstantNode, CallNode, TuppleNode等。我們來(lái)看CallNode的訪問(wèn)函數(shù)定義:

pIYBAGAJ2lmARVsVAAbKmwPUr8I233.png

在最后還會(huì)遞歸調(diào)用ExprVisitor::VisitExpr_函數(shù),最終將深度優(yōu)先搜索到的節(jié)點(diǎn)按照葉節(jié)點(diǎn)起始順序一次加入DAG圖中。只有ConstantNode的訪問(wèn)函數(shù)中不再調(diào)用VisitExpr_,因?yàn)槌A抗?jié)點(diǎn)應(yīng)該不存在葉節(jié)點(diǎn)了。在callNode中會(huì)將其輸入加入到DAG中,同時(shí)遍歷和輸入以及其op連接的節(jié)點(diǎn),ExprVisitor中對(duì)CallNode訪問(wèn)函數(shù)定義為:

o4YBAGAJ2peAYpq5AACTWGic2PA585.png

因?yàn)镋xprVisitor是被IndexForwardGraph繼承的,而VisitExpr_是虛擬函數(shù),this就會(huì)指向IndexForwardGraph實(shí)例,最終就會(huì)調(diào)用這個(gè)類(lèi)中定義的VisitExpr_函數(shù),實(shí)現(xiàn)遞歸的遍歷relay樹(shù)。

這里要關(guān)注一下OpPatternKind,它定義了算子類(lèi)型,是不同融合算法使用的依據(jù)。其定義在include/tvm/relay/op_attr_types.h文件中。

pIYBAGAJ2tuAdZhAAAHp6B7gjc0360.png

二 建立后序支配樹(shù)

接下來(lái)看后序支配樹(shù)的構(gòu)建。構(gòu)建函數(shù)是PostDom。因?yàn)楦?jié)點(diǎn)(DAG圖的出口)在post_dfs_order中最后,所以從根節(jié)點(diǎn)開(kāi)始尋找每個(gè)節(jié)點(diǎn)出點(diǎn)的LCA,這個(gè)LCA就是后序支配點(diǎn)。

o4YBAGAJ2xqAM6QfAADdIrgDoKQ847.png

GetNode函數(shù)是獲得支配點(diǎn),構(gòu)建支配樹(shù)。在GetNode中,首先初始化根節(jié)點(diǎn),然后求每個(gè)節(jié)點(diǎn)的輸入節(jié)點(diǎn)的LCA,即是這個(gè)節(jié)點(diǎn)的支配點(diǎn)。

pIYBAGAJ21mAScbsAAEpUSdPj2c136.png

LeastComonAncestor函數(shù)中主要代碼是:

pIYBAGAJ25mABK65AAF2UY5KmQs700.png

通過(guò)兩兩求節(jié)點(diǎn)的LCA,來(lái)求取所有節(jié)點(diǎn)的LCA。程序會(huì)將計(jì)算圖中的末節(jié)點(diǎn)深度設(shè)置為1。然后向上逐層增加,那么LCA的共同祖先是相同的,深度也一定是一致。遍歷所有的節(jié)點(diǎn),就得到一個(gè)后向支配樹(shù)。節(jié)點(diǎn)的pattern指向他的LCA。在計(jì)算支配點(diǎn)的pattern的時(shí)候,會(huì)依據(jù)pattern的定義,選擇pattern值最大的作為L(zhǎng)CA的pattern。這塊不是太深入理解??赡苁瞧涠x的從最小值到最大值pattern可以向下進(jìn)行融合,比如kElemWise=0, kInjective=2, 那么前者就能融合到KInjective中。

三 融合

完成了DAG和postDominator tree構(gòu)建后,就開(kāi)始融合操作。TVM中定義了group結(jié)構(gòu)體,用于表示融合后的圖結(jié)構(gòu)。Group結(jié)構(gòu)體如下:

pIYBAGAJ29eAK44AAAEOJLVDA3c904.png

如果某些算符可以融合,那么就通過(guò)這個(gè)結(jié)構(gòu)體中的parent,master_ref將這些節(jié)點(diǎn)建立連接關(guān)系。Group首先進(jìn)行初始化和DAG相同的圖。然后分別遍歷dag,postDominator tree,以及group圖中節(jié)點(diǎn),來(lái)判斷算符是否能被融合。Dag中和postDom中對(duì)應(yīng)相同index的節(jié)點(diǎn)分別是被支配點(diǎn)和支配點(diǎn)。主要融合函數(shù)是以下兩個(gè)函數(shù):

pIYBAGAJ3BaAGxgUAAD5TKkTU2I760.png

pIYBAGAJ3F2ATjJUAAPdJjrvDa0392.png

在runFuse中,有幾種情況是不進(jìn)行算符融合的:

1 算符類(lèi)型是Kopaque的。

2 該節(jié)點(diǎn)不存在支配點(diǎn)。

3 能夠融合的節(jié)點(diǎn)超過(guò)了一定數(shù)量。

融合操作算法基本上是考察當(dāng)前節(jié)點(diǎn)到其支配點(diǎn)所有路徑上的節(jié)點(diǎn)是否都符合融合規(guī)則,如果符合就進(jìn)行融合,不符合就不融合。函數(shù)CheckPath就是用于考察src到sink路徑是否能夠融合的。

融合分成了三個(gè)phase,每個(gè)phase處理不同可融合類(lèi)型。這里我沒(méi)有深入研究。當(dāng)判斷支配樹(shù)的前后節(jié)點(diǎn)可以融合后,就通過(guò)函數(shù)commitFuse執(zhí)行融合操作。

完成融合之后,會(huì)遍歷節(jié)點(diǎn)創(chuàng)建新的graph。

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • TVM
    TVM
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    3816
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RDMA簡(jiǎn)介3之四種子協(xié)議對(duì)比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網(wǎng)絡(luò)層級(jí)實(shí)現(xiàn)上有所不同,如圖1所示,接下來(lái)將
    發(fā)表于 06-04 16:05

    變頻器主要支持哪四種模式?有什么區(qū)別?

    變頻器作為現(xiàn)代工業(yè)自動(dòng)化領(lǐng)域中的關(guān)鍵設(shè)備,其控制模式的多樣性和靈活性對(duì)于滿(mǎn)足不同應(yīng)用場(chǎng)景的需求至關(guān)重要。變頻器主要支持四種控制模式:無(wú)PG的V/F模式、有PG的V/F模式、無(wú)PG的矢量控制模式以及有
    的頭像 發(fā)表于 04-16 18:22 ?671次閱讀
    變頻器主要支持哪<b class='flag-5'>四種</b>模式?有什么區(qū)別?

    四種常見(jiàn)ADC的特性和應(yīng)用

    模擬-數(shù)字轉(zhuǎn)換器(ADC)在現(xiàn)代電子系統(tǒng)中扮演著至關(guān)重要的角色,它們負(fù)責(zé)將連續(xù)的模擬信號(hào)轉(zhuǎn)換為離散的數(shù)字信號(hào)。這一轉(zhuǎn)換過(guò)程對(duì)于信號(hào)處理、通信、控制等多個(gè)領(lǐng)域都至關(guān)重要。本文將深入探討四種常見(jiàn)的ADC
    的頭像 發(fā)表于 02-02 13:52 ?1656次閱讀

    MSP430F4250的四種模式分別是在什么情況下使用呢?

    我是一名初學(xué)者,看了書(shū)知道MSP430F4250的AD轉(zhuǎn)換模式有四種,我想知道這四種轉(zhuǎn)化模式有什么區(qū)別,分別應(yīng)該在什么情況下使用。各位高手能否為我解答哈,在下不勝感激。因?yàn)槭浅鯇W(xué)者,有很多東西都不知道,能盡量詳細(xì)就盡量哈,謝謝了。
    發(fā)表于 01-06 06:16

    私藏技術(shù)大公開(kāi)!四種常見(jiàn)供電方案

    在現(xiàn)代生活中,供電問(wèn)題直接關(guān)系到我們的生活質(zhì)量與工作效率。以下是四種超實(shí)用的供電方案,無(wú)論是在家庭生活還是工作場(chǎng)景中,都能為你提供穩(wěn)定可靠的電力支持。 常見(jiàn)的物聯(lián)網(wǎng)應(yīng)用場(chǎng)景下,供電方式有四種
    的頭像 發(fā)表于 12-31 14:28 ?2367次閱讀
    私藏技術(shù)大公開(kāi)!<b class='flag-5'>四種</b>常見(jiàn)供電方案

    被問(wèn)爆的四種供電方式,來(lái)啦~

    4G模組的外部電源供電設(shè)計(jì)十分重要,對(duì)系統(tǒng)穩(wěn)定、射頻性能都有直接影響。 常見(jiàn)的物聯(lián)網(wǎng)應(yīng)用場(chǎng)景下,供電方式有四種: LDO供電方式 DCDC供電方式 鋰電池供電以及充電方式 不可充電鋰亞/鋰錳電池供電
    的頭像 發(fā)表于 12-30 15:40 ?926次閱讀
    被問(wèn)爆的<b class='flag-5'>四種</b>供電方式,來(lái)啦~

    DAC61404 SPI應(yīng)該是四種模式中的哪種?

    DAC61404 SPI應(yīng)該是四種模式中的哪種?
    發(fā)表于 11-27 06:18

    電氣設(shè)備的四種工作狀態(tài)

    在供配電系統(tǒng)中,電器設(shè)備的狀態(tài)管理是確保電力系統(tǒng)穩(wěn)定運(yùn)行和用電安全的關(guān)鍵。根據(jù)電氣設(shè)備的工作條件和安全要求,通常將電氣設(shè)備備的狀態(tài)分為四種不同的狀態(tài):運(yùn)行狀態(tài)、熱備用狀態(tài)、冷備用狀態(tài)和檢修狀態(tài)。下面
    的頭像 發(fā)表于 10-04 11:15 ?6344次閱讀

    雙軸測(cè)徑儀的四種樣式!

    儀設(shè)計(jì)了四種外觀樣式。 45°角布置的開(kāi)口測(cè)徑儀 這個(gè)樣式的雙軸測(cè)徑儀是目前大部分產(chǎn)線所使用的,樣式簡(jiǎn)單大氣。用于外徑及橢圓度尺寸的檢測(cè)。 45°角布置的閉口測(cè)徑儀 該樣式的雙軸測(cè)徑儀將上面的開(kāi)口閉合
    發(fā)表于 08-27 17:42

    串行口的四種工作方式各有什么特點(diǎn)

    串行通信是計(jì)算機(jī)硬件和外設(shè)之間常用的通信方式之一。串行口(Serial Port)是實(shí)現(xiàn)串行通信的硬件接口。在計(jì)算機(jī)系統(tǒng)中,串行口通常用于連接鼠標(biāo)、調(diào)制解調(diào)器、打印機(jī)等設(shè)備。串行口有四種工作方式
    的頭像 發(fā)表于 08-22 17:37 ?3759次閱讀

    變流電路的換流方式有哪四種

    變流電路是一將一形式的電能轉(zhuǎn)換為另一形式的電能的電路,廣泛應(yīng)用于電力電子領(lǐng)域。在變流電路中,換流方式是實(shí)現(xiàn)電能轉(zhuǎn)換的關(guān)鍵技術(shù)之一。換流方式主要有四種:負(fù)載換流、自換流、強(qiáng)迫換流和
    的頭像 發(fā)表于 08-14 11:08 ?5159次閱讀

    濾波電路的四種類(lèi)型是什么

    濾波電路是電子電路中非常重要的一部分,它主要用于對(duì)信號(hào)進(jìn)行頻率選擇,即允許特定頻率范圍內(nèi)的信號(hào)通過(guò),而阻止其他頻率的信號(hào)。濾波電路根據(jù)其特性可以分為四種基本類(lèi)型:低通濾波器(Low-Pass
    的頭像 發(fā)表于 08-08 16:25 ?6047次閱讀

    負(fù)反饋的四種類(lèi)型是什么

    負(fù)反饋是電子系統(tǒng)中常用的一技術(shù),它通過(guò)將系統(tǒng)輸出的一部分信號(hào)以某種方式反饋到輸入端,以減小輸出信號(hào)與期望信號(hào)之間的差異,從而提高系統(tǒng)的穩(wěn)定性和性能。負(fù)反饋主要分為四種類(lèi)型:電壓串聯(lián)負(fù)反饋、電壓并聯(lián)負(fù)反饋、電流串聯(lián)負(fù)反饋和電流并聯(lián)負(fù)反饋。
    的頭像 發(fā)表于 08-08 16:15 ?9316次閱讀

    負(fù)反饋的四種類(lèi)型及判斷方法

    負(fù)反饋,又稱(chēng)為負(fù)反饋調(diào)節(jié),是指在一個(gè)系統(tǒng)中,當(dāng)系統(tǒng)輸出的某些變化對(duì)輸入產(chǎn)生抑制作用時(shí),系統(tǒng)會(huì)自動(dòng)調(diào)節(jié)以維持穩(wěn)定狀態(tài)的現(xiàn)象。負(fù)反饋在生物、工程、經(jīng)濟(jì)等多個(gè)領(lǐng)域都有廣泛的應(yīng)用。本文將介紹負(fù)反饋的四種
    的頭像 發(fā)表于 08-02 11:01 ?4994次閱讀

    簡(jiǎn)述四種基本觸發(fā)器及其功能

    在數(shù)字電路設(shè)計(jì)中,觸發(fā)器是一基本且重要的存儲(chǔ)元件,用于存儲(chǔ)二進(jìn)制信息(即0和1)。根據(jù)功能和應(yīng)用場(chǎng)景的不同,觸發(fā)器可以分為多種類(lèi)型,其中四種基本觸發(fā)器包括RS觸發(fā)器、JK觸發(fā)器、D觸發(fā)器和T觸發(fā)器。以下是對(duì)這四種基本觸發(fā)器及其
    的頭像 發(fā)表于 07-27 14:59 ?1.9w次閱讀