99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Linux讀寫鎖邏輯解析—嘗試獲取寫鎖

冬至子 ? 來源:內(nèi)核工匠 ? 作者:郭健Cojack ? 2023-12-04 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Rwsem的count成員還有一些bit用來標記當前讀寫鎖狀態(tài)(waiter bit和handoff bit),也需要根據(jù)情況進行調(diào)整:

1.jpg

A、如果等待隊列為空了,肯定是要清除waiter flag,同時要清除handoff flag,畢竟沒有什么等待任務可以遞交鎖了。

B、雖然隊列非空,但已經(jīng)喚醒了reader,那么需要清除handoff標記,畢竟top waiter已經(jīng)被喚醒去持鎖了,完成了鎖的遞交。

C、完成sem->count的調(diào)整

第二輪將喚醒的reader加入喚醒隊列,具體的邏輯如下:

1.jpg

主要是把等待任務對象的task成員設置為NULL,喚醒之后根據(jù)這個成員來判斷是正常喚醒還是異常喚醒路徑。

這里對喚醒等待隊列上的reader和writer處理是不一樣的。對于writer,喚醒之然后被調(diào)度到之后再去試圖持鎖。對于reader,在喚醒路徑上就已經(jīng)持鎖(增加rwsem的reader count,并且修改了相關的狀態(tài)標記)。之所以這么做主要是降低調(diào)度的開銷,畢竟若干個reader線程被喚醒之后,獲得CPU資源再去持鎖,持鎖失敗然后繼續(xù)阻塞,這些都會增加調(diào)度的負載。

七、嘗試獲取寫鎖

和down_write不一樣,down_write_trylock只是嘗試獲取寫鎖,如果成功,那么自然是好的,直接返回1,如果失敗,也不會阻塞,只是返回0就可以了。代碼主邏輯在rwsem_write_trylock函數(shù)中,如下:

1.jpg

tmp的初始值設定為RWSEM_UNLOCKED_VALUE(0值),對于writer而言,只有rwsem是空鎖的時候才能進入臨界區(qū)。如果當前的sem->count等于0,那么給sem->count賦值RWSEM_WRITER_LOCKED,標記持鎖成功,并且把owner設定為當前task。

atomic_long_try_cmpxchg_acquire函數(shù)有三個參數(shù),從左到右分別是value,old和new。該函數(shù)會對比value和old,如果相等那么執(zhí)行賦值value=new同時返回true。如果不相等,不執(zhí)行賦值操作,直接返回false。

八、獲取寫鎖

Writer獲取寫鎖的代碼主要在__down_write_common函數(shù)中,如下:

1.jpg

rwsem_write_trylock(快速路徑)上一節(jié)已經(jīng)描述,我們主要看慢速路徑的邏輯(樂觀自旋我們下面會講,這里暫且略過):

1.jpg

首先準備好一個等待任務對象(棧上)并初始化,將其掛入等待隊列。在真正睡眠之前,我們需要做一些喚醒動作(和reader持鎖過程類似,有可能在掛入等待隊列的時候,臨界區(qū)線程恰好離開,變成空鎖),具體邏輯如下:

1.jpg

A、如果我們是等待隊列的top waiter(等待隊列從空變?yōu)榉强眨敲葱枰O定RWSEM_FLAG_WAITERS標記,直接進入后續(xù)阻塞邏輯。如果不是,那么邏輯要復雜點,需要掃描一下之前掛入隊列的任務,看看是否需要喚醒。

B、如果是writer持鎖,那么不需要任何喚醒動作,畢竟writer是排他的

C、如果是空鎖狀態(tài),我們需要喚醒top waiter(RWSEM_WAKE_ANY,top writer或者reader們)。你可能會疑問:為何空鎖還要喚醒等待隊列的線程?當前線程快馬加鞭去持鎖不就OK了嗎?這主要是和handoff邏輯相關,這時候更應該持鎖的是等待隊列中設置了handoff的那個waiter,而不是當前writer。如果是reader在臨界區(qū)內(nèi),那么,我們將喚醒本等待隊列頭部的所有reader(RWSEM_WAKE_READERS)。

D、上面僅僅是標記喚醒者,這里的代碼段完成具體的喚醒動作

下面進入具體writer的阻塞過程:

1.jpg

A、調(diào)用rwsem_try_write_lock試圖持鎖,如果成功持鎖則退出循環(huán),不再阻塞。有兩個邏輯路徑會路過這里。一個是線程持鎖失敗進入這里,另外一個是阻塞后被喚醒試圖持鎖。

B、有pending的信號,異常路徑退出

C、持鎖失敗但是設置了handoff,那么該線程對owner進行自旋等待,以便加快鎖的傳遞。

D、進入阻塞狀態(tài)

E、喚醒之后,重新試圖持鎖。Writer和reader不一樣,writer是喚醒之后自己再通過rwsem_try_write_lock試圖持鎖,而reader是在喚醒路徑上持鎖。

rwsem_try_write_lock代碼如下:

1.jpg

A、如果已經(jīng)設置了handoff,并且自己不是top waiter(top waiter才是鎖要遞交的對象),返回false,持鎖失敗。如果是top waiter,那么就設置handoff_set,標記自己就是鎖遞交的目標任務。

B、如果當前rwsem已經(jīng)有了owner,那么說明該鎖被偷走了。在適當?shù)臈l件下(等待超時)設置handoff標記,防止后續(xù)繼續(xù)被搶。如果已經(jīng)設置了handoff就不必重復設置了。

C、如果當前rwsem沒有owner,則持鎖成功,清除handoff標記并根據(jù)情況設置waiter標記。

D、通過原子操作來持鎖,成功操作后退出循環(huán),否則是有其他線程插入,需要重復上面的邏輯。

1.jpg

至此我們要不獲取了鎖并清除了handoff bit(B邏輯塊),或者沒有獲取鎖,僅僅是設置了handoff bit(A邏輯塊)。

九、釋放寫鎖

除了清除了owner task成員,其他邏輯和釋放讀鎖類似,不再贅述。

十、樂觀自旋的條件

只有writer在進入慢速路徑的時候才會進行樂觀自旋,而rwsem_can_spin_on_owner函數(shù)用來判斷writer是否可以樂觀自旋:

1.jpg

A、本cpu上需要reschedule,還自旋個毛線,趕緊去睡眠也順便觸發(fā)一次調(diào)度

B、讀取sem->owner,標記部分保存在flags臨時變量中,任務指針保存在owner中

C、如果該rwsem已經(jīng)禁止了對應的nonspinnable標志,那么肯定是不能樂觀自旋了。如果當前rwsem沒有禁止,那么需要看看owner的狀態(tài)。這里需要特別說明的是:為了方便debug,我們在釋放讀鎖的時候并不會清除owner task。也就是說,對于reader而言,owner中的task信息是最后進入臨界區(qū)的那個reader,僅此而已,實際這個task可能已經(jīng)離開臨界區(qū),甚至已經(jīng)銷毀都有可能。所以,如果rwsem是reader擁有,那么其實判斷owner是否在cpu上運行是沒有意義的,因此owner是reader的話是允許進行樂觀自旋的(ret的缺省值是true),通過超時來控制自旋的退出。如果rwsem是writer擁有,那么owner的的確確是正在持鎖的線程,如果該線程沒有在CPU上運行(不能很快離開臨界區(qū)),那么也不能樂觀自旋。

十一、rwsem_spin_on_owner

函數(shù)rwsem_spin_on_owner的功能是對rwsem的owner task進行樂觀自旋(即不斷輪詢其狀態(tài),僅writer有效),詳細的代碼邏輯如下:

1.jpg

A、在自旋之前,首先要獲得初始的狀態(tài)(owner task指針以及2-bit LSB flag),當這些狀態(tài)發(fā)生變化才好退出自旋。

B、rwsem_owner_state函數(shù)會根據(jù)當前的owner task和flag判斷當前的owner state。owner state的狀態(tài)總結(jié)如下:

1.jpg

只有明確的知道當前rwsem的owner是某個writer線程且沒有禁止自旋的時候才開啟下面的自旋過程。對于其他情況,例如reader owned的場景,我們不需要spin on owner,直接返回。

C、只要owner task或者flag其一發(fā)生變化,這里就會停止輪詢,同時也會返回當前的狀態(tài),說明停止自旋的原因。例如當owner task(一定是writer)離開臨界區(qū)的時候會清空rwsem的owner域(owner task和flag會清零),這時候自旋的writer會停止自旋,到外層函數(shù)會去試圖持鎖。當然也有可能是其他自旋writer搶到了鎖,owner task從A切到B。無論那種情況,統(tǒng)一終止對owner的自旋。

D、如果當前cpu需要reschedule或者owner task沒有正在運行,那么也需要停止自旋

十二、Writer的樂觀自旋

和mutex的樂觀自旋的概念是類似的,想要進行rwsem的樂觀自旋,首先要獲取osq鎖,只有獲得了osq lock才能進入rwsem的樂觀自旋,否則自旋在per cpu的mcs lock上。Writer通過rwsem_optimistic_spin完成整個樂觀自旋的過程。對于writer owned場景,自旋發(fā)生在rwsem_spin_on_owner中,上一節(jié)已經(jīng)描述了,這里我們主要看reader owned的情況,這時候通過for loop不斷自旋去持鎖:

1.jpg

2.jpg

A、對于rwsem,只有writer-owned場景能清楚的知道owner task是哪一個。因此,如果是writer-owned場景,會在rwsem_spin_on_owner函數(shù)進行自旋。對于非writer-owned場景(reader-owned場景或者禁止了樂觀自旋),在rwsem_spin_on_owner函數(shù)中會直接返回。從rwsem_spin_on_owner函數(shù)返回會給出owner state,如果需要退出樂觀自旋,那么這里break掉,自旋失敗,下面就準備掛入等待隊列了。

B、每次退出rwsem_spin_on_owner并且沒有要退出自旋的時候,都試著去獲取rwsem,如果持鎖成功那么退出樂觀自旋。

C、C和D是對reader-owned場景的處理。每次rwsem的owner state發(fā)生變化(從non-reader變成reader-owned狀態(tài))時都會重新初始化 rspin_threshold。

D、Owner state沒有發(fā)生變化,那么當前試圖持鎖的writer可以進行樂觀自旋,但是需要有一個度,畢竟rwsem的臨界區(qū)內(nèi)可能有多個reader線程,這有可能使得writer樂觀自旋很長時間。設置自旋門限閾值的公式是Spinning threshold = (10 + nr_readers/2)us,最大25us(30 reader)。一旦自旋超期,那么將調(diào)用rwsem_set_nonspinnable禁止樂觀自旋。

E、對于writer-owned場景,need_resched在函數(shù)rwsem_spin_on_owner中完成,對于reader-owned場景,也是需要檢查owner task所在cpu的resched情況。畢竟當前任務如果有調(diào)度需求,無論reader持鎖還是writer持鎖場景都要停止自旋。

F、在reader-owned場景中,由于無法判定臨界區(qū)reader們的執(zhí)行狀態(tài),因此rt線程的樂觀自旋需要更加的謹慎,畢竟有可能自旋的rt線程和臨界區(qū)的reader在一個CPU上從而導致活鎖現(xiàn)象。當然也不能禁止rt線程的自旋,畢竟在臨界區(qū)為空的情況下,rt自旋會有一定的收益的。允許rt線程自旋的場景有兩個:

a) lock owner正在釋放鎖,sem->owner被清除但是鎖還沒有釋放。

b) 鎖是空閑的并且sem->owner已清除,但是在我們嘗試獲取鎖之前另一個任務剛剛進入并獲取了鎖(例如一個自旋的writer先于我們進入臨界區(qū))。

十三、關于handoff

1、設置handoff標記

設置handoff往往是發(fā)生在喚醒持鎖階段。對于等待隊列的writer,喚醒之后要調(diào)度執(zhí)行后才去持鎖,這是一個長路徑,很可能被其他的write或者reader把鎖搶走。喚醒等待隊列中的reader們有點不一樣,在喚醒路徑上就會從這一組待喚醒的reader們選出一個代表(一般是top waiter)去持鎖,然后再一個個的喚醒。在這個reader代表線程持鎖的時候也有可能由于writer偷鎖而失?。╮eader雖然也會偷鎖,但是偷鎖的reader也會喚醒等待隊列的reader們,完成top waiter未完成的工作)。

無論是reader還是writer,如果喚醒后持鎖失敗,并且等待時間已經(jīng)超過了RWSEM_WAIT_TIMEOUT,這時候就會設置handoff bit,防止等待隊列的waiter餓死。具體設置handoff bit的場景如下:

1.jpg

2、清除handoff標記

標記了hand off之后,快速路徑、樂觀偷鎖(reader)、樂觀自旋(writer)都無法完成持鎖,鎖最終會遞交給top waiter的線程,完成持鎖。一旦完成持鎖,handoff標記就會被清除。具體清除handoff bit的場景包括:

1.jpg

3、確保鎖的所有權(quán)遞交給top waiter

1.jpg

十四、結(jié)論

標準linux內(nèi)核的讀寫鎖是在公平性、吞吐量和延遲選擇了比較均衡的策略,這樣的策略在手機平臺上(特別是重載場景下)不能算是“優(yōu)秀”,只能是合格吧。實際上,在手機用戶交互場景中,我們更期望是確保用戶體驗相關線程的持鎖時延,同時兼顧吞吐量。在這樣的背景下,OPPO內(nèi)核團隊對linux中的讀寫鎖進行了優(yōu)化,下一次有機會可以分享我們在讀寫鎖的持鎖時延方面做的改進。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11080

    瀏覽量

    217117
  • Linux
    +關注

    關注

    87

    文章

    11511

    瀏覽量

    213842
  • 狀態(tài)機
    +關注

    關注

    2

    文章

    493

    瀏覽量

    28252
  • Spin
    +關注

    關注

    0

    文章

    4

    瀏覽量

    8159
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Linux下線程間通訊---讀寫和條件變量

    讀寫,它把對共享資源的訪問者劃分成讀者和者,讀者只對共享資源進行讀訪問,者則需要對共享資源進行操作。件變量是線程可用的一種同步機制,
    的頭像 發(fā)表于 08-26 20:44 ?1864次閱讀
    <b class='flag-5'>Linux</b>下線程間通訊---<b class='flag-5'>讀寫</b><b class='flag-5'>鎖</b>和條件變量

    Linux讀寫邏輯解析Linux為何會引入讀寫?

    除了mutex,在linux內(nèi)核中,還有一個經(jīng)常用到的睡眠就是rw semaphore(后文簡稱為rwsem),它到底和mutex有什么不同呢?
    的頭像 發(fā)表于 12-04 11:04 ?1335次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>讀寫</b><b class='flag-5'>鎖</b><b class='flag-5'>邏輯</b><b class='flag-5'>解析</b>—<b class='flag-5'>Linux</b>為何會引入<b class='flag-5'>讀寫</b><b class='flag-5'>鎖</b>?

    FPGA代碼時,產(chǎn)生了存器有什么影響嗎

    經(jīng)常看到各種HDL代碼時說要避免生成存器,但是在某些情況,我不關心那種情況即使它生成了存器,對我的工程實現(xiàn)也沒有什么影響啊,想請教下各位大神,既然這樣,為什么還要避免生成存器(
    發(fā)表于 01-08 23:54

    Lock體系結(jié)構(gòu)和讀寫機制解析

    問題,JDK中還有另一套讀寫機制。讀寫中維護一個共享讀和一個排它
    發(fā)表于 01-05 17:53

    《有》/《無》/《簽約》/《解鎖》/《越獄》/《激活》專

    《有》/《無》/《簽約》/《解鎖》/《越獄》/《激活》專業(yè)技術(shù)詞解析 在討論區(qū)里,大家看到:《有版》,《無版》,《解
    發(fā)表于 02-03 11:05 ?1045次閱讀

    Linux 自旋spinlock

    背景 由于在多處理器環(huán)境中某些資源的有限性,有時需要互斥訪問(mutual exclusion),這時候就需要引入的概念,只有獲取的任務才能夠?qū)Y源進行訪問,由于多線程的核心是CPU的時間分片
    的頭像 發(fā)表于 09-11 14:36 ?2327次閱讀

    詳談Linux操作系統(tǒng)的三種狀態(tài)的讀寫

    讀寫是另一種實現(xiàn)線程間同步的方式。與互斥量類似,但讀寫將操作分為讀、兩種方式,可以多個線程同時占用讀模式的
    的頭像 發(fā)表于 09-27 14:57 ?3338次閱讀

    Linux中的傷害/等待互斥介紹

    序言:近期讀Linux 5.15的發(fā)布說明,該版本合并了實時機制,當開啟配置宏CONFIG_PREEMPT_RT的時候,這些被基于實時互斥的變體替代:mutex、ww_mutex
    的頭像 發(fā)表于 11-06 17:27 ?2933次閱讀

    使用Linux自旋實現(xiàn)互斥點燈

    自旋最多只能被一個可執(zhí)行線程持有。如果一個線程試圖獲得一個已經(jīng)被持有的自旋,那么該線程將循環(huán)等待,然后不斷的判斷是否能夠被成功獲取,直到獲取
    的頭像 發(fā)表于 04-13 15:09 ?1005次閱讀
    使用<b class='flag-5'>Linux</b>自旋<b class='flag-5'>鎖</b>實現(xiàn)互斥點燈

    Linux實例:多線程和互斥到底該如何使用

    最近在多進程和Linux中的各種的文章,總覺得只有文字講解雖然能夠知道多進程和互斥是什么,但是還是不知道到底該怎么用。
    發(fā)表于 05-18 14:16 ?583次閱讀
    <b class='flag-5'>Linux</b>實例:多線程和互斥<b class='flag-5'>鎖</b>到底該如何使用

    Linux互斥的作用 互斥是什么

    。如果釋放互斥時有一個以上的線程阻塞,那么這些阻塞的線程會被喚醒,它們都會嘗試對互斥進行加鎖,當有一個線程成功對互斥鎖上鎖之后,其它線程就不能再次上鎖了,只能再次陷入阻塞,等待下一次解鎖。 初始化互斥
    的頭像 發(fā)表于 07-21 11:13 ?1229次閱讀

    自旋和互斥的區(qū)別有哪些

    之間的區(qū)別: 實現(xiàn)方式上的區(qū)別:互斥是基于自旋而實現(xiàn)的,所以自旋鎖相較于互斥更加底層; 開銷上的區(qū)別:獲取不到互斥
    的頭像 發(fā)表于 07-21 11:19 ?9996次閱讀

    讀寫的實現(xiàn)原理規(guī)則

    讀寫 互斥或自旋要么是加鎖狀態(tài)、要么是不加鎖狀態(tài),而且一次只有一個線程可以對其加鎖。 讀寫
    的頭像 發(fā)表于 07-21 11:21 ?1246次閱讀
    <b class='flag-5'>讀寫</b><b class='flag-5'>鎖</b>的實現(xiàn)原理規(guī)則

    AQS獨占獲取

    AQS提供了兩種,獨占和共享。獨占只有一把,同一時間只允許一個線程獲得;而共享
    的頭像 發(fā)表于 10-13 14:51 ?685次閱讀
    AQS獨占<b class='flag-5'>鎖</b>的<b class='flag-5'>獲取</b>

    互斥和自旋的區(qū)別 自旋臨界區(qū)可以被中斷嗎?

    獲得了互斥時,其他線程如果要獲取,則必須等待直到該線程釋放?;コ?b class='flag-5'>鎖的實現(xiàn)通常會利用操作系統(tǒng)提供的原子操作和線程調(diào)度機制。當某個線程
    的頭像 發(fā)表于 11-22 17:41 ?1207次閱讀