99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TECS OpenStack資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問題處理

中興文檔 ? 來源:中興文檔 ? 2025-03-03 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

故障現(xiàn)象

某運(yùn)營商TECS資源池的一臺主機(jī)內(nèi)存故障,進(jìn)行關(guān)機(jī)、內(nèi)存更換操作,虛機(jī)自動遷移到其他主機(jī)上,同時做了其他虛擬機(jī)的手動遷移操作。后續(xù)在TECS上出現(xiàn)虛機(jī)內(nèi)核異常告警,如下圖所示。

942c8290-f40f-11ef-9310-92fbcf53809c.png

故障分析

1. 檢查告警,確認(rèn)是一臺虛擬機(jī)的多次告警,如下圖所示。

944e21ac-f40f-11ef-9310-92fbcf53809c.png

2. 經(jīng)排查,服務(wù)器SRV-09有內(nèi)存更換和下電操作,00:39 虛機(jī)全部自動遷移成功,其中包含了XXX0012虛機(jī),同時還包括其他網(wǎng)元的虛機(jī),其他網(wǎng)元未出現(xiàn)異常。

3. 現(xiàn)場進(jìn)行虛機(jī)重啟、遷移等操作,未成功恢復(fù)XXX00012虛機(jī)。分析虛機(jī)CPU都沖高到100%,虛機(jī)操作系統(tǒng)顯示軟鎖,如下圖所示。

9485e0b0-f40f-11ef-9310-92fbcf53809c.png

4. 經(jīng)操作系統(tǒng)分析,是有大量外部報文沖擊導(dǎo)致CPU沖高到100%,系統(tǒng)得不到調(diào)度。

5. 將該網(wǎng)元中除XXX00012外的其他虛機(jī)都shutdown后,再重啟XXX00012虛機(jī),XXX00012虛擬機(jī)恢復(fù)正常。

6. 逐一開啟其他虛機(jī),發(fā)現(xiàn)XXX00012虛機(jī)異常,其余虛機(jī)均正常啟動。3分鐘后XXX00012虛機(jī)CPU再次沖高到100%。

7. 分析XXX00012虛機(jī),發(fā)現(xiàn)該虛機(jī)存在I/O Error,數(shù)據(jù)盤不能正常讀寫,如下圖所示。

94916b24-f40f-11ef-9310-92fbcf53809c.png

8. 分析虛機(jī)殘留問題,原主機(jī)SRV-09故障下電后,虛機(jī)自動遷移,第一次自動遷移失敗,自動遷移落地的節(jié)點(diǎn)是SRV-10,如下圖所示。

94a8e088-f40f-11ef-9310-92fbcf53809c.png

9. SRV-10節(jié)點(diǎn)上因?yàn)閹捹Y源不足落地失敗,XXX00012虛機(jī)重新自動遷移到SRV-12,自動遷移成功,如下圖所示。

94cc0842-f40f-11ef-9310-92fbcf53809c.png

10. 自動遷移異常導(dǎo)致虛機(jī)實(shí)例在SRV-10和SRV-12同時啟動,如下圖所示。

94f0ad00-f40f-11ef-9310-92fbcf53809c.png

11. 綜上分析,產(chǎn)生該問題的原因是殘留虛機(jī),導(dǎo)致網(wǎng)元異常。

故障處理

1. 關(guān)閉SRV-12服務(wù)器上XXX0012虛機(jī),同時刪除SRV-10服務(wù)器上該虛機(jī)殘留的實(shí)例。

2. 重啟XXX0012虛機(jī),虛機(jī)啟動正常,CPU恢復(fù)正常。觀察半小時未再出現(xiàn)異常。

3. 總結(jié):異地重生階段建議不要做其他互斥或者相同的操作,容易造成集群中數(shù)據(jù)不一致等問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1416

    瀏覽量

    41424
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217050
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3124

    瀏覽量

    75266
  • 主機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    1038

    瀏覽量

    35985
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    966

    瀏覽量

    29358

原文標(biāo)題:TECS OpenStack-資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RCS融合通信系統(tǒng)設(shè)計方案解析

    TECS主要由以下部分組成:OpenStack自身的組件,OpenStack部署相關(guān)組件,以及擴(kuò)展的HA、自動部署與管理、系統(tǒng)管理(軟、硬件資源管理)等組件,
    發(fā)表于 07-01 15:45 ?3210次閱讀
    RCS融合通信系統(tǒng)設(shè)計方案解析

    OpenStack資源調(diào)度和現(xiàn)狀分析

    OpenStack云端的資源調(diào)度和優(yōu)化剖析2016-07-03 19:12 作者簡介:胡曉亮,目前就職于IBM Platform Computing 系統(tǒng)科技部云計算部門,擔(dān)任云計算開發(fā)部工程師。自
    發(fā)表于 10-10 10:44 ?0次下載
    <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b>調(diào)度和現(xiàn)狀分析

    電力云資源的建立

    國家電網(wǎng)公司從2010年開始建設(shè)電力云資源,存儲域作為資源的必須部分,設(shè)計和實(shí)現(xiàn)存儲域是資源
    發(fā)表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    OpenStack云平臺監(jiān)控數(shù)據(jù)采集及處理的實(shí)踐與優(yōu)化

    本文介紹了在OpenStack云平臺中通過Ceilometer采集云平臺中虛擬機(jī)、磁盤、網(wǎng)絡(luò)等資源的使用數(shù)據(jù),并通過Gnocchi處理、儲存和索引數(shù)據(jù)的實(shí)踐。
    的頭像 發(fā)表于 12-25 18:38 ?2321次閱讀

    線程池中如何獲取和處理異常

    在實(shí)際開發(fā)中,我們常常會用到線程,但任務(wù)一旦提交到線程之后,如果發(fā)生異常之后,怎么處理?
    的頭像 發(fā)表于 10-24 15:44 ?1700次閱讀

    TECS資源池上報網(wǎng)絡(luò)流程異常告警的問題處理

    資源TECS上報網(wǎng)絡(luò)流程異常告警,告警單次持續(xù)15秒-4分鐘之間。
    的頭像 發(fā)表于 06-07 09:41 ?1281次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報網(wǎng)絡(luò)流程<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    TECS資源池上報存儲設(shè)備離線的問題處理

    資源在運(yùn)行過程中出現(xiàn)存儲設(shè)備離線告警,通過底層cinder service-list命令查看,確認(rèn)存儲state為down狀態(tài)。
    的頭像 發(fā)表于 06-07 09:44 ?916次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報存儲設(shè)備離線的問題<b class='flag-5'>處理</b>

    TECS資源SSH控制節(jié)點(diǎn)機(jī)提示connection refused的問題處理

    某局點(diǎn)現(xiàn)場TECS控制節(jié)點(diǎn)的TECSClient平面使用雙棧配置,同時使用IPv4和IPv6。
    的頭像 發(fā)表于 06-07 09:47 ?1117次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>SSH控制節(jié)點(diǎn)<b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>提示connection refused的問題<b class='flag-5'>處理</b>

    TECS資源池上報BFD會話DOWN和網(wǎng)絡(luò)流量異常告警的問題處理

    資源TECS上報BFD會話DOWN告警和網(wǎng)絡(luò)流量異常告警,持續(xù)時間1秒至6分鐘不等,如下圖所示。
    的頭像 發(fā)表于 06-07 09:49 ?1850次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報BFD會話DOWN和網(wǎng)絡(luò)流量<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    資源后端存儲服務(wù)狀態(tài)異常的問題處理

    故障現(xiàn)象某資源在巡檢過程中檢查服務(wù)狀態(tài),其中云盤后端的服務(wù)狀態(tài)為down,如下圖所示,影響虛擬機(jī)云盤的生命周期管理操作。
    的頭像 發(fā)表于 09-20 11:06 ?1029次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>后端存儲服務(wù)狀態(tài)<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    資源虛擬機(jī)時鐘跳變異常的問題處理

    資源在運(yùn)行過程中一臺虛擬機(jī)出現(xiàn)業(yè)務(wù)異常,通過查看日志和異常記錄,判斷為虛擬機(jī)發(fā)生時鐘跳變問題
    的頭像 發(fā)表于 09-20 11:08 ?1919次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬機(jī)時鐘跳變<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源時間同步失敗的故障分析

    某運(yùn)營商TECS OpenStack資源,在當(dāng)前告警中顯示“時鐘同步失敗”,以10分鐘整數(shù)倍為間隔上報“時間同步失敗”告警,持續(xù)時間30秒-1分鐘不等。
    的頭像 發(fā)表于 03-03 10:09 ?449次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時間同步失敗的故障分析

    TECS OpenStack資源機(jī)寫磁盤時延高告警的問題處理

    某運(yùn)營商TECS資源,在當(dāng)前告警中顯示“機(jī)寫磁盤時延高告警”,如下圖所示。告警統(tǒng)計總體平均10分鐘左右自動恢復(fù)。
    的頭像 發(fā)表于 03-21 09:36 ?447次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b><b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>寫磁盤時延高告警的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源主機(jī)磁盤分區(qū)使用率過高的問題處理

    某運(yùn)營商TECS資源池上報“主機(jī)磁盤分區(qū)使用率過高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?492次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>主機(jī)磁盤分區(qū)使用率過高的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源虛擬機(jī)網(wǎng)絡(luò)二層地址無法互通的問題處理

    某運(yùn)營商TECS OpenStack使用主機(jī)overlay SDN方案組網(wǎng),運(yùn)維人員在創(chuàng)建虛擬機(jī)測試虛擬機(jī)網(wǎng)絡(luò)狀態(tài)時發(fā)現(xiàn)問題:在其中一臺主機(jī)上創(chuàng)建兩臺同網(wǎng)段虛擬
    的頭像 發(fā)表于 06-12 09:28 ?281次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬<b class='flag-5'>機(jī)</b>網(wǎng)絡(luò)二層地址無法互通的問題<b class='flag-5'>處理</b>