99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Slurm作業(yè)管理系統(tǒng)常用命令和教程

Cloudam云端 ? 來(lái)源:Cloudam云端 ? 作者:Cloudam云端 ? 2022-11-15 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Slurm ( Simple Linux Utility for Resource Management )是開(kāi)源的、具有容錯(cuò)性和高度可擴(kuò)展大型和小型 Linux集群資源管理和作業(yè)調(diào)度系統(tǒng)。超級(jí)計(jì)算系統(tǒng)可利用 Slurm 進(jìn)行資源和作業(yè)管理,以避免相互干擾,提高運(yùn)行效率。所有需運(yùn)行的作業(yè)無(wú)論是用于程序調(diào)試還是業(yè)務(wù)計(jì)算均必須通過(guò)交互式并行 srun、批處理式 sbatch 或分配式 salloc 等命令提交,提交后可以利用相關(guān)命令查詢作業(yè)狀態(tài)等。

同時(shí)北鯤云超算平臺(tái)也是使用的Slurm作業(yè)管理系統(tǒng),熟悉slurm作業(yè)管理系統(tǒng)的同學(xué)可以快速上手北鯤云進(jìn)行計(jì)算,不熟悉的也沒(méi)關(guān)系,一是可以學(xué),我們有完整的教程以及技術(shù)支持服務(wù),另外就是平臺(tái)還提供模板提交方式,無(wú)需it基礎(chǔ)也可以快速進(jìn)行計(jì)算。直接按照模板提示提交作業(yè)即可。多種軟件覆蓋多個(gè)行業(yè),歡迎lai'shi'yi's

一. 常用命令?

sinfo       #查看分區(qū)狀態(tài)squeue      #查看隊(duì)列中的作業(yè)scontrol    #查看作業(yè)詳細(xì)信息scancel     #取消已經(jīng)提交的作業(yè)sbatch      #批處理式提交作業(yè)salloc      #分配式運(yùn)行作業(yè)

1. 查看分區(qū)狀態(tài)?

sinfo

CPU分區(qū)命名規(guī)則為c-核心數(shù)-每核心內(nèi)存大小,如c-8-4:表示單節(jié)點(diǎn)規(guī)格為8核,每核心有4G內(nèi)存,即節(jié)點(diǎn)規(guī)格為8核32G。

GPU分區(qū)命名規(guī)則為g-卡號(hào)-每節(jié)點(diǎn)卡數(shù),如g-v100-2:表示有兩張顯卡型號(hào)為tesla v100的gpu節(jié)點(diǎn)。

pYYBAGNzO1CAVeJpAAC06YCVFHw173.png

2. 查看作業(yè)隊(duì)列?

squeue

JOBID:作業(yè)號(hào)。

ST:狀態(tài) (R:運(yùn)行中;CF:配置中;PD:排隊(duì)中)。

poYBAGNzO1CAEfidAAA3jM5usFs213.png

3. 查看所有作業(yè)詳細(xì)信息?

scontrol show jobs

pYYBAGNzO1GAHir4AAEXEvLM2gQ216.png

4. 取消作業(yè)號(hào)為20的作業(yè)?

scancel 20

二. 提交作業(yè)的方式?

1. 使用sbatch批處理模式提交作業(yè)?

sbatch命令可以提交任務(wù)至一個(gè)或多個(gè)計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)并行計(jì)算。

sbatch命令的一些常用選項(xiàng)

參數(shù) 功能
-N 申請(qǐng)的節(jié)點(diǎn)數(shù)量
-p 指定計(jì)算節(jié)點(diǎn)規(guī)格,使用sinfo查看所支持的規(guī)格
-n 指定任務(wù)數(shù),即并行程序運(yùn)行多少個(gè)進(jìn)程
-c 每進(jìn)程使用的cpu核心數(shù)

參考運(yùn)行程序:demo.sh

#!/bin/bashsleep 6000

提交示例:

使用2個(gè)4核心節(jié)點(diǎn)啟動(dòng)8個(gè)并行任務(wù)。

sbatch -N 2 -p c-4-1 -n 8 -c 1 demo.sh

1個(gè)4核心節(jié)點(diǎn)啟動(dòng)4個(gè)并行任務(wù)。

sbatch -N 1 -p c-4-1 -n 4 -c 1 demo.sh

1個(gè)4核心節(jié)點(diǎn)啟動(dòng)4個(gè)并行任務(wù)。

sbatch -p c-4-1 -n 4 demo.sh

1個(gè)4核心節(jié)點(diǎn)啟動(dòng)1個(gè)并行任務(wù), 該任務(wù)使用4個(gè)cpu核心。

sbatch -p c-4-1 -n 1 -c 4 demo.sh

2個(gè)4核心節(jié)點(diǎn)啟動(dòng)2個(gè)并行任務(wù), 每個(gè)任務(wù)使用4個(gè)cpu核心。

sbatch -p c-4-1 -n 2 -c 4 demo.sh

2. 使用salloc分配模式提交作業(yè)?

salloc命令可以用來(lái)分配節(jié)點(diǎn),用戶可以在獲取分配的計(jì)算節(jié)點(diǎn)后,ssh進(jìn)入直接運(yùn)行相關(guān)計(jì)算程序,主要用來(lái)調(diào)式程序執(zhí)行。

使用步驟(案例):

Step1. salloc申請(qǐng)計(jì)算節(jié)點(diǎn);

salloc -N 1 -p c-8-2 &

Step2. ssh登錄到分配的計(jì)算節(jié)點(diǎn);

ssh c-8-2-worker0001

Step3. 調(diào)試或運(yùn)行程序;

./demo.sh

Step4. 結(jié)束程序運(yùn)行后釋放分配的節(jié)點(diǎn);

scancel 17

poYBAGNzO1KACrrjAACXyNsNLEg493.png

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11511

    瀏覽量

    213808
  • 命令
    +關(guān)注

    關(guān)注

    5

    文章

    737

    瀏覽量

    22880
  • 管理系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    2767

    瀏覽量

    37052
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux常用命令大全

    Linux常用命令是指在Linux操作系統(tǒng)中廣泛使用的命令工具,這些命令工具可以完成各種不同的任務(wù),如管理文件和目錄、操作進(jìn)程、網(wǎng)絡(luò)通信、軟
    的頭像 發(fā)表于 05-03 18:08 ?1125次閱讀

    windowsxp常用命令

    windowsxp常用命令   winver---------檢查windows版本 wmimgmt.msc----打開(kāi)windows管理體系結(jié)構(gòu)(wmi) wupdmgr-------
    發(fā)表于 01-10 09:05 ?1390次閱讀

    Ubuntu常用命令大全

    Ubuntu常用命令大全,包括常用管理目錄,系統(tǒng)命令,硬盤(pán)相關(guān),內(nèi)存相關(guān),查看進(jìn)程等命令
    發(fā)表于 01-06 11:16 ?0次下載

    vim常用命令

    vim常用命令
    發(fā)表于 01-08 15:59 ?3次下載

    redis常用命令總結(jié)

    本文是對(duì)redis常用命令總結(jié)。
    發(fā)表于 02-09 11:25 ?1704次閱讀

    SQL Plus的常用命令與用戶管理實(shí)驗(yàn)說(shuō)明

    本文檔的主要內(nèi)容詳細(xì)介紹的是SQL Plus的常用命令與用戶管理實(shí)驗(yàn)說(shuō)明。
    發(fā)表于 10-30 17:19 ?8次下載

    linux常用命令手冊(cè)

    linux常用命令手冊(cè)免費(fèi)下載。
    發(fā)表于 06-01 14:59 ?70次下載

    Memcache系統(tǒng)常用命令講解

    Memcache系統(tǒng)常用命令講解(無(wú)線電源技術(shù)商業(yè)計(jì)劃書(shū))-該文檔為Memcache系統(tǒng)常用命令講解文檔,是一份還算不錯(cuò)的參考文檔,感興趣的可以下載看看,,,,,,,,,,,,,,,,
    發(fā)表于 09-28 11:27 ?5次下載
    Memcache<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>常用命令</b>講解

    linux常用命令大全

    linux常用命令大全,一些常用命令都可以找到
    發(fā)表于 03-03 09:20 ?0次下載

    DOS系統(tǒng)常用命令

    介紹了DOS系統(tǒng)常用命令
    發(fā)表于 03-21 14:59 ?0次下載

    Linux常用命令

    Linux常用命令
    的頭像 發(fā)表于 01-12 11:19 ?1408次閱讀

    Linux常用命令手冊(cè)分享

    linux常用命令合集
    發(fā)表于 04-26 11:46 ?1次下載

    linux常用命令及用法

    Linux是一種開(kāi)源的操作系統(tǒng),它以穩(wěn)定、高效和安全的特點(diǎn)受到廣大用戶的喜愛(ài)。掌握Linux的常用命令及其用法對(duì)于操作系統(tǒng)管理和開(kāi)發(fā)都至關(guān)重要。本文將詳盡、詳實(shí)、細(xì)致地介紹Linux
    的頭像 發(fā)表于 11-17 09:47 ?975次閱讀

    詳解kubectl常用命令

    詳解kubectl常用命令
    的頭像 發(fā)表于 11-05 15:39 ?1360次閱讀
    詳解kubectl<b class='flag-5'>常用命令</b>

    SSH常用命令詳解

    SSH常用命令詳解
    的頭像 發(fā)表于 06-04 11:30 ?644次閱讀