使用sinfo可以显示3个节点处于drain状态,

PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
all*         up   infinite      3  drain node[10,11,12]
我应该使用哪个命令行来卸载此类节点?

最佳答案

找到一种方法,输入scontrol解释器(在命令行类型scontrol中),然后

scontrol: update NodeName=node10 State=DOWN Reason="undraining"
scontrol: update NodeName=node10 State=RESUME

然后
scontrol: show node node10

显示其他信息
State=IDLE

更新:这些节点中的一些返回DRAIN状态;注意到例如show node a10显示为Reason=SlurmdSpoolDir is full,因此在Ubuntu中使用sudo apt-get clean删除/var/cache/apt内容,并压缩一些/var/log文件。

09-11 18:11