我有一个使用命令运行的简单test.ksh:

sbatch test.ksh

我不断收到“JobState = FAILED Reason = NonZeroExitCode”(使用“scontrol show job”)

我已经确定了以下内容:

  • slurmd和slurmctld已启动并正确运行
  • “test.ksh”的
  • 用户特权为777。
  • 命令“srun test.ksh”(本身,不使用sbatch)成功成功,没有问题
  • 我尝试在“test.ksh”的最后一行中放入“return 0”,但没有运气。
  • 我尝试在“test.ksh”的最后一行中放入“exit 0”,但运气不佳
  • 我尝试在“test.ksh”的最后一行中放入“主机名”,但没有运气。
  • 我尝试在“test.ksh”的最后一行中放入“srun主机名”,但运气不好
  • 最佳答案

    我发现我没有设置--error和--output,这意味着默认设置是我从中发出命令的当前目录。

    问题是我没有足够的权限写入当前目录。

    解决的办法是将--error和--output设置为我有特权的目录。

    关于linux - 为什么在使用Sbatch SLURM时仍不断获取NonZeroExitCode?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/28093854/

    10-12 14:19