artzers 2022-10-13 11:25 采纳率: 33.3%
浏览 45
已结题

slurm 任务被kill而没有报错信息,怎么办?

slurm集群提交cpp代码mpi任务,固定在某个大函数内部,不确定具体代码位置处随机挂掉,slurm的out文件只提示task xx killed,没有exied code。saact没有任何任务信息。偶尔任务会在挂掉后被再slurm再跑一次。请问这种情况会是什么?

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 10月21日
    • 修改了问题 10月13日
    • 修改了问题 10月13日
    • 创建了问题 10月13日