背景
lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下
解决方案
1.确定lsf系统状态
执行 lsload
命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。
2.进入root权限
执行 lsfstartup
重启LSF作业调度系统(期间需要输入三次y)
3.重启lsf短时间后情况
显示如下closed状态是正常的;
4.耐心等几分钟
bhosts
重新查看
可以正常使用了,问题已解决。
但是具体崩溃原因还是不清楚。
lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下
执行 lsload
命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。
执行 lsfstartup
重启LSF作业调度系统(期间需要输入三次y)
显示如下closed状态是正常的;
bhosts
重新查看
可以正常使用了,问题已解决。
但是具体崩溃原因还是不清楚。