背景
lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下

解决方案
1.确定lsf系统状态

执行 lsload命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。
2.进入root权限
执行 lsfstartup重启LSF作业调度系统(期间需要输入三次y)

3.重启lsf短时间后情况
显示如下closed状态是正常的;

4.耐心等几分钟
bhosts重新查看

可以正常使用了,问题已解决。
但是具体崩溃原因还是不清楚。
lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下


执行 lsload命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。
执行 lsfstartup重启LSF作业调度系统(期间需要输入三次y)

显示如下closed状态是正常的;

bhosts重新查看

可以正常使用了,问题已解决。
但是具体崩溃原因还是不清楚。