Linux 脚本用于检查进程是否正在运行并根据结果采取行动
- 2024-10-30 08:36:00
- admin 原创
- 70
问题描述:
我有一个经常失败且有时会启动重复实例的过程。
当我运行时:ps x |grep -v grep |grep -c "processname"
我会得到:2
这是正常的,因为该过程与恢复过程一起运行。
如果我得到:0
我将要启动该过程;如果我得到:4
我将要停止并重新启动该过程
我需要的是一种获取结果的方法ps x |grep -v grep |grep -c "processname"
然后设置一个简单的 3 选项功能
ps x |grep -v grep |grep -c "processname"
if answer = 0 (start process & write NOK & Time to log /var/processlog/check)
if answer = 2 (Do nothing & write OK & time to log /var/processlog/check)
if answer = 4 (stot & restart the process & write NOK & Time to log /var/processlog/check)
进程停止于:killall -9 process
进程启动于:process -b -c /usr/local/etc
我的主要问题是找到一种方法来根据结果采取行动ps x |grep -v grep |grep -c "processname"
。
理想情况下,我想将 grep 的结果作为脚本中的变量,如下所示:
process=$(ps x |grep -v grep |grep -c "processname")
如果可能的话。
解决方案 1:
监视系统上某个进程是否正在运行的程序。
脚本存储在crontab
并且每分钟运行一次。
如果进程未运行或进程多次运行,则此方法有效:
#! /bin/bash
case "$(pidof amadeus.x86 | wc -l)" in
0) echo "Restarting Amadeus: $(date)" >> /var/log/amadeus.txt
/etc/amadeus/amadeus.x86 &
;;
1) # all ok
;;
*) echo "Removed double Amadeus: $(date)" >> /var/log/amadeus.txt
kill $(pidof amadeus.x86 | awk '{print $1}')
;;
esac
0
如果找不到进程,则重新启动它。
1
如果找到了进程,则一切正常。
*
如果正在运行 2 个或更多进程,则终止最后一个。
更简单的版本。这只是测试进程是否正在运行,如果没有,则重新启动它。
$?
它只是测试程序的退出标志pidof
。如果0
进程正在运行,1
则退出。
#!/bin/bash
pidof amadeus.x86 >/dev/null
if [[ $? -ne 0 ]] ; then
echo "Restarting Amadeus: $(date)" >> /var/log/amadeus.txt
/etc/amadeus/amadeus.x86 &
fi
最后,一句台词
pidof amadeus.x86 >/dev/null ; [[ $? -ne 0 ]] && echo "Restarting Amadeus: $(date)" >> /var/log/amadeus.txt && /etc/amadeus/amadeus.x86 &
然后可以在 crontab 中使用它每分钟运行一次,如下所示:
* * * * * pidof amadeus.x86 >/dev/null ; [[ $? -ne 0 ]] && echo "Restarting Amadeus: $(date)" >> /var/log/amadeus.txt && /etc/amadeus/amadeus.x86 &
cccam oscam
解决方案 2:
我采用了 @Jotne 的解决方案,效果非常好!例如,我的 NAS 中的 mongodb 服务器
#! /bin/bash
case "$(pidof mongod | wc -w)" in
0) echo "Restarting mongod:"
mongod --config mongodb.conf
;;
1) echo "mongod already running"
;;
esac
解决方案 3:
我已根据我的情况采用了你的脚本。Jotne。
#! /bin/bash
logfile="/var/oscamlog/oscam1check.log"
case "$(pidof oscam1 | wc -w)" in
0) echo "oscam1 not running, restarting oscam1: $(date)" >> $logfile
/usr/local/bin/oscam1 -b -c /usr/local/etc/oscam1 -t /usr/local/tmp.oscam1 &
;;
2) echo "oscam1 running, all OK: $(date)" >> $logfile
;;
*) echo "multiple instances of oscam1 running. Stopping & restarting oscam1: $(date)" >> $logfile
kill $(pidof oscam1 | awk '{print $1}')
;;
esac
我在测试时遇到了一个问题...我用这行代码启动了 oscam1 的 3 个额外进程:/usr/local/bin/oscam1 -b -c /usr/local/etc/oscam1 -t /usr/local/tmp.oscam1
这使 oscam1 剩下 8 个进程。问题是这样的...当我运行脚本时,它每次只会终止 2 个进程,所以我必须运行它 3 次才能将其减少到 2 个进程...
除了后面killall -9 oscam1
跟上之外/usr/local/bin/oscam1 -b -c /usr/local/etc/oscam1 -t /usr/local/tmp.oscam1
,*)
除了原始进程之外,还有其他更好的 killall 方法吗?这样就不会有停机时间了?
解决方案 4:
如果您将 awk '{print $1}' 更改为 '{ $1=""; print $0}',结果将得到除第一个之外的所有进程。它将以字段分隔符(通常为空格)开头,但我不记得 killall 关心这一点。因此:
#! /bin/bash
logfile="/var/oscamlog/oscam1check.log"
case "$(pidof oscam1 | wc -w)" in
0) echo "oscam1 not running, restarting oscam1: $(date)" >> $logfile
/usr/local/bin/oscam1 -b -c /usr/local/etc/oscam1 -t /usr/local/tmp.oscam1 &
;;
2) echo "oscam1 running, all OK: $(date)" >> $logfile
;;
*) echo "multiple instances of oscam1 running. Stopping & restarting oscam1: $(date)" >> $logfile
kill $(pidof oscam1 | awk '{ $1=""; print $0}')
;;
esac
值得注意的是,pidof 路由似乎对没有空格的命令工作得很好,但是如果你正在寻找一个名为 myscript 的 python 脚本,并且它出现在 ps 下,那么你可能想要回到基于 ps 的字符串,就像
root 22415 54.0 0.4 89116 79076 pts/1 S 16:40 0:00 /usr/bin/python /usr/bin/myscript
仅供参考
解决方案 5:
“pidof”命令不会显示 shell/perl/python 脚本的 pid。因此,要找到我的 Perl 脚本的进程 ID,我必须使用 -x 选项,即“pidof -x perlscriptname”
解决方案 6:
我根本无法让案例发挥作用。以下是我所拥有的:
#! /bin/bash
logfile="/home/name/public_html/cgi-bin/check.log"
case "$(pidof -x script.pl | wc -w)" in
0) echo "script not running, Restarting script: $(date)" >> $logfile
# ./restart-script.sh
;;
1) echo "script Running: $(date)" >> $logfile
;;
*) echo "Removed duplicate instances of script: $(date)" >> $logfile
# kill $(pidof -x ./script.pl | awk '{ $1=""; print $0}')
;;
esac
现在,rem case 动作命令仅用于测试脚本。上面的 pidof -x 命令返回“1”,case 语句返回的结果为“0”。
有人知道我哪里做错了吗?
通过将以下内容添加到我的 BIN/BASH 脚本来解决这个问题:PATH=$PATH:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
解决方案 7:
如果您正在寻找一种更现代的方式来检查服务是否正在运行(这对任何旧进程都不起作用),那么systemctl可能就是您要找的。
这是基本命令:
systemctl show --property=ActiveState your_service_here
这将产生非常简单的输出(根据服务是否正在运行,将出现以下两行之一):
ActiveState=active
ActiveState=inactive
如果您想了解您可以获得的所有属性:
systemctl show --all your_service_here
如果您喜欢按字母顺序排列:
systemctl show --all your_service_here | sort
执行该操作的完整代码如下:
service=$1
result=`systemctl show --property=ActiveState $service`
if [[ "$result" == 'ActiveState=active' ]]; then
echo "$service is running" # Do something here
else
echo "$service is not running" # Do something else here
fi
解决方案 8:
如果您使用的是 CentOS,则无需编写脚本并设置 cron 作业。这是确保 systemd 服务在失败时重新启动的最聪明的方法之一。对 /usr/lib/systemd/system/mariadb.service 进行以下更改
然后在文件的[Service]部分下添加以下两行:
Restart=always
RestartSec=3
保存文件后,我们需要重新加载守护进程配置,以确保 systemd 知道新文件
systemctl daemon-reload
阅读以下链接了解完整步骤 -
https://jonarcher.info/2015/08/ensure-systemd-services-restart-on-failure/
- 2024年20款好用的项目管理软件推荐,项目管理提效的20个工具和技巧
- 2024年开源项目管理软件有哪些?推荐5款好用的项目管理工具
- 项目管理软件有哪些?推荐7款超好用的项目管理工具
- 项目管理软件哪个最好用?盘点推荐5款好用的项目管理工具
- 项目管理软件有哪些最好用?推荐6款好用的项目管理工具
- 项目管理软件有哪些,盘点推荐国内外超好用的7款项目管理工具
- 2024项目管理软件排行榜(10类常用的项目管理工具全推荐)
- 项目管理软件排行榜:2024年项目经理必备5款开源项目管理软件汇总
- 2024年常用的项目管理软件有哪些?推荐这10款国内外好用的项目管理工具
- 项目管理必备:盘点2024年13款好用的项目管理软件