zabbix监控可以使用自带的键值来监控服务进程的存活,我这里以sersync2进程为例来演示
使用的键值proc.num[<name>,<user>,<state>,<cmdline>]
格式说明:
<name>:进程名字,默认为"all processes"
<user>:运行该进程的用户,默认为"all users"
<state>:进程状态,默认是all,可以进一步设定比如run,sleep等
<cmdline>:模糊匹配
服务端配置:
1、在服务端执行
zabbix_get -s 客户端IP -k 'proc.num[,root,,sersync2]'
|---|------------------------------------------------------| | 1 | zabbix_get -s 客户端IP -k 'proc.num[,root,,sersync2]' |
2、配置监控项
3、配置触发器
名称我这里设置为(自行定义):sersync2-status-unnormal
问题表现形式(设置触发告警的条件,因为我的客户端有4个sersync2进程,<>表示sersync2进程不是4的时候触发告警):{主机名称:proc.num[,root,,sersync2].last()}<>4
恢复表达式(返回值为4时,即表示恢复告警):{主机名称:proc.num[,root,,sersync2].last()}=4
如果你是用模板添加的,就将"主机名称"改成相应的"模板名称"
最后在"监测中-触发器"里看到