Linux基础(day74)
2023-04-18 16:53:24 时间
20.23/20.24/20.25 告警系统邮件引擎
告警系统邮件引擎
- 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。
- 但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh ,所以这里需要定义调用mail.py的sh脚本
- mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
- 收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
- mail.sh内容 //其中mail.py内容
#!/bin/bahs
log=$1
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s` //定义2个小时的时间戳
#日志不存在就创建日志
if [ ! -f /tmp/$log ]
then
echo $t_s2 > /tmp/$log
fi
#下面这段,等同于一个计时器
t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2] //时间戳对比
echo $v
#当故障存在3600秒,就会进行告警
if [ $v -gt 3600 ]
then
./mail.py $1 $2 $3
echo "0" > /tmp/$log.txt //等同于计数器
else
if [ ! -f /tmp/$log.txt ]
then
echo "0" > /tmp/$log.txt
fi
nu=`cat /tmp/$log.txt`
nu2=$[$nu+1]
echo $nu2>/tmp/$log.txt
if [ $nu2 -gt 10 ]
then
./mail.py $1 "trouble continue 10 min $2" "$3"
echo "0" > /tmp/$log.txt //邮件告警结束以后,重新开始计数
fi
fi
- 该脚本运用于,间隔3600 故障;10分钟内故障;间歇性故障;
- 核心判断:计时、计数
20.26 运行告警系统
运行告警系统
- 要执行告警系统,肯定要是每分钟,执行一次
crontab -e
* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
- 监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以 空格来定义三个参数的
相关文章
- 第一次协同作业(一)
- 对话华清科盛:数智时代,看物流如何「变得更聪明」 | 镁客·请讲
- 进度报告二
- WordPress WP Symposium Pro 2021.10 跨站脚本
- 理解 docker 容器中的 uid 和 gid
- AlphaFold2被超越!中国团队刷新全球蛋白质结构预测纪录,大牛彭健创业项目一鸣惊人
- Linux也有全功能杀毒软件啦!
- 经典USB转串口芯片遭盗版!侵权单位罚款400万,两员工判刑!
- 干货 | 微服务架构下 Spring Cloud OAuth2 通用权限管理系统
- 开源 Docker 工具分享
- Comparable和Comparator的区别
- B站DIY区最精致、漂亮的桌面天气小电视,没有之一!
- 双人项目第一天
- Vmware ESXI(VM)兼容网卡查询列表
- 群发邮件 (setoolkit)
- 同事埋了个坑:Insert into select 语句把生产服务器炸了!
- 蓝桥杯嵌入式——LCD模块
- 一个题目,两种解法——数电PK模电
- 焦虑
- 魅族路由器(极速版)刷老毛子(padavad)固件