使用蓝鲸自愈平台完成java项目程序的自愈机制
2023-09-14 09:15:44 时间
使用蓝鲸自愈平台完成java项目程序的自愈机制
1.蓝鲸自愈平台
故障自愈是行业领先的"故障自动化处理"解决方案,提升企业的服务可用性和降低故障处理的人力投入,实现故障自愈从"人工处理"到"无人值守"的变革!
自愈平台可以根据连接配置好的监控平台,当收到我们指定要自愈的监控告警时,首先筛选出告警信息的ip地址,再匹配该服务器所在的集群节点,确认服务器信息,然后将服务器地址传到对应的作业平台的某个作业里,通过作业的具体恢复脚本,实现项目的故障资源机制。
实现步骤:
-
首先配置一个告警源
-
准备故障资源的作业平台脚本
-
然后配置一个自愈套餐,调用作业平台
-
最后接入自愈
2.配置告警源
在菜单 [接入自愈] -> [管理告警源] 中,点击 启用 Zabbix。
跳转到接入流程页面
登陆zabbix服务器操作以下步骤
cd /usr/lib/zabbix/alertscripts
wget 'http://${PaaS_Host}/o/bk_fta_solutions/0/alarm_source/scripts/zabbix_fta_alarm.py?fta_application_id=66fdfe50-3075-49bf-8101-d97386030c9b&fta_application_secret=EfgBbXD25N6870j9nkgf3ns8eOEsH2Sk' -O /usr/lib/zabbix/alertscripts/zabbix_fta_alarm.py --no-check-certificate
chmod +x zabbix_fta_alarm.py
./zabbix_fta_alarm.py --init http://${Zabbix_Host}/api_jsonrpc.php Admin zabbix
该脚本会创建一个名为FTA_Event_Handler
的 报警媒介,名为 FTA_Act
的 Action,名为 FTA_Mgr
的用户。
3.新建一个作业平台
点击作业执行—>新建作业—>填写作业名称—>填写脚本内容
脚本内容如下
#!/bin/bash
anynowtime="date +'%Y-%m-%d %H:%M:%S'"
NOW="echo [\`$anynowtime\`][PID:$$]"
##### 可在脚本开始运行时调用,打印当时的时间戳及PID。
function job_start
{
echo "`eval $NOW` job_start"
}
##### 可在脚本执行成功的逻辑分支处调用,打印当时的时间戳及PID。
function job_success
{
MSG="$*"
echo "`eval $NOW` job_success:[$MSG]"
exit 0
}
##### 可在脚本执行失败的逻辑分支处调用,打印当时的时间戳及PID。
function job_fail
{
MSG="$*"
echo "`eval $NOW` job_fail:[$MSG]"
exit 1
}
job_start
###### 可在此处开始编写您的脚本逻辑代码
###### 作业平台中执行脚本成功和失败的标准只取决于脚本最后一条执行语句的返回值
###### 如果返回值为0,则认为此脚本执行成功,如果非0,则认为脚本执行失败
#输出告警信息
echo "告警信息:`echo $1`"
echo $1
#输出自愈机器IP
ip=`ifconfig |grep 192.168 | awk '{print $2}' |awk -F ':' '{print $2}'`
echo "自愈机器IP: ${ip}"
#指定tomcat所在路径
tomcat_path=/data/tomcat
#剩余内存容量
free_memory=`free -g | grep Mem | awk '{print $4}'`
echo "服务器剩余内存:${free_memory} GB"
#要自愈的tomcat名称
tomcat_name=`echo $1 | awk '{print $1}'`
#输出当前tomcat服务所使用的端口号
port=`grep 'Connector port=' ${tomcat_path}/${tomcat_name}/conf/server.xml | grep 'protocol="HTTP/1.1"' | egrep -o "[0-9]{4,5}"`
echo "服务端口:${port}"
#自愈项目
if [[ "$ip" == "192.168.5.91" ]] || [[ "$ip" == "192.168.5.92" ]];then
echo "开始重启${tomcat_name}"
#ps aux | grep ${tomcat_name} | grep -v grep | awk '{print \$2}' | xargs kill -9
${tomcat_path}/${tomcat_name}/bin/startup.sh
sleep 10s
fi
#检查项目是否启动成功
for i in {1..20}
do
sleep 3s
echo "第$i次尝试"
ava=`curl curl -s http://${ip}:${port}/test_ping`
if [[ "$ava" = "true" ]];then
echo "${tomcat_name}自愈成功"
break
fi
if [ $i -ge 20 ];then
echo "项目自愈不成功!!!"
exit 1
fi
done
4.新建一个自愈套餐
按下图填写
5.接入自愈
相关文章
- 项目模块太多, 无法编译, java: java.lang.OutOfMemoryError: WrappedJavaFileObject[org.jetbrains.jps.javac.InputFileObjec
- 【华为云实战开发】1.传统Java项目怎么能变得高大上?
- Java 四种线程池newCachedThreadPool,newFixedThreadPool,newScheduledThreadPool,newSingleThreadExecutor
- java 调用webservice的各种方法总结
- Java实现 LeetCode 452 用最少数量的箭引爆气球
- Java实现 LeetCode 257 二叉树的所有路径
- Java实现第十届蓝桥杯特别数的和
- Java实现第九届蓝桥杯小朋友崇拜圈
- Java实现 蓝桥杯 算法提高 学霸的迷宫
- (转载)java多态(2)-------Java转型(向上或向下转型)
- Gradle在大型Java项目上的应用
- java.lang.OutOfMemoryError: Java heap space 解决方法
- Eclipse 平台Java项目文件结构
- 一个使用Java BlockingQueue实现的生产者和消费者
- atitit.研发管理--标准化流程总结---java开发环境与项目部署环境的搭建工具包总结
- 【Java实战】工作中如何规范定义Java常量
- 【项目实战】使用Java Keytool工具生成的CSR给第三方云平台签名
- 【项目实战】Java中对Clone克隆(Cloneable接口与clone()方法)的理解
- 【java】EJB(Enterprise Java Bean)概述
- 【java】Java教程
- 【java】Java 枚举(enum)如何使用以及原理
- Java的内存区域
- Maven创建Java项目
- 【Java面试】Kafka 怎么避免重复消费
- 【java】Spring Boot --spring boot项目整合xxl-job
- idea创建Java项目
- 魔塔小游戏Java版项目