故障描述
一台SM+SC+数据库,两台SC+数据库分布式部署。
TSM的监控器Monitor监控到两台SC有告警,提示与TSM服务器心跳连接异常,FTP服务器提示与镜像FTP连接异常。通过ping测试,发现SM与各SC网络连接正常,与各数据库连接正常,与各FTP连接也正常。
故障分析
从日志分析,SC都是由于连接数超过最大连接数,无法打开数据库连接,无法查询各SC和SACG的状态导致告警。
处理过程
1、采集两台SC,通过日志分析,两台SC都有由于达到连接最大数导致SC状态异常,SC不停的连接SM的远程接口.
2、进一步采集SM日志,同样发现大量的连接数据库失败的问题.
3、查看数据库日志(包括错误日志和事务日志),发现日志很大。因此SC在连接数据库是有大量的连接失败,导致各种告警.
4、进行数据清理和数据转储,将数据库空间释放出来,解决问题。
建议/总结
无