早上买完早点骑车时,接到物联网小程序后台维护客户的反馈——系统用不了了。我之前提前准备了重启服务的脚本,赶紧执行后系统恢复正常,但心里纳闷为啥会突然出问题。

查流量图发现,凌晨3点左右流量直接降到0,和系统故障时间对上了;再看Linux服务器的uptime,当时9点多,服务器刚启动6个多小时,刚好是凌晨3点重启过的样子。我立刻给阿里云提了工单,工程师说云主机没异常,让我查查运维控制台的定时任务。一查才发现,客户那边有个凌晨3点的自动重启任务(说是为了释放Java内存泄露的内存),但今天重启后程序没自动启动,才导致了故障。最后我跟客户说明情况,把这个定时任务关了。

最后修改:2025 年 11 月 21 日
如果觉得我的文章对你有用,请随意赞赏