通过监控发现,某台dcos集群中的长连接服务器cpu使用率与其他节点不同。根据经验判断,该节点的dcos-spartan服务异常了。

截图_选择区域_20231110090819.png

使用top查看异常进程编号。
截图_选择区域_20231110090615.png

进入proc对应程序pid目录,查看cgroup信息,确定是dcos-spartan服务,并重启。
截图_选择区域_20231110090634.png

处理完成后,指标恢复。

截图_选择区域_20231110125744.png

最后修改:2023 年 11 月 10 日
如果觉得我的文章对你有用,请随意赞赏