接到哥们消息,之前搭建的12台超融合节点一直稳定运行,后来扩容了5台(与之前年份不同,CPU架构相同),而后又新建了一个集群由10台服务器组成(与之前年份也不同,CPU架构也不同)。问题是,5+10台服务器在硬盘故障后,会出现服务器重启。超融合厂商与硬件服务器厂商互相之间推来推去,问题始终得不到解决。

我们俩查找了相关资料:
https://www.cnblogs.com/bingxinguoke/p/16731846.html
https://support.huawei.com/enterprise/zh/knowledge/EKB1100049474

以及分析了日志:
2024-05-31T03:40:09.png
2024-05-31T03:40:17.png
2024-05-31T03:40:01.png
2024-05-31T03:40:30.png

超融合底层系统基于CentOS7.9制作,而系统自带的驱动与官网给出的驱动在大小上有出入,可能是RAID驱动兼容性不好导致。

目前,等待进一步分析中。

最后修改:2024 年 05 月 31 日
如果觉得我的文章对你有用,请随意赞赏