接到哥们消息,之前搭建的12台超融合节点一直稳定运行,后来扩容了5台(与之前年份不同,CPU架构相同),而后又新建了一个集群由10台服务器组成(与之前年份也不同,CPU架构也不同)。问题是,5+10台服务器在硬盘故障后,会出现服务器重启。超融合厂商与硬件服务器厂商互相之间推来推去,问题始终得不到解决。
我们俩查找了相关资料:
https://www.cnblogs.com/bingxinguoke/p/16731846.html
https://support.huawei.com/enterprise/zh/knowledge/EKB1100049474
以及分析了日志:
超融合底层系统基于CentOS7.9制作,而系统自带的驱动与官网给出的驱动在大小上有出入,可能是RAID驱动兼容性不好导致。
目前,等待进一步分析中。