黑群晖失联卡死问题分析小记
缘起
夏天到了,最近蜗牛星际搞的黑群频繁的卡死失联,短则开机十来分钟就卡死,长则半天一天的。
表现就是机器完全卡死,ping不通,机器只能强制按电源关机后再开。
这次记录下分析的过程,做一个小记。
分析过程
既然是运行中死机,那查下网上死机的分析,看了很多基本没有明确的思路。
那既然没有思路,就使用电脑硬件常见的排除法了,开始是怀疑移动硬盘存在稳定性问题导致整体卡死了,因为之前遇到过挂了一个移动硬盘,导致硬盘io巨慢,系统卡顿。
把移动硬盘去除后,发现问题依旧,那么是不是内置的硬盘坏了呢?从系统smart信息看,并没有坏。
那就直接替换吧,由于是卡死不稳定,首先怀疑电源,把黑群拆开,其他电源直接替换上去,发现就非常的稳定了,运行几天后确认是电源的问题。
为什么电源容易挂?
去年夏天的时候,蜗牛自带的zumax的电源也挂了,直接就开不开机了,换了一个台达的拆机电源。
没想到这么快就挂了,可能是这个台达有点假吧。
而蜗牛里的flex电源体积小,扇热可能不太好,到夏天就不太稳定了,这次不定期死机可能是电容等电源硬件长时间高温就不行了。
分析到问题后就好办了,再买一个就行,选了好半天,二手flex电源水挺深的,很多假电源。
于是直接30买了一个zumax,这电源网上拆机还可以,我这里去年挂的也用了有5年了,换一个最便宜的这个,总不至于假吧。。。
另外一点关于风扇
蜗牛星际的风扇也用了5年了,最近也是挂了,这次换电源把风扇也换了,插在蜗牛星际主板上,居然发现群晖里不支持调速,但是之前好像记得是可以的,网上查了好像黑群是不行的。。。
总结
电脑或者nas在长期运行时,最容易挂的现在看来,要么是硬盘、要么是bios的电池、要么是电源,这几样直接替换排除一般就行了。。。
参考文档
https://blog.lyc8503.net/post/8-syno-down-troubleshooting/
https://xpenology.com/forum/topic/40371-control-pwm-fan-speed/
https://xpenology.com/forum/topic/39150-fan-control/
发表评论