故障现象:
配备ServeRAID M5210阵列卡的System x 服务器在开机过程中出现Critical Message界面。 提示"Cache data was lost..." 或者提示"Bad... RAID controller memory module detected."
原因分析:
提示"Cache data was lost..."的是阵列卡缓存数据丢失,一般是服务器遭遇意外停机、停电所致。 阵列卡缓存数据丢失可能导致操作系统出错、文件损坏,严重时可能造成阵列出错、掉线或者阵列卡进入安全模式。 提示"Bad... RAID controller memory module detected."的是阵列卡缓存模块出现异常,可能是缓存模块故障或者缓存模块松脱。
缓存模块异常可能导致阵列卡进入降级模式或者安全模式,处理不当可能导致阵列丢失或者损坏硬件。 如果是主动移除缓存模块,请参考《移除ServeRAID M5210阵列卡的缓存模块以开启JBOD模式》(知识库编号:154463)进行操作。
解决方案:
提示缓存数据丢失,通常只能忽略错误,按回车键调出输入框,输入除字母"C"和字母"D"以外的任意键,并回车确认。 接下来会提示"Critical Message handing completed. Please exit." 处理完成,按ESC键退出。 按"Y"键继续。 然后服务器会正常进行引导。如果无法引导系统或者系统报错,可能是数据丢失所导致,需要对系统进行修复或者重新安装。 如果已按照上述进行操作,关机或者重启后依然出现"Critical Message"界面提示,则可能发生硬件故障,建议及时联系硬件售后(400-810-6678)保修。 提示缓存模块异常,如果不是主动移除的,请先关闭服务器并断开电源,打开服务器机箱盖,查看并重新插拔阵列卡及缓存模块。硬件拆装操作可以参考前述知识库文档及System x 服务器在线文档,并请遵守硬件拆装操作规则,以防损坏硬件。 重新插回硬件并重新通电开机后,若硬件正常,则不会再有"Critical Message"界面提示;若再出现,则可能有硬件故障发生,建议及时联系硬件售后(400-810-6678)保修。 如果此时输入除字母"C"和字母"D"以外的任意键,并回车确认,将导致阵列卡进入安全模式。 在安全模式下阵列卡功能会严重受限,无法正常使用,一般消除异常后即可自动恢复正常。 在阵列卡Dashboard View会提示当前状态为Safe Mode / 安全模式。 进入阵列卡主界面后会提示在安全模式下功能严重受限,需要消除异常后重启服务器。 如果阵列卡遭遇严重错误,将会锁定安全模式无法自行恢复,可以尝试刷新阵列卡微码,详见《System x 服务器在BIOS中刷新阵列卡微码》(知识库编号:155104)。 |