10大优享服务
62项会员特权

服务器故障维护常见问题 服务器故障排除原则

发布时间:2021-12-01 02:48:04     阅读次数:12690次     评论数:0次
    服务器故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的服务器故障等。下面分别举例说明服务器故障维护的一些问题。
    对于日常的服务器维护,服务器一般都是比较正常的,但我们还是要检查机器可能出现的问题,起码出现问题时候,我们不会束手无策,能有解决问题的方案,以更好的维护服务器的工作,下面介绍下服务器故障排除的基本原则和常见的问题。
服务器故障维护常见问题
    一、服务器故障排错的基本原则是什么
    1、尽量恢复系统缺省配置
    a:硬件配置:去除第三方厂商备件和非标配备件
    b:资源配置:清除CMOS,恢复资源初始配置
    c:BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序
    d:TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗
    2、从基本到复杂
    a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理
    b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止
    c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止
    3、交换对比
    a:在最大可能相同的条件下,交换操作简单效果明显的部件
    b:交换NOS载体,既交换软件环境
    c:交换硬件,既交换硬件环境
    d:交换整机,既交换整体环境
    二、服务器开机无显示应怎么办
    1、检查供电环境,零-火;零-地电压
    2、检查电源指示灯,如果亮,正常吗
    3、按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗
    4、是否更换过显示器,更换另一台显示器
    5、去掉增加内存
    6、去掉增加的CPU
    7、去掉增加的第三方I/O卡
    8、检查内存和CPU 插的是否牢靠
    9、Clear CMOS
    10、更换主要备件,如系统板,内存和CPU
    三、服务器故障维护需要收集哪些信息
    故障信息:
    1、在POST时,屏幕显示的异常信息
    2、服务器本身指示灯的状态
    3、报警声和BEEP CODES
    4、NOS的事件记录文件
    5、Events Log 文件
    服务器信息:
    1、机器型号
    2、机器序列号(S/N:如:NC00075534)
    3、Bios 版本
    4、是否增加其它设备,如网卡,SCSI 卡,内存,CPU
    5、硬盘如何配置,是否做阵列, 阵列级别
    6、安装什么操作系统及版本(Winnt 4, Netware, Sco, others)
    确定故障类型和故障现象:
    1、开机无显示
    2、上电自检阶段故障
    3、安装阶段故障和现象
    4、操作系统加载失败
    5、系统运行阶段故障
    在服务器故障维护中,线索都会显得扑朔迷离,一般来说不可能一次就可以准确地判断出问题的所在。这样就要求相关人员要有信心及耐心。出现错误一般的流程是通过系统日志上的信息来解决,如果没有解决问题再找出其它因素,然后再看日志信息。总之,服务器出错后,必须一步一步解决,没有捷径可言。
(一品威客 anyi)
本文地址:
来源:一品威客,转载须经版权人书面授权并注明来源

留言(0

↓展开留言

该攻略尚无留言记录