1、服务器故障一般性故障检测步骤及解决方案
网络管理员90%的工作往往是诊断和解决各种各样的故障。虽然说没有人喜欢麻烦,但麻烦总是自己找上门来。只有拥有高超的诊断技能,你才能在紧急情况下迅速响应,保障网络流畅地运行。当你面临网络故障的挑战时,首先向自己问几个简单的问题:有哪些地方被改变了?这个问题以前遇到过吗?如果是,是什么时候?是否有可能让问题再次出现?用户做了什么特别的操作吗?其他用户有没有遇到过同样的问题?
接下来尝试隔离问题,每次排除一部 分可能引起该问题的因素,逐步找出问题的真正根源。例如,如果一个工作站不能连接到服务器,那就先确定是网络问题还是工作站本身的问题。如果能够迅速地肯定问题出在工作站本身,你就排除了一大半可能导致问题的因素,向真正的故障根源接近一大步了。即使你最终拿不出解决办法,不得不寻找外援,隔离问题也会节省你大量的时间。
为了说明诊断网络故障的一般过程,本文例举了几种故障情形,有的是常见的小问题,有的是比较艰巨的挑战。当你遇到类似的问题时,就可以按照本文例子的介绍,先问自己几个简单的问题,逐步隔离问题所在,最后找到真正的问题根源。
一、找不到验证密码的域服务器
毫无疑问,你也一定遇到过这样的情形:当你坐在一台工作站之前准备登录网络,windows却报告说找不到用来验证密码的域服务器。要解决这个故障,首先要确定问题到底出在网络、工作站还是服务器上。从下面几个问题开始:
→哪些地方改变了?最近是否改动过网络,而这些改动可能导致当前的问题?有没有添加新的服务器、拆除原有的服务器、改动过交换机或HUB?有没有添加或减少域控制器、将成员服务器提升为DC(域控制器)或者相反?
→其他工作站也存在类似的问题吗?
→服务器正在运行吗?
经过检查,你发现此前工作站一直顺利地运行,其他工作站没有遇到类似的问题,服务器也正常。根据故障现象,基本上可以确定故障出在工作站本身。接下来要确定工作站的那个地方出了故障,试试下面几个问题:
→工作站能够Ping到服务器吗?
→工作站获得了一个IP地址吗?
检测表明,工作站能够Ping到服务器,但Ping操作有时超时,这表明工作站和服务器之间只有断断续续的通信。在命令行上执行ipconfig /renew命令,多执行几次,工作站有时会更新IP地址,有时不会。这是工作站和服务器之间断续通信的症状。
现在将问题工作站的网络连接和另一台工作站的对换一下,新工作站在问题工作站的位置上也不能连接网络,而问题工作站却能从另一个网络位置顺利地连接网络。现在已经很清楚:问题工作站所在位置的电缆或Hub出了问题。
拆下故障位置上网络电缆连接Hub的那一端,将它接到另一个Hub上,故障依旧。现在可以肯定电缆就是引起故障的罪魁祸首了。
二、windows服务不能启动
在一台Windows 2000服务器上,部分服务设置成不用本地的系统帐户启动。一次重新启动Windows 2000服务器之后,发现这些服务没有启动,必须手工打开服务,重新输入密码,然后启动服务。每次重新输入密码,都收到消息说:<用户名字>已被授予作为服务登录的权限。
要解决该故障,首先回答下面几个问题:
→哪些地方改变了?是否有人修改了服务器?
→这个服务以前能够启动吗?
→用户名称和密码正确吗?
查询修改记录发现,该服务器是一个DC,不久之前还是域控制器组织单元(OU,Organizational Unit)的成员。在移出该OU之前,这些服务一直能够顺利启动。另外,用来启动这些服务的用户名称和密码都是合法的。进一步研究发现,域控制器OU的成员有一些特殊的权限,其中包括作为服务登录的权限。当出现问题的服务器移出该OU时,服务器失去了那些权限。现在要做的是恢复服务器的权限。
要将权限授予服务器,请按照如下步骤操作:
→在管理控制台(MMC)中打开活动目录用户和计算机管理单元,再打开域控制器OU的“属性”对话框。
→在组策略页中,点击“默认域控制器策略”,然后点击“编辑”,打开组策略管理器。
→依次扩展计算机配置/Windows设置/安全设置,再扩展“本地策略”,然后点击“用户权利指派”。
→在右边的窗格中,右击“作为服务登录”,选择菜单“安全”。
→把用来启动服务的用户帐户加入到策略,完成后点击“确定”。
有关该问题的更多资料,请参见微软的文章“如何解决服务启动权限问题”(http://support.microsoft.com/?kbid=259733)。
三、无法收到外面发来的邮件
单位用Exchange 2000 Server作为内部和外部的邮件服务器。有一天原来的ISP不能再提供服务了,所以你迅速换了一个新的ISP。用户仍旧能够照常访问Internet,却收不到外面来的邮件。不过,发出去的邮件看来没有问题。
要排解这一故障,第一个要问的问题是:
→在改变ISP之前,邮件系统工作正常吗?
要确定Exchange Server是否正常工作,防火墙配置是否正确,可以从Internet连接到Exchange Server 25端口(具体操作办法,请参见微软文章:Telnet 到 IMC 的端口 25 以测试 IMC 通信, http://support.microsoft.com/?kbid=153119),发送一个测试消息,确认服务器和防火墙都在正常运行。故障的原因很可能是因为改变ISP。
再回答下面这个问题:
→域名信息正确转移到了新的ISP吗?
用Nslookup工具,测试一下是否能够找到域的邮件交换(MX)记录,结果却什么也没有找到。根据这一现象,可以推断在更换ISP时,域名注册公司没有正确转移域名信息。现在你可以联系域名注册公司,要求登记MX记录,以及将域名信息正确转到新的ISP。只要MX记录在Internet上一传播开,Exchange Server又可以收到外面来的邮件了。
四、网络上看不到服务器
Win2K Pro工作站遇到了奇怪的问题:偶尔能够看到Win 2K Server,但大部分时间里服务器就象从网络上消失了一样。在排解这一网络故障的过程中,首先要回答的问题是:
→过去出现过该故障吗?
→是否所有的工作站都出现相同的情况?
经调查后发现,这一故障现象自服务器从 Windows NT 4.0升级到Win2K就开始存在了,网络上的所有工作站都出现同样的现象。现在要确定的是:故障的根源是服务器呢,还是网络。
登录一个工作站,打开命令控制台,执行ping/pathping命令来连接服务器。结果发现,Ping服务器的IP地址没有问题,但却Ping不到服务器的名字。可以肯定,故障的原因是名称解析或DNS错误。
接下来执行ipconfig/all,注意到工作站上DNS服务器指向了ISP的DNS服务器。Win2K将DNS作为其基本的名称解析机制,但现在工作站却用ISP的DNS服务器来解析本地网络的Win2K服务器名称。当工作站向ISP的DNS服务器查询Win2K服务器名称时,只能得到超时错误,导致Win2K服务器从网络上隐身了。要解决该故障,必须把主DNS服务器指向内部的Win2K DNS服务器,让内网的工作站向Win2K DNS服务器查询本地服务器名称。
首先证实Win2K服务器上确实已经安装了DNS服务,且DNS服务在正常运行,然后修改Win2K DNS服务器IP地址指向它自己。接下来利用DNS管理器,验证DNS服务器位于根位置,且已经启用转发。启用转发之后,就可以解析非本地的任何IP地址了。不要忘记将ISP的DNS服务器输入转发栏。最后配置一下服务器上的DHCP,将DNS服务器从ISP的改成Win2K服务器,刷新工作站上的IP地址。现在网络已经能够稳定地运行了。有关在这类环境下配置DNS的信息,请参见微软的文章“HOW TO:配置 DNS 以访问 Internet”(http://support.microsoft.com/?kbid=300202)。
五、LAN连接到多个WAN
不久前在A市安装了一个LAN,它有两个WAN连接,其中一个连接通向私有的帧中继网络,另一个连接通向Internet,这是为了防止出现故障和提高性能(图二显示了网络结构)。现在出现的故障是:A市的用户有时不能顺利访问B市的服务器。
要解决该故障,首先要搞清楚下面两个问题:
→故障何时出现?
→默认网关是什么?
故障出现是间歇性的。在A市的DHCP配置中,默认网关是192.168.1.11(即防火墙)。由于A市LAN里面的所有机器都会出现同样的故障现象,所以问题很可能出在A市网络上的全局性路由配置上。
在防火墙上有一条静态路由,从192.168.2.0(掩码255.255.255.0)到192.168.1.10,用Route Print可以验证这一规则。A市服务器有时可以Ping到B市的服务器,但有时不能。运行Tracert,结果如图三所示,它显示出了数据包应当通过的路径。但有的时候,运行Tracert却显示出数据包在第一个跃点(192.168.1.11)之后遇到超时错误。根据这一现象,可以推测防火墙没有可靠地将数据包转发到控制192.168.2.0通信的Cisco路由器。
查阅防火墙的日志,可以看到数据包有时被禁止转发到192.168.1.10,虽然存在这样一条转发规则也无济于事。防火墙的种类很多,但大多数防火墙厂商都反对将防火墙当作路由器,如果防火墙被攻击者劫持,有关WAN连接的大量信息就会泄露。
因此现在要重新配置网络,使用默认的网关192.168.1.10(即路由器),执行命令Ip route 0.0.0.0 0.0.0.0 192.168.1.11在路由器上建立一个默认的路由。用户访问Internet时先通过路由器,再穿越防火墙。
如果A市的路由器(192.168.1.10)出现故障,会对Internet访问产生哪些影响?如果帧中继网络失效,但Internet连接仍正常,情况又如何?一旦A市的路由器故障,Internet连接也会丢失,这是因为默认的网关指向了该路由器,该路由器故障导致数据包不能转发到防火墙。在A市,将DHCP默认网关配置成防火墙可以恢复Internet连接,当然,在恢复A市路由器之前,其他地区的私有WAN和Internet访问仍旧无效。
六、工作站不能连接网络
办公大楼五楼的工作站看不到服务器,也不能访问Internet。故障间歇性出现。首先要搞清楚的问题是:
→故障出现多长时间了?
→有哪些地方被改变了?
经Pathping工具测试,检测到一些数据包丢失错误。问题看来可以归结到五楼之内。
利用信号发生器或线缆扫描器追踪故障,跟踪网络连接一直到了六楼的Ethernet交换机,五楼和六楼共用该交换机。考虑到可能是交换机端口故障,所以将端口和六楼的一台机器对换了一下,但故障仍旧存在,而且仍只出现在五楼的工作站上,由此推断,交换机应该没有问题。
返回五楼,注意到一个办公室里有个五口的小Hub。进一步查看,注意到还有四个小Hub菊形相连。现在故障的根源找到了。在100 Base-T Ethernet中,每个网络只能有一个Class I转发跃距(0.7毫秒延迟),或者两个Class II转发跃距(0.4毫秒延迟)(由于这个原因,所以不推荐在重要场合使用大量小Hub)。现在拆除所有小Hub,将线头直接接到六楼的交换机,故障消失。
总地来说,不能认为靠死记硬背就能够解决所有常见的网络问题,相反地,应当以开放的心态审视每一种故障现象,从几个简单的问题开始,逐步排除可能的故障原因。记住,隔离问题是迅速排解故障的关键所在。
七、附录:常用网络诊断工具
Windows XP和Windows 2000提供了许多基本的网络检测工具:
■ Pathping
Pathping用来检验是否能够联系到指定的主机。命令行语法是:pathping 。pathping将显示出数据包丢失情况的基本信息。
■ Ipconfig
Ipconfig命令用来显示出工作站的IP配置。命令行语法是:ipconfig /all。通过ipconfig命令的运行结果,至少可以:
→验证工作站具有正确的IP地址和子网掩码。错误的IP地址和子网掩码会导致连接出错。 →如果启用了DHCP,则可以验证工作站已经租到了一个IP地址。如果不能获得IP地址,则表明与DHCP服务器联系方面出了问题。
→验证默认的网关。如果网关错误,连接远程网络或Internet时就会出现问题。
→验证DNS服务器。XP和Win 2K依靠DNS进行名称解析。一般地,工作站应当指向一台Win 2K服务器以获得DNS解析。
■ Nslookup
Nslookup即名称服务器查找(Name Server Lookup),用来查找DNS服务器上的DNS记录。命令语法:nslookup。在前文的例子中,我们用NSLookup来验证邮件交换(MX)记录,排解Internet邮件传送问题。
■ Route Print
Route Print命令显示出本地机器上的路由规则。这个工具和Ping、Tracert以及Pathping命令结合很有用,能够帮助确定数据包通过的路由器。命令语法是:route print。另外,利用Route Add可以将静态路由规则加入到服务器或工作站。
2、服务器出故障
1.先到电信局里询问一下,看看你的网络有没有问。题,这样就排除了网络故障的可能
2.开始-运行输入gpedit.msc进入组策略,定位到:PC配置-管理模板-windows组件-终端服务-加密与安全
将右窗口中的两项全改为“未配置”
再“加密与安全”下的子分支(RPC安全性策略)也改为“未配置”(若这样改了,重启生效的话,除了人为的原因外,可能你的系统中有恶意程序)
3.这情况,最大的可能就是certificate子键损坏引起的
注册表编辑器定位到
HKLM\SYSTEM\currentcontrloset\services\termservice\parameters
找到子键certificate和X509 certificate及X509 certificate ID
将它们删除,重启后,XP service会为它们重建
这下该没什么问题了
若还不,个人分析,是你网线或你的 ADSL 猫有问题,
网线自己找原因,对ADSL猫可能性问题,你可借一个相同品牌的model换一下本地连接的IP试试
所有的可能与设置都在这,有问题请留言
3、服务器硬件常见故障有哪些
常见服务器硬件故障排查判断:
服务器常见故障的诊断与解决:服务器故障排除第一部分 服务器故障排除的基本原则性问题服务器故障排除一、服务器开机黑屏故障排查1.检查供电环境,零-火;零-地电压?2.检查电源指示灯,如果亮,正常吗?3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?4.是否更换过显示器,更换另一台显示器。5.去掉增加内存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.检查内存和CPU插的是否牢靠9. Clear CMOS10.更换主要备件,如系统板,内存和CPU服务器故障排除二、服务器故障排除的基本原则1.尽量恢复系统缺省配置a:硬件配置:去除第三方厂商备件和非标配备件;b:资源配置:清除CMOS,恢复资源初始配置;c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序;d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?2.从基本到复杂a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。3.交换对比a:在最大可能相同的条件下,交换操作简单效果明显的部件;b:交换NOS载体,既交换软件环境;c:交换硬件,既交换硬件环境;d:交换整机,既交换整体环境;服务器故障排除三、服务器故障排除需要收集哪些信息?服务器信息:1.机器型号2.机器序列号(S/N:如:NC00075534)3.Bios版本4.是否增加其它设备,如网卡,SCSI卡,内存,CPU5.硬盘如何配置,是否做阵列,阵列级别6.安装什么操作系统及版本(Windows Server, Netware, Sco, others)
4、服务器一般出现的故障有哪些
主要的故障有,宕机,崩溃,,主要分硬件故障和软件故障,也分为人为故障和机器故障。发生故障的第一时间找到服务商进行控制,以免造成更多损失。因此,租用服务器选择售后服务好的服务商至关重要。——网时服务商
5、服务器正常运行时出现的故障
常见故障有两种,第一,硬件故障.第二,软件故障.
<br>听报警声
<br>一长两短是内存有问题
<br>一长几短是显卡有问题
<br>如果没报警声,风扇转,屏幕无显示,说明CPU有问题
<br>以上情况都没有,系统自检也成功的话,就是操作系统有问题或者硬盘坏了,如果自检不成功,则检查CMOS设置
脑常见故障及排除
从PC诞生到现在,电脑经过了无数次的更新换代。随着各项技术的不断突破,电脑作为一个奢侈品的时代已一去不返,已经从商务应用过渡到了娱乐休闲,走入了寻常百姓家;电脑从原本单纯的专业使用,变成了目前的大众家庭娱乐中心,更多的家庭用户还将电脑作为一个家庭装饰品。
但在电脑给我们带来方便的同时,也给我们带来了不少烦恼。比如说:死机、重启、黑屏等一些电脑故障,就经常困扰着不少朋友。当自己的电脑出了故障,不少朋友只能将自己的电脑送去电脑城维修,废时废力不说,还得付上那高额的维修费。而实际上,许多故障往往很容易搞定,不需要任何专业工具,自己动手也就是几分钟的事情。
电脑启动不了,是不是很着急?
在本文中,笔者会以简练详尽的语言“手把手”的带你走进电脑基础维修的大门,力求在最短的时间内教会您电脑基本硬件故障解决之道。
首先,需要明确的一点是,电脑故障分别软件故障和硬件故障。对于专业维修人员,一般是采用先“硬”后“软”方法来检测故障的所在处(即先检查硬件,确认硬件是否有故障,如果排除了硬件故障,再检查软件问题);而对于动手能力较差的新手来说,笔者建议朋友们选择先软后硬的方法。
由于这篇文章是以“电脑常见硬件故障解决方案”为核心,所以对于排除电脑软件故障,我们只教大家一点。即将电脑系统盘完全格式化,重新安装操系统,仅仅安装必要驱动。这时,如果故障解决了,即为软件故障;如果故障仍没有解决,即为硬件故障。还有一种情况是,格式化后不能正常安装操作系统,这同样为硬件故障。
另外,还有两点需要确认,明确了这两点有助于您更快的理解本文。
一、本文中的“常见故障”是指电脑在正常使用过程中,非人为原因出现的故障。其它故障不在本文讨论范围之内,比如说:新攒的电脑;更换CPU、内存、硬盘、显卡等;暴力磕碰等情况下出现的故障。
二、如果您的电脑安装的是Windows 98或Windows ME操作系统,那么经常遇到死机、重启、蓝屏等情况是正常的,这是操作系统本身的BUG造成的。解决之道也很简单,就是升级Windows 2000或XP系统。
电脑常见故障之一——死机
死机是电脑的常见故障之一,每个使用过电脑的人恐怕都遇到过死机现象,电脑的死机确实是一件很烦人的事,有时还会给您带来不小的损失。
在笔者的实际维修生涯中,造成死机的硬件故障最常见就是:CPU散热器出问题,CPU过热所致。
检测方法:检测这个故障的方法也很简单,首先将电脑平放在地上后,打开电脑,观察CPU散热器扇叶是否在旋转,如果扇叶完全不转,故障确认。有时候,CPU风扇出现故障,但却没有完全停止转动,由于转数过小,所以同样起不到良好的散热作用。检测这种情况笔者常用的一个方法是:将食指轻轻的放在CPU风扇上(注意,不要把指甲放到风扇上),如果有打手的感觉,证明风扇运行良好;如果手指放上去,风扇就不转了,风扇故障确认。
解决方案:很间单,更换CPU散热器。
其它造成死机的常见硬件故障:显卡、电源散热器出问题,过热所致。
检测方法:完全可以用上述方法来检测显卡散热器,在这里我们就不再赘述。电源散热风扇故障的检测方法稍有不同,将手心平放在电源后部,如果感觉吹出的风有力,不是很热,证明正常;如果感觉吹出的风很热,或是根本感觉不到风,证明有问题。
解决方案:显卡问题可以直接更换显卡风扇;电源风扇虽然在内部,但同样拆开自行更换,所需要只是一个螺丝刀而已。
电脑常见故障之二——重启
电脑在正常使用情况下无故重启,同样常见故障之一。需要提前指出的一点是:就算没有软、硬件故障的电脑,偶尔也会因为系统BUG或非法操作而重启,所以偶尔一两次的重启并不一定是电脑出了故障了。
造成重启的最常见硬件故障:CPU风扇转速过低或CPU过热。
一般来说,CPU风扇转速过低或过热只能造成电脑死机,但由于目前市场上大部分主板均有:CPU风扇转速过低和CPU过热保护功能(各个主板厂商的叫法不同,其实都是这个意思)。它的作用就是:如果在系统运行的过程中,检测到CPU风扇转速低于某一数值,或是CPU温度超过某一度数,电脑自动重启。这样,如果电脑开启了这项功能话,CPU风扇一旦出现问题,电脑就会在使用一段时间后不断重启。
检测方法:将BIOS恢复一下默认设置,关闭上述保护功能,如果电脑不再重启,就可以确认故障源了。
解决方案:同样为更换CPU散热器。
造成重启的常见硬件故障:主板电容爆浆
电脑在长时间使用后,部分质量较差的主板电容会爆浆。如果是只是轻微爆浆,电脑依然可以正常使用,但随着主板电容爆浆的严重化,主板会变得越来越稳定,出现重启的故障。
比较严重,这种情况电脑根本就不可能启动
不是很严重,这种情况电脑应该还可正常使用
检测方法:将机箱平放,看主板上的电容,正常电容的顶部是完全平的,部分电容会有点内凹;但爆浆后的电容是凸起的。
解决方案:拆开电脑,拿到专门维修站点去维修,一般更换主板供电部分电容的维修费在20块钱以内(成本不过几毛钱);超过这个数,你就碰到JS了。
如果是某一次非法关机后或是磕碰电脑后,电脑可以通过硬件自检的过程,但在进入操作系统的过程中重启,并且一再如此的话,就要考虑是否是硬盘问题了。
检测方法:使用“金海硕-效率源磁盘坏道修复程序1.6破解版”,去网上下载一个,很好找的。使用这款软件时,注意要将系统时间调整到2003年5月到2003年12月之间,进入这款软件运行界面后,完全是中文傻瓜式操作就不用介绍了。
解决方案:上文介绍的“效率源”同样可以修复硬件坏道,不过就笔者使用,修复效果并不是很好。在这里,笔者推荐大家使用“HDD Regenerator Shell硬盘坏道修复工具”,操作介面虽然是英文的,不过英文比较简单,就算是你完全看不懂,那就一直按“回车键”就可以进入修复界面。需要提醒大家的是,在使用“HDD”前,请注意备份硬盘数据。
在使用HDD修复完后,再使用“效率源”检测一下,90%以上的硬盘可以完全修复。如果这时检查你的硬盘依然有坏道,建议你更换一块新硬盘,为你的老硬盘准备“后事”吧。
请朋友们注意,以上方法适用于任何情况下的硬盘坏道修复,是笔者在多年的维修工作中,发现的比较简单,同样是修复率比较高的一个方法,完全修复率可达90%以上。
电脑常见故障之三——开机无响应(上)
经常使用电脑的朋友应该会碰到这种情况,开机时按下电源按钮后,电脑无响应,显示器黑屏不亮。除去那些傻瓜式的故障原因,如显示器、主机电源没插好;显示器与主板信号接口处脱落外,常见的故障原因如下。
其实这个故障还分两种情况,一是开机后CPU风扇转但黑屏,二是按开机键CPU风扇不转。我们先来分析比较简单第一种情况。
“开机后CPU风扇转但黑屏”的故障原因一般可以通过主板BIOS报警音来区分,我们将常用主板BIOS报警音的意义列在后面。
AWARD BIOS程序图片,开机时按DEL可进入
一般我们的BIOS是AWARD,所以在这里我们只列这种BIOS的报警音含义。
1短 系统正常boot机
2短 常规错误,请进入CMOS SETUP重新设置不正确的选项
1长1短 RAM或主板出错
1长2短 显卡错误-----------------------常见
1长3短 键盘控制器错误
1长9短 BIOS损坏
不断地响(长声) 内存插不稳或损坏-------常见
不停地响 电源,显示器未和显示卡连接好
重复短响 电源
如果你的电脑属于上文报警音中之一,你就可以“头疼医头,脚痛医脚”了。注意在上文中标出的两个“常见”项,这两项故障一般可以通过将配件拔下,用橡皮擦干净金手指重新安装上解决。据笔者经验,90%以上的这两种故障可以通过上述方式解决。
还有时开机后,主板BIOS报警音没有响。这时,就需要注意一下主板硬盘指示灯(主机上显眼处红色的那个),如果一闪一闪的(间隔不定),像是不断的在读取硬盘数据,正常启动的样子,那就将检查的重点放在显示器上。如果确定是显示器的问题,就只能送维修站了。注意:普通用户请不要自行打开显示器后盖进行维修,里面有高压电。
如果主板硬盘指示灯长亮,或是长暗的话,就要将检查的重点放在主机上。可以试着将内存、显卡、硬盘等配件逐一插拔的方式来确认故障源。如果全部试过后,电脑故障依然没有解决,就只能送维修站了。估计故障是:CPU或主板物理损坏。
电脑常见故障之三——开机无响应(下)
下面我们来分析“按开机键CPU风扇不转”的故障原因。这种故障可以说是最难处理的,尤其是在没有任何专业设备的情况下。笔者只能根据以往的维修经验给出一些确实可行的检验步骤。请注意,以下的每一步骤全都是笔者曾经见到的实际故障案例。
电脑主机一大杀手——灰尘
1、检查电源和重启按键是不是出了物理故障,最常见的是按下去起不来,两个按键的任一个出现这种问题,均可以造成电脑无法正常开机。解决方法只能送修或更换机箱,因为机箱由于集成在机箱内部,普通用户很难修理。
2、打开机箱,将主板BIOS电源拔下,稍等一会,再重新按上,看电脑是否可以正常运行。
3、将主板与机箱的链接线全部拔下,用螺丝刀碰触主板电源控制针(由于有许多针,电源控制针的确认请参照主板说明书,别乱碰,会烧主板的),如果正常开机,证明是机箱开机和重启键的问题。解决方法同上。
4、将电源和主板、光驱、硬盘、软驱等设备相互之间的数据和电源线全部拔下,将主板背板所有设备,如显示器、网线、鼠标、键盘也全部拔下,吹干主板电源插座和电源插头上的灰尘后重新插上,开机。如果可以开机,再将设备一件一件插上,以确认故障源。确认后更新出故障的配件即可解决问题。
以上四步全部试完了,依然不可以确定故障源的话,在现在设备的情况下,已经不能确定故障源所在,只能将电脑主机送维修站了。估计故障是:电源或主板烧毁。
电脑常见故障之四——显示器色斑
CRT显示器全屏、一个角或是一小块地方,出现色班,可以说并不是一个大故障,电脑仍然可以使用。但对于这个面子上的事情,如果不解决掉,总是用着不“爽”。
显示器色斑,即磁化现象。消磁
参考资料:
6、DNS服务器发生故障怎么办
依选取始/程序/管理工具(公用)/
DNS
管理器现域名服务管理器主窗口要做第件事添加专DNS服务器进行配属置
打
DNS
菜单选择新建服务器框输入DNS服务器主机名或IP址:199.168.1.1单击确定按钮操作完刚添加服务器现服务器列表
7、服务器故障和服务器资源共享故障的区别
前者包含后者
服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。
有一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Mole (VRM) over/under-voltage 2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH /CMC A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。
任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。
相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。
这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER 2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。
在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随操作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。
正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用规则。
这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它操作系统均有效)。
正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才能使系统进入正常的关闭过程中。
另外,为了避免数据丢失,你应该按照如下的步骤操作:
· 经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。
· 安装第二块硬盘并与原来的硬盘设置成镜像,
一旦Server Apliance未能正确关闭,并无法重起,请按如下操作恢复:
1. 当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。
2. 连接串口线的另一头到一台运行Windows的PC的串口上。
3. 运行超级链接程序(HyperTerminal),并设置端口的参数为19200, n-8-1, Flow control - None. 你可以看到appliance的控制提示,并要求你输入管理员口令。
4. 重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。
5. 敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。
6. 在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)
翻至Defaults… 并按右箭头键选中。
翻至Root Password…并按右箭头键选中。
翻至Random 并按右箭头键选中,会提示一个随机产生的密码。
记下此密码。
翻至Yes并按右箭头键选中,系统密码会立刻更改。
7. 回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。
8. 为修复分区,请按如下方法操作:
对于sa1100,按顺序输入:
[…]#: fsck /dev/hda5
[…]#: fsck /dev/hda6
[…]#: fsck /dev/hda7
对于sa1120,按顺序输入:
[…]#: fsck /dev/sda5
[…]#: fsck /dev/sda6
[…]#: fsck /dev/sda7
当所有的分区都被修复后,应回到“#”提示符下。
9. 输入“reboot”重新启动系统。
如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。
对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。
8、开机出现"服务器正在运行中"故障怎么办?
原因:netkeeper应用程序造成的。
1、首先打开电脑左下角的win图标按钮,选择打开齿轮图标。
2、然后在弹出来的窗口中点击打开“系统”。
3、然后在弹出来的窗口中点击应用和功能,在右侧找到netkeeper ,点击后会显示卸载按钮,点击将其卸载即可。
4、然后重启电脑就可以解决这问题了。
9、服务器硬件故障要如何排查和判断
常见服务器硬件故障排查判断:服务器常见故障的诊断与解决:服务器故障排除第一部分 服务器故障排除的基本原则性问题服务器故障排除一、服务器开机黑屏故障排查1.检查供电环境,零-火;零-地电压?2.检查电源指示灯,如果亮,正常吗?3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?4.是否更换过显示器,更换另一台显示器。5.去掉增加内存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.检查内存和CPU插的是否牢靠9. Clear CMOS10.更换主要备件,如系统板,内存和CPU服务器故障排除二、服务器故障排除的基本原则1.尽量恢复系统缺省配置a:硬件配置:去除第三方厂商备件和非标配备件;b:资源配置:清除CMOS,恢复资源初始配置;c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序;d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?2.从基本到复杂a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。3.交换对比a:在最大可能相同的条件下,交换操作简单效果明显的部件;b:交换NOS载体,既交换软件环境;c:交换硬件,既交换硬件环境;d:交换整机,既交换整体环境;服务器故障排除三、服务器故障排除需要收集哪些信息?服务器信息:1.机器型号2.机器序列号(S/N:如:NC00075534)3.Bios版本4.是否增加其它设备,如网卡,SCSI卡,内存,CPU5.硬盘如何配置,是否做阵列,阵列级别6.安装什么操作系统及版本(Windows Server, Netware, Sco, others)
故障信息1.在POST时,屏幕显示的异常信息2.服务器本身指示灯的状态?3.报警声和BEEP CODES4. NOS的事件记录文件?5. Events Log文件
确定故障类型和故障现象:1.开机无显示;2.上电自检阶段故障;3.安装阶段故障和现象;4.操作系统加载失败;5.系统运行阶段故障.