工业以太网
如何排除以太网故障(一)
2013-03-25 16:37  浏览:53

  根据经验发现大多数网络故障是与硬件有关的:比如电缆、中继器、Hub、Switch和网卡等。本文描述了以太网典型故障的查找过程。

   一、故障查找的一般规则

   以太网的故障查找可分为5个步骤:

   1.收集所有可以收集到的有价值的信息,分析故障的现象。
   2.将故障定位到某一特定的网段,或者是单一独立功能组(模块),也可以是某一用户。
   3.确认是特定的硬件故障还是软件故障。
   4.定位与修复故障。
   5.验证故障的排除。

   一般来说,最好的办法是先把故障细分或隔离在一个小的功能段上,即首先排除最大的简单段,从任何一个方便的、靠近问题的站点入手,利用二分法隔离故障,再继续使用二分法直至把故障划分到最小的单位。网管人员不要过多指望用户会给出完整准确的情况描述,最好由自己来确认一下。当然也可以让用户演示所发现的问题。由于网络故障带来的压力和混乱,人们经常忽略一些细节问题。如果某个部件出了问题,最好不要立即去替换它,除非能肯定故障的来源。

   二、故障查找应注意的事项

   由于以太网采用通用总线拓扑结构以及物理层可扩展的潜在问题,所以某个特定物理层的问题会以不同的方式显示出来,而且由于采用的测试手段、位置和环境不同,显示出的现象还常常有矛盾。

   为了避免被假象误导,推荐两个故障查找的步骤:

   1.沿网段多做几次测试

   如果故障现象随测试点的不同还保持一样的话,就可以依照所测试出的故障现象去排除。如果故障现象在一些或所有的测试点都不相同的话,就要把查找故障的方向定在物理层(除非有特别提示),例如去查找坏的电缆、噪声环境、接地循环等故障。

   2.要提高测试质量,在测试的同时要把测试仪器设置成至少可同时发送较低的流量。由于增加了网络流量,微小的和间歇性的物理层问题会被暴露出来。

   三、典型的网络故障

   故障1、不能访问服务器或某项服务

   在这里设定服务器或某项服务以前是正常的,并且已经做过如下的工作:

   重新冷启动PC机(热启动不能复位全部的适配卡)。

   确认PC机没有本身的硬件故障。

   确认所有的网络电缆都连接正确。

   确认所有的网卡驱动软件都正常地装入,没有报告错误。

   确认服务器或服务没有改变,比如重新配置增加硬? 软件。

   要测试一下这一故障是否只影响该工作站(本地故障)还是会影响其它站点(大范围故障),可以通过其它工作站装入服务器或服务来证明这一点。这些工作站要在同一网段或Hub上。如果故障在同一网段或Hub上的其它的站点也存在,就试着从其它的Hub或网段上的站点进行测试。

   (一)本地故障

   在进行硬件故障查找以前,要确认其它用户也不能登录从这台机器上,这就排除了用户帐号的错误。对一个单一的站点来说,典型的故障多发生在坏的电缆、坏的网卡、驱动软件或是工作站设置的不正确等问题上。

   (二)全局问题

   通常来说,在同轴网中的物理层故障会导致灾难性的网络故障。使用“二分法”来查找这类故障是可以很快定位解决的。间歇性的故障是比较难以隔离的。


发表评论
0评