导航

公告

文章

收藏

相册

友情联接

存档

原帖地址:http://www.stcore.com/bbs/archiver/?tid-5224.html



页: [1]

zmcsdh2006-3-6 02:45
[精华]网络故障排除参考大全

A.1  故障现象及原因    10/100/1000Mbit/s以太网

A.1.1  故障现象:网络性能降低的同时伴有FCS差错

CSMA/CD算法在冲突发生时会引起校验和无效(即FCS差错),在发生次数不多的情况下属于正常现象,因此FCS差错与冲突同时发生、且发生次数在合理的范围内时就无需担忧。对于本故障现象,可以利用协议分析仪来检测某段时间内冲突发生的次数与FCS差错的次数并分析它们之间的特性曲线,如果在这两者之间找不到对应关系的话,则可能是如下原因之一:

原因一:网络中存在噪声和干扰。

在网络设备没有接地或接地不正确的时候就会产生噪声干扰,可以用电缆扫描仪或万用表来检测网络中的噪声电平。一个10Base2/10Base5网络中只能有一个接地连线,如果还存在另一个连线接地(如网卡差错或电缆损坏)的话,则由于两个地之间存在压降而引起电缆中的电流泄漏。

原因二:电缆路由上有电磁干扰。

复印机、电梯、手机以及寻呼机带来的电磁干扰都可能会引起FCS差错,可以用万用表来检测干扰情况并使用电缆测试仪来检测噪声情况。在检测电磁干扰时,可以检查电缆路由上是否存在电梯、电机、变电器、灯带以及带有高时钟频率或X射线仪器的计算机系统。

原因三:网卡有故障。

在检查是否由网卡故障引起FCS差错时,可以检查按网络节点排序的所有无效数据包(大多数协议分析仪都能自动生成这类标准的统计报告),如果发现某个节点比较可疑的话,则可以检测该节点的活动率(以数据包/秒为统计单位)与该节点所处网段的FCS差错发生次数。如果发现两者之间存在某种对应关系,那就有机会找到故障源。需要记住的是,由于网卡故障经常是间歇性的出现(如网卡达到一定温度时才出现),因此需要经过较长时间的监测才有可能得到准确和重复出现的故障结果。

原因四:接头(如NIC、墙插、MAU、中继器、集线器等)松动或损坏。

定位这类故障源的方法就是仔细检查网络路径上的所有连接情况。




A.1.2  故障现象:网络性能降低的同时伴有滞后冲突

以太网中冲突次数的增加常常与线缆有问题(如线缆段过长)、网卡损坏、级联的中继器数量过多、终端电阻损坏或缺少等原因有关,如果能确定冲突属于滞后冲突还是正常冲突,将有助于我们缩小故障源的范围,滞后冲突的可能原因如下:

原因一:线缆长度超过了特定网络拓朴所能允许的最大长度。

此时只需使用线缆测试仪测量一下线缆的长度即可。

原因二:网络中级联的中继器数量过多。

可以用网桥代替其中的一个中继器,或者改变网络的配置。

原因三:网卡或MAU损坏。

利用协议分析仪收集发送无效数据包最多的站点的运行统计数据,并收集冲突发生次数与活动站点的统计数据以检查两者之间是否存在对应关系,如果这些方法无法找到故障源的话,就必须使用网络分段法来排除网络故障了。




A.1.3  故障现象:网络性能降低的同时伴有早期冲突

原因一:终端电阻损坏或缺失。

10Base2和10Base5以太网必须带有50Ω的终端电阻,检查网络中所有需要终端电阻的地方是否均安装了正确的终端电阻,其阻抗可以用万用表来测量(阻抗值应介于48Ω~52Ω之间)。



原因二:T型接头松动或损坏。



检查网络中的所有接头,以确定是否有松动或损坏现象。



原因三:网络中的节点数过多。



检查每个网段中的MAU数量,一个10Baes2网段中最多不能超过30个MAU,而一个10Base5网段中最多也只能数据U讥2  /10Base5Mbit/s有100个MAU。

原因四:线缆被扭折。

可以使用线缆扫描仪来定位并替换被扭折的线缆。

原因五:电缆与IEEE 802.3不兼容。

IEEE 802.3的10Base5电缆每隔2.5米就以一种颜色加以标记,为了减少连接点处的反射干扰,接头的插入点应选择在这些颜色的标记处。此外要记住,并不是所有的BNC接头都使用50Ω的电缆,尽管以太网能在75Ω的电缆上传输几十米之远,但是长度的增加迟早会引发网络故障,因而在检测网络故障时要检查所用电缆的规范。






A.1.4  故障现象:网络速度慢、响应时间长(冲突与FCS差错均处于正常范围)



原因一:传输路径上的网桥或路由器的缓存溢出。



检查路由器或网桥的统计数据(如CPU使用率、端口使用率等),利用协议分析仪检测哪个站点产生的经由网桥或路由器转发的流量最大?是否有超时现象出现?一般可以用ping命令来测试通过网桥或路由器的响应时间,以查明网络互连设备是否是引起故障的部分原因,如果是的话,就需要重新配置网络(如将部分服务器或客户机移到其他网段)以减轻重载互连设备的流量。



原因二:光纤链路的传输问题。



在光纤链路衰耗过大或发射光功率过低的情况下,如果光纤链路的传输距离过长可能会引起性能劣化(即使没有出现任何FCS校验差错)。此时可以用ping命令来检测有问题的光纤链路的响应时间,并检查光纤耦合器及线路衰耗的设置情况。



原因三:存在本地网段路由。



本地路由是网络速度减慢的常见原因,常常发生于子网地址不同、但连接在同一个LAN交换机下的两个节点之间的连接上,且LAN交换机连接在一个路由器下,这种本地路由有时也称为one-armed路由。此时,尽管这两个节点均连接在同一个交换机下,但它们之间的数据包必须经过路由器的路由之后才能到达对方。






A.1.5  故障现象:间歇性的出现网络连接故障、网络性能降低以及帧对齐差错。



原因一:网卡在每个FCS之后还发送了一些额外的比特。



可以使用协议分析仪捕获在FCS之后有额外比特的数据帧(称为dribble数据帧或帧对齐差错的数据帧),从数据帧的源地址中就可以找到有故障的网卡。



原因二:最大传输距离超出了以太网的规范。



数据包能否到达最终目的地取决于发送站点和接收站点,在两个站点相距较近时一般没有什么问题,但是在两个站点相距较远、且处在同一个网段中时就有可能会出现连接问题。此时就需要尽力找出这类连接问题是否只与某些特定的节点有关,可以使用线缆测试仪来检测传输路径上的线缆长度和质量,必要时可以在传输路径上插入一个网桥或路由器。



原因三:如果在传输路径上级联了过多的网桥或路由器,将会导致信号的传输延时增加和协议超时(如TCP超时),可以使用ping命令或响应时间代理来检测响应时间。






A.1.6  故障现象:网络连接出现间歇性故障的同时伴有短包。



原因:网卡有故障。



可以使用协议分析仪捕获短包并从短包的源地址中找到发送节点,如果源地址字段损坏,则可采用前面讲述的相关测试方法来找到有故障的网卡。






A.1.7  故障现象:网络连接出现间歇性故障的同时伴有超时传输包



原因一:由于在10Base2和10Base5以太网中存在两个接地连接,因而在网线中产生直流电流。



可以使用电缆测试仪来检测网线中的直流电流。



原因二:网卡损坏。



网卡损坏有时会产生jabber数据帧(即超长数据帧),导致所处网段出现连接故障。可从协议分析仪捕获的jabber数据帧的源地址字段中找到失效网卡的位置。






A.1.8  故障现象:网络连接出现间歇性故障的同时伴有帧间距过短现象



原因:帧间距过短引起数据包丢失。



如果以太网中的站点不能维持正常的最小帧间距(10Mbit/s以太网中为9.6μs,100Mbit/s以太网中为0.96μs)的话,某些集线器设备就无法正确处理接收到的数据包。此时,数据包有可能会转变为jabber数据包。在进行故障检测时,可以用协议分析仪来测量帧间距(可由数据包的时间戳得到帧间距),之后,再从协议分析仪捕获的数据帧的源地址字段中找到失效网卡的位置。






A.1.9  故障现象:经由网桥互连的传输路径上出现间歇性的网络连接故障



原因:由于网桥使用了负载均衡功能而打乱了数据包的到达次序。



检查网桥的在必要时关闭网桥的负载均衡功能。






A.1.10  故障现象:经由路由器互连的传输路径上出现间歇性的网络连接故障



原因:路由器连接在重载WAN链路或所连接的WAN链路质量较差。



排除这类故障可以使用协议分析仪由器所连接的WAN链路的使用率,FCS差错率以及误码率,此外,分析路由器端口的日志也有助于我们找到故障原因。






A.1.11  故障现象:单个节点与网络失去连接



原因一:MAU与网线或网卡与网络的连接松动或连接失效。



单个节点突然与网络完全失去连接的主要原因如下:



l         MAU连接松动;



l         连接电缆断开、短路或有噪声干扰;



l         网卡失效。



此时需检查电缆、接头、网卡是否有问题,在必要时应予以替换。为了确定故障是否是节点本身,可以用一个工作正常的节点(如笔记本电脑)完全替换到有故障的节点,如果网络连接恢复正常的话,则表示故障源在节点内部,否则表示故障源在网络侧。



原因二:网卡配置有误,如接头激活有误(如应激活AUI接头的却激活了双绞线接头)或选择的中断资源已被占用。



此时可利用ping命令(ping 127.0.0.1)检查网卡的工作是否正常以及数据包能否被正确的发送和接收,此外,还应检查最近是否有人在网络中安装了软件或硬件。当然,也可以采用原因一中的方法,用一个工作正常的节点完全替换故障节点,以确定故障源在节点本身还是在网络侧。



原因三:网卡损坏或保险丝被烧断。



使用外接MAU时需要检查其电系统是否完好。使用ping命令(ping 127.0.0.1)来检查网卡的工作是否正常以及数据包能否被正确的发送和接收。



原因四:不兼容的网卡把外接MAU发送的“心跳信号”当成是SQE信号,进而发生差错。



此时,应监视MAU上的LED,如果每欠发送数据时SQE LED都点亮的话,则应关闭MAU的心跳模式(也就是把MAU的工作模式从Ethernet 2.0切换到IEEE802.3)。



原因五:由于网桥工作于保护模式下而没有激活学习模式,因而其老化功能将有故障的节点地址从地址表中删除了。



原因六:网桥或路由器的过滤器设置不正确。



检查过滤器的设置情况并与故障节点的地址相比较,以确定是否因过滤器的设置不当而引起了节点的连接故障。特别是在网桥使用了备份路径或负载均衡机制之后,更应检查过滤器的设置是否与这些功能相冲突。



原因七:MAC-IP地址映射有问题,这主要是由于静态IP地址发生了变化或网络中同时配置静态IP地址和DHCP。






A.1.12  故障现象:网络中的某个网段与其余网段之间失去了桥接连接



原因一:网桥的端口配置不正确(如端口没有被激活、端口的运行模式不正确(如应为10Mbit/s的却配成100Mbit/s)、连接失效(如电缆、接头以及插板松动)或布线错误等)。



检查网桥的安装和配置是否正确。



原因二:由于网桥工作于保护模式下而没有激活学习模式,因而其老化功能将有故障的节点地址从地址表中删除了。



检查网桥的地址表和工作模式(网桥的学习模式是否打开?)。



原因三:网桥或路由器的过滤设置不正确。



检查网桥或路由器的过滤器设置情况,特别是要检查使用了通配符的过滤项。






A.1.13  故障现象:网络中的某个网段与其余网段之间失去了路由连接



原因一:路由器的端口配置不正确(端口没有被激活、端口的运行模式不正确(如10Mbit/s设成了100Mbit/s)、连接失效(如电缆、接头以及插板松动)、协议没有被激活或布线错误等)。



检查路由器的安装和配置是否正确。



原因二:路由器的地址表、映射表或路由表的配置有误。



检查路由器的配置。



原因三:路由器的过滤器设置有误。



检查路由器的过滤器设置情况,特别是要检查使用了通配符以及有可能阻塞备份路由或负载分担路由的过滤项。



原因四:与路由器WAN端口相连的WAN链路失效。



检查WAN链路的工作是否正常。



原因五:没有设置默认网关。



检查路由器中是否配置了默认网关。



原因六:子网掩码配置有误。



全面检查网络文档中有关子网掩码的所有配置情况。



原因七:定时器配置有误。



检查路由器中不同协议的定时器参数配置是否正确,并与这些定时器的默认值相比较,特别是在网络中使用了不同厂商的路由器设备时尤为重要。






A.1.14  故障现象:客户机出现间歇性的网络连接故障



客户机出现周期性的网络连接故障,虽然能ping通,但数据包时有丢失。



原因一:NIC或交换机/路由器的配置有误。



NIC或交换机/路由器的配置有误,致使连接双方工作在不同的工作模式下,此时应检查NIC以及交换机/路由器端口的配置是否正确。



原因二:NIC或交换机/路由器的工作模式配置有误(一方被配置为手动工作模式,而另一方被配置为自动协商工作模式)。



检查NIC以及交换机/路由器的端口配置情况,避免使用自动协商工作模式。



原因三:主机忙或处于重载状态,服务器遇到问题。



检查服务器的运行统计数据及其响应时间。






A.1.15  故障现象:10/100BaseT自动协商进程太过频繁,吞吐量很低



原因:通信双方未达成一致(一方为全双工方式,另一方为半双工方式)。









A.2  以太网中的常见差错



下面以字母顺序列出了以太网中最常见的故障原因:



l         AUI电缆损坏;



l         网桥地址列表的配置不正确,网桥工作在保护模式下;



l         网桥过滤器设置不当;



l         网桥过载;



l         网桥的老化功能删除了某些地址表项;



l         级联的网桥或中继器太多,从而引发超时和响应时间过长;



l         电缆长度超标;



l         连接器松动或损坏:接咔、墙插、MAU、Hub、网桥、路由器;



l         电磁干扰;



l         外部MAU损坏;



l         路由器、网桥或Hub的物理连接故障(电缆、连接器和插入模块松动;背板上的电缆连接错误);



l         接地时;



l         帧间距过短;



l         网络被多处接地;



l         NIC配置不正确;



l         网桥负载均衡功能引起的数据包失序;



l         光组件(如光Hub端口)的功率时;



l         路由器的过滤器设置不当;



l         路由器配置不正确(端口未激活、协议未激活、运行模式不正确等);



l         路由器过滤;



l         路由协议属性项配置不正确(如地址表、映射表、子网掩码、默认网关、路由表和定时器);



l         路由协议的(OSPF Hello定时器、Dead定时器、IGRP Active定叶器的设置不正确);



l         终端电阻损坏或丢失(10Base2、10Base5);



l         WAN链路中断、过载或质量低劣(BER非常高)。

zmcsdh2006-3-6 02:46
A.3  故障现象及原因:令牌环



A.3.1  故障现象:活动监视器差错或活动监视器改变



原因一:活动监视器检测到申请令牌帧,则退出活动监视器状态并发送一个报告活动监视器帧。



这一般是由备用监视器(环中所有不是活动监视器的站点都是备用监视器)未检测到环中有活动监视器引起的。



原因二:活动监视器检测到环中有不是其产生的AMP帧。



出现这种情况时,活动监视器会发出一个带子向量2(subvector 2)的报告活动监视器帧(监视器重复)。



原因三:参与监视器竞争进程的站点检测到一个源地址为本机地址、但NAUN地址与本机内存中的NAUN地址不匹配的申请令牌帧。



此时,该站点会发出一个子向量3的报告监视器差错帧(在监视器争用过程中出现地址重复情况)。






A.3.2  故障现象:地址识别错误



原因:站点检测到环中有多个AMP帧或在未收到AMP帧的情况下就收到了一个SMP帧。






A.3.3  故障现象:突发差错



原因:硬件故障,如网卡、电缆、MAU或集中器损坏。



如果在帧首定界符和帧尾定界符这间的5.5bit时间内都没有收到有效信号,则会发出一个突发差错帧。分析令牌环消息就可以定位故障源,即找出报告这一差错的站点及其所有上游站点(列出这些处于活动状态的站点),然后分析故障域内站点的活动与差错现象之间的对应关系,使用网桥的自测功能检查集中器,并用电缆扫描仪检测电缆问题。






A.3.4  故障现象:环路严重告警、数据流环路严重告警



原因一:集中器或网卡损坏;



原因二:连接器(网卡、插座、集中器、网桥和路由器等)松动或损坏。



分析环路严重告警帧,从其发送站点和NANU地址中追踪故障域,故障域包括发送环路严重告警帧的站点及其输入线路、发送环路严重告警帧的站点的NAUN及其输出线路以及这两个站点之间的集中器,应仔细检查该故障域内的所有网络组件(网卡、集中器、电缆、连接器和插座等)。






A.3.5  故障现象:站点插入失败



原因一:地址重复;



在地址重复检查(属于站点插入过程的一部分)中,新插入的站点检测到环中已存在地址相同的站点。



原因二:站点未能成功地参与邻居通告进程;



原因三:站点初始化出错。






A.3.6  故障现象:帧复制差错



原因:站点接收到一个目的地址为本机地址、但地址识别和帧复制比特均为“0”的帧。



一个很有可能的原因就是环上存在重复的MAC地址。为了找出另一个拥有相同地址的站点,可以使用协议分析仪分析无效的插入帧,在找出该MAC地址重复的站点之后就可以重新加以配置。






A.3.7  故障现象:帧丢失差错



原因:未接收到一个已发送帧。



在其它站点进入或离开令牌环时可能会出现该故障。



帧丢失差错是非孤立性差错,不能把它归结于某个站点。






A.3.8  故障现象:频率差错



原因一:环时钟速率与网卡的内部时钏速率相差太大。



原因二:电缆不合格。



原因三:网卡损坏。



频率差错是非孤立性差错,不能归结于某个站点,典型的频率差错原因是电缆质量不合格、电缆长度超出允许范围以及网卡损坏等。






A.3.9  故障现象:间歇性的差错和连接丢失



原因一:环中两个站点之间的电缆长度过长。



环中某个站点移除之后,会使两个站点之间的距离增大,进而导致信号不能可靠传送,产生严重的连接问题(如非孤立性差错和令牌差错等),此时应检查两个站点之间最大可允许的间距并重新设计网络。



原因二:相位抖动、频率差错、令牌环协议定时器超时或间歇性地出现环路严重告警状态(见图A-2)。



电缆类型


最大站点数(4Mbit/s)


最大站点数(16Mbit/s)



IBM-类电缆


260


140



3类UTP


72


72



5类UTP


132


132




图A-2  令牌环中的最大站点数



验证环中的站点数是否超出了允许范围。






A.3.10  故障现象:内部差错



原因:站点检测到内部差错并自行恢复。



内部差错是孤立性差错,可以归结到单个故障站点,只要借助协议分析仪捕获并分析内部差错帧即可找出故障站点。






A.3.11  故障现象:连不上服务器



原因一:站点到集中器的电缆松动、断开、连接失效、短路或有电磁干扰。



原因二:网卡损坏。



检查电缆、连接器和网卡,必要时应予以替换。



原因三:在网桥地址表中有关到服务器的传输路径的表项中缺失站点的MAC地址。



由于网桥老化功能可以在一定时间之后删除长久未使用的地址,因而如果网桥工作于保护模式下(也就是说不能自学习),则发送站点的地址无法被自动加入到网桥的地址表中。此时应检查网桥到服务器这条路径上的地址表,并检查网桥的工作模式。



原因四:网桥端口未被激活或损坏。



检查网桥端口,通过网桥向站点发送ping包,同时检查日志文件。



原因五:网桥过滤器设置不当。



检查网桥对到达服务器的传输路径所做的过滤器设置。






A.3.12  故障现象:间歇性地网络连接丢失



原因:MAC地址重复。



如果希望加入令牌环的新站点的MAC地址与环中已有站点的MAC地址相同,则该新站点会被拒绝加入并会收到一个请求移除帧。为了找出环中具有相同MAC地址的站点,可以用协议分析仪捕获并分析请求移除帧,在找到MAC地址重复的站点之后就可以重新加以配置。






A.3.13  故障现象:网络负载很高



原因:网桥和/或路由器的负载过重或配置不正确。



可以用协议分析仪找出环中活动最为频繁的站点并查找网桥和路由器问题,如果有超时现象出现,则可以通过测量响应时间来定位故障源。此外,应检查网桥和路由器中的日志文件,统计有多少个帧被丢弃;同时检查网桥的转发表和过滤器设置情况,禁止网桥的可选功能项,如环参数监视器或配置端口服务器等。






A.3.14  故障现象:网速变慢,站点锁定



原因:线路差错、突发差错、FCS差错以及环清除过量。



线路差错和突发差错主要是由站点电缆损坏、集中器或网卡的硬件故障引起的,首先应检查网络的线路和突发差错,然后再检查报告差错的站点及其上游的集中器、电缆和连接器等组件。






A.3.15   故障现象:邻居通告差错



原因一:有站点插入或移除。



原因二:网卡出现间歇性的硬件故障。






A.3.16  故障现象:报告邻居通告未完成



原因:活动监视器向坏差错监视器发送进程未完成帧并发起一个新的AMP帧。



当活动监视器发出AMP帧后,第7s就发起一次邻居通告进程,当站点检测到AMP帧之后就比较AMP帧中的地址识别比特和帧复制比特,如果还没有其它站点复制该AMP帧,该站点就比较自己的NAUN地址与AMP帧的源地址,若两个地址不同,则该站点将AMP帧中的源地址保存为新的NAUN地址,并向配置报告服务器发送NAUN地址改变帧。如果在邻居通告定时器超时前AMP帧仍未返回到活动监视器,活动监视器就会向环差错监视器发送一个进程未完成帧并发出一个新的AMP帧。



用协议分析仪检查请求移除帧并找出MAC地址重复的站点。






A.3.17   故障现象:网络流量不大时网速仍然很慢



原因一:配置不当,协议效率低下或网卡内存不够。



原因二:路由器或网桥端口的设置限制了最大可允许的帧尺寸。



网络负载(以百分经表示)并不是决定网络性能的唯一因素,其它重要因素还有传输帧的尺寸和类型。以LLC帧为例,它并不承载用户数据,而只负责建立和维护连接,如果短LLC帧和MAC帧比例过大,则表明协议效率较低。例如,在NetBIOS/SMB协议中LLC帧与用户数据包的比例大约是1:1,其低效原因是NetBIOS/SMB在LLC子层采用面向连接的协议;而NetWare/IPX采用无连接服务,无需等待接收端的确认即可发送数据,因而IPX中LLC帧很少,而面向连接的协议却通常产生大量的管理帧。



帧过短可能还有其它原因,即网卡所能处理的最大包尺寸取决于网卡的内存。在4Mbit/s令牌环中,最大帧尺寸为4500byte,在16Mbit/s令牌环中,最大帧尺寸可达17800byte,而老式的网卡只有8kbype RAM,因而最多只能处理1000byte的数据。不过,目前的网卡一般都能支持4500byte和17800byte的最大帧长度。此外,某些网络操作系统对最大帧尺寸也有一定的限制,如NetWare 3.11支持的最大帧长度为4000byte点障  10  r 2。






A.3.18  故障现象:环清除



原因一:电缆短路。



原因二:噪声和串扰干扰。



原因三:令牌环行时间过长。



原因四:网卡损坏。



活动监视器在发布一个新的令牌之前需要清除环中的所有数据,为些要进行环清除操作。环清除操作经常发生于站点插入或移出令牌环之时,如果在无任何站点插入或移出环的情况下出现环清除操作,则表明令牌环上的硬件出了故障。






A.3.19  故障现象:环复位



原因:环中有多个申请令牌帧;环在环路严重告警后恢复正常。






A.3.20  故障现象:接收站点拥塞



原因:接收内存不足而无法复制帧。



如果经常出现这种差错,就应该考虑升级现有网卡以增大缓存量。






A.3.21  故障现象:令牌差错



原因一:站点插入或移出令牌环。



原因二:噪声。



原因三:网卡或电缆损坏。



原因四:广播包太多。



在下列情况下站点会发出令牌差错帧:



l         活动监视器接收到一个优先级大于“0”、监视计数器为“1”的令牌(表明该牌已在环行第二圈);



l         在有效令牌定时器超时(10ms)前都未收到一个令牌或帧;



l         检查到非法编码。



令牌差错是非孤立性的令牌差鏎,不能仅归结到某个站点。






A.3.22  故障现象:请求站点被移除



原因:令牌环MAC地址重复。



使用协议分析仪捕获请求移除MAC帧并分析其中的源地址,以找出故障源。






A.3.23  故障现象:令牌环行方向发生变化



原因一:站点插入或移出令牌环。



原因二:令牌环组件的软件或硬件出现故障。



为了确定环行方向,可以利用协议分析仪分析某个与分析仪直接物理相连的站点发送给分析仪的数据帧,需要注意的是,在这过程中要确保该选定的被测站点与协议分析仪都不是活动监视器。如果这些帧的监视比特为“1”,则这些帧是从分析仪流向选 定的被测站点;如果监视比特为“0”,则帧的流动方向相反。如果令牌的环行方向发生了变化,则表明环中到少发生了一次环清除操作,这可能是由站点插入或移出等正常操作引起的,也可能是由环中组件的软、硬件故障引起的。









A.4  令牌环中的故障现象



下面以字母顺序给出了令牌环中的常见故障原因:



l         网桥地址列表配置不正确;网桥处于保护模式下//



l         网络过滤器的设置不正确;



l         网桥过载;



l         网桥的老化功能删除了某些地址表项;



l         相邻站点间的电缆长度超标;



l         接口卡、墙插、集中器、网桥和路由器的连接器松动或损坏;



l         TCU(中继耦合单元)损坏;



l         叶状电缆损坏;



l         网卡损坏;



l         MAC地址重复;



l         电磁干扰;



l         路由器、网桥或集中器的物理安装错误(电缆、连接器、插板松动;背板上的电缆连接出错);



l         路由器/网桥端口上的帧长度限制;



l         由布线、噪声和站点过多引起的频率和抖动问题;



l         由于接口卡内存不足,从而不支持最大帧长度;



l         NIC配置不正确;



l         协议效率低下,未很好的适应令牌环(NetBIOS/SMB);



l         接口卡上的接收缓存不足;



l         网桥/路由器端口上的环速率设置不对,比如应为4Mbit/s而配置成16Mbit/s正常  19   17800byte NetWare 3.11 4000byte;



l         路由器上的过滤器设置不正确;



l         路由器过载;



l         路由协议项配置不正确(如地址表、映射表、子网掩码、默认网关、路由表、定时器);



l         路由设置不正确:端口或协议未激活;



l         电缆短路;



l         源路由问题;



l         环上的站点过多;



l         WAN连接过载或质量低劣(BER过高)。

zmcsdh2006-3-6 02:46
A.5  故障现象及原因:FDDI环网



A.5.1  故障现象:环经常性地重新初始化和高误码率(由LEM检测到的)



这类故障现象常常是由于网卡或集中器的信号功率过弱引起的,为了确定此推断是否正确。



原因一:接头松动;光纤或连接器被弄脏或有手印。



原因二:DAS被去活。



当DAS或集中器失效或被去活时,站间距或能会超出最大允许值。对一个高冗余的网络来说,在设计时应确保所有站间距都小于400m,这样可保证即使有4个连续的站点失效,网络仍能维持运行。



原因三:激活了光旁路切换系统。



只有在站点失效时才会激活光旁路切换系统,它可增大由环引起的衰减(最多为2dB),如果激活了多个光旁路系统,则衰减过大会导致误码率升高并产生大量的申请帧和环路严重告警帧。



原因四:网卡损坏。



原因五:路由器、网桥或集中器的端口损坏。






A.5.2  故障现象:环中出现大量状态报告帧



原因一:出现新的MAC邻居。



原因二:端口的运行状态发生变化。



FDDI站点在配置发生变化后会向其它站点发送SRF以通告其变化行为。但是,环中出现大量的状态报告帧则可能是由差错引起的。此时,可以使用协议分析仪或环管理系统收集并分析SRF,如果这些SRF没有指示任何异常状态,则可以发送SIF以轮询各站的状态。需要注意的是,由于每个站点所维护的差错计数据器只有在接收到带有效结束定界符的差错帧时才开始计数,因而那些以空闲符号或无效字符结尾的差错帧只能通过协议分析仪来检测。






A.5.3  故障现象:环中出现大量的令牌申请帧



原因:TVX或TRT系统Bm,  DTBUit/s超时。



如果站点在2.5ms内都未收到一个有效令牌或数据包,就会导致环中出现大量的令牌申请帧。这主要是由于环上BER太高所致(BER高的原因一般是线缆、连接器、FDDI端口或光旁路系统出现了问题)。






A.5.4  故障现象:校验和差错率非常高(FCS差错)



原因:线缆损坏;FDDI网卡损坏;MIC连接器问题(如灰尘、湿气、指纹等因素)。






A.5.5  故障现象:环中出现大量差错比特被置位的FDDI帧



原因:线缆或FDDI网卡损坏。



此类差错的故障域为设置E比特的站点及其所有上游站点。依次检查设置E比特的站点及其上游传输路径上的所有网络组件,包手集中器、线缆、连接器以及网卡,直到找出故障源。






A.5.6  故障现象:数据包超长(长度差错比特被置位)



原因:网卡或驱动程序有问题。



超长数据包指的是长度大于4500byte的帧,其LE(长度差错)比特被设置为“1” 。






A.5.7  故障现象:令牌环行时间过长



原因:站点配置差错或线缆有问题。



与站点的容量使用率统计数据相似,TRT也能指示环的性能,它应低于申请进程中协商的TTRT。如果TRT经常超过协议的TTRT,则很可能是由于站点配置出错或线缆、连接器出现了故障。






A.5.8  故障现象:无效帧(冲突帧)



原因:站点检测到无效信号。



站点检测到无效信号后会在其发送的下一个有效帧里报告这一事件,带有差错消息的帧就是包含编码冲突或差错的帧,此时故障域就是报告冲突的站点及其上游站点。应依次检查上游传输路径上的各种网络组件,包括集中器、线缆、连接器、网卡,直到找出故障源。






A.5.9  故障现象:接口溢出(楔形接口)



原因:大量突发的小数据包导致队列溢出。



楔形接口是网络中的常见问题,指的是输入/输出队列超出了路由器端口支持的最大队列值,解决办法就是增加队列长度或重新装载路由器。









A.6  FDDI环中的常见差错



下面以字母顺序给出了FDDI网络中的常见故障原因:



l         网桥的地址列表配置不正确;网桥处于保护模式下;



l         网桥过滤器的设置不正确;



l         网桥过载;



l         网桥的老化功能删除了某些地址表项;



l         相邻站点间的电缆长充超标(特别是某个DAS站点失效或发生环回绕时);



l         CDDI:电磁干扰;



l         接口卡、墙插、集中器、网桥或路由器的连接器松动或损坏;



l         跳线损坏;



l         集中器损坏;



l         FDDI环地址重复;



l         路由器、网桥或集中器的物理安装错误(电缆、连接器、插板松动;背板上的电缆连接出错);



l         光纤连接器有灰尘或手印;



l         路由器/网桥端口的帧长度限制;



l         布线、噪声和站点过多引起的频率和抖动问题;



l         网络接口卡损坏;



l         网络接口卡配置不正确(TTRT、驱动程序、中断);



l         接口卡上的接收缓存不足;



l         路由器的过滤器配置不正确;



l         路由器过载;



l         路由协议表项配置错误(如地址表、映射表、子网掩码、默认网关、路由表和定时器码射RT、CN IE);



l         路由器配置不正:正确口或协议未激活;



l         有源光旁路交换系统引起的信号损失;



l         环上的站点数过多;



l         WAN连接中断、过载或质量过劣(BER过高)。

zmcsdh2006-3-6 02:46
A.7  故障现象及原因:ATM



A.7.1  故障现象:PVC上无连接



原因一:ATM网卡或驱动程序有问题;



原因二:未设定PVC,所选VCI不正确;



原因三:交换机的硬件或软件有故障;



原因四:ATM端口配置不当,如比特率、扰码、接口类型、帧类型(如PLCP、SDH/SONET等)。






A.7.2  故障现象:SVC上无连接



原因一:ATM网卡或网卡的驱动程序有问题;



原因二:ATMARP服务配置不当;客户未以正确的ATM地址在ATMARP服务器上进行注册;



原因三:客户系统上配置的ATMARP服务器地址不正确;



原因四:客户或服务器未激活ILMI;



原因五:客户或服务器的ILMI版本不兼容;



原因六:SSCOP层未建立;



原因七:UNI信令版本不兼容(UNI 3.0、3.1、4.0);



原因八:被叫方或主叫方号码不对;



原因九:信息单元未知或无效,或者是必选信息单元的顺序不对;



原因十:信元参考数不对;



原因十一:被叫方未准备好接受呼中,所有呼叫建立请求都被RELEASE消息拒绝;



原因十二:ATM端口配置不当,如比特率、扰码、接口类型、帧类型(如PLCP、G .804、SDH/SONET等);



原因十三:交换机的硬件或软件出现了故障。






A.7.3  故障现象:信元差错率(CER)很高



原因一:物理层问题,如线缆、连接器、ATM端口等;



原因二:VP或VC连接的路径上站点数过多。






A.7.4  故障现象:信元丢失率(CLR)很高



原因一:物理层问题,如线缆、连接器、ATM端口等;



原因二:VP或VC连接的路径上站点数过多;



原因三:ATM交换过载;



原因四:ATM交换机的缓存不足;



原因五:网络负载过重;



原因六:超出了流量合同的限制。






A.7.5  故障现象:信元误插率(CMR)很高



原因一:物理层问题,如线缆、连接器、ATM端口等;



原因二:VP或VC连接的路径上站点数过多;



原因三:网络负载过重;



原因四:ATM交换机故障。






A.7.6  故障现象:平均信元传输延时(MCTD)很高



原因一:传输路径过长引起的高信号延时;



原因二:VP或VC连接的路径上站点数过多;



原因三:ATM交换机过载;



原因四:ATM交换机的缓存不足;



原因五:网络负载过重;



原因六:超出了流量合同的限制。






A.7.8  故障现象:仿真局域网(ELAN)上无连接



原因一:ELAN连接的传统LAN(如以太网、FDDI、令牌环)有问题;



原因二:局域网仿真客户上的IP接口未激活或不起作用;



原因三:IP地址和子网掩码不正确;接口属于不同的子网;



原因四:客户上的LANE软件未激活;



原因五:LE客户试图与其它ELAN的客户建立连接;



原因六:LE客户没有在同一个LE服务器/BUS上进行注册;



原因七:LE服务器(LES)的VCC和ATM 地址不正确;



原因八:BUS的VCC和ATM地址不正确;



原因九:LANE-ARP条目不正确(MAC-ATM地址解析不起作用);



原因十:LE客户的流量合同不兼容;



原因十一:主用LANE服务失效,而备用LANE服务未激活。






A.7.9  故障现象:PNNI网络上无连接



原因一:终端系统间的SVC信令有问题;



原因二:终端系统的ATM地址不对,从而引起路由选择出错;



原因三:交换机端口上的拓朴信息不完整或未及时更新;



原因四:对等组领导配置不当(PGL未激活或无指定的父LGN);



原因五:未激活PNNI路由控制通路(SVCC-RCC);



原因六:未激活PNNI上的Hello协议;



原因七:PNNI端口参数配置不当(信元速率、信无传输延时和比特率);



原因八:未激活或未定义到相邻对等组的上行链路;



原因九:PNNI地址、前缀或汇总地址不正确。






A.7.10  故障现象:ATM连接丢失



原因一:流量合同冲突;激活了流量整形功能;



原因二:网络处于重载状态时只传送高优先级的信元流,低优先级的信元流则被丢弃;



原因三:ATM端口配置不正确,从而引起时钟和同步差错;



原因四:物理层问题,如线缆、连接器、ATM端口等。









A.8  ATM网络中的常见差错



下面以字母顺序给出了ATM网络中的常见故障原因:



l         ATM接口卡损坏;



l         ATM接口卡配置出错(中断、驱动、定时器);



l         网络重载时传输不同优先级的信元流,因而低优先级的信元被丢失;



l         经典IP Over ATM:客户系统上未配置ATM ARP服务器地址;



l         经典IP Over ATM:ATM ARP服务器地址配置有误,客户未注册或注册地址不正确;



l         电缆设施出错一因  10  P.14.0;



l         电磁干扰(ATM over UTP);



l         交换机的软、硬件故障;



l         传输路径过长引起的高信号传输延时;



l         客户端或ATM交换机上未激活ILMI;



l         客户或服务器上的软件版本不兼容;



l         端口配置不正确:比特率、扰码、接口类型、帧类型(PLCP、G.804、SDH、SONET);



l         路由器配置不正确(端口未激活、操作模式不对、协议未激活);



l         路由器的过滤器设置不正确;



l         交换机上的缓存不足;



l         LANE:IP地址和子网掩码不正确;接口属于不同的子网;



l         LANE:LE客户上的IP接口未激活或未起作用;



l         LANE:客户或服务器上的LANE软件未激活;



l         LANE:LANE-ARP表项不正确(MAC-ATM地址解析未工作);



l         LANE:LE客户未在同一LE服务器/BUS上注册;



l         LANE:LE客户试图与不同ELAN的客户进行通信;



l         LANE:主用LANE 服务失效、备用LANE服务未激活;



l         LANE:LE客户上流量合同不兼容;



l         LANE:LE服务器(LES)的VCC未激活或LES的ATM地址不正确;



l         LANE:BUS VCC未激活或BUS的ATM地址不正确;



l         接口卡、墙插、MAU、Hub、网桥、路由器的连接器松动或损坏;



l         ATM接口卡配置不正确(中断、驱动、定时器);



l         路由协议表项配置不正确(地址表、映射表、子网掩码、默认网关、路由平和定时器);



l         PNNI:PNNI接口上的Hello协议未激活;



l         PNNI:对等组领层配置不正确(PGL未激活或无指定的父LGN);



l         PNNI:PNNI端口参数配置不正确(信元速率、信元传输延时、比特率);



l         PNNI:PNNI地址、前缀或汇总地址不正确;



l         PNNI:PNNI路由控制信道(SVCC-RCC)未激活;



l         PNNI:交换机端口上的拓朴信息不全或过时;



l         PNNI:到相邻对等组的上行链路未激活或未定义;



l         PNNI:ATM地址错误引起路由选择错误;



l         PVC未建立:VCI无效;



l         路由器或交换机的物理安装有问题(电缆、连接器、插板松动、背板连接不正确);



l         物理层故障(布线、连接器、ATM端口);



l         交换机过载;



l         VPI/VCI连接上的站点数过多;



l         超过了流量合同,信元被丢弃。

zmcsdh2006-3-6 02:47
A.9  故障现象及原因:LAN交换



A.9.1  故障现象:LAN交换机互连的网段之间无连接



原因一:布线差错;



原因二:交换机电源失效;



原因三:交换机硬件故障;



原因四:交换机配置差错:例如,环速率配置差错(令牌环)、10Mbit/s以太网被配置为100Mbit/s以太网、半双工以太网被配置为全双工以太网等;



原因五:交换机的IP地址、子网掩码或默认网关地址不对;



原因六:VLAN配置差错;不能通信的节点位于不同的VLAN中;



原因七:源路由未被激活(令牌环);



原因八:某个FDDI交换端口被配置了重复的FDDI地址;



原因九:某个令牌环交换端口被配置了重复的令牌环地址;



原因十:不能通信的节点的网卡损坏。






A.9.2  故障现象:广播风暴



原因:由于未激活或不支持生成树算法,从而在传输路径上形成回路。






A.9.3  故障现象:吞吐量很低



原因一:网络设计质量低劣;交换端口上的对称带宽上出现了不对称负载;



原因二:交换机端口配置不正确(10Mbit/s以太网被配置为100Mbit/s以太网;半双工以太网被配置为全双工以太网);



原因三:交换机端口损坏产生了大量的差错帧;



原因四:线缆长度超出了规定范围。






A.10  交换式LAN网络中的常见差错



下面以字线顺序列出了交换式LAN网络中的常见差错原因:



l         多个交换机之间的环回引起的广播风暴;生成树算法未激活;



l         交换机硬件损坏;



l         某个FDDI交换机端口重复的FDDI地址;



l         给某个令牌环端口配置了重复的令牌环地址;



l         电缆设施故障;电缆长度超标;



l         网络设计拙劣,对称带宽的交换机端口上出现不对称的流量;



l         交换机安装错误(电缆、连接器或插板松动;背板布线错误);



l         三层交换机设置不正确:IP地址、子网掩 码或默认网关;



l         路由器或网桥上的交换端口运行于路由/桥接模式下;



l         VLAN配置不正确;位于不同VLAN中的站点无法通信;



l         源路由被去活(令牌环);



l         交换机过载;



l         交换机电源系统故障;



l         交换机配置不正确:端口未激活;环速率不正确(令牌环);以太网速率不正确;应为半双工模式却被设为全双工模式(或相反)。

zmcsdh2006-3-6 02:48
A.11  故障现象及原因:ISDN



A.11.1  故障现象:无连接



原因一:布线错误或连接器故障;



原因二:供电系统失效;



原因三:交叉线对(BRI);



原因四:用户号码错误;



原因五:网络组件(如ISDN路由器端口、终端适配PBX、接口卡、电话机等)故障;



原因六:ISDN接口(ISDN卡、路由器端口、PBX)配置错误;



原因七:噪声、高BER;



原因八:TE1分配问题(手工分配与自动分配模式);



原因九:TE1重复;



原因十:Q.931变体(国家ISDN与欧洲ISDN)不兼容;



原因十一:ISDN业务不兼容;



原因十二:Q.931实现错误;



原因十三:S0总线上的布线错误;



原因十四:S0总线上地终端电阻;



原因十五:接地错误(PRI);



原因十六:NT与TE之间缆线未屏蔽(PRI);



原因十七:在多信令链路(北美BRI)中,发送的信令消息的TE1值不正确。






A.11.2  故障现象:经常性的连接丢失



原因一:BER过高;



原因二:终端设备处理速度太慢(对接收准备好或状态查询帧的响应太慢);



原因三:应用进程无响应。






A.11.3  故障现象:ISDN上的应用的响应时间过长



原因一:由于ISDN路由器自动拆除连接(在空闲时间内)导致额外的呼叫建立时间;



原因二:在高负载状态下路由器未激活其它B信道;



原因三:B信道上的应用协议(如IP)的窗口尺寸过小;



原因四:B信道上应用协议的定时器超时;



原因五:应用进程忙;



原因六:由于终端应用设置错误导致速率适配握手进程失败;



原因七:呼叫方/被呼叫方是移动电话;



原因八:呼叫不是端到端的ISDN呼叫。






A.12  ISDN网络中的常见差错



下面以字线顺序给出了ISDN网络中常见的故障源:



l         呼叫转发被激活;无入局呼叫;



l         交叉线对(在BRI中);



l         TE1分配重复;



l         电磁干扰;



l         路由器上的过滤器设置不正确;



l         高误码率;



l         多用户号(MSN)输入错误;



l         路由器或交换机的安装出错:缆线、连接器、插板或卡板松动;背板布线错误;



l         ISDN接口卡损坏;



l         ISDN接口配置不正确(ISDN接口卡、路由器端口、PBX或ISDN电话);



l         ISDN线路被阻塞或服务提供商未开通;



l         ISDN网卡配置不正确(中断、驱动程序或定时器的配置等);



l         ISDN中路由器端口损坏;



l         ISDN服务不兼容;服务不可用(未向ISDN服务提供商申请);



l         ISDN电话损坏;



l         线路折断(在插线或布线时);



l         由于路由器设置的自动连接清除导致了响应时间过长;



l         网卡、墙插或配线柜松动或连接器损坏;



l         未接地(PRI);



l         S0总线未接终端电阻;



l         NT损坏;



l         PBX损坏;



l         供电系统损坏;



l         路由器上的协议配置不正确(地址表、映射表、子网掩码、默认网关、路由表、定时器);



l         Q.931的实现不正确;



l         Q.931变体不兼容(国内ISDN与欧洲ISDN);



l         路由器未激活第二个(或PRI中的第n个)B信道(配置错误);



l         路由器的配置不正确:端口未激活、操作模式错误、协议未激活;



l         终端设备太慢(PR或status Enqulry响应太慢);



l         TE1值分配问题(手工与自动模式);



l         终端适配器损坏;



l         B信道应用协议定时器超时;



l         NT和TE(PRI)间的电缆未屏蔽;



l         B信道上的应用协议(如IP)窗口尺寸太小;



l         呼叫的号码有误。

zmcsdh2006-3-6 02:48
A.13  故障现象及原因:FR



A.13.1  故障现象:无连接



原因一:线缆或连接器损坏;



原因二:路由器或FR交换器的供电系统出现错误;



原因三:路由器FR交换机的配置有误(如线路速率、时钟以及端口的信道化配置有误);



原因四:噪声、高误码率;



原因五:信道内信令(LMI)的版本不兼容;



原因六:被叫号码不正确(对FR SVC而言);



原因七:信号电平过低;



原因八:对等站点或对等网络未被激活或失效。






A.13.2  故障现象:响应时间过长



原因一:CIR太低;



原因二:DLCI配置拙劣;



原因三:通过FR传输的应用协议(如TCP/IP)的窗口尺寸太小;



原因四:由于超时或高误码率导致应用层协议经常性地要求重传;



原因五:最大包尺寸太小;经常出现碎片帧;



原因六:电信运营商没有提供承诺的带宽;误码率太高;



原因七:隐藏的或无意的流量被错误地路由到FR链路上;



原因八:FR网络节点出现拥塞(出现FECN、BECN消息)。






A.14  FR网络中的常见差错



下面以字线顺序列出了FR网络中常见的一些故障原因:



l         接口、墙插或配线柜的布线或连接器损坏或松动;



l         CIR(承诺的信息速率)太低,流量超出了峰值负载;



l         路由器或FR交换机上的配置出错;



l         FR网络节点拥塞(FECN、BECN消息);



l         DCLI配置拙劣;



l         电磁干扰;



l         基本的路由器配置错误(端口未激活、协议未激活、操作模式错误);



l         路由器、网桥或Hub安装错误(电缆、连接器或插板松动;背板连接不正确);



l         由于超时或误码率过高导致应用层协议经常性地重传;



l         FR链路上隐藏的、无意的流量路由错误;



l         信道 内信令(LMI)版本不兼容;



l         最大包尺寸过小;经常性的分段;



l         噪声;高误码率;



l         供电系统损坏(路由器或FR交换机);



l         路由器或FR交换机损坏;



l         电信运营商未提供保证带宽和/或误码率;



l         通过FR传输应用层协议(如IP)时的窗口尺寸太小;



l         呼叫的号码错误(对FR SVC来说)。

zmcsdh2006-3-6 02:49
A.15  故障现象及原因:PDH



A.15.1  故障现象:网络连接丢失



原因一:线缆故障(光纤折断、接头松动等);



原因二:网络组件的电源故障;



原因三:网络组件的模块故障;



原因四:网络组件的配置不正确;



原因五:网络组件中运行的软件有问题;



原因六:静电电流(由技术人员身上的静电或闪电引起);



原因七:焊点故障或短路(由灰尘、潮湿或老化等原因引起)。






A.15.2  故障现象:PDH告警



原因一:网络组件接口的发射功率过低;



原因二:接头不良引起的光反射;



原因三:网络组件过载;



原因四:帧定位丢失;



原因五:高压切换时引起的瞬时电压峰值;



原因六:高误码率;



原因七:接地问题。









A.16  PDH网络中的常见问题
    下面以字母顺序列出一PDH网络中的常见故障原因:



l         网络组件失效;



l         网络组件电源故障;



l         静电电流(闪电、技术人员身上的静电);



l         接地错误;配线箱没接地;



l         网络组件配置有误;



l         焊点故障、短路(由老化、软化、灰尘、油污、潮湿等引起);



l         高误码率;



l         抖动、漂移;



l         线缆折断;



l         高电压切换引起的电压浪潮;



l         接头松动;



l         接头引脚锈蚀;



l         背景噪声;



l         帧同步丢失;



l         PDH接口的输出信号功率/接收灵敏率不足。

zmcsdh2006-3-6 02:49
A.17  故障现象及原因:SDH/SONET



A.17.1  故障现象:无连接



原因一:线缆故障(光缆折断、接头松动等);



原因二:网络组件的电源故障;



原因三:网络组件的模块故障;



原因四:网络组件的配置不正确(如通道路由的配置不正确);



原因五:网络组件中运行的软件有问题;



原因六:静电电流(由技术人员身上的静电或闪电引起);



原因七:焊点故障或短路(由老化、磨损、灰尘或潮湿等原因引起的);



原因八:激光器发射功率降低(由老化、磨损、灰尘或潮湿等原因引起)。






A.17.2  故障现象:SDH/SONET告警



原因一:网络组件接口的发射功率过低;



原因二:接头不良引起的光反射;



原因三:指针抖动;



原因四:网络组件过载;



原因五:指针无效或指针丢失(LOP);



原因六:帧定丢失(LOF);



原因七:高压切换时引起的瞬时电压峰值;



原因八:高误码率;



原因九:接地问题。









A.18  SDH网络中的常见差错



下面以字母顺序给出了SDH/SONET网络中的常见故障原因:



l         高电压切换引起的电压浪涌;



l         接头松动;



l         接头引脚锈蚀;



l         网络组件重载;



l         指针丢失;



l         帧定位丢失;



l         由于网络组件中的激光器老化引起的输出功率不足。

zmcsdh2006-3-6 02:49
A.19  故障现象及原因:X系列和V系列接口



A.19.1  故障现象:无连接



原因一:引脚分配不正确(如用空Modem电缆代替直通Modem电缆);



原因二:电缆损坏(扭绞或被挤压);



原因三:连接器损坏(腐蚀、折断或引脚弯曲);



原因四:电缆太长;



原因五:DTE接口未被激活或损坏;



原因六:DCE掉电;



原因七:DCE未连接到网络上;



原因八:DCE配置有问题(脉冲拨号而不是音频拨号;激活了Modem环路);



原因九:线路忙(其它系统正在发送数据);



原因十:X.21协议差错(C或I信号未设成“ON”);



原因十一:由于状态转移无效,从而引发X.21协议差错(C/T或I/R未在规定时间内完成切换)。






A.19.2  故障现象:吞吐量太低;响应时间过长



原因一:线路质量低劣;



原因二:DTE或DCE之间的电缆太长引起的高BER;



原因三:X.21的DTE-DCE电缆达到临界长度时引发的定时差错(在64kbit/s时临界电缆长度为781m,在2048kbit/s时为24m。);



原因四:由于DTE-DCE连接路径上有电磁干 扰而引起的BER过高。









A.20  X/V系列连接中的常见问题



下面列出了电话网中V系列和X系列DTE-DCE接口(PC串口、Modem)的最常见的故障原因。



电话网中DTE和DCE差错



l         串口Modem连接上的电磁干扰引起高BER;



l         串口和Modem之间电缆过长引起的高BER;



l         串口和Modem之间的电缆故障(折断或弯度过大);



l         连接器故障(腐蚀、折断或引脚弯曲);



l         连接器引脚分配不正确(如空Modem连接电缆和直连Modem电缆);



l         DTE接口(PC串口、路由器端口)未激活或损坏;



l         线路忙(其它系统正在发送数据);



l         Modem与电话线的连接中断;



l         Modem配置不正确(应为脉冲拨号的被设为音频拨号;电话号码拨错了);



l         Modem被锁定:在多次拨号均失败的情况下激活了Modem的重拨锁定(无载波、波特率不正确、目的系统忙);



l         Modem未连在网上;



l         Modem未接电源;



l         只能通过PABX拨打外线(未加外线接入号时无载波);



l         线路质量差。



电路交换数据网(X.20和X.21)中的DTE、DCE差错:



l         DTE-DCE电缆受电磁干扰引起的高BER;



l         DTE-DCE电缆过长引起的高BER;



l         DTE-DCE电缆处于临界长度(X.21),从而引起定时问题(64Kbit/s时的临界长度为781m,2048Kbit/s时为24m);



l         电缆损坏(折断或穿孔);



l         连接器损坏(腐蚀、折断或引脚弯曲);



l         连接器引脚分配不正确(将空Modem电缆当作直通Modem电缆使用);



l         DCE未连到网上;



l         DCE未接电源;



l         DTE接口未激活或损坏;



l         线路忙(其他系统正在发送数据);



l         无意间激活了Modem环路(如被清洁工误操作);



l         测试结束后未击活Modem环境;



l         X.21协议差错(C或I信号);



l         线路质量差。

zmcsdh2006-3-6 02:50
A.21  故障现象及原因:IP



A.21.1  故障现象:在故障主机上ping环回地址(127.0.0.1)失败



原因一:TCP/IP驱动程序出错或网卡软件未正确安装;



原因二:网络接口损坏。






A.21.2  故障现象:从同一子网的其它主机到故障主机的ping测试失败



原因一:故障主机未连到网上;



原因二:故障主机的网卡配置不正确;



原因三:故障主机的IP地址或子网掩码不正确。






A.21.3  从故障主机到同一子网其它主机的ping 测试失败



原因一:故障主机并未连到网上;



原因二:目的主机未被激活;



原因三:ping命令中的IP地址不正确。






A.21.4  故障现象:从故障主机到默认路由器的ping测试失败



原因一:故障主机未连在网上;



原因二:故障主机的IP地址或子网掩码不对;



原因三:ping命令中的IP地址不正确;



原因四:默认路由器的配置不正确;



原因五:路由器的端口未激活;



原因六:DHCP问题。DHCP服务器被用来管理固定的IP地址(即某个IP地址被固定分配给某个MAC地址的主机),并且站点已移动到其它网段,但DHCP服务器仍将以前的IP地址分配给该站点(该IP地址在新的子网中无效)。






A.21.5  故障现象:从故障主机到其它子网主机的ping测试失败



原因一:路由器上的默认网关配置不正确;



原因二:路由器上未配置默认网关;



原因三:远端主机未激活;



原因四:到目的主机的路由器端口未激活;



原因五:路由器上的访问列表不全,未反映路由的更新;



原因六:路由器激活了错误的过滤器。






A.21.6  故障现象:用名字ping故障主机失败



原因一:故障主机未连在网上;



原因二:故障机上主机名到IP地址的映射不正确;



原因三:DNS服务器的IP地址配置不正确;



原因四:DNS服务器未激活;



原因五:发送ping命令的主机中的主机名到IP地址的映射不正确。






A.21.7  故障现象:用名字从故障主机到同一个子网中的其他主机的ping测试失败



原因一:ping命令中输入的主机/域名不正确;



原因二:远端主机未激活;



原因三:故障主机上配置的DNS服务器的IP地址错误;



原因四:DNS服务器未激活;



原因五:故障主机上有关目的主机的主机名到IP地址的映射不正确。






A.21.8  故障现象:用名字从故障主机到其他子网中的主机的ping测试失败



原因一:ping命令中输入的主机名不正确;



原因二:远端主机未激活;



原因三:故障主机上配置的DNS服务器的IP地址错误;



原因四:DNS服务器未激活;



原因五:故障主机上有关远端主机的主机名到IP地址的映射不正确。



原因六:路由表中默认路由器的IP地址不正确。






A.21.9  故障现象:间歇性的网络连接丢失



原因一:目的主机或目的网络过载;



原因二:IP地址重复:其他站点正在使用与目的主机相同的IP地址;



原因三:连接超时(例如,由风桥或路由器故障引起的TCP连接超时);



原因四:混合使用动态(基于DHCP机制)和静态IP地址。






A.21.10  故障现象:IP连接正常,但应用程序不可用



原因一:路由器上配置的访问列表阻塞了应用程序的端口;



原因二:应用程序未启动。






A.21.11  故障现象:无盘工作站无法启动



原因一:路由器阻塞了UDP广播包的转发:BOOTP广播包传送不出去;



原因二:路由器上的过滤器设置不正确,阻塞了BOOTP包。






A.21.12  故障现象:TCP/IP的性能普遍低劣



原因一:DNS客户的DNS配置拙劣:客户需要一直等到第一个DNS请求超时之后才能尝试第二个DNS服务器;



原因二:DNS服务器未配置反向查找功能,不能处理反向查找请求;



原因三:DNS表不全,没有包含所有主机的IP地址与名字的映射关系;



原因四:本地选路。交换机连在一台路由器下,为了将数据包传输到连接在同一具交换机下的其他网段,需要首先被交换机交换到路由器上,在路由器选路后再经交换机传送到目的网段,因而该数据包需要经过两次交换机的交换之后才能传输到其他网段,并且还占用了路由器有限的缓存和CPU资源。



原因五:TCP连接所经过的网络处于过载状态。






A.21.13  故障现象:TCP重传的次数过多



原因一:交换机或路由器过载致使TCP包或确认包丢失;



原因二:数据包在传输过程中损坏(CRC出错);



原因三:TCP包损坏(TCP校验和出错);



原因四:分段后的TCP包的某个分段丢失或损坏;



原因五:接收端缓存溢出;



原因六:接收端对TCP包序列的确认速度太慢,致使发送端超时重发。






A.21.14  故障现象:TCP窗口尺寸太小



原因一:用户更改了IP的默认MTU大小;



原因二:IP的MTU和接收TCP缓存的大小被某些应用程序更改了。






A.21.15  故障现象:TCP窗口尺寸掉到最大值以下



原因:应用程序接收数据的速度跟不上TCP的发送速度,最可能的原因就是服务器或客户的性能问题(但是,如果出现这种问题的站点是打印机,则属于正常现象)。






A.21.16  故障现象:TCP窗口尺寸不变,但确认包的速度太慢



原因一:网络、路由器或交换机过载;



原因二:拨号连接或WAN连接过载。






A.21.17  故障现象:TCP窗口尺寸太大



原因:一般情况下,TCP窗口尺寸太大与接口内存过小及硬盘速度较慢结合在一起,可能会引发性能问题,导致通信中断,直至存储了TCP报文段(如大于64kbyte的TCP报文段)之后才能恢复数据传输过程。






A.21.18  故障现象:OSPF路由问题



原因一:不同网络中的Hello定时器和Dead定时器不一致;



原因二:路由器的过滤器设置不正确;



原因三:路由器与主机的子网掩码不正确。









A.22  IP网络中的常见差错



下面以字母顺序列出了TCP/IP网络中的常见故障原因:



l         应用程序未激活;



l         目的主机未激活;



l         DNS服务器未激活;



l         DNS服务器未配置反向查找,因而无法处理反向查找请求;



l         DNS表不全,未包含所有主机的IP地址与域名的映射关系;



l         IP地址重复:有其他站点正在使用与目的主机相同的IP地址;



l         网络接口损坏;



l         故障主机的主机名或IP地址配置问题;



l         路由器端口未激活;



l         Ping命令中的目的IP地址不正确;



l         故障主机上的IP地址或子网掩码不正确;



l         路由器的过滤器被错误激活;



l         由于从错误的接口或协议中检索路由信息,致使路由表出错;



l         终端设置不正确;



l         用户ID或密码不正确;



l         路由器上配置的默认网关不正确;



l         接口卡配置不正确;



l         不正确的路由器过滤器设置阻塞了BOOTP帧;



l         虚链路配置不正确;



l         路由表中默认路由的IP地址不正确;



l         故障主机上的DNS服务器的IP地址配置不正确;



l         故障主机的IP地址或子网掩码不正确;



l         路由器上未配置默认网关;



l         路由器端口未分配IP地址(OSPF将IP地址用作ID);



l         目的网络或目的主机过载;



l         DNS客户配置拙劣:客户在第一个DNS请求超时后才尝试第二个DNS服务器;



l         故障主机未连到网上;



l         无法通过网络访问远程主机;



l         OSPF中错误地配置了IGRP和RIP路由分发;



l         路由器阻塞了UDP广播的转发:无法传输BOOTP广播;



l         到目的子网的路由器端口未激活;



l         路由器和主机的子网掩码不匹配;



l         TCP连接超时(如网桥或路由器问题);



l         TCP/IP软件或接口卡驱动程序安装有问题;



l         网络中不同路由器的Hello定时器、Dead定时器不一致;



l         发送ping命令的主机的主机表中包含的故障主机的表项不正确(主机名与IP地址的映射不正确);



l         故障主机的主机表中包含的有关发送ping命令的主机的表项不正确(主机名与IP地址的映射不正确);



l         路由器的访问列表不全:未反映路由的更新;



l         路由器的访问列表被配置为阻塞应用程序端口。

zmcsdh2006-3-6 02:50
A.23  故障现象及原因:网络服务与应用



A.23.1  故障现象:应用进程循环



原因一:应用软件有缺陷;



原因二:服务器的总线性能不高;



原因三:网卡的内存分配有问题;



原因四:网卡的驱动程序差错。






A.23.2  故障现象:应用程序运行缓慢



原因一:网络拥塞;



原因二:服务器过载;



原因三:应用程序正在执行小而递增的文件读操作;



原因四:应用程序执行覆盖式的读操作(如每次读命令读到20%或30%、甚至快读到100%时又重新进行读操作);



原因五:应用程序执行覆盖式的写操作。






A.23.3  故障现象:连接超时



原因一:系统过载(服务器/客户的内存、CPU超负荷运行);



原因二:网络过载(交换机或路由器丢包)。









A.24  故障现象及原因:FTP与Telnet



A.24.1   故障现象:没有到FTP、Telnet服务器的连接



原因一:用户名不正确(输入错误、键盘驱动程序不对或键盘布局问题(美国/非美国键盘布局));



原因二:密码错误(输入错误、键盘驱动程序不对或键盘布局问题(美国/非美国键盘布局));



原因三:用户名、密码已改变;



原因四:用户帐号不存在或不允许登录;



原因五:用户帐号已被删除;



原因六:IP地址错误;



原因七:TCP/IP驱动程序配置错误;



原因八:域名服务器的配置不对或未起作用(可以试着用IP地址访问主机);



原因九:防火墙阻塞了FTP和Telnet等应用;



原因十:通过防火墙访问FTP、Telnet等网络应用时客户端的设置有问题(未配置代理服务器或FTP代理服务器的配置不正确);



原因十一:FTP或Telnet服务器宕机(是否响应ping);



原因十二:没有到FTP或Telnet服务器所在网段的可用路由(用traceroute 检查一下服务器的路由情况)。






A.24.2  故障现象:FTP/Telnet连接超时



原因一:系统过载(服务器或客户端的内存、CPU超负荷运行);



原因二:网络过载(交换机或路由器正在丢包)。









A.25  故障现象及原因:电子邮件



A.25.1  故障现象:发送和接收邮件问题



原因一:没有到邮件服务器的TCP连接;



原因二:邮件服务器宕机;



原因三:邮件服务器虽然已运行,但没有监听25号TCP端口;



原因四:服务器软件设置不正确;



原因五:邮件客户程序的配置不正确;



原因六:代理服务器的端口号不是25。






A.25.2   故障现象:邮件交换很慢



原因一:邮件的附件太大;



原因二:通过X.400网关进行通信;



原因三:到邮件服务器的连接速度太慢;



原因四:代理服务器的性能较差。



(全完)累死啦,休息一下!

bdwzf2006-3-12 12:17
学习

辛苦了,学习学习!


查看完整版本: [精华]网络故障排除参考大全


Powered by Discuz! Archiver 4.1.0  © 2001-2006 Comsenz Inc.
Processed in 0.009679 second(s), 2 queries
 



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=778160


[点击此处收藏本文]  发表于2006年03月21日 3:06 AM




正在读取评论……
大名
网址
验证码
评论 

Blog统计

文章

收藏

相册

友情联接

存档