[导读]
安捷伦两把利剑, 别把网络工程师带到故障面前,要把网络故障带到网络工程师面前!
首先,你的网络维护是否还只是停留在对网线的测试上呢?如果这样的话,你对你的网络健康状况是否做到心中有数了?
网络管理、维护工具主要可以分为两大类:网络管理系统和网络测试仪表。
网络管理系统的构成包括:网管工作站(运行各种网络管理软件)和分布在不同网络设备中的网管代理(Agent)或硬件探头(Probe)。Probe是RMON标准中的专业名词,它是一种硬件采集设备,对网络流量进行采集、统计,然后通过SNMP将数据传送给网管工作站进行进一步处理、显示。
网络测试仪表按照OSI协议层来分类,可分为物理层的测试仪表(如电缆测试仪WS PRO、误码测试仪、OTDR光时域反射仪等)和协议分析仪(用于解决2-7层网络协议问题)。而协议分析仪又可分为基于硬件的协议分析仪和基于软件的协议分析仪。基于硬件的协议分析仪是指采用专门的硬件设计(如:专用CPU、FPGA芯片、高速捕捉缓冲区)来完成对网络数据包的捕捉和实时协议分析;基于软件的协议分析仪一般由普通的PC机、网卡和协议分析软件构成,它利用PC机的RAM来捕捉数据包,用PC机的CPU来进行网络协议分析。
如下图所示,可以看出不同的工具在OSI网络协议层次管理和维护中的定位和所起的作用。
网络管理、维护工具比较
由于目前市场上有众多的网络管理、维护工具,每种工具都有各自的产品定位和侧重点,并且有些工具在功能上也存在一定的重复性,这在一方面给网络管理、维护人员提供了更多灵活的选择空间,在另一方面,也给他们确定何种产品更适合自己的应用和需要带来一定的难度。
网络管理维护工具 |
功能侧重点 |
优点和局限性 |
主要应用领域 |
网络节点管理系统 |
对分布在不同地理位置的网络设备进行集中式的参数配置管理; 监视网络的拓扑结构和设备运行状态; 对网络节点进行故障和性能管理。 |
优点:具有较全面的网络节点和主机系统的管理功能,并具有完善的事件处理和告警功能。 局限性: 缺乏对网络流量的分析能力; 会产生一定的网管流量负荷。 |
适合于对中、大型网络的集中式网络设备管理和监控。 属于网络管理的基本系统,一般在网管项目的初期便可实施。 |
基于RMON的分布式流量监测系统 |
进行分布式的长时期数据采集和流量监测; 对网络链路进行性能分析、确定网络瓶颈; 确定网络趋势,对网络容量规划提供参考依据。 |
优点:可进行分布式的流量监测,分析流量分布和发展趋势。 局限性: 会产生较高的网管流量负荷; 缺乏对交换式以太网的全面监测手段; 网络故障分析功能较弱; 对大型网络的监测,需要很大的投资。 |
适合于对中、大型网络进行集中式网络性能监测和预防性网络维护; 属于较高级的网络管理系统,且投资较大,一般在网管项目的高级阶段实施。 |
基于硬件的协议分析仪 |
进行实时的协议过滤、统计和解码; 100%数据捕捉; 实时的专家系统分析(支持OSI 2-7层); 完善的链路层故障测试功能和部分物理层测试功能。 |
优点: 便携性好,一台仪表可以灵活地分时测试不同地理位置的网络故障; 能进行准确的网络故障检测和定位; 具有一定的物理层测试功能。 局限性: 同软件协议分析仪相比,价格较高; 单台仪表只能对1-2个网段进行同时测试。 |
适合于对中、大型网络进行网络安装和响应式的网络故障维护; 属于数据通信网络安装、维护的必备工具,尤其当采用了先进的宽带网络技术(如ATM、帧中继和快速以太网)时,它更为适用。 |
基于软件的协议分析仪 |
用软件实现协议过滤和解码(一般为后分析方式); 具有一定的统计功能; 后分析方式的专家系统。 |
优点: 价格便宜。 局限性:无法100%数据捕捉; 非常局限的数据链路层错误事件报告能力。 |
适合于对小型网络进行初步性的网络协议故障检测; 一般只适用于对局域网的维护。 |
电缆测试仪,光时域反射计,误码测试仪 |
进行线缆、光纤的物理层指标、通断情况测试; 对广域网链路的质量和可靠性进行测试。 |
优点:便携性好,价格较便宜。 局限性:只适合于对物理层的网络问题进行诊断和维护。 |
适合于各种网络的线路安装、维护使用。 |
网络的故障定位和排除方案
对局域网的维护
局域网是应用最普及、使用范围最广的数据组网方式,这一部分针对运用最广泛的以太网的维护和故障排除,列出一些常见故障现象和相应的处理方法。
局域网中的常见故障
常见碰撞故障
A. 本地碰撞(Local Collsion)
在同轴线的网中(10Base2和10Base5),信号沿电缆传输直至碰到来自另一个节点的信号。这时波形会叠盖在一起。部分信号会相互抵消(减弱),而部分信号会相互迭加(加强)。而加强的信号部分的电压值会超过所允许的最高电平。这种过压的现象会被本网段的所有节点所观测到,称之为局部碰撞。
B. 远端碰撞
如果碰撞发生在中继器的另一端,过压的现象在中继器的这一端就不会发现。在中继器这一侧所发现的是不完整的信息帧。这个缩短的信息帧的FCS将会报告有问题并且不会满足64个字节的帧最小要求。事实上,通常是帧短的几乎整个帧首都看不见(含目的和源地址)。而且还会有“阻塞”的字符出现在缩短了的帧的最后4个8位(一组8个二进制位,有时不严格的称为字节)。
这种帧首缩的帧称为远端碰撞。其关键的特征是不存在过压现象,帧的长度小于72个字节并且FCS是无效的。
因为10BaseT的集线器基本上是一个多口的中继器而且每个站点就象一个局部网段,所以在10BaseT中的碰撞几乎全是远端碰撞。
C. 延迟碰撞
当碰撞发生在帧的前同步信号和前64个字节之后,而且是局部碰撞的现象时(有过压或同时发送和接收),也就是和局部碰撞一样只是发生的较晚一些,这种碰撞称延迟碰撞。一般它只在同轴线的网络(在10BaseT网中,监测站必须同时发送才能看见延迟碰撞)。延迟碰撞的通常原因是网卡故障或网络电缆太长。所谓电缆过长的网络是指信号从一端传送另一端的时间超过了最小的合法帧的大小。
D. 延迟的远端碰撞
发生在中继器另外一侧的延迟碰撞就是延迟的远端碰撞。因为中继器将阻止过压传至另一侧,所以只是将本网段的局部碰撞报告给另一侧。延迟的远端碰撞也可以通过分析出现阻塞信号的破损帧的最后几个字节来推断出来。典型的这种类型的碰撞可以在本网段用检查坏的FCS来查出。
常见链路层错误故障
(1)帧检测序列-FCS
一个帧中的FCS错误也称为CRC错误。一般帧首的信息是正确的(如地址等),但接收站累计出的累加和与帧尾的FCS不相符。单一站的FCS数目过大常表明网卡有问题或软件驱动有问题,如果FCS的错误与多个站点相关则可能是电缆故障,网卡驱动故障,集线器接口故障或噪声的影响。
(2)短帧-Short Frame
一个帧比有效的最短帧(72字节)还小而FCS是正常的则为短帧。某些网络协议分析仪和网络监测仪称之为帧不全(Runts),但这不准确。一般来说你看不见短帧。虽然他们的出现不一定会造成网络故障。短帧的最可能原因就是网卡故障,设置错误或网卡驱动文件损坏。
(3)碎片帧-Runts
当发生碰撞时,设备会停止发送没有发完的帧,这种不完整的帧叫碎片帧。这可以是任何长度短于法定帧长的帧,它包括了局部,远端或前端碰撞,也可以是FCS是好的或坏的短帧。
(4)帧过长-Jabber
帧过长在802.3标准中定义为比标准的最大长度(1518 Bytes)还要长的帧,但没有说明其FCS是好还是坏。所以一般很难发现帧过长。造成帧过长的可能原因有坏的网卡,网卡中的驱动文件损坏,电缆故障或接地问题等。
(5)长帧-Long Frame
比标准最长(1518 Bytes)还长的帧,但FCS是有效的帧称为长帧。其可能的原因是软件设置有问题或网卡驱动文件损坏。
(6)定位错误-Alignment Error
是指不能被8整除的帧,FCS也是错误的。通常是由于软件驱动有错误或网络碰撞造成的。
声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们。
千家智客微信公众号
扫描下方二维码,关注千家智客微信公众号(qianjiacom),随时随地知晓智能行业天下事!