交换机接口故障排查与修复

(整期优先)网络出版时间:2023-08-11
/ 2

交换机接口故障排查与修复

侯雪松

中国铁路呼和浩特局集团有限公司呼和通信段 

内蒙古自治区乌兰察布市   012000

摘要:在网络运维中,常需检查交换机端口,这些端口包含大量数据信息,仔细观察和分析这些数据信息,有助于解决网络故障。

关键词:交换机;接口故障;原因;对策

网络运维虽然看似简单,但其实包含了很多内容,这就需运维人员学习更多的理论知识,打下坚实理论基础。此外,具有逻辑推理及分析判断能力,能通过故障现象分析其原因,能通过表象看到事物本质。而且还要具备解决问题的方法及应急能力,通过平常学习及经验积累,能快速找到问题解决方案,在短时间内排出故障,防止长时间延迟,降低用户体验。

一、交换机概述

交换机是一种网络设备,通常用于将计算机、服务器、路由器等设备连接起来,并在它们之间进行数据交换和转发。其是现代计算机网络中的重要组成部分,能提高网络效率及安全性。

交换机的工作原理是将数据包转发到目标设备,而不是广播到整个网络。这种转发方式称为单播,它能提高网络性能和带宽利用率。在交换机中,每个端口都有一个唯一的MAC地址,这个地址用于标识连接到该端口的设备。当数据包到达交换机时,交换机会查找目标设备的MAC地址,并将数据包转发到相应的端口,从而实现数据的传输。

交换机可分为两种类型:传统、智能交换机。其中,传统交换机通常只能进行基本的数据转发和过滤,而智能交换机则能进行更多高级功能,如VLAN划分、流量控制、QoS管理等。智能交换机通常具有更高性能及更多功能,但也更加昂贵。

此外,因交换机有带宽很高的内部交换矩阵和背部总线,并且这个背部总线上挂接了所有端口,通过内部交换矩阵,能把数据包直接迅速传送到目的节点而非所有节点,不会浪费网络资源,产生较高效率。同时在此过程中,数据传输安全程度高,更是受到使用者欢迎及普遍好评。

交换机数据带宽具有独享性,在这种前提下,在同一时间段内,交换机能将数据传输到多个节点间,并且每个节点都可当做独立网段而独自享有固定的部分带宽,则无与其他设备竞争实用的必要。交换机主要功能包括物理编址、网络拓扑结构、错误校验、帧序列及流控。还具备一些新的功能,如对VLAN(虚拟局域网)的支持、对链路汇聚的支持,甚至有的还具有防火墙功能。

交换机交换方式包括:①直通式:以太网交换机可理解为在各端口间是纵横交叉的线路矩阵电话交换机,在输入端口检测到一个数据包时,检查该包的包头,获取包的目的地址,启动内部的动态查找表转换成相应的输出端口,在输入输出交叉处接通,把数据包直通到相应端口,实现交换功能。无需存储,延迟小、交换快,但因数据包内容并未被以太网交换机保存下来,所以无法检查所传送数据包是否有误,不能提供错误检测能力。由于无缓存,不能将具有不同速率的输入输出端口直接接通,易丢包。②存储转发:其是计算机网络领域应用最广泛方式,将输入端口数据包存储起来,然后检查CRC(循环冗余码校验),在对错误包处理后才取出数据包目的地址,通过查找表转换成输出端口送出包。正因如此,存储转发方式在数据处理时延时大,但能对进入交换机的数据包进行错误检测,有效改善网络性能。尤其能支持不同速度端口间转换,保持高低速端口间协同工作。③碎片隔离:这是介于前两者间的一种解决方案,检查数据包的长度是否够64个字节,若小于64字节,说明是假包,则丢弃该包;若大于64字节,则发送该包,这种方式也不提供数据校验,数据处理速度比存储转发方式快,但比直通式慢。

二、交换机故障处理方法

交换机的故障多种多样,不同故障会有不同表现形式,故障分析目的是通过分析故障现象,找出故障原因和确定故障地点,以排除故障。

1、排除法。当面对故障现象并分析问题时,无意中就已学会使用排除法来确定发生故障的方向。这种方法是指依据所观察到的故障现象,尽可能全面地列举出所有可能发生的故障,然后逐个分析、排除。在排除时遵循由简到繁的原则,提高效率。这种方法能应付各种故障,但维护人员需有较强逻辑思维,而且对交换机知识有全面深入了解。

2、对比法。其是利用现有及相同型号的本系统正常运行的设备或他局正常的设备作为参考对象,对比故障设备和正常设备之间的区别,找出故障所在。这种方法简单有效,只要简单地对比一下就能找出故障的原因。

3、替换法。该法是指使用正常的交换机部件来替换可能有故障的部件,从而找出故障点的方法。主要用于硬件故障的诊断,但需注意的是,替换的部件必须是相同品牌、相同型号的同类交换机。

三、交换机接口故障原因

用户无法访问目标终端原因是交换机端口发生假死现象,这是由于交换机在接口fa0/22口上接收到BPDU包造成。系统配置启用了BPDU防护功能,因此一旦接口接收到BPDU包,它将处于err-disabled假死状态,导致用户无法访问目标终端。

此外,交换机启用生成树STP后,端口通常会经历从禁用到转发的五种状态:disable、blocking、listening、learning、forwarding。从一种状态过渡到下一种状态需要时间,因此从终端连接到互联网需经过三个阶段:经历阻塞-侦听、侦听-学习、学习-转发。所需的默认时间为50s,若设置了portfast,它将绕过监听、学习状态,直接从阻塞转化为转发,这能减少网络连接时间。

同时,为防止重新连接接口下端的交换机可能导致的环路,系统还配置了spanning-tree portfast default、spanning-tree portfast bpduguard default命令。配置完成后,网络已正常运行一段时间,然而,在后期阶段,由于目标位置的终端数量增加,级联在交换机的fa0/22口下方的一台小交换机接收到BPDU包,这导致端口假死,造成用户不能访问目标终端。

四、交换机接口故障解决对策

在了解故障现象并分析其原因后,则有解决问题的思路。

方法1:将交换机插拔电源,进行硬重启,消除交换机的err-disabled假死状态,并将端口恢复到正常转发状态。

方法2:使用如下命令。

config t

errdisable recovery cause bpduguard

这种命令虽然能使端口正常恢复,但耗时长,默认需5min。

方法3:可通过以下命令缩短恢复时间。

config t

errdisable recovery cause bpduguard

errdisable recovery interval 30

或errdisable recovery cause all

errdisable recovery interval 30

以上做法只能将端口恢复到正常转发状态,而且仅仅是治标,不能从根本上解决故障,端口可能会再次进入err-disabled假死状态。还可采用以下方法。

方法4:

Config t

no spanning-tree portfast bpduguard

default

或Config t

no spanning-tree portfast bpduguard

default

Interface fa0/22

No spanning-tree portfast

exit

方法5:在全局配置no spanning-tree portfast bpduguard default禁用BPDU防护功能后,参照FA0/22口的配置重新设置一个新端口fa0/20,并将目标网络线缆接入fa0/20端口。

考文献:

[1]卢立云.交换机接口故障排查与修复[J].网络安全和信息化,2022(06).