一、Cisco 7609 与H3C之间的LSU重传导致OSPF邻居抖动
01故障现象
XX分行发现自xx月xx日上线以来,一直随机性的发生7609与下联的多个H3C路由器OSPF邻居down的日志。
02分析过程
7609路由器和H3C路由器之间的OSPF邻居down问题,是由于两家设备ATM互联接口MTU值不匹配造成,7609接口MTU为WAN接口默认的4470bytes,而H3C接口MTU为1500字节,7609发送超过1500字节的LSU在H3C侧无法接收,重传24次没有得到对端邻居确认后,导致OSPF邻居关系down。排查此类问题时,建议采用以下步骤进行故障排查及信息的收集:
show logShow inter x/x
Show ip ospf nei
Show ip ospf nei detail
Show ip ospf retransmission-list。
03故障原因
由于两家设备ATM互联接口MTU值不匹配造成,7609接口MTU为WAN接口默认的4470 bytes,而H3C接口MTU为1500字节。
04解决方案
对所有7609下联设备的ATM接口MTU进行检查,如发现不匹配的情况,更改至和7609 MTU相同的4470。
05处理结果
修改接口MTU后正常。类似OSPF的这种问题,在EIGRP中也有可能发生,当路由数量足够多的时候,路由更新报文大小会达到接口MTU,如果两端MTU不匹配,就会发生报文被丢弃引起路由计算问题甚至邻居关系中断。RIP由于协议规定最大更新报文为512字节,不会有类似问题发生。
二、Cisco 7609 上线过程中发现的Qos限速策略问题
01故障现象
XX分行两台7609进行上联变更操作,7609下行GE接口需要配置限速Qos策略,针对某些应用类别进行限速,对到总行的流量是没有配置限速的。现场发现当在GE口应用Qos策略后,分行下行设备到总行的业务受到影响,ping总行地址有丢包发生。
02分析过程
通过分析,问题的原因和限速class在policy-map中的配置顺序相关,当配置在policy-map的中间位置时,ACL中deny 11.0.0.0/8网段的流量会match到限速队列中,造成丢包的现象,而且问题发生在SIP400板卡上,当使用PFC base的Qos时,没有问题。
03故障原因
命中bug:CSCta41186,当在SIP400板卡上应用policy策略时,如果有过多deny项(包括ACL中的deny项和class not match)时,可能存在deny条目工作不正常的问题。
04解决方案
将限速class配在policy-map的最后位置,并且进行严格测试,验证没有问题后,再进行变更。12.2(33)SRD4,12.2(33)SRE及后续版本修正此bug。
05处理结果
更改配置后,问题解决。
三、Cisco 7609 esp nat 问题
01故障现象
C7609设备,为IPSec流量配置静态NAT地址转换,发现配置后IKE流量可以被正常转换并转发,ESP流量无法完成NAT地址转换。C7609版本12.2.SRB。
02分析过程
经分析,C7609上对于IPsecNAT地址转换存在BUG:CSCek10384 (此bug定义的是其他平台的bug,76中同样存在此问题),当使用静态NAT时会导致IPsec的ESP流量无法被转换,引起问题发生。
03故障原因
软件BUG引发。
04解决方案将静态NAT配置更改为如下配置:ip nat inside source static 15.30.6.13610.50.69.1------------original configto:ip nat inside source static 15.30.6.136interface Loopback1ip nat inside source static esp 15.30.6.136 interfaceLoopback1此BUG将会在新的SRD和SRE train中fix。05处理结果
更改配置后,问题解决。排查此类问题时,建议采用以下步骤进行故障排查及信息的收集进行分析:
Show ip nat trans
Show techsh ip nat tr ver