首页_恒达注册_恒达娱乐_登陆平台
首页_恒达注册_恒达娱乐_登陆平台
全站搜索
 
 
新闻详情
 
当前位置
交换机运行维护与故障排查
作者:管理员    发布于:2022-09-03 09:29    文字:【】【】【
       

  交换机运行维护与故障排查?前言 本文针对 RG-S5760 系列交换机产品, 介绍如何进行运行维护、 自 检、 产品故障的定位与排除,供客支工程师在实际工作中参考。 内容简介 编号 章节名 内容简介 1 运行维护及自检 介绍产品日常维护与自检的方法、输出信息解释、 产 品出现紧急故障时所采用的恢复方法。 2 基本功能维护 针对基本故障,介绍故障的处理逻辑、方法以及案例。 3 硬件转发功能维护 这部分主要是对交换机的硬件转发原理, 以及部分 底层命令信息收集的指导, 以及在判断软件问题时常需要收集的信息。 4 协议功能维护 例。 阅读 在阅读本文档之前,希望您能够基本了解该产品所涉及的技术原 针对功能模块故障,介绍故障的处理逻辑、方法以及案

  理。参考文档如下: RG-S5760 系列交换机用户手册 锐捷交换机软件版本升级操作指导 1 运行维护及自检 1.1 产品状态自检 1.1.1 产品自 检一览表 硬件诊断项目及命令

  诊断项目及命令 说明 设备指示灯 观察所有的系统运行灯及模块灯的运行状况, status 状态灯 常亮,插入模块的模块指示灯常亮, 具体信息请参考《安全 智 能 万 兆 多 层 交 换 机 交 换 机 RG-S5760 硬 件 说 明 书 V 1.0.pdf 》 。 Show device 查看模块运行状况, 由于 S5760 不支持扩展模块, 从设备 列表中是否正常连接其他设备。 风扇电源状态 由于 S5760 暂不提供 show 命令, 通过指示灯以及外观检 查 系统状态诊断项目及命令 诊断项目及命令 说明 show cpu 查看 CPU 利用率, RGOS10.x 以后提供对功能模块的 CPU 占 用信息的详细描述。 Show cpu-protect 【】 查看设备 CPP 保护的阀值以及协议报文送 CPU 的 队列优先级, 对于硬件的丢弃送 CPU 的报文速率暂时无法显 示。 Show memory 内存利用率, RGOS 10.X 平台提供对功能模块的 Memory 暂用信息详细描述, Memory 占用见各功能模块介绍部分。 Show logging 查看日志信息, 正常情况下无严重出错日志记录, 查看有 无端口 频繁震荡等情况。 Show mac-address-table 查看交换机 MAC 地址表, 观察交换机学习 MAC 地址的情况, 默认情况下 MAC 的老化时间为 300s 。

  Show arp 查看交换机的 ARP 地址表, 观察交换机学习 ARP 地址的情 况, 重点关注 ARP 地址的老化时间。 Show clock 查看系统的日期和时间信息。如果发现系统时间有误,可及时 调整。 Show running 显示交换机当前生效的配置参数。 当用户完成一组配置之 后, 如果需要验证配置是否正确,则可以执行 show running 命令查 看当前生效的参数。对于某些正在生效的配置参数, 如果与缺省工作 参数相同,则不显示。对于某些参数,虽然用户已经配置,但如果这 些参数对应的功能没有生效,则不显示。 Show version 显示系统的版本信息。 用户可以通过该命令查看软件的版本 信息、 发布时间、 交换机的基本硬件配置、设备运行时间等信息。 接口状态诊断项目及命令 断项目及命令 show interface 说明 1 、 以太网端口是否协商出了半双工?端口默认为自 协

  商,如果此时协商出的结果为半双工,很可能两端配置不一致, 是否 存在一端强制一端协商的情况,将两端配置成一致。 如果厂商兼容问 题需深入排查解决。 2 、端口是否有大量的错误报文,包括收和发,是否迅速增加 线路,中间连接的光电转换器;检查两端配置是否一致? 3 、光电复用接口是否 up 4 、端口流量信息,观察是否有广播报文环路等状况。 Show vlan 互联 Trunk 端口的两端设备允许通过的 VLAN 配置为一致,

  OK, upload file successfully! 2. 将下载的配置文件删除密码字段部分, 回到主菜单文件操作项, 删除 配置文件 config.text 。 3. 加载主程序,启动交换机配置文件,系统恢复为无配置状况,再将配置 文件重新粘贴添加。 1.2.2 版本升级及回退 相关内容请参考《锐捷交换机 RGNOS 10.2 版本升级操作指导》 。 1.3 故障处理基本逻辑 1.3.1 流程图

  流程简介 S5760 系列交换机产品问题,通常可以遵循上述流程进行故障定位。 硬件问题 分为设备本身、互联设备的问题和线路连接问题。 开机无法通过自检; 设备接口损害或者雷击烧毁; 输出或警示灯长亮; 此类故障排查可参考《安装手册》 。对于比较明显的硬件故障可以直接 定位, 对于确认的高端产品硬件故障按照硬件故障处 理流程处理, 有些硬件故障无法直接定位在配置和软件排查过程中可能深 入分析后才能确认。 配置 / 环境 / 已知问题 首先查询交换机现有版本的 release 及《锐捷交换机预警通告》 , 《锐捷交换 机 FAQ 》 , 通过结合网络环境以及配置分析, 确认是否为现有版本 上已知的 BUG 或功能限制,并同 TAC 确认解决方式。 排除上述问题的可能性后, 则对配置功能进行深入分析, 针对某功能的 特性、 设备兼容等专项故障维护, 参见后续故障排查章节。 软件问题 如配置正确,现场工程师经过多方排查(参见后续故障排查章节) ,仍无法 解决问题,提供充分必要的数据分析信息, 在服务事件管理系统提交 CASE ,请 TAC 工程师协助处理。 1.4 网络联通性 1.4.1 Ping

  网关,主要用于检查网络连接是否可达,以及辅助分析网络在何处发 生了故障。 Traceroute 命令的执行过程: 首先发送一个 TTL 为 1 的数据包, 因此 第一跳发送回一个 ICMP TTL-expired 超时报文以指明此数据包不能 被发送(因为 TTL 超时) , 之后此数据包被重新发送, TTL 为 2 ,

  2.1 以太网接口维护 2.1.1 端口协商 电口:支持 10/100/1000M 协商及强制手工配置; 光口:速率千兆,支持强制设置双工和流控; 2.1.2 流控设置 交换机是基于存储转发的 , 因此很关键的问题是在缓冲存储器大小一定的 情况下 , 如何合理的使用缓冲存储器,以避免由于用完这个存储器资 源而出现丢包现象在实际运用中 , 当流量超过了网络的最大传输能力 时, 网络吞吐量将会下降。 例如在一个交换机中, 如果流量是突发 性的且都流向一个端口, 那么缓冲区将溢出, 并将导致吞吐量下降 和数据包丢失。 数据包丢失对于吞吐量性能具有负面效应, 对于那 些使用像 TCP / IP 这样的存取方法的应用而言尤为如此。 在 TCP / IP 中, 如果一个数据包丢失了, 发送方的 TCP / IP 最终会发现数据包 没有被送到,并将重发这些帧。即使帧丢失率很小,也将导致很大的 吞吐量下降。一个简单的流量控制机制会带来很大的好处 , 流量控制 是交换机用于限制网络访问的机制 , 它通过对缓冲区设置上限 , 修 改发送速率或将发送源关闭一段预定的时间来实现 . 流量控制是当交换机的端口 出现拥塞时 , 才会起作用 . 当交换机的 各个端口都是一对一的同速率转发 , 不出现拥塞时 , 是不会产生流 控的。 S5760 系列交换机默认关闭端口流控,当网络结构为非对称网络时,建议 打开流控。观察流控是否打开的方法为:

  2.2.1 故障说明 以太网端口连接后,无法 link ,或者 link 不稳定, link 后协商的速率不 正常; 2.2.2 诊断流程 Link down 1. 首先确认配置是否有问题,如端口被 shut down ,光电复用口未切换 到合适状态 2. 检查两端端口的自协商是否打开, 建议双方交换机的端口将自协商打 开。 至少需要保证两台交换机的端口的工作状态是一致的 3. 重新插拔线缆(网线或者光纤或者光模块) ,看是否可以 Linkup 。此 举可以确定是否由于这些部件未良好连接导致的问题 4. 5. 尝试更换网线或者光纤(或者光模块、扩展模块) ,看是否可以 Linkup 把线缆更换到本机的其他端口上, 看是否可以正常 Linkup 。 如果其 他端口可以 Linkup , 很大可能是端口硬件故障。 如果无法 Link, 需 要更换 RJ45 线( 需要尝试正线和反线) ,确认光纤线的 TX 、 RX 的正确连接 6. 7. 8. 如果是长线,则改为短线进行和其他正常端口连接,看是否 Link 正常 把对端更换到其他正常端口上,看是否可以正常 Linkup 或者使用测试设备对网线或者光纤的衰减进行测试, 并和标准值比较, 以确认线 常见故障二: 端口丢包 / 错帧 , 或 ping 包延迟大 2.3.1 故障说明

  网络访问缓慢,检查用户接入端口或者上联端口出现丢包及 CRC 错误。 2.3.2 诊断流程 1. 2. 3. 确认网络拓扑是否有问题 确认软件配置是否有问题 通过端口 LED 指示灯观察或者通过 Console 口进入主程序界面, 使 用 Show interfaceGi 0/1 counters ( 假设 Gi 0/1 故障 ) 来确认是否有 CRC 等错误。 以及是发送还是接收错误。 务必保存串口信息,以备 后续分析。 2.4 常见故障三:光模块无法 link-up 或出现大量 CRC 2.4.1 故障现象 光模块无法 link-up 或出现大量的 CRC. 2.4.2 诊断流程 1. 确认光纤线是否和光模块匹配 , 不能使用单模光纤连接两个多模光模 块,多模信号在单模光纤上衰减非常大 2. 3. 确认光模块安装是否到位 确认光模块指标是否符合现场环境 . 因为光纤通信是比较精密的技 术,若现场环境恶劣(尤其是灰尘) ,对通信质量会有较大的影响,应 该尽可能避免在这种环境下使用,若要用,需要做好对光纤和光模块 接口的保护工作 4. 确认交换机互连光口的端口配置是否匹配 , 主要要留意光电复用口是 否已经切换为光口、互连的两个光口的速率配置是否对称 5. 将互连光口的端口配置为自适应,确认是否解决

  更换其中一个光模块所处端口,确认是否解决 更换光纤线,确认是否解决 将其中一个光模块换到第三台设备上,确认是否解决 插入第三个光模块,确认第三个光模块和其他两个模块的连接情况

  异常, 一般来说有以下几种情况: 物理端口损坏,导致数据无法正常转发; 生产树 block 端口以及安全功能如 mac 地址过滤, dot1x , 端口安全 等原因导致端口无法正常转发; 对于问题一,可参考端口状态一章进行排查,问题二则通过以下步骤对信 息进行收集,并结合二层转发原理进行分析处理。 1. 2. 3. 4. 查看设备基本运行状态: Show cpu , show memory 查看端口状态及收发报文: 统计 Show interface counters,show interface 查看 vlan 配置, Show interface , show vlan 查 看 mac 表 , Show mac-address-table 查 看 STP 状 态 , Show spanning-tree interface 3 硬件转发功能维护与故障排查 3.1 底层命令简介 通过上层和底层相关表项的对应, 能快速的定位问题的原因。 如上层 mac 地址表对应底层的 fdbtable 表, 上层路由表对应底层的 vs dump v4disprefix 表, 上层 ACL 应用表对应底层的 PCL 表。 在交换机日常运行和维护过程中可能遇到下述几种情况,需要使用底层排 查: 1. 上层 show mac-address-table 表项中, 有目的 mac , 但是交换机不 转发数据, 可通过底层 fbdtable 命令查看底层 mac 表项是否正确 2. 上层路由表中, 有目的 ip 网段, 但是交换机却不转发数据, 可通 过使用底层 vs dumpv4disprefix 命令排查底层路由表是否正确 3.

  PCL 资源在硬件中一个共 512 行,每行有 2 列,每个单元有 24 字 节,当使用标准模式时, 每个单元可以用于存储一个 PCE , 而使用

  S5760 系列交换机支持标准生成树协议( STP/RSTP ) 。该协议可应用于 环路网络,通过一定的算法实现路径冗余, 同时将环路网络修剪成无环路 的树型网络, 避免报文在环路网络中的增生和无限循环。 S5760 所实现 的快速生成树协议 RSTP ( Rapid SpannIng Tree Protocol )是生成树协议 的优化版。系统缺省不运行 RSTP 协议。 RSTP 协议可以与 STP 协议完 全兼容, RSTP 协议会根据收到的 BPDU 版本号来自动判断与之相连的 网桥是支持 STP 协议还是支持 RSTP 协议, 如果是与 STP 网桥互连就只 能按 STP 的 forwardIng 方法,过 30 秒再 forwardIng ,无法发挥 RSTP 的最大功效。生成树协议报文的目的 MAC 地址是 0180-C200-0000 ,源 MAC 地址为接口地址。 当端口的生成树协议启动后, 目的 MAC 地址 为 0180-C200-0000 的报文被自动识别为桥控制报文,不论端口为何种生 成树状态,该报文都将无条件送 CPU 进行处理。 MSTP 和 RSTP 能够互相识别对方的协议报文, 可以互相兼容。 而 STP 无 法识别 MSTP 的报文, MSTP 为了实现和 STP 的兼容, 设定了两种 工作模式: STP 兼容模式, MSTP 模式。在 STP 兼容模式下,交 换机各个端口将发送 STP 报文;在 MSTP 模式下,交换机的各个端 口将发送 MSTP 报文或者 STP 报文(如果端口上连接了 STP 交换 机) , 并且具备多生成树的功能。 可以通过命令配置 MSTP 的工作 模式。 MSTP 可以和 STP 协议互通,如果交换网络中存在运行 STP 协议的交换机,可以通过命令配置当前的 MSTP 运行在 STP 兼容模 式下,否则可以配置 MSTP 运行在 MSTP 模式下。MSTP 可以弥补 STP 和 RSTP 的缺陷, 它既可以快速收敛, 也能使不同 VLAN 的

  流量沿各自的路径分发,从而为冗余链路提供了更好的负载分担机制。 MSTP 属性

  4.1.2 STP 常见问题 哪些端口不受生成树协议控制 路由口, 配置了 BPDU filter 的端口, 配置了 Dot1q tunnel 的端口。 所 谓不受控制的意思是:这些端口是不处理 BPDU 的,此外,这些端口 的状态改变不会影响到网络拓扑。 全局 BPDUguard 对所有边缘端口都起作用。 端口的 BPDUguard 只在显 示配置的端口上起作用, 提供两种配置可以提高应用的灵活性。 BPDUguard 功能用于端口安全, 配置了该功能后,如果对应端口收 到 BPDU 将引发一个端口违例并使得端口 down 掉。 配置全局的 BPDUfilter 和配置接口的 BPDUfilter 有什么区别 接口模式下的 BPDUfilter 功能是指在某些端口上强制不收 / 发处理 任何 BPDU 报文,一般是用于在直连 PC 的端口上防止用户的恶意 BPDU 攻击的。 全局的 BPDUfilter 只在配置了 Portfast 的端口上起 作用, 在这种状态下, Port Fast enabled 的 Interface 将既不收 BPDU , 也不发 BPDU ,这样,直连 Port Fast enabled 端口的主机

  对网络拓扑有个清晰的掌握。 Portfast 功能是什么意思 Portfast 是一个接口命令,它使得设备在运行生成树的时候,配置了该命令 的端口可以快速进入转发状态,通常这个功能是用在接入层设备上直 连 PC 的端口。这样可能避免生成树协议中转发延迟对用户的影响。 交换机打印― topochange : topology is changed ‖信息表示了什么意思 说明当前设备拓朴发生变化, 简单理解就是有端口发生了角色变化, 比 如 从 Disableport 变 成 DesignatedPort , Alternateport 变 成 DesignatedPort 等等。这种拓扑变化有两种可能情况: 端口从转发 状态变成阻塞状态(ForwardIng-DiscardIng), 端口从阻塞状态变成 转发状态 (DiscardIng-ForwardIng) 。 打印这个信息通常有如下两中可 能: 一是端口 LInk 状态发生变化,此时在 up/down 时都会打印; 二是端口的 LInk 状态没有发生变化,但 Stp 的协议计算让某些端口 的角色进行了切换,比如从 Root 口变成了 Alternate 口等。 交换机打印― NEWROOT : new root is produced ‖表示什么意思 说明本机的 Instance 0 的根桥从其它设备切换成自己, 注意这里指的是

  为什么有时修改路径值不会引起拓扑变更 假设 A , B 两台设备互联。 A 是根桥, 我们也可以将其称为 B 的上 游网桥。 此时 BPDU 是由 A 发向 B 的。 如果在 B 的端口上修改 端口的 Cost 值, 是不会引起 B 上的选路变化。必须在上游网桥的 端口上修改才有效果。 设备在不断清除 mac 地址是为什么 本机发生拓朴变化或者是网络中其它设备发生拓朴变化时就会清本机的 Mac 地址。典型的有: 本机有端口 up/down , 本机某些端口角色发 生变化了, 比如根口变成 Alternate 口, 收到其它设备发送的 TCN 报 文或者是 TC BPDU TCN 和 TC BDPU 的说明 TCN 和 TC BPDU 是通告网络拓扑变化的两种报文, 不同的是 TCN 只在 STP 模式下才能发送并且只向根口发送,其 BPDU 类型是 ox80 。 TC BPDU 也算是 Config BPDU ,类型都是 0x02 ,只不过此时报文 里面的 Flags 字段的 Topology Change 位被置成了 1 。 TC BPDU 可以在根口和 DesignatedPort 上发送。这两种报文的作用是一样的, 都是向其他设备通告网络拓扑变化, 其结果将导致报文的接收者清除 本机的 Mac 地址, 同时将这种拓扑信息通过根口或 DesignatedPort

  口继续向网络扩散, 并最终引发全网的 Mac 地址清除操作。 清地址对网络通讯的影响有哪些 对于二层设备来说, 清地址对用户的通讯是没有影响的, 因为 mac 地址 删除后, 未知名单播报文是会被当做广播在 vlan 内泛洪的,不过对 设备的 CPU 会有一定的冲击,原因是设备必须重新学习 mac 地址。 对于三层设备来说, 清 Mac 地址会导致 2-10 秒左右的三层转发的中 断 ( 这时因为三层转发功能需要延迟重学习 Arp) ,同时还伴有大量 的 Mac 地址学习 ( 三层设备通常是作为网关设备, 学习的 Mac 地 址相对较多 ) , 而当这种清除地址操作很频繁时就会严重影响用户的 网络通讯, 尤其是需要通过该设备进行三层转发的流将会中断。

  TPP 功能对 SpannIng-Tree 的影响 RGNOS10.1 软件上开始提供的 TPP 功能能够在系统繁忙的情况下保持系 统拓扑的稳定性,避免一些因为系统繁忙引发的拓扑振荡甚至是环路 等问题。 TPP 绝大多数情况下是用在本机 CPU 利用率高, 内存不足, 或者是邻 居 CPU 利用率高,内存不足时,保证本机的生成树协议和 Vrrp 协议 稳定。因为这类系统繁忙情况下,容易引发系统处理 BPDU 延迟或发 送 BPDU 延迟,一旦这种繁忙的状况短时间内无法恢复, 就会引发 生成树协议因为 BPDU 消息老化而出现拓扑振荡, 这时将出现大量

  的 Mac 地址清除操作以及网络环路问题, 使得原本就已经繁忙的系统 更难恢复。 此时引入 TPP 协议后, 系统将有能力检测到这种情况并告知生成树协议 保持稳定。 TPP 功能默认是打开的(命令: topology guard ) ,使用 时要通过 cpu topology-limit 命令配置一个合理的 cpu 利用率阀值来 作为生成树保护的依据, 当系统 CPU 利用率超过该值是 STP 将维持 当前的端口角色状态。 我们建议这个值在中偏上比较合适, 太小或 太大都比较有可能使得对当前系统是否繁忙的判断产生错误的判断。 4.2 ARP 4.2.1 ARP 简介 ARP (地址解析协议) , 为 IP 地址到对应的硬件地址之间提供动态映射。 通常, S5760 上学习不到主机或其他交换机的 ARP ,可能是由于下 面几种原因造成: ARP 请求报文发送异常 ARP 响应报文接收异常 4.2.2 ARP 诊断思路 ARP( 地址解析协议 ) 提供从 IP 地址到对应硬件地址的动态映射。通常 情况下 ARP 故障诊断遵循从上至下诊断思路。 ARP 是否学习到, 通过 Show arp IP_ADDR 查看, 如果是可信 ARP ,

  及 Debug ip error 这两个网络层开关。 如果报文到达网络层, Debug ip packet 能够打印相应的报文信息。如果网络层报文队列已满出现丢包 时, Debug ip error 能够看到相应的提示。 通过在报文入口抓包或者 Show 对应 Interface 的收包统计 (报文流很小的 情况)来查看报文是否正确被接受和发送。在复杂的应用环境中可能 出现请求报文未能正确的发送,应答及路由不可达等都可以通过这一 步的核查查找出来。 实际环境情况可能更加复杂, 问题更加多样, 上面 ARP 故障诊断的基 本思路仅供参考,各个诊断步骤中的诊断手段也是多样的,不仅仅局 限提到的方式方法了。4.2.3 ARP 诊断示例 ARP 请求报文发送异常 1. 在特权用户层,打开 ARP 报文调试开关,确认 ARP 请求报文是否被 发送。 S5760#Debug arp 2. 3. 查看端口统计是否已经发送 ARP 请求广播报文。 如果现场条件允许, 也可以通过端口出报文镜像来分析 ARP 请求报文 是否被正确的发送。 调试开关打开后,显示管理板发送和接收到的相关报文。 ARP 响应报文接收异常 1. 在特权用户层查看软件 ARP 表项中是否存在希望的 ARP 表项。 S5760#Show arp 2. 在特权用户层,打开 ARP 报文调试开关,确认是否接收到 ARP 相应

  报文。 S5760#Debug arp 3. 4. 如果已经接收到 ARP 报文,但没有生成 ARP 表项,属于故障。 如果交换机没有接收到 ARP 报文,分析报文接收。打开报文接收调试 开关,确定 ARP 报文是否被接收。 5. 6. 查看端口统计是否收到 ARP 应答报文。 如果现场条件允许, 可以通过端口入报文镜像来分析是否接收到对端 发送的 ARP 响应报文。 4.3 OSPFv2 4.3.1 OSPFv2 简介 功能简介 OSPF 是由 IETF 的 IGP 工作组为 IP 网络开发的路由协议。 OSPF 作为 一种内部网关协议( Interior Gateway Protocol , IGP ) ,用于在同一 个自治域( AS )中的路由器之间发布路由信息。它是一种链路状态 协议,区别于距离矢量协议 (RIP) , OSPF 具有支持大型网络, 路 由收敛快, 占用网络资源少等优点, 在目前应用的路由协议中占有 相当重要的地位。 我司 OSPFV2 支持以下特性: 支持广播网络与点对点网络(配置为点对点的以太网接口)以及点到 多点网络。 支持的区间包括存根区间 (Stub) ,不完全存根区间 ( NSSA ) 。 支持虚拟连接。支持路由认证,认证方式可以选择文本 认证或者 MD5 加密认证。 支持通过 Loopback 接口选择路由器 ID 。

  支持路由重分发, 即能将一个 IP 路由协议的路由信息重新分配到另 一个协议, 比如:将通过 RIP 学习到的路由信息导入 OSPF ,或者 相反地, 将 OSPF 学习到的路由信息导入 RIP 。支持丰富的状态显 示命令和调试命令,方便用户进行诊断故障。 支持地址汇总和区域间 路由过滤。 缺省设置 网络接口 接口代价: 不预设接口代价 ;LSA 重传间隔: 5 秒 LSA

  发送延迟: 1 秒 Hello 报文发送间隔: 10 秒 邻接路由器失效的时 间: Hello 报文发送间隔的四倍 优先级: 1 认证类型:无认证 证密码:无 区间 认证类型:无认证 ; 进入 Stub 或 NSSA 区域的汇总路由的缺省 认

  Metric : 1 网络范围:未定义 存根区间: 未定义 不完全存根区 间: 未定义 虚拟连接 未定义虚拟连接。 有关虚拟连接参数的缺省值: LSA 重传间 隔: 5 秒 LSA 发送延迟: 1 秒 Hello 报文发送间隔: 10 秒 邻接路由器失效的时间: Hello 报文发送间隔的四倍 认证 认证密码:无 认证类型:无

  自动代价生成 打开 缺省的自动代价参考是 100 Mbps 缺省路由生成 type-2 缺省 Metric 重分发其他路由协议所使用的缺省 Metric 若配置重分发路由

  的 Metric , 则为配置的 Metric , 缺省情况下, 重分发 BGP 的路 由 Metric 为 1 , 其他协议的路由为 20 管理距离 OSPF 缺省配置如下: 区间内路由信息:110 区间间路由信息: 110 外部路由信息: 110 可通过 distance ospf 配置管理距离 数据库过滤 关闭,所有接口都可以接收状态更新信息 LSA 。 邻居变化日志记录 打开 邻居 无 邻居数据库过滤 关闭,输出的 LSA 发送到所有邻居; 区间 无 路由器 ID 未定义 路由汇总 未定义 状态更新信息调整时间 240 秒 最短路径优先算法定时器 收到拓扑改变信息到下一次开始调用 SPF 算

  常用调试命令 OSPF 调试信息用于显示 OSPF 运行时的动态信息, 当通过前面的静态信 息无法判断 OSPF 故障的原因时,我们可以通过打开 OSPF 调试开

  OSPF 协议是一个分布式协议,它要求自治系统内的所有设备都能协调工 作,任意两台设备之间的故障都可能导致整个协议的运行失效。在保 证设备基本配置正确的情况下,我们需要确定, 设备与其邻居之间的 运行状态是否正确。 通过 Show ip ospf Neighbor 可以查看邻居关系是 否异常,通常情况下,邻居应处于 FULL 状态,对于 NBMA 和广播 网络中, DROther 之间为 2-Way 状态。下面为通常的检查步骤: 检查物理连接及下层协议正确性; OSPF 协议的报文收发需要下层协议支 持,报文的收发通过单播和多播两种形式来实现的,因此可通过 Ping 程序或者打开报文收发开关( Debug ip ospf packet )来确定下层协议 是否运行正常,报文收发是否正常。 检查设备双方的接口配置是否一致, , 在下层协议的正确性情况下,我们 还需要保证试图建立邻居关系的双方接口的配置是否正确, 这包括: 网路地址和掩码是否一致, 接口所属区域一致, HelloInterval , ROuterDeadInterval 配置一致, 区域认证方式和接口认证方式及密码是 否一致。 不一致的参数会导致, 邻居无法建立邻居关系。 通过打开 Debug ip ospf packet 开关,可以显示详细的异常事件,有助于定位异 常原因。 设备双方区域属性是否一致;如某台设备上区域 A 配置为 Stub ,而另一

  台区域 A 为普通区域, 则导致双方在区域 A 无法正常建立邻居关系。 在广播网络和 NBMA 网络中,至少配置一台设备的该接口的 Priority 大 于 1 ;因为在 NBMA 网络和广播网络中,需要选举 DR ,而只有 Priority 大于 1 的设备才有能力参与选举, 因此必须满足该条件, 否 则网络中的设备将无法正常运行。 在接口模式下执行命令 ip ospf priority num 配置接口的优先级。 3. 区域规划是否正确。

  OSPF 协议的区域概念使得 OSPF 可以应用于大型网络, 这也给 OSPF 的 部署带来复杂度;下面是常见的区域规划注意事项: 当一个自治系统存在多个区域时, 应保证存在骨干区域, 且其他区域均 与骨干区域物理相连或逻辑相连,同时骨干区域自身应该是连通的; 不同设备的对应的区域属性应该一致, 如区域认证方式, 是否为 Stub 区域, 不一致性会导致 OSPF 运行异常 4.3.3 OSPFv2 诊断示例 邻居状态始终在 Exstart 和 Exchange 状态之间振荡 这时可以通过打开邻居双方的 DD 报文调试开关和 NFSM 调试开关, 查 看邻居状态机的运行情况, 可能的原因是一方 DD 报文中的 MTU 字段值太大而超出了邻居接口的 MTU 值,从而导致邻居总是丢弃 DD 报文,无法正常 Full 。

  路由表中某条路由表项时通时断,不断振荡 这个原因可能有很多,常见的可能是:

  4.4.1 OSPFv3 简介 功能简介 OSPF 是由 IETF 的 IGP 工作组为 IP 网络开发的路由协议。 OSPF 作为 一种内部网关协议( Interior Gateway Protocol , IGP ) ,用于在同一 个自治域( AS )中的路由器之间发布路由信息。它是一种链路状态 协议,区别于距离矢量协议 (RIP) , OSPF 具有支持大型网络, 路 由收敛快, 占用网络资源少等优点, 在目前应用的路由协议中占有 相当重要的地位。 OSPFv3 协 议 是 OSPF 协 议 在 IPv6 协 议 栈 中 的 应 用 , 采 用 的 了 与 OSPFv2 相同的基本实现机制 —SPF 算法, 洪泛, DR 选举, 区 域, 邻居状态机, 接口状态机等等;对应的内容可参考 RFC 2328 ; OSPFv3 所扩展的内容, 在 RFC 2740 中有详细的描述; 我司 OSPFv3 支持以下特性 支持广播网络,点对点网络(配置为点对点的以太网接口) , NBMA 与 点对多点网络 。 支持的区间包括存根区间 (Stub) 。 支持虚拟连接 。 路由器 ID 需要手动配置 。 支持路由重分发, 即能将一个 IP 路由协议的路由信息重新分配到另一个 协议, 比如将通过 RIPng 学习到的路由信息导入 OSPFv3 ,或者相 反地, 将 OSPFv3 学习到的路由信息导入 RIPng 缺省设置

  网络接口 接口代价: 不预设接口代价 LSA 重传间隔: 5 秒 LSA 发送 延迟: 1 秒。Hello 报文发送间隔: 10 秒。邻接路由器失效的时间: Hello 报文发送间隔的四倍 。优先级: 1 。认证类型:无认证 。认 证密码:无 。 区间 认证类型: 无认证 。进入 Stub 区域的汇总路由的缺省 Metric : 1 网络范围:未定义 。存根区间: 未定义 。不完全存根区间: 未定 义 。 虚拟连接 未定义虚拟连接。LSA 重传间隔: 5 秒 。LSA 发送延迟: 1 秒 。Hello 报文发送间隔: 10 秒 。邻接路由器失效的时间: Hello 报文发送间隔的四倍 。认证类型:无认证。认证密码:无。 自动代价生成 打开 。缺省的自动代价参考是 100 Mbps 。 缺省路由生成 关闭。 如果打开则缺省使用的 Metric 是 1 , 类型是 type-2 缺省 Metric 重分发其他路由协议所使用的缺省 Metric。 管理距离 区间内路由信息: 110。区间间路由信息: 110 。外部路由信 息: 110 。 数据库过滤 关闭,所有接口都可以接收状态更新信息 LSA 。 邻居变化日志记录 打开 。 邻居 无。 邻居数据库过滤 关闭,输出的 LSA 发送到所有邻居; 区间 无。 路由器 ID 未定义。 路由汇总 未定义。

  数据包发向该虚拟设备, 由 VRRP 组中的主设备负责转发数据包。 当由于某种原因主设备发生故障时, 处于备份状态的设备自动被选择 来代替原来的主设备。 VRRP 使得局域网内的主机看上去只使用了一 个设备。 VRRP 报文是一类指定目的地址的组播报文, 该报文由主设备定时发出来 标志其运行正常, 同时该报文也用于选举主设备。 VRRP 允许为 IP 局域网承担路由转发功能的设备失效后,局域网中另外一个设备将自 动接管失效的设备,从而实现 IP 路由的热备份与容错, 同时也保证 了局域网内主机通讯的连续性和可靠性。 一个 VRRP 应用组通过多 台设备来实现冗余, 但是任何时候只有一台设备作为主设备来承担路 由转发功能, 其他的为备份设备, VRRP 应用组中不同设备间的切 换对局域网内的主机则是完全透明的。 运行 VRRP 协议后, VRRP 的缺省配置如下: 缺省设置

  VRRP 广播发送间隔 1 秒 备份变成主状态的超时时间 3 秒 抢占模式 允许抢占 抢占延时 0 秒 优先级 100 (注:若是接口地址所有者,则为 255 ) 监视的接口 无 监视的主机地址 无

  探测时间间隔(设置了监视时) 3 秒 探测超时时间(设置了监视时) 1 秒 优先级减值(设置了监视时) 10 验证字符串 无 VRRP 广播发送间隔学习功能 关闭 描述字符串 无 常用监控命令 Show vrrp 显示信息包括以太网口名称, 接口 上设置的 VRRP 备份组

  VRRP 的如果出现故障可以通过考察配置以及调试信息来分析和解决, VRRP 故障定位 基本流程如下: 1. 2. 3. 4. 5. 确保 VRRP 的配置是否正确 确认接口配置是否正确 确认 ARP 和核心路由表中有虚拟 IP 的表项 查看当前 CPU 利用率 打开 VRRP 调试开关跟踪

  4.5.3 VRRP 诊断示例 虚拟 IP 地址不可达 必须确保备份组内至少有一台路由设备处于活动状态 如果在其它网络设备上 Ping 虚拟 IP 地址不通则可能由于以下原因引 起 : 由 VRRP 状态的转换需要短暂时间这可以通过 Show vrrp 命令 考察 VRRP 信息来确认 如果本地网络设备与虚拟路由设备位于同一网段就需要考察本地网络设备 的 ARP 表中是否有虚拟 IP 地址的 ARP 项, 如果没有就需要检查网 络线路 如果本地网络设备与虚拟路由设备不在同一网段则需要确认在本地网络设 备上是否有到虚拟 IP 地址的路由 同一个 VRRP 备份组内出现多个 Master 路由设备 同一 VRRP 备份组内各路由设备以太网接口上 VRRP 组验证模式 不同

  同一 VRRP 备份组内各路由设备以太网接口上 VRRP 组验证模式 相同均为 明文密码模式,但是验证字符串不一致 同一 VRRP 备份组内存在路由设备的以太网口电缆断开, 但是路由设 备未能检测到以太网口电缆已经断开 同一个 VRRP 备份组内路由设备上 VRRP 的广告发送间隔不一致, 并且未设置定时设备学习功能 同一个 VRRP 备份组内路由设备上 VRRP 的虚拟 IP 地址不一致 VRRP 备份组状态出现振荡,在主从状态间不停切换 VRRP 出现振荡,直接原因往往是备份设备未能在规定时间(备份变成主 状态的超时时间)内收到主设备的 VRRP 广播报文,于是自动切换为 主设备状态,之后又收到了该 VRRP 广播报文,重新切换回备份设备 状态,如此反复,导致出现振荡现象。还有可能是因为设置了监视的 接口或者主机是否可达时, 该接口的状态或主机路由出现振荡,导致 主设备的优先级降低(默认值为 10 ) ,若低于备份设备的优先级,且 设置了允许抢占, 便会被备份设备抢占, 之后监视的接口或主机重 新变为可达时, 该设备的优先级重新增加, 从而切换回主设备状态, 如此反复导致出现振荡。 这种情况出现的可能性很小,可以通过查看 VRRP 组的设置和监视的接口或主机的状态来排查。 第一种情况则可能是因为以下原因: 主设备 CPU 利用率过高, 3 秒钟(备份变成主状态的默认超时时 间) 内发不出 VRRP 广播报文,可以通过在主、从设备上查看 CPU

  利用率来排查; 网络通信量太大, 导致主设备发出的 VRRP 广播报文 3 秒钟以后才 到达备份设备,可以通过确认网络通信量来排查; 网络拓朴中出现 STP 振荡,可以通过查看网络设备的具体设置、分 析拓朴来排查。 4.6 DHCP 4.6.1 DHCP server 简介 功能简介 DHCP(Dynamic Host Configuration Protocol , 动态主机配置协议 ) 在 RFC 2131 中有详细的描述, DHCP 为互联网上主机提供配置参数。 DHCP 是基于 Client/Server 工作模式, DHCP 服务器为需要动态配 置的主机分配 IP 地址和提供主机配置参数。 DHCP 有三种机制分配 IP 地址: 自动分配, DHCP 给客户端分配永久性的 IP 地址; 动态分配, DHCP 给客户端分配过一段时间会过期的 IP 地址(或 者客户端可以主动释放该地址) ; 手工配置,由网络管理员给客户端指定 IP 地址。管理员可以通过 DHCP 将指定的 IP 地址发给客户端。 三种地址分配方式中,只有动态分配可以重复使用客户端不再需要的地址。 DHCP 消息的格式是基于 BOOTP(Bootstrap Protocol) 消息格式的, 这就要 求设备具有 BOOTP 中继代理的功能,并能够与 BOOTP 客户端和 DHCP 服务器实现交互。 BOOTP 中继代理的功能, 使得没有必要在

相关推荐
  • 交换机常见的几种故障及排障方法
  • 交换机运行维护与故障排查
  • 工业级以太网交换机
  • 排查光纤交换机的故障方法
  • 工业以太网交换机安装流程图解
  • 工业级以太网交换机-管理型
  • 工业交换机
  • 工业以太网交换机厂家
  • 工业以太网交换机的作用和工作原理详解!
  • 一文读懂工业以太网设备的发展史
  • 脚注信息
    友情链接: