华为乾坤-ALM-142147599 BGP连接中断:处理步骤

时间:2024-06-13 16:30:20

处理步骤

  • 原因1:BGP配置导致邻居断连接

    1. 请查看是否是由于自身配置造成邻居断开。

    • 如果是,则请执行步骤2。
    • 如果不是,则请执行步骤3。

    2. 取消造成邻居断开的配置即可恢复。

    3. 检查是否重置了BGP连接。

    • 若未重置BGP连接,请执行步骤4。
    • 若重置了BGP连接,短暂等待后查看是否恢复连接。如果未恢复连接请执行步骤4。

    4. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因2:BGP收到notification报文

    1. 使用display bgp peer ip-address log-info查看BGP断连时的Notification信息。

    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,则请执行步骤3。
    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,则请执行步骤17。
    • 如果Notification的Error Code是6,表示BGP断连的原因是BGP主动关闭连接,则请执行步骤2。

    2. 使用display bgp peer ip-address log-info查看Notification是否是由产生告警的设备所发。

    • 如果是,则请执行步骤3。
    • 如果不是,则请执行步骤4。

    3. 使用ping命令查看BGP邻居的地址是否能通。

    • 如果是,则请执行步骤4。
    • 如果不是,则请执行步骤5。

    4. 使用命令display cpu-usage查看CPU的利用率是否过高。

    • 如果是,则请执行步骤17。
    • 如果不是,则请执行步骤6。

    5. 使用命令display ip routing-table查看BGP peer地址路由表是否存在。

    • 如果是,则请执行步骤7。
    • 如果不是,则请执行步骤8。

    6. 使用命令display acl命令可以查看设备是否配置了禁止TCP端口179的ACL。

    • 如果是,删除禁止TCP端口179的ACL。
    • 如果不是,则请执行步骤9。

    7. 使用命令display interface查看路由的出接口是否是UP的。

    • 如果是,则请执行步骤17。
    • 如果不是,则请执行步骤10。

    8. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF,则请执行步骤11。
    • 如果路由来源来自IS-IS,则请执行步骤12。

    9. 查看BGP配置,BGP是否是用loopback接口建连。

    • 如果是,则请执行步骤13。
    • 如果不是,则请执行步骤14。

    10. 查看接口上是否被执行shutdown命令。

    • 如果是,在接口上执行undo shutdown命令。如果未能解除告警,则请执行步骤13。
    • 如果不是,则请执行步骤17。

    11. 使用命令display ospf peer查看ospf peer是否建立。

    • 如果是,则请执行步骤17。
    • 如果不是,请参考告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的处理步骤。

    12. 使用命令display isis peer查看IS-IS邻居是否建立。

    • 如果是,则请执行步骤17。
    • 如果不是,请参考告警ISIS_1.3.6.1.3.37.2.0.17 isisAdjacencyChange的处理步骤。

    13. 检查是否指定发起BGP连接时使用的源地址。

    • 如果是,则请执行步骤14。
    • 如果不是,请配置peer connect-interface命令指定发起BGP连接时使用的源地址。

    14. 如果BGP是EBGP邻居并且EBGP邻居间有多跳,检查是否配置peer ebgp-max-hop命令。

    • 如果是,则请执行步骤15。
    • 如果不是,请配置peer ebgp-max-hop命令。

    15. 如果配置了peer valid-ttl-hops hops,检查从对端收到报文的TTL是否在[255-hops+1, 255]的范围内。

    • 如果是,则请执行步骤16。
    • 如果不是,请重新配置peer valid-ttl-hops hops命令,使到对端的报文的TTL满足在[255-hops+1, 255]的范围内的判断条件。

    16. 联系对端设备的维护人员,检查对端设备是否有重置BGP,或者本端是否在其他地址族下使用peer enable命令使能Peer,或者配置BGP连接参数等操作。如果存在以上操作,请等待一段时间再查看告警是否解除。如果告警未解除请执行步骤17。

    17. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因3:BGP收到错误包

    1. 使用display bgp peer ip-address log-info查看BGP断连时的Notification信息。

    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文。请执行步骤2。
    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文。请执行步骤2。
    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文。请执行步骤2。

    2. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因4:BGP hold timer 超时

    1. 使用ping命令查看BGP邻居的地址是否能通。

    • 如果是,则请执行步骤2。
    • 如果不是,则请执行步骤3。

    2. 使用命令display cpu-usage查看CPU的利用率是否过高。

    • 如果是,则请执行步骤15。
    • 如果不是,则请执行步骤4。

    3. 使用命令display ip routing-table查看BGP peer地址路由表是否存在。

    • 如果是,则请执行步骤5。
    • 如果不是,则请执行步骤6。

    4. 使用命令display acl命令可以查看设备是否配置了禁止TCP端口179的ACL。

    • 如果是,删除禁止TCP端口179的ACL。
    • 如果不是,则请执行步骤7。

    5. 使用命令display interface查看路由的出接口是否是UP的。

    • 如果是,则请执行步骤15。
    • 如果不是,则请执行步骤8。

    6. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF,则请执行步骤9。
    • 如果路由来源来自IS-IS,则请执行步骤10。

    7. 查看BGP配置,BGP是否是用loopback接口建连。

    • 如果是,则请执行步骤11。
    • 如果不是,则请执行步骤12。

    8. 查看接口上是否被执行shutdown命令。

    • 在接口上执行undo shutdown命令。如果未能解除告警,则请执行步骤11。
    • 如果不是,则请执行步骤15。

    9. 使用命令display ospf peer查看ospf peer是否建立。

    • 如果是,则请执行步骤15。
    • 如果不是,则请参考告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的处理步骤。

    10. 使用命令display isis peer查看IS-IS邻居是否建立。

    • 如果是,则请执行步骤15。
    • 如果不是,则请参考告警ISIS_1.3.6.1.3.37.2.0.17 isisAdjacencyChange的处理步骤。

    11. 检查是否指定发起BGP连接时使用的源地址。

    • 如果是,则请执行步骤12。
    • 如果不是,则请配置peer connect-interface命令指定发起BGP连接时使用的源地址。

    12. 如果BGP是EBGP邻居并且EBGP邻居间有多跳,检查是否配置peer ebgp-max-hop命令。

    • 如果是,则请执行步骤13。
    • 如果不是,则请配置peer ebgp-max-hop命令。

    13. 如果配置了peer valid-ttl-hops hops,检查从对端收到报文的TTL是否在[255-hops+1, 255]的范围内。

    • 如果是,则请执行步骤14。
    • 如果不是,则请重新配置peer valid-ttl-hops hops命令,使到对端的报文的TTL满足在[255-hops+1, 255]的范围内的判断条件。

    14. 联系对端设备的维护人员,检查对端设备是否有重置BGP,或者本端是否在其他地址族下使用peer enable命令使能Peer,或者配置BGP连接参数等操作。如果存在以上操作,请等待一段时间再查看告警是否解除。如果告警未解除请执行步骤15。

    15. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因5:BGP远端不可达

    1. 使用ping命令查看BGP邻居的地址是否能通。

    • 如果是,则请执行步骤2。
    • 如果不是,则请执行步骤3。

    2. 使用命令display cpu-usage查看CPU的利用率是否过高。

    • 如果是,则请执行步骤15。
    • 如果不是,则请执行步骤4。

    3. 使用命令display ip routing-table查看BGP peer地址路由表是否存在。

    • 如果是,则请执行步骤5。
    • 如果不是,则请执行步骤6。

    4. 使用命令display acl命令可以查看设备是否配置了禁止TCP端口179的ACL。

    • 如果是,则删除禁止TCP端口179的ACL。
    • 如果不是,则请执行步骤7。

    5. 使用命令display interface查看路由的出接口是否是UP的。

    • 如果是,则请执行步骤15。
    • 如果不是,则请执行步骤8。

    6. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF,则请执行步骤9。
    • 如果路由来源来自IS-IS,则请执行步骤10。

    7. 查看BGP配置,BGP是否是用loopback接口建连。

    • 如果是,则请执行步骤11。
    • 如果不是,则请执行步骤12。

    8. 查看接口上是否被执行shutdown命令。

    • 在接口上执行undo shutdown命令。如果未能解除告警,则请执行步骤11。
    • 如果不是,则请执行步骤15。

    9. 使用命令display ospf peer查看ospf peer是否建立。

    • 如果是,则请执行步骤15。
    • 如果不是,则请参考告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的处理步骤。

    10. 使用命令display isis peer查看IS-IS邻居是否建立。

    • 如果是,则请执行步骤15。
    • 如果不是,则请参考告警ISIS_1.3.6.1.3.37.2.0.17 isisAdjacencyChange的处理步骤。

    11. 检查是否指定发起BGP连接时使用的源地址。

    • 如果是,则请执行步骤12。
    • 如果不是,则请配置peer connect-interface命令指定发起BGP连接时使用的源地址。

    12. 如果BGP是EBGP邻居并且EBGP邻居间有多跳,检查是否配置peer ebgp-max-hop命令。

    • 如果是,则请执行步骤13。
    • 如果不是,则请配置peer ebgp-max-hop命令。

    13. 如果配置了peer valid-ttl-hops hops,检查从对端收到报文的TTL是否在[255-hops+1, 255]的范围内。

    • 如果是,则请执行步骤14。
    • 如果不是,则请重新配置peer valid-ttl-hops hops命令,使到对端的报文的TTL满足在[255-hops+1, 255]的范围内的判断条件。

    14. 联系对端设备的维护人员,检查对端设备是否有重置BGP,或者本端是否在其他地址族下使用peer enable命令使能Peer,或者配置BGP连接参数等操作。如果存在以上操作,请等待一段时间再查看告警是否解除。如果告警未解除请执行步骤15。

    15. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因6:BGP直连接口断开连接

    1. 检查接口是否被执行shutdown命令。

    2. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因7:BGP路由超限

    1. 查看是否配置了peer route-limit命令,是否路由超上限。

    • 如果是,则请执行步骤2。
    • 如果不是,则请执行步骤3。

    2. 请查看配置的peer route-limit是否必要,如果必要则通过减少路由使路由数量低于route-limit上限值。

    3. 请收集告警信息和配置信息,并联系技术支持工程师。

support.huaweicloud.com/moredocuments-qiankuncs/alarm_detail_100000_142147599.html