华为乾坤-ALM-139591683 接口状态down:处理步骤

时间:2024-06-13 16:30:42

处理步骤

  • 原因1:接口物理链路变为Down状态。
    1. 请在接口视图下执行命令display this,查看两端接口是否被shutdown。如果是子接口,还需要查看两端接口是否配置了VLAN ID。
      • 如果是子接口,可执行命令vlan-type dot1q,在子接口上配置正确的VLAN ID,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口未被shutdown,则请执行步骤2。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。

    3. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因2:LACP协商失败。
    1. 请在系统视图下执行命令display interface,检查本端和对端端口是否Down。
      • 如果端口Down,则请在接口视图下执行命令undo shutdown,查看告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果端口Up,则请执行步骤2。
    2. 请在系统视图下执行命令display interface eth-trunk,查看本端和对端加入Eth-Trunk的成员口数目是否大于成员链路数的上限阈值。
      • 如果本端和对端加入Eth-Trunk的成员口数目大于成员链路数的上限阈值,则请在Eth-Trunk接口视图下执行命令max active-linknumber,配置合适的Eth-Trunk接口成员链路数的上限阈值,查看告警是否被清除。如果未被清除,则请执行步骤4。
      • 如果本端和对端加入Eth-Trunk的成员口数目小于成员链路数的上限阈值,则请执行步骤3。
    3. 请在系统视图下执行命令display interface eth-trunk查看本端和对端加入Eth-Trunk的成员口数目是否小于成员链路数的下限阈值。
      • 如果本端和对端加入Eth-Trunk的成员口数目小于成员链路数的下限阈值,则请在Eth-Trunk接口视图下执行命令least active-linknumber,配置合适的th-Trunk接口成员链路数的下限阈值,查看告警是否被清除。如果未被清除,则请执行步骤4。
      • 如果本端和对端加入Eth-Trunk的成员口数目大于成员链路数的下限阈值,则请执行步骤4。

    4. 请收集告警信息和配置信息,并联系技术支持工程师。

  • 原因3:收到ConfReq报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因4:收到ConfAck报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因5:收到Nak报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因6:收到Term报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因7:收到TermAck报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因8:收到CodeRej报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因9:收到ProtoRej报文。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因10:CHAP认证失败。
    1. 请在接口视图下执行命令display this查看本端是服务器端(验证对端)还是客户端(被对端验证)。
      • 如果本机作为服务器端,则检查对端的用户和密码配置是否正确。如果用户和密码不正确,请在AAA视图下使用命令local-user password重新配置。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果本机作为客户端,则在接口视图下执行命令display this查看本端的用户和密码配置是否正确。如果用户和密码不正确,请在AAA视图下使用命令local-user password重新配置。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因11:PAP认证失败。
    1. 请在接口视图下执行命令display this查看本端是服务器端(验证对端)还是客户端(被对端验证)。
      • 如果本机作为服务器端,则检查对端的用户和密码配置是否正确。如果用户和密码不正确,请在AAA视图下使用命令local-user password重新配置。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果本机作为客户端,则在接口视图下执行命令display this查看本端的用户和密码配置是否正确。如果用户和密码不正确,请在AAA视图下使用命令local-user password重新配置。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因12:Keepalive超时。
    1. 请在系统视图下执行命令display interface检查对端设备PPP协议是否正常。
      • 如果对端设备PPP协议工作正常,则继续执行display interface命令,检查设备的物理链路(包括中间设备)的状态是否正常,包括丢包、错包情况等。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果对端设备PPP协议工作不正常,则联系对端设备的工程师进行检查。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因13:虚通道Down。
    1. 请在子接口视图,使用命令display this,查看两端接口是否被shutdown。
      • 如果接口处于shutdown状态,请执行步骤4。
      • 如果接口处于undo shutdown状态,请执行步骤2。
    2. 请在系统视图下执行使用命令display fr interface,检查主接口物理状态和协议状态。
      • 如果物理状态Down,请执行步骤5。
      • 如果物理状态Up,协议状态为Down,请执行步骤6。
      • 如果都Up,请执行步骤3。
    3. 联系对端工程师检查Pvc状态是否active。
      • 如果对端active,请执行步骤7。
      • 如果对端unactive,请执行步骤8。
    4. 进入子接口视图,执行undo shutdown打开接口。
    5. 检查主接口物理连接。
    6. 检查LMI协议配置。
    7. 请收集告警信息和配置信息,并联系技术支持工程师。
    8. 结束。
  • 原因14:EFM会话连通性检测故障。
    1. 请在系统视图下执行命令display efm session检查EFM State是否为Detect状态。
      • 如果EFM State是Detect状态,则请执行步骤3。
      • 如果EFM State不是Detect状态,则请执行步骤2。
    2. 请在系统视图下执行display efm命令检查EFM enable flag项是否为enabled。
      • 如果EFM enable flag是enabled状态,则重新检查物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果EFM enable flag不是enabled状态,则按照配置指南在系统视图和接口视图执行命令efm enable (接口视图)和efm enable (系统视图)。然后检查告警是否被清除。如果未被清除,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因15:隧道变为Down状态或被删除。
    1. 请在系统视图下执行命令display interface检查隧道链路状态是否down状态。
      • 如果接口的物理状态为Down,执行命令undo shutdown打开接口,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口的物理状态为Up,则请执行步骤3。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请在接口视图下执行命令display this检查隧道链路接口以及节点配置是否都配置了MPLS TE以及MPLS RSVP-TE。
      • 如果隧道链路接口以及节点配置MPLS TE以及MPLS RSVP-TE,则请执行步骤4。
      • 如果隧道链路接口以及节点没有配置MPLS TE以及MPLS RSVP-TE,则在MPLS视图下执行命令mpls te和命令mpls rsvp-te重新配置,然后检查告警是否被清除。如果未被清除,则请执行步骤4。
    4. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因16:接口被shutdown。
    1. 请在接口视图下执行命令display this,查看两端接口是否被shutdown。如果是子接口,还需要查看两端接口是否配置了VLAN ID。
      • 如果是子接口,可执行命令vlan-type dot1q,在子接口上配置正确的VLAN ID,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口未被shutdown,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因17:链路层协议变为Down状态。
    1. 请在接口视图下执行命令display this,查看两端接口是否被shutdown。如果是子接口,还需要查看两端接口是否配置了VLAN ID。
      • 如果是子接口,可执行命令vlan-type dot1q,在子接口上配置正确的VLAN ID,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口未被shutdown,则请执行步骤2。
    2. 根据对应的链路层协议,检查协议Down的原因。
      • 如果链路层协议可以Up,则故障清除。
      • 如果链路层协议仍无法Up,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因19:链路层协议变为Up状态。

    正常运行信息,无需处理。

  • 原因20:主接口变为Down状态。
    1. 请在接口视图下执行命令display this,查看两端接口是否被shutdown。
      • 如果接口被shutdown,可执行命令undo shutdown打开接口。然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口未被shutdown,则请执行步骤2。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因21:物理连接变为Up状态。

    正常运行信息,无需处理。

  • 原因22:无法达到接口Up的条件。
    1. 请在系统视图下执行命令display interface检查本端和对端接口物理状态是否为Up。
      • 如果接口的物理状态为Down,则在接口视图下执行命令undo shutdown打开接口,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
      • 如果接口的物理状态为Up,则请执行步骤2。
    2. 请在系统视图下执行命令display eth-trunk检查本端和对端加入Trunk的成员口数目是否大于max active-linkup number的值。
      • 如果本端和对端加入Trunk的成员口数目大于max active-linkup number的值,则无需处理,属于LACP协议正常协商现象。
      • 如果本端和对端加入Trunk的成员口数目小于max active-linkup number的值,则请执行步骤3。
    3. 请在系统视图下执行命令display eth-trunk检查本端和对端加入Trunk的成员口数目是否小于least active-linkup number的值。
      • 如果本端和对端加入trunk的成员口数目小于least active-linkup number的值,则执行命令least active-linknumber配置Trunk的least active-linup number的值,使得加入Trunk的成员口数目大于或者等于least active-linkup number。
      • 如果本端和对端加入Trunk的成员口数目大于least active-linkup number的值,则请执行步骤4。
    4. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因23:达到接口Up的条件。

    正常运行信息,无需处理。

  • 原因24:隧道变为Up状态。

    正常运行信息,无需处理。

  • 原因25:接口被删除。

    通常是用户删除某逻辑接口,正常运行信息,无需处理。

  • 原因26:BFD会话变为Down状态。
    1. 请在系统视图下执行命令display bfd session查看BFD会话信息。
      • 如果BFD会话绑定当前接口,并且BFD会话为Down状态,请参考BFD会话的相关故障处理内容。
      • 如果BFD会话绑定当前接口,并且BFD会话为Up状态,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因27:BFD会话变为Up状态。

    正常运行信息,无需处理。

  • 原因28:EFM会话变为Up状态。

    正常运行信息,无需处理。

  • 原因30:DLDP状态变为Down。
    1. 查看告警记录,确认故障原因。
    2. 查看到具体故障原因。
  • DLDP状态变为Up状态。

    正常运行信息,无需处理。

  • 原因32:VRRP状态变为Backup或Initialize状态。
    1. 请在系统视图下执行命令display vrrp查看VRRP的状态信息。
      • 如果管理VRRP为Down状态,请参考VRRP的相关故障处理内容。
      • 如果管理VRRP为Up状态,则请执行步骤2。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因34:VE接口的状态为FLOW DOWN。
    1. 执行命令display interface virtual-ethernet ve-number查看VE接口的状态信息。
      • 如果VE接口为DOWN状态,则请执行步骤2。
      • 如果VE接口为Up状态,则请执行步骤4。
    2. 收集主接口配置。
      • 如果是配对L2VPN终结的接口,请参考L2VPN的相关故障处理内容。
      • 如果是配对L3VPN终结的接口,则请执行步骤3。
    3. 请收集L3VPN终结子接口的配置,检查该子接口是否正确配置VLAN ID以及IPv4地址。
      • 如果配置不正确,则请执行步骤4。
      • 如果都已配置正确,请检查告警是否被清除,若未被清除,则请执行步骤4。
    4. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因35:VE接口的状态为FLOW UP。

    正常运行信息,无需处理。

  • 原因36:接口的链路协议状态为error-down。

    处理建议的详细信息请参考"ERROR-DOWN_1.3.6.1.4.1.2011.5.25.257.2.1 hwErrordown"处理步骤。

  • 原因37:接口误码率超过误码告警阈值。
    1. 执行命令display interface [ interface-type [ interface-number ] | slot slot-number ],查看接口的链路协议状态。
      • 如果接口的链路协议状态为UP(Bit-error-detection down),表明接口误码率超过的误码告警阈值,则请执行步骤2。
      • 如果接口的链路协议状态不是UP(Bit-error-detection down),则请执行步骤3。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因38:接口误码率降低到误码告警阈值以下。

    正常运行信息,无需处理。

  • 原因39:当前端口上传输速率和配置的速率不匹配。
    1. 删除端口上已配置的速率信息,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因40:当前端口插入了不支持的介质。
    1. 请更换匹配的光电模块,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因41:前端口上的介质不支持negotiation配置。
    1. 删除端口上已配置的negotiation配置,然后检查告警是否被清除。如果未被清除,则请执行步骤2。
    2. 请查看物理链接是否正常(包括网线、光模块等硬件是否松动或脱落)。
      • 如果物理链路工作不正常,可以重新正确连接物理线路,然后检查告警是否被清除。如果未被清除,则请执行步骤3。
      • 如果物理链路工作正常,则请执行步骤3。
    3. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因43:接口报trigger down。
    1. 执行命令display interface [ interface-type [ interface-number ] | slot slot-number ],检查对应接口是否(TRIGGER DOWN)。
      • 如果接口状态是TRIGGER DOWN,则请执行步骤2。
      • 如果接口状态不是TRIGGER DOWN,则请执行步骤4。
    2. 根据TRIGGER DOWN后面的原因描述,例如TRIGGER DOWN (MONITOR GROUP),查看相应的联动业务。
      • 如果能查看到TRIGGER DOWN的原因描述,则请执行步骤3。
      • 如果不能查看到TRIGGER DOWN的原因描述,则请执行步骤4。
    3. 检查联动业务,使业务恢复正常,检查告警是否被清除。如果未被清除,则请执行步骤4。
    4. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因48:CFM状态连通性检测故障。
    1. 检查CFM状态信息。
      • 如果状态正常,则请执行步骤2。
      • 如果状态不正常,则参考CFM相关故障处理内容。
    2. 请收集告警信息和配置信息,并联系技术支持工程师。
  • 原因49:CFM变为UP状态。

    正常运行信息,无需处理。

  • 原因51:子接口linkDown告警功能被关闭。

    正常运行信息,无需处理。

support.huaweicloud.com/moredocuments-qiankuncs/alarm_detail_278562125_139591683.html