检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。 图5 应用服务整体流量不均-流量统计&流量分布 根因分析方法
_free_megabytes) 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) 可用虚拟内存(aom_node_virtual_memory_free_megabytes) 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(MB) 显存容量
登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“日志流”页面左侧过滤器中,以不同的视角(云日志视角)及对应的参数对日志进行过滤。并按照界面提示设置日志查询条件。 单击“查询”,完成过滤器设置。 搜索原始日志 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析
您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展示,支持您自定义别名和分组对资源进行管理。 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形
抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
108:41333,其他区域地址请参考接入地址。 接入Agent 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 当前仅华北-北京四、华东-上海一区域菜单路径为:“接入 > 接入中心”。 在右侧“应用层”面板单击“Node.js”卡片。 在“基础信息”下选择“区域”和“应用”。 如果现有的应用无法满
108:41333,其他区域地址请参考接入地址。 接入Agent 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 当前仅华北-北京四、华东-上海一区域菜单路径为:“接入 > 接入中心”。 在右侧“应用层”面板单击“Node.js”卡片。 在“基础信息”下选择“区域”和“应用”。 如果现有的应用无法满
最多可查看最近7天内的桶日志。 查看桶日志 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”,在“桶日志”页签查看桶日志。 设置查询条件。 选择日志桶:在左上方的下拉列表框中选择目标日志桶。 设置查询的时间范围:在右上方的下拉列表框中可选择“近30分钟”、“近1小时”或“近
面。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“接入 > 接入中心”,单击页面右上角“体验新版”,进入新版接入中心页面。 筛选出“API开源协议及其他”类型下的“自定义 Prometheus 格式指标”卡片,并单击卡片上的“接入指标(AOM)”,进入配置页面。 配置自定义
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
说明 收藏卡片 单击待收藏卡片上的。 下架卡片 单击卡片右上角的并选择“下架”。 说明: 服务下架时,需确认服务是否被定时运维场景引用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。 下架后服务场景页面将不展示该卡片,并且在工具市场页面系统默认的卡片
可以查询到kafka开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus
为“已结束”。 事件总览 在“智能洞察(BETA)”主页面,默认以柱状图形式展示近30分钟的所有事件。您可以根据需要调整时间范围,查看近1小时、近6小时、近1天、近1周或自定义时间段的事件。 图2 事件统计视图 在事件统计图区域,还可以执行以下操作: 在图表左上角,查看设置的时间段内事件巡检检测到的异常事件总数。
故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
可以查询到kafka开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus
配置接入规则时以主机组为单位下发采集配置,方便您对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机,该主机会自动继承主机组关联的接入规则,无需为每台主机重复配置。 采集配置。 在“采集配置”中,参考下表配置相关参数信息。 表1 采集配置 类别 参数 说明 基础配置 采集配置名称
遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几个部分,采样点以时间线的方式在逻辑上组织起来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点
可以查询到mongodb开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus
可以查询到mongodb开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus