检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
任务执行日志中的执行机与任务配置的不一致 可能原因 该任务中配置的执行机已被删除或无权限,则执行时会忽略这些执行机,不显示在执行日志中。 解决方法 自动化运维在执行任务时会校验任务参数中的有效的执行机,请检查当前任务中配置的执行机是否都有效。 父主题: 运维管理(日落)
Prometheus实例id。 bind_notification_rule_id 否 String 绑定的告警行动规则名称。 related_cce_clusters 否 String CCE集群id。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String
信息。 单击“组件设置”,进入组件配置页。组件设置提供自定义设置、Agent设置以及监控项功能。 图1 组件设置 单击“批量复制到其他组件”,在弹框中选择想要复用的其他组件。 图2 复用到其他组件 单击“复用到其他组件”,即可将组件设置中的配置复用到其他组件。 自定义设置 自定义
DaemonSet、普通任务Job、容器组 Pod。 功能介绍 工作负载监控方案开箱即用。开通AOM之后,在工作负载监控页面,CCE、CCI的工作负载状态、CPU使用率、物理内存使用率等信息默认呈现。 图1 工作负载监控 用户自建k8s容器监控方案,当前只支持通过Promethe
议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。 日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。 应用资源管理 通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQ
正常状态的工作负载,AOM界面显示异常是什么原因? 在AOM页面看到工作负载的状态显示异常,但是实际上在CCE页面看工作负载是正常的。 图1 查看工作负载状态 可能的原因如下: ICAgent的版本过低。 ICAgent当前需要用户主动升级的,但是过旧的ICAgent版本可能存在状态上报延迟导致显示异常的问题。
指标含义 指标的含义。 设置完成,单击“下一步”。 配置日志的统计方式。 配置日志统计方式前,请按照界面指引先在采集配置中配置好ICAgent结构化解析规则。否则会无法在日志过滤和日志统计处选择到想要的日志字段。 指标预览。基于您配置的日志过滤和统计规则,对日志流执行SQL查询模拟生成的指标结果。
String scale_out_k8s scale_out_vm scale_in_k8s scale_in_vm scale_set_k8s scale_set_vm scale_out_k8s、scale_out_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。
String scale_out_k8s scale_out_vm scale_in_k8s scale_in_vm scale_out_k8s、scale_out_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。 说明: 含有k8s的表示容器应用,含有vm的表示进程应用。
固定时间:仅在指定的时间段执行屏蔽告警通知的操作。 周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。 时区/语言 告警通知被屏蔽的时区/语言,默认为用户首选项配置的时区/语言,可根据需要修改。 设置完成后,单击“立即创建”。 更多静默规则操作 静默规则创建完成后,您还可以执行表2中操作。 表2 相关操作
开启后,设置比较对象时间,时间小于等于24小时。设置完成后,将当前时间的数据与对象时间数据进行比较。 图例配置 隐藏图例 开启后,可以隐藏图例和对比值的显示。 图例位置 选择图表顶部或图表右边。 对比数值 选择显示最大值、最小值、平均值、求和值等,可勾选多个。 图形配置 连接方式 设置线图显示格式,可选择直线或曲线。
表格图标配置说明 类别 参数名 说明 标准配置 格式化 将表格数据按照指定格式进行显示。 单位 自定义配置表格数据的单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 查询分析设置 隐藏字段 选择目标字段,将该字段在表格中隐藏。 表格配置 每页显示
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
和结构化配置的字段。 内置字段有appName、category、clusterId、clusterName、collectTime、containerName、hostIP、hostIPv6、hostId、hostName、nameSpace、pathFile、podName、
概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
线程分析 线程分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您快速定位耗时较高的线程。 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 线程分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
参数库 “参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏单击