检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。
功能介绍 支持邮件、短信、企业微信、钉钉、飞书、语音、welink、HTTP或HTTPS消息模板。 支持消息模板自定义,详情请参考自定义消息模板内容。
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
domain_ak 否 String IAM账号AK,选填。 domain_sk 否 String IAM账号SK,选填。 响应参数 状态码: 200 表6 响应Body参数 参数 参数类型 描述 state Boolean 执行状态: true:成功下发任务。
统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
-0","container_name1"]' 父主题: 容器日志采集配置
约束与限制 当指标告警规则的状态(正常、超限阈值、生效中、停用中)发生变化时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考创建告警行动规则设置告警行动规则(告警通知规则)。
约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。
≥0 千字节/秒(kB/s) GPU显存 ma_container_gpu_mem_total_megabytes 显存容量 该指标用于统计训练任务的显存容量。
若回显信息中无“failed”字样,则说明ICAgent可成功上报指标 => 执行 4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
内置字段有appName、category、clusterId、clusterName、collectTime、containerName、hostIP、hostIPv6、hostId、hostName、nameSpace、pathFile、podName、serviceID,默认简化显示
≥0 千字节/秒(kB/s) 文件系统可用(aom_container_filesystem_available_capacity_megabytes) 该指标用于统计测量对象文件系统的可用大小。
告警方式包括邮件、短信、钉钉、企业微信、语音等方式。 告警降噪:选择告警降噪的分组规则进行告警降噪。 告警行动规则 告警行动规则定义产生告警之后,按照规则做何种动作。包括消息发送到哪里和以什么形式发送。消息发送到哪里通过华为云服务SMN主题设置。
容器是否terminated kube_pod_container_status_terminated_reason terminated容器的reason kube_pod_container_status_waiting 容器是否waiting kube_pod_container_status_waiting_reason
然后根据应用近7天的调用链数据来训练调用链模型。
≥0 无 ai_cpu_rate ai_cpu_rate AI cpu占用率 昇腾AI加速卡的AI CPU使用率,由用户调用edgecore接口上报。
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.”
CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。