检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看执行记录 单击“操作”列的“执行记录”可查看任务执行的详细信息,包括任务名称、任务ID、任务状态、执行时间以及审批人等信息。 删除任务 单击“操作”列的“删除”,可以删除任务。只有在任务关闭时,才能删除任务。
概述 AOM提供告警行动规则定制功能,您可以通过创建告警行动规则关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。告警行动规则创建成功后,可在“告警管理 > 告警降噪 > 分组规则”中“创建分组规则”关联行动规则。 创建告警行动规则 创建消息模板 父主题: 告警行动规则
表2 主机指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则
{Site domain name suffix}/v1/{project_id}/{prometheus_instance_id}/api/v1/read' tls_config: insecure_skip_verify: true bearer_token
0~100 百分比(%) 表2 集群指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 projectId 项目ID。 父主题: 指标总览
AK 已获取的访问密钥ID,参考获取AK/SK。 SK 已获取的访问密钥,参考获取AK/SK。 描述 凭证的描述信息。 单击“确定”,完成创建。 更多操作 凭证创建完成后,您可以在凭证列表页面查看凭证信息,还可执行表2中的操作。
选填 Trace ID 调用链的TraceID,填写该搜索条件后,其他搜索条件全部失效,只根据该TraceID搜索。
ak/sk ak/sk(Access Key ID/Secret Access Key)即访问密钥,表示一组密钥对。具体请参考获取AK/SK。 父主题: UniAgent 安装与配置
因为ICAgent在每个节点上会自动生成唯一的ID文件,拷贝镜像后不同节点的ID文件可能会重复。 采集的日志文件是什么类型的?
例如: ak/sk(Access Key ID/Secret Access Key)即访问密钥,表示一组密钥对(旧版本ICAgent需要输入ak/sk,新版本无需ak/sk)。具体请参考获取AK/SK。 父主题: UniAgent 安装与配置(新版)
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建
表1 AOM 2.0与AOM 1.0版本的功能特性对比 功能项 功能项说明 AOM 1.0 AOM 2.0 应用资源管理 资源检索 提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。
创建访问密钥成功后,您可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)。 返回AOM 2.0控制台页面,在左侧导航栏中选择“采集管理”,进入“采集管理”界面。 在左侧导航栏中,选择“UniAgent管理 > 虚机接入”。
创建指标告警规则 通过指标告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 功能介绍 支持设置告警的统计周期、检测规则、触发条件等,具体请参考设置告警规则详情。 支持配置告警通知场景,具体请参考设置告警通知策略。 告警通知策略支持直接告警和告警降噪两种方式
创建事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择
快速监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台
可以通过服务器名称/ID或IP地址对列表进行过滤,也可以单击,并在弹出的搜索框中输入多个主机IP,进行批量搜索。 当列表中没有所需主机时,单击“安装Uniagent”,在弹出的页面安装指引完成Uniagent安装,具体操作可参见安装UniAgent。
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择
自定义属性:clusterId=ee-643f-XXXX-XXXX-XXXXXXX,即可查询出指定时间范围内自定义属性集群ID(clusterId)为ee-643f-XXXX-XXXX-XXXXXXX的相关事件。