检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏选择“接入 > 接入中心”。当前仅华南-广州区域的菜单路径为“接入中心 > 接入中心”。 您可以根据不同类型的监控对象,接入对应的指标或日志: 表1 接入总览说明 类型 监控对象 数据源 接入方式 业务层接入 ELB日志 指标 业务层接入AOM APM事务 Browser监控 业务监控(基于日志)
ty}_${event_type}_${clear_type}]于${starts_at}时间发生告警\",\"content\":\"华为云账号:${domain_name};\\n通知类型:${event_type};\\n事件级别:${event_severity};\\n
如何获取Prometheus实例的服务地址? 用户可以登录AOM控制台,进入Prometheus实例的详情页面,获取Prometheus实例的服务地址。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。
AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统(AO
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_cluster_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核数。 ≥0 核(Core) CPU使用率(aom_cluster_cpu_usage) 该指标用于统计测量对象的CPU使用率。
击“批量删除”,随后在提示页面单击“确定”即可删除。 说明: 删除消息模板前需要先删除消息模板绑定的告警行动规则。 搜索消息模板 在右上角的搜索框中输入模板名称关键字,单击后显示匹配对象。 父主题: 告警行动规则
时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。SMN-价格说明 日志转储:依赖对象存储服务(简称OBS),将日志文件转储到OBS桶中,以便进行长期存储。OBS-价格说明 日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警数据到Kafk
cs和Compute引擎的平均值。Graphics或Compute引擎处于Active是指Graphics或Compute Context绑定到线程,并且Graphics或Compute Context处于Busy状态。 0~1.0 占比(Fraction) DCGM_FI_PROF_SM_OCCUPANCY
管理访问凭证 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。每个用户只能创建一个凭证。 新建凭证 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > 访问凭证”,进入访问凭证页面。 单击“同意授权”。
OVERY、CONSOLE,默认值:API 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 id String 对象id 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg
下发批量安装UniAgent任务 功能介绍 该接口用于下发批量安装UniAgent任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/uniagent-console/mainview/batch-import 表1 路径参数 参数 是否必选
支持按规则名称等信息搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警规则详细信息 单击规则名称前的,可查看该告警规则的详细信息,包括每个规则的基本信息、告警条件等。指标告警规则还可查看监控对象及触发的告警列表信息。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。
线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
UniAgent版本 UniAgent的版本,必选项。 1.1.6 接入方式 接入UniAgent的方式,此处选择“直连接入”。 直连接入:华为云主机,使用直连接入的方式。 直连接入 安装命令 安装UniAgent的命令,此处选择复制LINUX安装命令。 单击复制安装命令。 set +o
不区分大小写 name 是 String 组件名称 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 id String 对象id 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg
请求Body参数 参数 是否必选 参数类型 描述 metrics 是 Array of MetricQueryMeritcParam objects 指标对象列表。 取值范围 JSON数组大小不超过20 period 是 Integer 监控数据粒度。取值范围(枚举): 60:表示粒度为1分钟。
GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。