检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) gpuUtil gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
参考信息 Agent包下载配置
升级AOM 手动升级 一键迁移
云审计服务支持的关键操作 云审计服务支持的AOM操作列表 在CTS事件列表查看云审计事件
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
T时间 使用AK/SK认证时必选 20160629T101459Z Authorization 签名认证信息 该值来源于请求签名结果。 使用AK/SK认证时必选 - Host 请求的服务器信息,从服务API的URL中获取。值为hostname[:port]。端口缺省时使用默认的端口,https的默认端口为443
日志 查询日志 父主题: API
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
告警 查询事件类告警规则列表 新增一条事件类告警规则 更新事件类告警规则 删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则
弹性伸缩(即将下线) 创建策略 删除策略 更新策略 查看策略列表 查看单个策略 更新策略组属性 查询策略组属性 父主题: 历史API
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
Prometheus实例 卸载托管Prometheus实例 查询Prometheus实例 新增Prometheus实例 创建Prometheus实例的预聚合规则 获取Prometheus实例调用凭证 修改Prometheus实例 父主题: API
自动化运维(aom2.0接口) 创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
基本概念 应用资源管理 资源监控 自动化运维 采集管理
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
运维管理(即将下线) 安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件