检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
卸载托管Prometheus实例 DELETE /v1/{project_id}/aom/prometheus aom:metric:delete √ √ 查询Prometheus实例 GET /v1/{project_id}/aom/prometheus aom:metric:list √ √ 新增Prometheus实例
AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 创建云监控告警规则 云监控服务支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。 告警模板 告警模板是一组
告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。 图1 自定义静态阈值模板 单击“立即创建”。 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。
请在界面上查看对应的阈值规则是否存在。 400 AOM.02005404 The rule does not exist. 要删除的规则不存在 请在界面上查看对应的阈值规则是否存在。 400 AOM.02004404 The rule does not exist. 要查询的规则不存在
tile")或运算符(例如:"and"、"or"、"unless")作为自定义指标名称,并将该自定义指标上报到AOM时,为避免promql查询时有误,AOM会将此类指标名称默认增加前缀“aom_prom_fixed_”。例如:原始自定义指标名称为"count",会被自动转换为“a
据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天
conditions 是 参见表5 conditions最多5个,最少1个 匹配条件内容。一个规则可以有多个条件,多个条件之间的关系是“并且”,内部描述了多个详细匹配条件。一个条件可以描述一个metric的匹配方式。 actions 是 参见表6 actions最多5个,最少1个 指定策略匹配成功后执行的动作。
字符长度小于64位,以小写字母(a-z)开头,只能包含0-9/a-z/-,不能以-结尾。 规则名称。 createTime 否 String - 创建时间(创建时不传,修改时传查询返回的createTime) enable 是 Boolean true、false 规则是否启用。 hostid 否 Array - 主机ID(暂不使用,传空即可)。
/v2/{project_id}/push/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 action 否 String
=> 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent
=> 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent
gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0
消息模板中通过$event.annotations.key2变量获取标注信息,具体请参见消息模板变量说明。 管理告警标签和告警标注 用户可以在告警规则界面对告警标签或告警标注进行增删改查。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 单击“创建”
关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
alarm_rule_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 alarm_rule_id 是 String 阈值规则ID。 请求参数 表2
m-rules/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。 图5 事件类告警规则 更多事件类告警规则操作 事件类告警规则创建完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 修改事件类告警规则 单击“操作”列的“修改”。 删除事件类告警规则 删除一个事件类告警规则:单击“操作”列的“删除”。
discoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 appRulesIds
/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token