检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于CMDB模型,从应用、组件到环境对资源健康状态分层监控。 部分支持 不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对
选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。 命令行输入:提供手动输入和系统自动填充两种输入方式。
"in_execution" : [ ], "not_performed" : [ ], "success" : [ ] }, "status" : "success" } ], "last_record_id_with_snapshot" : "xxxxxxx"
组、日志流、关键词、查询语句可跳转到具体详情页面,查看更详细的数据。 关联CCE类型Prometheus实例的告警规则触发的告警:单击告警详情页中涉及容器相关资源的cluster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。
"aom_alarm_rule", "result" : "success" } ], "error_code" : "200", "error_message" : "success" } 状态码: 400 BadRequest 非法请求。建议直接修改该请求,不要重试该请求
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes 挂载的文件系统占用空间
应用名称。 clusterId 是 String CCE集群ID。 hostIP 否 String 日志所在虚拟机IP。 nameSpace 否 String CCE容器集群的命名空间。 pathFile 否 String 日志文件名称。 podName 否 String 容器实例名称。
添加日志转储 接入LTS 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 登录AOM 2.0控制台。 在左侧导航栏选择“日志分析
、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签+aom_mon
"isEditor" : false, "key" : "properties.cmsAccessPodLb" }, { "default" : "", "showFormat"
/api/v1/label/job/values 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : [ "node", "prometheus" ] } 状态码: 400 BadRequest 非法请求。建议直接修改该请求,不要重试该请求。
query=up&time=1630124012 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : { "resultType" : "vector", "result" : [ ] }
ct_id}/aom/api/v1/labels 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : [ "__name__", "call", "code", "config", "dialer_name"
_id}/aom/api/v1/metadata 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : { "aggregator_openapi_v2_regeneration_count" : [ {
告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。 告警级别+等于+紧急、重要 告警源+等于+AOM 行动规则 告警行动规则关联SMN主题与消息模板,当日志、资源或指标数据满足
/{execution_id}/terminate 响应示例 状态码: 200 终止任务执行成功。 { "result" : "success" } 状态码: 400 BadRequest。非法请求。建议直接修改该请求,不要重试该请求。 { "error_code" : "AOM
&end=1630127612&step=15s 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : { "resultType" : "matrix", "result" : [ {
action=skip&node_id=xxxxxxx 响应示例 状态码: 200 请求响应成功,任务状态已改变。 { "result" : "success" } 状态码: 401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。
orkflow_id}/trigger/action?action=enable 响应示例 状态码: 200 任务启停操作成功 {"success"} 状态码: 400 BadRequest。非法请求。建议直接修改该请求,不要重试该请求。 { "error_code" : "AOM
自动化运维使用限制 限制项 说明 任务 单个操作ECS的任务最多支持选择100个实例。 单个操作RDS的任务最多支持选择20个实例。 单个操作CCE负载的任务最多支持选择10个实例。 作业 单用户支持最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。