检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
errorCode String 错误码 errorMessage String 详细信息 config 参见表4 策略组属性集合 表4 config数据结构说明 参数名称 参数类型 描述 id String 策略组属性ID max_instances Integer 最大实例个数 min_instances
且不能以下划线开头,您最多可创建10个自定义标签。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 告警标注特征 告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
application/json 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 meta_data MetaData object 查询结果元数据信息,包括分页信息等。 thresholds Array of QueryAlarmResult objects 阈值规则列表。 表4 MetaData
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
指定类型为application/json。 region 是 String Prometheus实例所属Region,一般为承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 表3 请求Body参数 参数 是否必选 参数类型 描述 prom_name 是 String Prometheus实例名称
批量查询 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 data Array of objects 分页查询的数据。 page_info Object 分页信息。 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String
y 和value只能包含中文、字母、数字和下划线。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则
架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 AOM提供基础运维能力,APM是对AOM运维能力的补充。AOM界面集成了APM,可通过AOM界面统一运维;APM也有独立的控制台入口,可以单独使用APM。 图1 立体化运维解决方案 父主题: 其他常见问题
删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则 修改告警行动规则 获取告警行动规则列表 查询指标类或者事件类告警规则列表 添加或修改指标类或事件类告警规则
单击“组件”列,某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“调用链”,切换至调用链页签,页面展示该组件调用链详情。 图1 调用链 通过选择实例、URL等查询条件查询,也可在界面下方新增自定义查询条件来查看调用链详情。详情请参考查看调用链。 父主题: 监控组件性能指标
时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
Agent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。 父主题: 常见使用问题
新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS
ReadOnlyAccess" ], "status" : true }, "ECS" : { "role_name" : [ "ECS CommonOperations", "ECS ReadOnlyAccess" ], "status" : true }
执行方案 从作业模板中挑选1个或多个步骤组合组成执行方案。是作业模板的实例化对象。 云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运