检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理
2023-09-30 新增以下章节: AOM与CES的云服务监控功能对比 安全 优化以下章节: 基础指标:容器指标 2023-09-15 删除“计费说明”章节。 2023-08-04 删除“基础指标-云服务指标”章节。 2023-06-30 新增以下章节: 与AOM 1.0对比 基础指标:IoTDA指标
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
导致通知发送失败 为主题添加相关的订阅者,即通知的接收人(例如,邮件或短信),SMN可以实时地将告警信息以广播的方式通知这些订阅者,操作详见订阅主题。 例如,订阅者设置为该运维人员的邮箱。 创建通知规则:输入规则名称,选择通知条件,选择2中已创建的主题,根据实际选择时区/语言,输
更目标主机。 切换采集任务的排序 在采集任务列表的表头,单击“超时时间”或“采集周期”列的可切换采集任务的排序。为默认排序,为按时间正序排序(即最大时间显示在最后方),为按时间倒序排序(即最大时间显示在最前方)。 复制采集任务 单击采集任务对应操作列下的,进入创建采集任务页面,修改参数配置。
401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。 父主题: 自动化运维(aom2.0接口)
选择对应日志组、日志流下的可视化图表,单击“确定”。若该日志流下没有图表或没有所需的图表,单击界面上的“前往添加图表”,进入可视化界面,设置完成后单击“保存并返回”返回到告警规则界面,自动打开创建规则弹框,填充新创建的图表及图表的查询语句。 可以指定图表的查询时间(1 ~ 60分钟/1
在下拉列表中选择已创建日志组。如果没有可用的日志组,可单击“ELB日志接入LTS”创建新的ELB接入日志组。 所属日志流 在下拉列表选择已创建日志流。单击“日志预览”可查看该日志流包含的日志数据。 日志结构化 单击“结构化”,将选择的日志数据结构化处理。结构化配置的字段默认显示在下方列表中。 设置完成后,单击“下一步”。
Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
可能原因 通过cmdb树选择云服务资源执行任意任务时,会校验已选择的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,将不会操作这些资源。 解决方法 检查需要操作的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,重新选择子项目或将需要操作的资源添加到该子项目下。查看资源信息的详细操作请参考资源管理。
Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴
AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 添加采集任务 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 请求响应成功,下发任务成功。 401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。
401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。 父主题: 自动化运维(aom2.0接口)
http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 添加采集任务 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。
说明 搜索云服务 在“云服务接入”界面搜索框中输入关键字,即可搜索云服务。 取消接入云服务 在“云服务接入”界面右侧已接入云服务下单击需要取消接入的云服务卡片,在弹出的对话框中单击“取消接入云服务”。 查看/修改已接入的云服务标签配置 在“云服务接入”界面单击已接入云服务下的云服务卡
401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。 父主题: 自动化运维(aom2.0接口)