检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“集成中心”界面,单击“接入集群”,在集群列表中可以查看集群信息、安装状态和采集状态。 图1 查看集群接入信息 根据需要,选择需要接入的集群,单击该集群右侧的“一键安装”,为集群安装Prometheus插件。 图2 接入CCE集群 等待安装成功,单击“关闭”即可接入该CCE集群,并将集群关联到当前Prometheus实例。
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理(日落)
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
将AOM仪表盘图表页面嵌入用户自建系统 AOM支持将仪表盘图表页面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至用户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。 应用场景 该功能主要用于用户可
${message};\\n最新指标值: ${current_data};\\n本消息是由${domain_name}在AOM告警规则中配置;\"},{\"subType\":\"wechat\",\"version\":\"v2\",\"content\":\"告警名称:${event_name};
采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
00001"],value格式为["/xxx/xx.log"],表示当启动命令是00001时,日志路径为/xxx/xx.log。 日志路径配置规则。详见表8。 表4 discoveryRule参数 参数 是否必选 参数类型 取值范围 描述 checkType 是 String cmdLine、env、scope
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
ICAgent和UniAgent是同一个插件吗? ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(IC
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效
创建分组规则 使用分组规则,可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方
创建策略 功能说明 该接口用于创建策略。 策略名称必须为以0~9、a~z、A~Z、下划线(_)或中划线(-)组成的1~64位字符串,且必须以字母开头。 同一伸缩组下的策略,相同指标(metric_name)的metric_operation为“>”的metric_threshol
、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用App监控功能,华北-北京四区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关。 App监控功能当前仅在华北-乌兰察布二零一、华北-北京一、华北-北京四、华南-广州、西南-贵阳一、亚太-
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置
更新策略 功能说明 该接口用于修改策略规则。 告警策略支持更新,定时和周期策略不支持更新。 URI PUT /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID
事件根因分析 事件根因分析服务提供异常事件快速根因定位分析的功能,根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位根因。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围:
指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建阈值规则等操作,以便实时查看业务及分析数据关联分析。 监控指标 在左侧导航栏中选择“监控 > 指标浏览”。 选择指标: 华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并