检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus监控 “√”表示支持,“x”表示暂不支持。 表1 prometheus监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1
管理日志接入LTS规则 AOM支持本章为您介绍如何管理日志接入LTS规则,支持添加、查看、删除日志接入LTS的规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并
AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。详细的功能对比请参见AOM 2.0与AOM 1.0版本的功能特性对比。
如何将Prometheus数据接入到AOM? 将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报到
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象
管理访问凭证 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。每个用户只能创建一个凭证。 新建凭证 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > 访问凭证”,进入访问凭证页面。 单击“
绑定到应用 选择CMDB中创建的应用绑定。 如果开启了“应用洞察”功能,才会出现该配置项。开启“应用洞察”功能的详细操作请参见配置AOM菜单开关。 分组类型 分组类型包含“已有分组”和“新建分组”两种类型。 已有分组:从下拉列表中选择已有的仪表盘分组。
AOM告警规则状态为什么显示“数据不足”? AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足
AOM展示的日志是否为实时日志? AOM展示的日志为近实时日志,日志存在秒级时延。 日志从采集上报到处理需要一定的时间,日志量较小时日志会存在10秒左右的时延,日志量特别大时时延会更长。 父主题: 日志分析
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
自动化运维 “√”表示支持,“x”表示暂不支持。 表1 自动化运维 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 创建任务 POST /v1/{project_id}/cms/workflow cms:workflow
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则
含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型 描述 scale_unit Integer 扩缩容实例数 响应示例 { "errorCode" : "SVCSTG.PE.0",
Prometheus实例 “√”表示支持,“x”表示暂不支持。 表1 Prometheus实例 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 卸载托管Prometheus实例 DELETE /v1/{project_id
管理中间件采集任务 当为中间件成功接入AOM后,您可以在接入中心管理中间件接入AOM时创建的采集任务。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入新版接入中心页面。当前仅华南-广州区域的菜单路径为“接入中心 > 接入中心”。 如果您进入的是旧版接入中心