检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
进入Prometheus配置页面 配置Grafana数据源参数。 URL:将URL设置为3获取的HTTP URL信息。 User:将User设置为3获取的用户名信息。 Password:将Password设置为3获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。
在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置应用信息的统计条件。 设置时间范围,查看已设时间范围内应用。可通过如下两种方式设置时间范围: 方式
企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,此处选择“Prometheus 通用实例”。 设置完成,单击“确定”。 父主题: 创建Prometheus实例
根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用AOM资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规
CMDB会强制校验环境和资源企业项目以及区域的一致性,如果不一致就不展示资源。 上述两种情况都一致还是看不到相应资源,则表示资源已经绑定环境,所以不显示在资源关联界面。用户设置关联状态为“已关联”,筛选后即可看到。 通过转移资源方式,可将一个资源绑定到多个环境,资源关联界面不支持重复绑定。 父主题: 应用资源管理(即将下线)
选择所属的企业项目。 描述 作业的描述信息,最多可输入1000个字符。 添加全局参数。 在“新建作业”页面,“全局参数”中,单击“添加全局参数”。 设置全局参数信息,具体的参数说明请参见表2。 图2 添加全局参数基本信息 表2 添加全局参数列表 参数名称 说明 添加方式 添加参数方式,包括新建和从参数库选择两种。
机)并按照界面提示设置日志查询条件。 支持分别搜索“组件”、“系统”、“主机”日志。 组件日志支持设置“集群”、“命名空间”、“组件”等过滤条件,还可以通过“高级搜索”,设置“实例”、“主机”、“文件名称”、“隐藏系统组件”等过滤条件搜索日志。 系统日志支持设置“集群”、“主机”等过滤条件。
“参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
用率指标,然后在“条件”设置处设置维度名称为RDS for MySQL实例、RDS for PostgreSQL实例等RDS实例类型,并选择对应维度值,即可过滤显示出特定RDS实例类型的CPU使用率指标。 单击“新增指标”可多次添加监控指标,并为指标设置统计周期等信息。将光标移动
、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计方式:指标数据按照所设置的统计方式进行聚合。 统计周期:指标数据按照所设置的统计周期进行聚合。 选择是否发送通
在页面右上角单击,根据需要在下拉列表中设置组件信息的统计条件。 设置时间范围,查看已设时间范围内组件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。 方式二:通过设置开始时间和结束时间,自定义时间段,最长可设置为30天。
为了方便查看,可以在主机列表上方设置运行状态、主机类型、主机名称、IP地址等过滤条件,实现主机列表过滤显示。 通过开启或关闭“隐藏控制节点”开关,自定义控制节点的展示与隐藏。系统默认隐藏控制节点。 单击“隐藏控制节点”后的,可同步主机信息。 在页面右上角设置主机信息的统计条件。 设置时间范围,查看
根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用AOM资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告警恢复通知后,当满足“高级设置-告警恢复”中设置的告警恢复条件,则按照选择的告警行动规则发送告警恢复通知。 图6 设置直接告警方式 告警降噪:对告警
S、CSS、DC、CBR、DMS、ELB、EVS、OBS、DDS、WAF 指标告警规则 单击“新增阈值告警规则”。 在弹出的“创建规则”对话框中设置规则名称、指标数据和告警条件等信息,设置方法请参见按全量指标创建指标告警规则中的5.d和6。 设置完成,单击“确定”。 CCEFromProm