检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
体化运维管理平台,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。将ECS接入AOM后,可以通过AOM实时监控ECS主机状态,并提供告警通知。 本文以监控ECS主机的“node_network_up”指标为例,帮助您快速上手使用AOM。
资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防
指标维度格式 指标的维度标签必须符合AOM标准格式或普罗标准格式,才能将指标上报到AOM: AOM标准格式:可以包含大小写字母、数字、下划线,且必须以字母或下划线开头。 普罗标准格式:可以包含ASCII字母、数字以及下划线,且必须与正则表达式匹配[a-zA-Z_][a-zA-Z0-9_]*。
节点:待关联的节点,直接从下面的应用树中选择需要的节点,或输入关键字搜索后选择。 设置完成后,单击“确认”。 更多操作 标签新增完成后,您可以在标签列表中查看标签的名称、描述、更新时间和创建时间,还可执行表2中的操作。 表2 相关操作 操作 说明 修改标签 单击“操作”列的“编辑”。
String 所属project ID。 version String UniAgent版本。 is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。
条数,并生成日志指标。 图1 创建统计规则 统计规则创建完成后,会生成以统计规则名称命名的指标。 更多统计规则操作 创建完统计规则后,您还可以执行更多统计规则操作中的操作。 表1 相关操作 操作 说明 查看统计规则 在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则
同一个应用下,最多可创建3层子应用。 同一个应用下,最多可创建50个子应用。 同一个应用下,最多可创建50个组件。 设置完成后,单击“确认”。 更多操作 节点创建完成后,您可以在应用树中执行表2中的操作。 表2 相关操作 操作 说明 添加子节点 将光标移至待操作的节点名称后,单击,添加子节点,具体操作请参见添加节点。
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Memcached Exporter是否部署成功,有指标数据返回则表示Memcached
消息通知服务 消息通知服务(Simple Message Notification,简称SMN)可以依据您的需求主动推送通知消息,最终您可以通过短信、电子邮件、应用等方式接收通知信息。您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。 AOM使用SMN提供的消息
时间范围:可选择查询最近1小时、最近1天、最近1周的操作事件,也可以自定义最近7天内任意时间段的操作事件。 在事件列表页面,您还可以导出操作记录文件、刷新列表、设置列表展示信息等。 在搜索框中输入任意关键字,按下Enter键,可以在事件列表搜索符合条件的数据。 单击“导出”按钮,云审计服务会将查询结果以
知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。 图5 事件类告警规则 更多事件类告警规则操作 事件类告警规则创建完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 修改事件类告警规则 单击“操作”列的“修改”。 删除事件类告警规则 删除一个事件类告警规则:单击“操作”列的“删除”。
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.a创建的无状态工作负载,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图1 查看日志 输入命令验证Kafka Exporter是否部署成功,有指标数据返回则表示Kafka
指标类型等信息。 查看CCE类型Prometheus实例的指标:可以通过集群名称、Job名称或指标类型筛选指标,也可以通过输入指标名称中的关键字进行模糊搜索指标。 查看云服务类型Prometheus实例的指标:可以通过指标类型或资源类型过滤显示指标,也可通过输入指标名称中的关键字进行模糊搜索指标。
汇报或展示时,出现断点的指标图表不太美观,您可通过切换插值为0或null的方式,对缺失的指标数据进行断点插值,进而规避掉断点。 插值方式您可以选择null、0。 null:默认设置,断点处使用空值表示。如下图所示: 图1 插值方式为null 0 :断点处使用0表示。如下图所示: 图2
告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。 图1 自定义静态阈值模板 单击“立即创建”。 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图3 查看日志 输入命令验证MySQL Exporter是否部署成功,有指标数据返回则表示MySQL
没有消息通知服务的访问权限? 以IAM用户登录AOM,当创建或修改阈值规则、通知规则、静态阈值模板时,“选择主题”参数下提示:“抱歉,您没有消息通知服务的访问权限”,如下图所示。 问题分析 原因:该问题是由于您是以IAM用户登录AOM,但IAM用户没有消息通知服务的访问权限导致的。
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证MongoDB Exporter是否部署成功,有指标数据返回则表示MongoDB
从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持 数据订阅 支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 支持 支持 采集管理 通过UniAgent调度采集
CCE接入”。当前仅华南-广州区域的菜单路径为“采集设置 > CCE集群管理”。 您可以对已接入的CCE集群中的主机进行ICAgent插件的安装、升级和卸载操作: 安装ICAgent插件:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。