检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
体化运维管理平台,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。将ECS接入AOM后,可以通过AOM实时监控ECS主机状态,并提供告警通知。 本文以监控ECS主机的“node_network_up”指标为例,帮助您快速上手使用AOM。
ICAgent的控制端口 30201: ICAgent的控制端口 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。 是否可通过拷贝已安装ICAgent节点镜像的方式安装其他节点?
emplate/{name} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 name 是 String 消息通知模板名称。 请求参数 表2 请求Header参数
project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String 具体的服务发现规则ID,可以精确匹配到一条服务发现规则。不传时返回project下所有服务发现规则的列表。
PodUID/ContainerName:Pod的ID/容器名称。 PodName/ContainerName:Pod名称/容器名称。 采集路径 设置采集路径可以更精确的指定采集内容,当前支持以下设置方式: 不设置则默认采集当前路径下.log .trace .out文件。 设置**表示递归采集5层目录下的
节点:待关联的节点,直接从下面的应用树中选择需要的节点,或输入关键字搜索后选择。 设置完成后,单击“确认”。 更多操作 标签新增完成后,您可以在标签列表中查看标签的名称、描述、更新时间和创建时间,还可执行表2中的操作。 表2 相关操作 操作 说明 修改标签 单击“操作”列的“编辑”。
迁移完成后,单击过“迁移完成”弹框中的“开始使用AOM 2.0”,再次进入AOM 1.0控制台会自动跳转到AOM 2.0控制台。如果需要回到AOM 1.0控制台,可以在AOM 2.0控制台左侧导航栏中单击“返回旧版”。 图4 迁移完成 父主题: 迁移AOM 1.0数据至AOM 2.0
级定义了不同客户的宽限期和保留期时长。 图1 按需计费AOM资源生命周期 避免和处理欠费 欠费后需要及时充值,详细操作请参见账户充值。 您可以在“费用中心 > 总览”页面设置“可用额度预警”功能,当可用额度、通用代金券和现金券的总额度低于预警阈值时,系统自动发送短信和邮件提醒。
with-http_stub_status_module ,则说明Nginx 已启用 stub_status模块。 如果未输出任何结果,则可以使用 --with-http_stub_status_module 参数重新配置configure文件,来编译一个Nginx。示例如下:
“39338”和“39339”,用于查询日志级别,采集任务等。 其他相关操作 您可以对已安装UniAgent的主机执行如下相关操作: 表5 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过服务器ID,服务器名称,运行状态来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器
“39338”和“39339”,用于查询日志级别,采集任务等。 其他相关操作 您可以对已安装UniAgent的主机执行如下相关操作: 表5 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过服务器ID,服务器名称,运行状态来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
etheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM支持以下原生Prometheus的API:
告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。 图1 自定义静态阈值模板 单击“立即创建”。 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。
如果需要在AOM控制台中使用CES的功能,需要提前获取CES的相关权限,详情请参见CES权限管理。 “告警屏蔽”功能当前仅华南-广州区域受限开放,如有需求可以通过提交工单,为您开放此功能。 AOM 2.0融合CES相关功能后,会向AOM FullAccess策略中添加“CES:*:*”,“ecs
机状态为“异常”。 主机监控 在左侧导航栏中选择“主机监控”,查看主机列表。 为了方便您查看主机列表,您可以: 单击右上角图标对主机列表进行过滤显示,实现隐藏控制节点。 可以在主机列表上方设置过滤条件,实现主机列表过滤显示。 您可根据需要选择是否对主机执行如下操作: 添加别名 当
从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持 数据订阅 支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 支持 支持 采集管理 通过UniAgent调度采集
rules-template 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String
/var/opt/oss/servicemgr/ICAgent/bin/manual/mstop.sh 登录AOM控制台的“采集管理”界面,查看ICAgent状态是否可以显示。 ICAgent状态正常显示 => 结束。 ICAgent状态仍然不显示 => 请联系技术支持工程师处理。 父主题: 采集管理
根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。 告警级别+等于+紧急、重要 告警源+等于+AOM 行动规则