检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
中心总览。 接入完成后,即可在“接入管理”的“指标接入规则”页签下查看配置的指标接入规则。 您还可以根据需要执行表1中的相关操作。 表1 相关操作 操作 说明 搜索指标接入规则 单击搜索框,可以根据“接入配置名称”、“接入方式”、“状态”搜索指标接入规则,也可以直接在搜索框中输入关键字搜索指标接入规则。
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?
在搜索文本框中输入关键词时,搜索规则如下: 支持关键词精确搜索。关键词指相邻两分词符之间的单词,通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时即可使用切分后的单词进行搜索。如果不确定关键词相邻的分词符是否已配置,建议使用关键词模糊匹配搜索方式。 支持关键词模糊匹配搜索,关键词不能以“?”
支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持 数据订阅 支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS
内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set 5.12.96 新增云资源发现类型 5
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
操作日志 操作日志会记录显示用户对UniAgent和其他插件执行安装、升级、卸载日志操作。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中,选择“采集设置 > 操作日志 > UniAgent操作日志”。 可
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置
在常用中间件Exporter接入AOM中,已经提供部分常用中间件Exporter接入指导,您可以参考相关实践步骤,在CCE集群中部署其他的Exporter,并配置CCE集群指标采集规则,然后进行验证。 父主题: CCE容器场景自建中间件接入AOM实现指标监控
在常用中间件Exporter接入AOM中,已经提供部分常用中间件Exporter接入指导,您可以参考相关实践步骤,在CCE集群中部署其他的Exporter,并配置CCE集群指标采集规则,然后进行验证。 父主题: CCE容器场景自建中间件接入AOM实现指标监控
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" }, "annotations" : {
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
化、自动化。 应用资源管理 通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQL数据上报,也可通过API等方式上
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
组规则无法满足需要,可在下拉列表中单击“新建分组规则”添加,具体操作请参见创建分组规则。 所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建完成后,单击“返回告警规则列表”可查看已创建的告警规则。
桶中,以便进行长期存储。 日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
单击“结构化”,将选择的日志数据结构化处理。结构化配置的字段默认显示在下方列表中。 设置完成后,单击“下一步”。 设置指标配置的相关信息。 单击“添加接入指标”,为创建的日志指标规则添加指标数据。具体的参数说明请参见表2。 图2 添加接入指标 表2 指标配置参数说明 类别 参数 设置方法 基本信息