检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置AOM菜单开关 AOM支持用户自定义选择在控制台导航栏中显示或隐藏“概览”、“应用洞察”、“自动化运维”、“云服务监控”、“业务监控”等功能。 配置AOM菜单开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“菜单开关”,所有
如果没有创建过OBS桶,请单击“查看OBS”跳转到OBS界面进行创建。 首次配置一次性转储到未授权的OBS桶中时,AOM服务会授权给OBS桶ACL规则,授权生效需要15分钟,如果您第一次配置一次性转储后失败,请15分钟后重试。 不支持转储到存储类型为归档存储或配置了跨区域复制的OBS桶。 obs-store-test
log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。更多关于日志采集路径的说明请参见:配置日志采集路径。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”,在“配置中心 > 采集开关”页签,将“日志采集开关”置于“开启”状态。
扩展的计算服务器,同时它结合虚拟私有云、虚拟防火墙、数据多副本保存等能力,为您打造一个高效、可靠、安全的计算环境,确保您的服务持久稳定运行。弹性云服务器创建成功后,您就可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。 您购买了弹性云服务器(弹性云服务器操作系统需
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM 安装并启动开源版Prometheus,具体操作请参见Prometheus官方文档。(如果已经部署并正在使用开源
图7 关联资源 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需要单击“关联资源&安装Agent”,在关联资源后继续完成Agent安装。安装Agent的详情操作请参见安装UniAgent。 配置告警 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建和按Prometheus命令创建。
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
ICAgent安装成功后,无法在界面上获取到ICAgent状态 问题描述 ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
监控。具体操作,请参见:管理Prometheus实例。 约束与限制 目前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持数据多写功能。 CCE类型的Prometheus实例中配置的预汇聚规则指标暂不支持数据多写。 AOM汇聚生成的部分默认指标,例如:aom_me
ReadOnlyAccess" ], "status" : true }, "ECS" : { "role_name" : [ "ECS CommonOperations", "ECS ReadOnlyAccess" ], "status" : true }
变量信息。 当在消息模板中添加“TMS标签: $event.annotations.tms_tags;”变量时,需要在配置告警消息内容显示资源的TMS标签开关配置中打开“告警消息内容显示资源的TMS标签开关”开关后,该变量才会生效。 选择“邮件”方式发送通知时,可单击“预览”查看
"resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签 }, "annotations"
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
组规则无法满足需要,可在下拉列表中单击“新建分组规则”添加,具体操作请参见创建分组规则。 所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。 创建成功的告警模板默认会显示到“自定义模板”页签下。 只要资源或指标满足告警模板中设置