检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
云资源与应用的开通与复制;同时在示例模板中提供了海量的免费应用模板,覆盖各热点云服务应用场景,方便您直接使用或为您设计个性化模板提供参考。 通过AOM界面您可监控RFS的基础资源和运行在其上的应用,同时在AOM界面还可查看相关的日志和告警。 应用管理与运维平台 应用管理与运维平台
入云服务标签”下“指标维度是否增加云服务标签”的开关并单击“立即接入”。 如图1所示,即可接入DCS服务与标签。 图1 接入云服务和标签 步骤三:告警添加标签 验证云服务指标与标签是否接入。 在左侧导航栏中选择“指标浏览”。 在“指标源”页签下选择3创建的云服务类型Prometheus实例。
数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
ML”,将"url"修改成Prometheus的访问域名。 修改以上两个配置文件之后,重启grafana pod,即可查看到监控数据。 父主题: 常见使用问题
由浅入深,带您玩转AOM 01 了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提
em、Network等。通过给弹性云服务器 ECS主机安装Node Exporter插件来创建采集任务,即可将相关指标上报到AOM。 约束与限制 一个主机只能安装一个Node Exporter插件。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
率和是否启用告警行动规则。 通知频率:发送告警通知的频率,请根据需要从下拉列表中选择。 行动规则:启用告警行动规则后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有列表中的告警行动规则无法满足需要,可在下拉列表中单击“新建告警行动规则”添加。设置告警行动规则的操作详见配置告警行动规则。
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
自动化运维只读权限,拥有该权限的用户仅能查看自动化运维数据。 系统策略 应用资源管理常用操作与系统权限 表2列出了应用资源管理常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表2 应用资源管理常用操作与系统权限的关系 操作 AOM FullAccess AOM ReadOnlyAccess
关闭。 通知人配置:在下拉列表中选择“通知人”,可以选择一个或者多个。 也可以通过“创建主题”的方式选择。通过选择“主题”的方式配置通知人,需要先通过“创建主题”创建一个新主题,并为这个主题添加订阅,之后即可通知。 执行失败通知 任务执行失败时,发送通知给相关人,系统默认开关关闭。
java9提示反射使用告警,后期针对java9以上版本会避免这个问题 规避措施:设置illegal-access = warn (仅提示)或者删除该选项。 父主题: 采集管理
到容器。通过各层状态,您可完成对组件的立体监控。 主机监控 通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 容器监控 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。
0表示正常 1表示异常 无 aom_node_ntp_offset_ms NTP偏移量 该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态
AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。 cat
Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。
配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。 以“仪表盘”页面为例,时间范围与统计周期的关系如下表所示。
设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 设置是否启用告警行动规则。启用告警行动规则后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见告警行动规则。 启用