检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点的时间与实际不同步。 如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。 父主题: 常见使用问题
输入模板名称,选择资源类型,设置指标名称、统计方式、阈值条件等参数。 统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Memcached Exporter是否部署成功,有指标数据返回则表示Memcached
DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN ModelArts服务默认自动将指标上报到AOM,其指标数据开箱即用。用户无需手动接入。 ModelArts指标的详细说明请参考基础指标-Modelarts指标。
执行时会忽略这些执行机,不显示在执行日志中。 解决方法 自动化运维在执行任务时会校验任务参数中的有效的执行机,请检查当前任务中配置的执行机是否都有效。 父主题: 运维管理(即将下线)
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.a创建的无状态工作负载,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图1 查看日志 输入命令验证Kafka Exporter是否部署成功,有指标数据返回则表示Kafka
Exporter接入AOM实现指标监控 应用场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Po
Prometheus实例内置的指标管理功能采集到自定义指标并上报指标到AOM。 表1 内置ServiceMonitor配置费用说明 ServiceMonitor 是否导致费用 默认状态(关闭表示不会采集自定义指标) etcd-server 会产生部分自定义指标,产生费用 关闭 kube-controller
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Redis Exporter是否部署成功,有指标数据返回则表示Redis
Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证MongoDB Exporter是否部署成功,有指标数据返回则表示MongoDB
源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
可能原因 需要被清理的目录或文件不存在。 当前时间减去被清理的文件或目录最后修改的时间小于指定清理的天数。 解决方法 检查需要被清理的目录或文件是否存在,若被清理的目录或文件存在,确保当前时间减去文件或目录最后修改的时间大于指定清理的天数。 例如,要成功清理1天前的文件,当前时间减去文件或目录最后修改的时间要大于24小时。
后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默、屏蔽需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则、创建静默规则和创建告警屏蔽规则。
配置AOM应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用、组件和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则说明发
配置应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
p_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接 无 NTP同步状态(aom_node_ntp_status) 该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 进程数
AOM支持您自定义全屏模式在线时长。 约束与限制 为提高安全性,请在不需要使用全屏模式进行监控时,及时退出全屏模式。 全屏模式在线时长与是否操作无关,只要超过已设时长,则退出到登录界面。 全屏模式在线时长优先级高于系统在线超时退出机制。 例如,登录控制台后,打开了AOM全屏界面
运维管理(即将下线) 安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件
告警规则详情填写说明 参数名称 参数说明 多指标 按设置的多个指标数据和对应告警条件进行计算,有两种计算方式: 满足以下“全部”指标判断条件时,触发告警。 满足以下“任意”指标判断条件时,触发告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标”文
les-template 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String 告警规则模板id。