检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
若没有合适的消息模板,请单击消息模板选择栏右侧“创建消息模板”,新建消息模板,操作详见创建消息模板。 设置完成后,单击“确定”。 更多操作 告警行动规则创建完成后,您还可以执行表2中的相关操作。 表2 相关操作 操作 说明 编辑告警行动规则 单击“操作”列的“编辑”。 删除告警行动规则 删除单条规则:单击对应
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 “日志采集
Prometheus实例读写地址支持公网的局点 华为云用户应使用公网Remote Read地址和Remote Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明
的,自定义列表项的展示。单击“接入日志组”列的日志组名称,可以跳转到LTS控制台的日志组详情。 编辑 单击“操作”列的“编辑”,可以编辑该接入规则。修改接入规则的影响请参见修改映射。 删除 单击“操作”列的“删除”,可以删除该接入规则。勾选多个规则名称前的复选框,单击“批量删除”,可批量删除接入规则。
在主机上手工安装ICAgent后提示安装成功,但采集器管理器界面上提示状态异常? 状态异常说明您安装的AK/SK等凭据不正确,或者使用委托安装的方式但没有设置委托导致,请参考如何通过创建委托获取AK/SK,获取AK/SK重新安装ICAgent即可。 父主题: 采集管理
的,自定义列表项的展示。单击“接入日志组”列的日志组名称,可以跳转到LTS控制台的日志组详情。 编辑 单击“操作”列的“编辑”,可以编辑该接入规则。修改接入规则的影响请参见修改映射。 删除 单击“操作”列的“删除”,可以删除该接入规则。勾选多个规则名称前的复选框,单击“批量删除”,可批量删除接入规则。
涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。 获取指定告警行动规则的详细信息 接口相关信息 URI格式:GET /
在Prometheus实例详情页面的“指标管理”中不能废弃以aom_prom_fixed_作为前缀的指标,且该指标上报到AOM时会收费。 原因分析 当用户使用普罗函数(例如:"count"、"max"、"min"、"avg"、"sum"、"count_values"、"stddev"、"stdv
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快
通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
日志费用说明 初次使用AOM时,默认为您开通基础版套餐包,该版本包含免费额度,如日志读写流量免费额度为500MB,超过额度的部分将自动按需收费。 AOM中日志相关功能由云日志服务LTS提供,并由LTS统一上报日志、话单,AOM不重复计费。如需停止计费请参见:如何停止日志功能,不再收费?
Agent版本2.4.10-profiler及以后版本,支持Debugging诊断。 表2 使用限制以及说明 序号 使用限制及说明 1 Debugging诊断需要环境中含有jdk8或者jdk17,如果仅有JRE则无法使用。 2 Debugging诊断仅支持JAVA语言。 性能影响 Debuggi
在左侧导航栏单击“指标管理”,在“指标”页签下即可查看当前Prometheus实例所有指标的指标名、指标类型等信息。 还可以通过集群名称、Job名称或指标类型筛选指标,也可以通过输入指标名称中的关键字进行模糊搜索。 表1 指标参数说明 参数 说明 指标名 指标的名称。 指标类型 指标的类型,包含基础指标和自定义指标。
CPU内核占用(aom_process_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(
界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。
按需版分为按量后付费和预付费套餐包(其中预付费套餐包又分为专业版套餐包和企业版套餐包),计费详见AOM-价格说明。 AOM与其他云服务组合使用,为您提供通知发送、日志转储、性能管理等功能,这些功能可能产生额外费用,具体费用由提供该功能的云服务结算。 阈值规则和告警通知:依赖消息通
添加日志桶 日志桶是对日志文件逻辑上的分组。用于以日志桶为单位查看日志等,使用这些功能前您需先添加一个日志桶。 注意事项 每个日志桶最多可添加500个日志文件。 同一个日志桶中只能添加同一个集群的日志文件。 添加日志桶 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”。