检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警数据到Kafka队列中,可从分布式消息服务的Kafka队列中获取消费日志或阈值告警数据。分布式消息服务Kafka版-价格说明 应用性能管理:AOM集成了应用性能管理服务(简称APM),方便提供更高级的运维能力。APM-价格说明
在“采集任务”页签中,您可以对该中间件已创建的采集任务进行管理。具体操作如下: 表1 相关操作 操作 说明 查看采集任务 单击采集任务名称,跳转到采集任务的详情页,可以查看该采集任务的详细配置信息。 启动/停用采集任务 单击采集任务对应启停列下的按钮,可控制采集任务开启和暂停。 搜索采集任务
默认展示资源Top5图表,通过单击“显示Top15”、在图表任意处双击或在“操作”列选择“放大”,均可查看资源Top15图表。 如果您需监控所有集群下的所有资源的Top5数据,可在“监控概览”界面查看,也可将“监控概览”界面的资源Top5数据添加到仪表盘。 资源TopN图表的标题支持您自定义,标题默认命名为资源类型(集群名称)。
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
卸载托管Prometheus实例 DELETE /v1/{project_id}/aom/prometheus aom:metric:delete √ √ 查询Prometheus实例 GET /v1/{project_id}/aom/prometheus aom:metric:list √ √ 新增Prometheus实例
例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 告警管理 告警列表是告警和事件的管理平台。 对于重点
触发脚本执行、文件管理、服务场景以及作业管理等操作)。 可能原因 账号欠费、冻结或受限,会导致定时任务无法正常触发。 解决方法 账号欠费:客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。 账号冻结或受限:云服务资源因欠费冻结或受限时,若
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
tile")或运算符(例如:"and"、"or"、"unless")作为自定义指标名称,并将该自定义指标上报到AOM时,为避免promql查询时有误,AOM会将此类指标名称默认增加前缀“aom_prom_fixed_”。例如:原始自定义指标名称为"count",会被自动转换为“a
磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
该指标用于统计该内存workingset的使用量,即RSS内存和缓存的总和。 ≥0 兆字节(MB) 表2 容器指标维度 维度 说明 appID 服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName
监控总览 监控概览 仪表盘
日志配置 设置日志配额 配置分词 采集开关 父主题: 配置管理
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
权限策略和授权项 权限和授权项说明 策略授权参考
历史API 弹性伸缩(即将下线) 监控(即将下线)
指标总览 简介 基础指标:虚机指标 基础指标:容器指标 基础指标:Modelarts指标 基础指标:IEF指标 基础指标:CSE指标 基础指标:IoTDA指标 基础指标:node-exporter指标 基础指标:Flink指标 指标维度