检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
为了保障租户主机和组件的正常运行,租户的主机上会运行部分系统提供的组件(例如,kube-dns),查询租户日志时也会查询到这些组件的日志。 在“上下文显示行数”下拉列表框中,可设置该条日志的上下文原始数据显示行数。 例如,设置“上下文显示行数”为“200”。 若该日志之前已打印的日志条数 ≥100,该日志之后已打印的日志条数
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理
在调用接口时,部分URI中需要填入用户名称、用户ID、项目名称、项目ID,在“我的凭证”页面可以获取这些信息。 登录控制台。 单击右上角已登录的用户名,在下拉列表中单击“我的凭证”。 在“API凭证”界面,可以查看用户名称、账号ID、项目名称、项目ID。 调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。
配置管理 ICAgent管理(华为云主机) ICAgent管理(非华为云主机) 接入管理 日志配置 配额设置 指标配置 数据订阅
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
“LTS” “AOM” monitor_objects 否 Array of Map<String,String> objects 监控对象列表。键值对形式,键值为: “event_type”:通知类型 “event_severity”:告警级别 “event_name”:事件名称
行日志。 正则表达式:此配置是用来标识一条日志数据的正则表达式。 单击“立即接入”。 配置接入完成后该配置会显示在对应的应用与组件接入配置列表中。 查看和管理接入配置 您可以在日志接入界面对已添加的接入配置进行搜索、查看、编辑和删除。 搜索 在“日志接入”界面左侧选择需要查看接入
选择某一环境,在右侧区域查看当前环境信息、进程信息、性能、日志分析、调用链以及告警信息。 图5 查看环境 在“环境概览”区域的应用树中,单击某个资源或云服务,右侧列表中展示对应资源或云服务信息。单击某个实例名称,可查看对应实例的指标、告警、日志等信息。 在“概览”页签,展示环境指标以及应用层和基础设施类信息。
云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件
若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。
规则发现部分,数组中有多个对象时表示需要同时满足所有条件的进程才会被匹配到。详见表4。 attrList 否 Array cmdLine、env 属性列表(暂不使用,可不传)。 isDetect 是 String true、false 是否为规则预探测场景(预探测场景不会保存规则,仅用于规则下发之前对规则正确性的检测)。
GET方法查询瞬时数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query 表1 路径参数
元数据查询 功能介绍 该接口用于查询指标的元数据。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/metadata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
批量删除阈值规则 功能介绍 该接口用于批量删除阈值规则 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alarm-rules/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据 配置Remote Write地址实现自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据