检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面上显示状态异常。 问题原因 状态异常说明您安装的AK/SK等凭据不正确,或者使用委托安装的方式但没有设置委托导致ICAgent状态异常。 解决方法 请参考如何通过创建委托获取AK/SK,获取AK/SK重新安装ICAgent即可。
根据组件名称查询组件详情 功能介绍 该接口用于查询组件详情。 调用方法 请参见如何调用API。 URI GET /v1/components/application/{application_id}/name/{component_name} 表1 路径参数 参数 是否必选 参数类型
查询指标类或者事件类告警规则列表 功能介绍 查询AOM2.0指标类或者事件类告警规则列表。 调用方法 请参见如何调用API。 URI GET /v4/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
us_JVM_CPU_Time jobmanager中JVM使用的CPU时间。 无 flink_jobmanager_Status_ProcessTree_CPU_Usage JobManager 中JVM的CPU使用率。 无 flink_taskmanager_Status_JVM_CPU_Load
配额设置 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 登录AOM控制台。 选择“配置管理 > 配额设置”。 查看指标配额。 图1 查看配额 当指标超过配额时,时间较早的指标将会被删除。 父主题: 配置管理
仪表盘变量列表。 display String 是否展示。 query_count String 查询总次数。 time_range String 默认查询时间范围。 请求示例 查询仪表盘id为f804-03-4f-b**9-bf32f**f的详情 https://{Endpoi
仪表盘变量列表。 display String 是否展示。 query_count String 查询总次数。 time_range String 默认查询时间范围。 请求示例 查询所有仪表盘详情 https://{Endpoint}/v2/{project_id}/aom/dashboards
快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
查询仪表盘分组列表 功能介绍 该接口用于查询仪表盘分组列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/aom/dashboards-folder 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项
通过helm部署pod后,AOM无法查找到工作负载 问题描述 通过helm部署pod后,AOM无法查找到对应的工作负载。 原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,
更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。 修改静态阈值模板 单击“操作”列的“编辑”。 删除静态阈值模板 删除一个静态阈值模板:单击“操作”列的“删除”。
入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。 父主题:
登录控制台。 单击右上角已登录的用户名,在下拉列表中单击“我的凭证”。 在“API凭证”界面,可以查看用户名称、账号ID、项目名称、项目ID。 调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。 获取项目ID的接口为“GET https://{Endpoi
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
s监控 > 实例列表”,进入目标Prometheus实例详情页面查看或删除该Prometheus实例相关的中间件采集任务。 表1 相关操作 操作 说明 查看采集任务 单击采集任务名称,跳转到采集任务的详情页,可以查看该采集任务的详细配置信息。 启动/停用采集任务 单击采集任务对应
避免造成业务损失。 如果您未创建任何通知规则,则无法收到告警通知。只能登录AOM控制台,在左侧导航栏中选择“告警> 告警列表”,在告警页面查看。 创建通知规则 通知规则创建成功后,当符合通知规则时发送短信或邮件。 登录AOM控制台,在左侧导航栏中选择“告警> 通知规则”,单击右上角的“创建通知规则”。
供,并由LTS统一上报日志、话单,AOM不重复计费。AOM界面集成了LTS,可通过AOM界面统一运维;LTS也有独立的控制台入口,可以单独使用LTS。如需停止计费请参见:如何停止日志功能,不再收费? 父主题: 其他常见问题
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。 访问控制 对企业中的员工设置不同的AOM访问权限,以达到不同员工之间的权限隔离,使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权