检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
查询仪表盘分组列表 功能介绍 该接口用于查询仪表盘分组列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/aom/dashboards-folder 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项
通过helm部署pod后,AOM无法查找到工作负载 问题描述 通过helm部署pod后,AOM无法查找到对应的工作负载。 原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,
更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。 修改静态阈值模板 单击“操作”列的“编辑”。 删除静态阈值模板 删除一个静态阈值模板:单击“操作”列的“删除”。
入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。 父主题:
登录控制台。 单击右上角已登录的用户名,在下拉列表中单击“我的凭证”。 在“API凭证”界面,可以查看用户名称、账号ID、项目名称、项目ID。 调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。 获取项目ID的接口为“GET https://{Endpoi
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
s监控 > 实例列表”,进入目标Prometheus实例详情页面查看或删除该Prometheus实例相关的中间件采集任务。 表1 相关操作 操作 说明 查看采集任务 单击采集任务名称,跳转到采集任务的详情页,可以查看该采集任务的详细配置信息。 启动/停用采集任务 单击采集任务对应
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
避免造成业务损失。 如果您未创建任何通知规则,则无法收到告警通知。只能登录AOM控制台,在左侧导航栏中选择“告警> 告警列表”,在告警页面查看。 创建通知规则 通知规则创建成功后,当符合通知规则时发送短信或邮件。 登录AOM控制台,在左侧导航栏中选择“告警> 通知规则”,单击右上角的“创建通知规则”。
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。 查看CCE集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“采集设置 > CCE接入”。 查看已接入的CCE集群。 可根据集群名称,在搜索框中搜索集群。 管理CCE集群的ICAgent插件
供,并由LTS统一上报日志、话单,AOM不重复计费。AOM界面集成了LTS,可通过AOM界面统一运维;LTS也有独立的控制台入口,可以单独使用LTS。如需停止计费请参见:如何停止日志功能,不再收费? 父主题: 其他常见问题
已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。 查看CCE集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“采集设置 > CCE接入”。 查看已接入的CCE集群。 可根据集群名称,在搜索框中搜索集群。 管理CCE集群的ICAgent插件
详细说明请参见:欠费还款。 账号冻结或受限:云服务资源因欠费冻结或受限时,若处于保留期,用户可通过续费或充值来解冻该资源,恢复云服务正常使用,详细说明请参见:资源冻结。 账号恢复正常后,定时任务可恢复正常执行。 父主题: 运维管理(即将下线)
的指标。 更多统计规则操作 创建完统计规则后,您还可以执行更多统计规则操作中的操作。 表1 相关操作 操作 说明 查看统计规则 在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则 单击“操作”列的“编辑”。 删除统计规则 删除一个统计规则:单击“操作”列的“删除”。
详细说明请参见:欠费还款。 账号冻结或受限:云服务资源因欠费冻结或受限时,若处于保留期,用户可通过续费或充值来解冻该资源,恢复云服务正常使用,详细说明请参见:资源冻结。 父主题: 应用资源管理(即将下线)
问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。 访问控制 对企业中的员工设置不同的AOM访问权限,以达到不同员工之间的权限隔离,使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权
问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。 访问控制 对企业中的员工设置不同的AOM访问权限,以达到不同员工之间的权限隔离,使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权