检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通自动化运维 开通自动化运维时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需分别进行开通操作。 用户首次登录开通自动化运维,需要添加Security Administrator角色,后续使用自动化运维服务则不需要此角色权限。 自动化运维功能
您可快速查看组件实例或主机的日志文件,以便定位问题。 查看日志文件 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志文件”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志文件”页面。 在“日志文件”页面选择“组件”或“主机”页签并单击名称,在页面右侧的日志文件
dimensions 是 String - 指标维度,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 unit 是 String - 指标单位,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 actionEnabled 否 Boolean - 告警是否启用
表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 错误码 表6 错误码 错误码 错误信息 处理措施 SVCSTG_AMS_4000109 Invalid project ID. 请检查对应的参数是否符合要求。
卸载ICAgent 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致AOM功能不可用,请谨慎操作! 卸载方式,您可以按照需要进行选择: 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 远程卸
Integer topic中订阅者的状态。0:主题已删除或主题下订阅列表为空。1:主题下的订阅列表存在状态为“已订阅”的订阅信息。2:主题下的订阅信息状态处于“未订阅”或“已取消”。 枚举值: 0 1 2 topic_urn 是 String Topic的唯一的资源标识。 最小长度:1 最大长度:100
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,执行以下命令检
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题:
服务场景会按照场景分类展现对应的已上架的工具卡片,可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。如果不需要对卡片做下架操作,请参考自动化运维自定义策略,拒绝卡片下架操作。具体操作如表1。 表1 相关操作 操作 说明 收藏卡片 单击待收藏卡片上的。 下架卡片 单击卡片右上角的并选择“下架”。
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(日落)
2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 ICAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet 代理机ip”,检查代理机和目标机器间的网络连通性。 安装ICAgent时需要开放8149、810
Integer topic中订阅者的状态。0:主题已删除或主题下订阅列表为空。1:主题下的订阅列表存在状态为“已订阅”的订阅信息。2:主题下的订阅信息状态处于“未订阅”或“已取消”。 枚举值: 0 1 2 topic_urn String Topic的唯一的资源标识。 最小长度:1 最大长度:100
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 添加采集任务 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。
告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,
为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化
租户从IAM申请到的projectid,一般为32位字符串。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。 Content-Type 是 String 指定类型为application/json。
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:ev