检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。 图1 分组流程 创建分组规则 用户最多可创建100条分组规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“分组规则”页签下单击 “创建分组规则”,设置规则名称、分组条件等信息,字段说明请参见表1。
自动化运维权限管理 创建用户并授权使用自动化运维 自动化运维自定义策略 父主题: 运维管理
时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prometheus实例相关API,包括新增、查询Prometheus实例、卸载托管Prometheus实例等接口。 配置管理 配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。
告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
failed.", "http_code" : 401 } 状态码: 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 { "error_code" : "AOM.31002005", "error_msg" : "script internal
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理
empty", "trace_id" : "" } 状态码: 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 { "error_code" : "APM.00000500", "error_msg" : "Internal
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0的企业项目下实例。 响应参数 无 请求示例 删除仪表盘id为2439f2c7--43eb--cd1b****8b2e的仪表盘
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0的企业项目下实例。 响应参数 无 请求示例 删除仪表盘分组 https://{Endpoint}/v2/{project
Enterprise-Project-Id 否 String 企业项目id。 获取方式请参见:获取企业项目ID 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0下的实例。 表3 请求Body参数 参数 是否必选 参数类型 描述 alarm_rule_templates 是 Array
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
自动化运维自定义策略样例 示例:拒绝用户对服务卡片进行上下架操作 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予CMS FullAccess的系统策略,但不希望用户拥有CMS Full
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 查询单个企业项目下实例,填写企业项目id。 查询所有企业项目下实例,填写“all_granted_eps”。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述
统计租户在当前实例/资源空间下的在线的设备数量 ≥0 个 iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量
主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。 PAAS.SLA SLA指标的命名空间。 自定义指标的命名空间:用户自定义,自定义时命名空间必须以字母开头,但不能以“PAAS.”、“SYS.”和“SRE