检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看单个策略 功能说明 该接口用于查询指定项目下单个策略的详细信息。 URI GET /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID policy_id
约束与限制 应用资源管理使用限制 表1 应用资源管理使用限制 对象 使用限制 应用 租户创建的应用个数<=1000。 子应用 应用下创建的子应用数量<=50。 组件 子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=
查看策略列表 功能说明 该接口用于查询指定项目下所有策略的详细信息。 URI GET /v1/{project_id}/pe/policy 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID 请求消息 请求消息头 无 请求参数 无 请求示例
关联资源 为组件创建对应环境后,即可为环境关联相关资源实例,后续可通过应用监控功能实时监控资源的使用情况。 查看资源列表 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,
与其他服务的关系 AOM可与消息通知服务、分布式消息服务、云审计等服务配合使用。例如,通过消息通知服务您可将AOM的阈值规则状态变更信息通过短信或电子邮件的方式发送给相关人员。同时AOM对接了虚拟私有云、弹性负载均衡等中间件服务,通过AOM您可对这些中间件服务进行监控。AOM还对接了云容器引擎
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度
基础指标:IoTDA指标 介绍IoTDA服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 IoTDA服务监控指标 指标类别 指标 指标名称 指标含义 取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例
全局拓扑 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计的,也可以是从被调用方统计的。单击线条,右边可以查看这个调用关系的趋势图。同时拓扑图也能展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
MongoDB Exporter接入 操作场景 使用MongoDB过程中需要对MongoDB运行状态进行监控,以便了解MongoDB服务是否运行正常,排查MongoDB故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控MongoDB运行状态
MongoDB Exporter接入 操作场景 使用MongoDB过程中需要对MongoDB运行状态进行监控,以便了解MongoDB服务是否运行正常,排查MongoDB故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控MongoDB运行状态
基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring
外部调用 外部调用是对当前应用调用外部服务进行监控,包括CSEConsumer集群监控、ApacheHttpClient连接池、ApacheHttpAsyncClient连接池、DubboConsumer监控、HttpClient监控、NodeJsHttpClient监控、NodeJsHttpServer
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能