检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
QL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控PostgreSQL运行状态。本文介绍如何部署Exporter以及实现PostgreSQL Exporter告警接入等操作。 前提条件 CCE服务已拥有CCE集群并已安装PostgreSQL。
提供不同任务类型,并且可以对各原子服务场景卡片进行管理。 定时运维 提供创建定时任务等功能,并展示定时任务的执行记录。 任务管理 提供执行任务等功能,并展示所有任务的执行记录。 参数库 提供创建参数等功能,并展示现有所有参数信息。 作业管理 提供创建作业等功能,并支持对作业进行管理。
CAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。 在弹出的页面中,单击“确认”,可对该集群所有主机安装ICAgent。 升级ICAgent插件:当集群中的主机安装的ICAgent版本较低时,可以对所有主机升级ICAgent。 选择待执行升级操作的集群,单击“升级ICAgent”。
了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗? ECS主机上执行UniAgent安装命令,下载安装脚本失败
约束与限制 只有组织管理员或委托管理员账号才可以创建多账号聚合Prometheus实例,并执行接入账号的操作。设置委托管理员相关操作请参见添加、查看和取消委托管理员。 以委托管理员登录,如果无法执行接入账号操作,请参考给IAM用户授权为委托管理员授予以下权限: organizatio
资源管理界面有资源则展示该资源,无资源则不展示。 应用管理界面涉及到绑定环境的资源都会展示。 表1 资源列表 资源类型 子类型 信息 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、应用环境、UniAgent状态、资源状态、操作。 云容器引擎CCE
该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 单击列表中“调用次数”、“平均响应时间(ms)”、“错误数”等列的蓝色字体数值,可以查看默认20分钟内该通信协议的趋势图。 单
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
在“实例名称”和“监控项”下拉框中选择实例与监控项,可以查看该实例在对应采集器下不同指标集的基础监控项指标数据,具体指标及说明请参见:基础监控。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指
单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“拓扑”,切换至拓扑页签,即可查看所选组件的调用关系拓扑图。 您可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的拓扑图。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小
HttpClient错误率由高到低排序,前10位的组件环境。 在“应用”和“区域”下拉框中选择需要监控的应用和区域,即可查看不同应用和区域的概览指标数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1
tomcat版本 在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
该接口使用POST方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query_range 表1 路径参数 参数 是否必选
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9104/metrics curl http://{集群任意节点私有IP}:30337/metrics 在实例列表中单击操作列下的“更多 > 远程登录”,执行如下命令: curl http
于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。 AOM帮您解决 图2 一站式运维平台 应用运维管理(Application Operations
“组件”页签下显示除系统组件外的其他组件日志文件。 “系统”页签下显示所有的系统日志文件。 “主机”页签下显示所有的主机日志文件。 更多日志桶操作 日志桶添加完成后,您还可执行表1中的操作。 表1 相关操作 操作 说明 查看桶日志 单击日志桶名称,可直接查看该桶的日志。 修改日志桶 单击“操作”列的“编辑”。 删除日志桶
查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。