检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
中间件”类型中的“Redis”卡片。 如果进入新版接入中心页面,需筛选出“自建中间件”类型中的“Redis”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“Redis”卡片。
heus 中间件”类型中的“PostgreSQL”卡片。 如果进入新版接入中心页面,需筛选出“自建中间件”类型中的“PostgreSQL”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理
参数类型 描述 page 否 Long 分页查询的起始页数(第几页)。默认值:1。 page_size 否 Long 每页查询数量,默认20。每页最多支持查询100条数据。 ecs_id_list 否 Array of strings ecs ID列表信息。最多支持传入100条数据。 agent_id_list
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
在页面左上角选择需要统计的Prometheus实例。 在页面右上角设置该Prometheus实例上报的资源信息的统计条件。 设置时间范围。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 建议将指标查询的时间范围设置为大于1小时。
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
如果当前AOM提供的中间件Exporter插件不满足您的需求,可以先安装自定义的Exporter,然后使用AOM提供的Custom Exporter插件创建采集任务,即可以监控该中间件的相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
配置管理 ICAgent管理(华为云主机) ICAgent管理(非华为云主机) 接入管理 日志配置 配额设置 指标配置 数据订阅
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
ReadOnlyAccess" ], "status" : true }, "ECS" : { "role_name" : [ "ECS CommonOperations", "ECS ReadOnlyAccess" ], "status" : true }
运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
search_time_start 否 Long 时间范围查询的开始时间。 最小值:0 最大值:9999999999999 search_time_end 否 Long 时间范围查询的结束时间。 最小值:0 最大值:9999999999999 status 否 String 任务的状态 ["success","fail"
单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。 图8 设置告警规则详情 表5 告警规则详情填写说明 参数名称 参数说明 多指标 按设置的多个指标
for ECS实例,并在AOM的接入中心安装node-exporter或自建中间件。 配置完成后,单击“保存”。 全采样设置 为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,
read_recent: true 将复制的Remote Read Prometheus配置代码添加到对应用户自建Prometheus的prometheus.yml文件中。 重启用户自建的Prometheus服务。 即可在用户侧的自建Prometheus中查看AOM的Prometheus数据。 Remote
标的普罗格式命令行。 单击告警规则详情后的,可以锁定告警规则详情中的内容。锁定后,您可以进行以下操作: 单击告警规则详情后的,解除锁定。 单击告警规则详情后的,复制普罗语句。 命令行输入的详细说明请参见普罗语句说明。 告警级别 指标告警的级别,包括: :表示紧急告警。 :表示重要告警。
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring