检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在调用应用运维管理服务API之前,请确保已经充分了解应用运维管理服务相关概念,详细信息请参见产品介绍。 终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的
AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统(AOM支持的操作系统详见操作系统使用限制)且主机已安装ICAgent,即可将主机接入到AOM中进行监控。
实例”去创建Prometheus 通用实例。 单击“下一步”,配置接入规则。 表2 配置接入规则参数说明 参数 说明 接入规则名称 指标接入规则的名称。规则名称可以包含大小写字母,数字,特殊字符(_-),以字母开头,最大长度为50。 云服务指标配置 接入云服务指标:选择需要接入的云服务,将云服务指标接入到AOM的普罗实例中。
查询全部代理区域 √ √ 安装Agent结果详情 √ √ 获取对应主机的安装命令 √ √ 获取对应主机的心跳及和server的连接状况 √ √ 批量卸载运行中的Agent √ x 查询Agent首页 √ √ 测试安装机和目标机的连通性 √ x 批量导入安装Agent √ x 获取Agent最近一次操作的执行日志相关信息
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333 父主题: 如何调用API
单击“日志文件”页签。 查看日志文件 日志路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径。 登录AOM 2.0控制台。 在左侧导航栏选择“日志分析 > 日志管理”。
展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对应用的立体监控。在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置AOM应用发现规则。 通过AOM监控应用进程
tigrade node_temperature 节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas 500小站节点功率,由用户调用edgecore接口上报。 ≥0 瓦(W)
如何处理界面“ICAgent状态”为“离线”的问题? 在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面显示状态异常? ICAgent安装成功后,无法在界面上获取到ICAgent状态 ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK?
tus_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示:
单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。
单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。
进程监控”,在右侧区域选择“组件监控”页签,进入组件监控界面,查看组件列表。 组件列表中对组件名称、所属应用、部署方式、应用发现规则、使用率、操作等参数进行展示。 为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。 通过开启或关闭“隐藏系统
parent_node String 父亲节点的名称。 最小长度:1 最大长度:64 category String 节点类型。 最小长度:1 最大长度:32 description String 节点描述。 最小长度:1 最大长度:1024 id String 节点id 最小长度:1 最大长度:64
单击“立即接入”,则将云服务接入到云服务类型Prometheus实例中。 接入ECS资源。 获取AK、SK,详细操作可参考新增访问密钥。 登录AOM 2.0控制台,在左侧导航栏中选择“设置”,进入“全局配置”界面。 在左侧导航栏中,选择“UniAgent安装与配置”,选择待安装ICAgent的主机,单击“插件批量操作”。
通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。
ount 配置个数 ServiceComb配置个数。 ≥0 个 Nacos config nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。
级中”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台。 在左侧导航栏中选择“告警 > 告警规则”。 选中一个
是否必选 参数类型 描述 action 是 String 对当前节点的操作:失败重试,失败跳过,暂停继续。 restart可重新执行失败的节点,skip可跳过失败的节点进入下个节点的执行,continue可通过暂停节点进入下一个节点。 最小长度:1 最大长度:10 枚举值: restart