检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您可通过在AOM中设置告警规则,及时了解CCE集群中各种资源是否存在异常,全面掌握集群的实时运行状况。本章节以监控云容器引擎 CCE的CPU使用率指标“aom_container_cpu_usage”,当该指标达到告警阈值条件时,产生告警为例,帮助您快速上手使用应用运维管理。 操作流程 开通AOM 2.0并授权。
192.168.0.39 2 tasks running, please wait... 2 tasks running, please wait... 2 tasks running, please wait... End of install agent: 192.168.0.39
该时间后才能继续执行下条策略 } } 错误码 表5 错误码 错误码 错误信息 处理措施 SVCSTG.PE.4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。 SVCSTG.PE.5001203 Query
关联CCE类型Prometheus实例的告警规则触发的告警:单击告警详情页中涉及容器相关资源的cluster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。 规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件详情页。
说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。 PAAS.SLA SLA指标的命名空间。 自定义指标的命名空间:需要您自定义,
取值范围 描述 metrics 是 Array JSON数组大小不超过20 指标列表 namespace 是 String PAAS.CONTAINER、PAAS.NODE、PAAS.SLA、PAAS.AGGR、CUSTOMMETRICS 指标命名空间 metricName 是 String
"error_code" : "SVCSTG.AMS.4010000", "error_msg" : "auth failed.", "error_type" : "AUTH_FAILED", "trace_id" : null } 状态码: 500 InternalServerError
APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、AI平台 ModelArts、湖仓构建 LakeFormation、表格存储服务 CloudTable、MapReduce服务 MRS、数据仓库服务
M页面查询时指标名称转换成蛇形格式(以memUsage指标为例,原始指标名称为memUsage,AOM页面查询时指标名称为aom_container_memory_usage)。 配置数据多写 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
Prometheus配置代码。 remote_read: - url: 'https://aom.{region_name}.{Site domain name suffix}/v1/{project_id}/{prometheus_instance_id}/api/v1/read'
触发频率的类型: “FIXED_RATE”:固定间隔 “HOURLY”:每小时 “DAILY”:每天 “WEEKLY”:每周 “CRON”:Cron表达式 枚举值: FIXED_RATE HOURLY DAILY WEEKLY CRON promql_for String Prometheus原生监控时长。
告警级别:${event_severity} 发生时间:${starts_at} 发生区域:${region_name} 华为云账号:${domain_name} 告警源:$event.metadata.resource_provider 资源类型:$event.metadata.resource_type
pu_usage) 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) 可用磁盘空间(aom_cluster_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_cluster_d
Server),高性能、高安全的云上物理服务器。具体操作请参见:裸金属服务器BMS日志接入(LTS)。 云容器引擎CCE 云容器引擎(Cloud Container Engine),提供高可靠高性能的企业级容器应用管理服务,支持Kubernetes社区原生应用和工具,简化云上自动化容器运行环境搭建。具体操作请参见:
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
配置虚机日志采集路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 前提条件 您需先为您的虚机安装ICAgent,详见安
构化配置的字段。 内置字段有appName、category、clusterId、clusterName、collectTime、containerName、hostIP、hostIPv6、hostId、hostName、nameSpace、pathFile、podName、se
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
通过AOM监控主机 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICA
cmd to 192.168.0.109 send cmd to 192.168.0.39 2 tasks running, please wait... End of uninstall agent: 192.168.0.109 End of uninstall agent: 192