检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,执行以下命令检查Nginx是否已经启用stub_status模块(一般在/usr/local/n
CCE接入 CCE(云容器引擎)接入展示您已购买的CCE集群,可以对该集群下的主机批量执行ICAgent安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群。 查看集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南、CCI用户指南;已配置容器服务日志采集路径。 添加接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM控制台,在左侧导航栏中选择“日志 > 接入LTS”。
日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 添加接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 接入LTS”。 单击“添加接入规则”。
kube_pod_container_status_waiting_reason waiting容器的reason kube_pod_info Pod信息 kube_pod_labels Pod标签 kube_pod_owner Pod的Owner信息 kube_pod_status_phase
配置CCE集群指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例
如需使用“应用监控”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。 如果需要将CCE的工作负载上报到AOM中,并挂载到“应用监控”页面左侧的应用树中以组件形式体现,需要先升级工作负载。具体操作如下: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。
和效率。当CCE对接AOM后,支持将云容器引擎 CCE的集群信息上报至AOM,AOM可以实时监控CCE集群的状态和性能等,并提供告警通知。 您可通过在AOM中设置告警规则,及时了解CCE集群中各种资源是否存在异常,全面掌握集群的实时运行状况。本文以监控云容器引擎 CCE的CPU使
/v1/{project_id}/{cluster_id}/{namespace}/agents 表1 路径参数 参数 是否必选 参数类型 描述 cluster_id 是 String 查询集群主机时,填写集群id。 查询用户自定义主机时,填写“APM”。 namespace 是 String 查询集群主机时,填写命名空间。
操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 接入管理”。 单击“添加AccessCode”。 图1 添加AccessCode 每个项目最多可创建2个AccessCode。
依赖系统权限 AOM FullAccess AOM管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE Administrator、OBS Administrator、LTS FullAccess AOM ReadOnlyAccess AOM只读权限,拥有该权限的用户仅能查看AOM数据。
Profiler开启 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。 单击
Prometheus实例 for CCE CCE Prometheus实例类型,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。默认提供对容器服务CCE集群的监控集成,也可通过接入中心添加容器服务集群中的各种组件的监控。 注意事项 在CCE “插件市场” 页面存在云原生监
件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 单击“创建”。 设置告警规则基本信息,具体的参数说明如表1所示。
CCE容器场景自建中间件接入 PostgreSQL Exporter接入 MySQL Exporter接入 Kafka Exporter接入 Memcached Exporter接入 MongoDB Exporter接入 ElasticSearch Exporter接入 Redis
(LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy ”、"ia
引起业务异常,事件一般用来表达一些重要信息。您可根据需要对事件进行处理。用户可通过“事件”页面查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。 单击“事件”页签,查看事件信息。 设置时间范围,查看已设时间
Node Exporter”卡片当前仅华北-北京四卡片改名为“弹性云服务器 ECS”。 在“ECS Node Exporter”弹框中的“安装步骤”页签,按照页面提示进行安装。 选择Prometheus For ECS实例。在下拉列表中选择对应的ECS类型的Prometheus实例。
容器ID。 containerName 容器名称。 deploymentName k8s Deployment名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID 实例ID。 podName 实例名称。 serviceID 存量ID。 gpuID GPU ID。
创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目标实例”时选择“全局参数”,并通过下拉框选择 param2,保存作业步骤即可生效。 作业创建完成后,可以在每次执行时填入 param1