检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求示例 通过namespace+metric_name查询系统当前可监控的时间序列列表 https://{Endpoint}/v2/{project_id}/series { "series" : [ { "namespace" : "PAAS.CONTAINER"
表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes 挂载的文件系统占用空间 node_filesystem_readonly 只读挂载的文件系统 node_filesystem_free_bytes
请求示例 通过namespace,metric_name和dimensions信息查询最近五分钟的监控时序数据。
≥1 核(Core) CPU内核占用(aom_cluster_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核数。 ≥0 核(Core) CPU使用率(aom_cluster_cpu_usage) 该指标用于统计测量对象的CPU使用率。
系统策略 CCE FullAccess、DMS ReadOnlyAccess和CCE命名空间权限 AOM ReadOnlyAccess AOM2.0只读权限,拥有该权限的用户仅能查看AOM数据。
图2 Remote Write Prometheus配置代码 内网Remote Write地址为: url: 'https://aom-internal-access.{region_name}.
在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 AccessCode是调用API的身份凭据,每个项目最多可创建2个AccessCode,请您妥善保管。 获取Grafana 数据源配置代码。 登录AOM 2.0控制台。
约束与限制 目前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持数据多写功能。 CCE类型的Prometheus实例中配置的预汇聚规则指标暂不支持数据多写。
涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。
已成功接入容器 CCE Prometheus 实例。 在下拉列表中选择集群视图、Pod视图、主机视图、Node视图,查看该集群的CPU使用率、物理内存使用率等各种关键指标。 没有接入容器 CCE Prometheus 实例。
执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查8149端口的连通性。
set -o history 当显示“ICAgent install success”时,表示安装成功,ICAgent已安装在了/opt/oss/servicemgr/目录。
系统策略 CCE Administrator、OBS Administrator、LTS FullAccess AOM ReadOnlyAccess AOM只读权限,拥有该权限的用户仅能查看AOM数据。
在“组件详情”页面右上角可设置查询时间范围,查询该组件的pod实例、主机或告警信息。如果该时间范围内不存在相关数据,AOM会自动跳转到“组件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。
只要系统回显信息包含“ICAgent install success”,即表示ICAgent安装成功,ICAgent的数据采集等功能即可正常使用。 父主题: 常见使用问题
涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被重命名。
Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - X-Auth-Token 从IAM服务获取的用户Token。
自建K8S集群 K8S(Kubernetes)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序,提升应用程序的可靠性和扩展性。具体操作请参见:自建K8S集群日志接入(LTS)。
当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。